Você está na página 1de 163

UNIVERSIDADE FEDERAL DE MINAS GERAIS

INSTITUTO DE CIENCIAS
EXATAS
DEPARTAMENTO DE ESTATISTICA

Estatstica e Probabilidade para Engenharias


Cl
odio Pereira de Almeida & Greg
orio Saravia Atuncar

Notas de aula
2010

cpa/gsa

Introduc
ao
A ideia para esse trabalho surgiu da vontade de se reunir em uma u
nica fonte, e em portugues, material
que atendesse `as ementas dos cursos basicos de estatstica e probabilidade ministrados pelo Departamento
de Estatstica do Instituto de Ciencias Exatas (ICEX) da UFMG para os ciclos basicos dos diversos cursos
de engenharia.
O conte
udo utilizou como fontes, notas de aula do curso de Introduc
ao `
a Estatstica ministrado pela
professora Rosangela Loschi e notas de aula do curso de Estatstica e Probabilidade ministrado pela professora Denise Duarte, alem da bibliografia basica apresentada no captulo 6.
Esperamos que sirva para despertar nos alunos que o utilizarem a consciencia da importancia dessas
ciencias (Estatstica e Probabilidade) para todas as areas do conhecimento humano, especialmente para
as ciencias exatas.

Os Autores
Belo Horizonte, agosto de 2010

Sum
ario
1 Introdu
c
ao `
a An
alise de Dados
1.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Organizacao de dados . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Tipos de dados . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Construcao de tabelas . . . . . . . . . . . . . . . . . . .
1.2.3 Representacao grafica . . . . . . . . . . . . . . . . . . .
1.3 Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Medidas de posicao . . . . . . . . . . . . . . . . . . . . .
1.3.2 Medidas de variabilidade . . . . . . . . . . . . . . . . .
1.3.3 Propriedades da media, mediana e variancias amostrais
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

6
6
8
8
8
13
16
16
20
23
23

2 Probabilidade
2.1 Experimentos aleatorios, espaco amostral e eventos
2.1.1 Operacoes com eventos . . . . . . . . . . .
2.1.2 Operacoes com mais de dois eventos . . . .
2.2 Definicao de probabilidade . . . . . . . . . . . . . .
2.2.1 Definicao frequentista de probabilidade . .
2.2.2 Axiomas de probabilidade . . . . . . . . . .
2.2.3 Regras de adicao . . . . . . . . . . . . . . .
2.2.4 Definicao classica de probabilidade . . . . .
2.3 Probabilidade Condicional . . . . . . . . . . . . . .
2.4 Regras da multiplicacao e probabilidade total . . .
2.4.1 Regra da multiplicacao . . . . . . . . . . . .
2.4.2 Regra da probabilidade total . . . . . . . .
2.5 Teorema de Bayes . . . . . . . . . . . . . . . . . .
2.5.1 Independencia . . . . . . . . . . . . . . . .
2.5.2 Teorema de Bayes . . . . . . . . . . . . . .
2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

26
26
27
29
32
32
33
34
34
35
37
37
37
39
39
41
43

3 Vari
aveis Aleat
orias Discretas
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Variaveis aleatorias discretas . . . . . . . . . . . . . . . .
3.3 Distribuicoes de probabilidades e funcoes de probabilidade
3.4 Funcoes de distribuicao acumuladas . . . . . . . . . . . .
3.5 Media e variancia de uma variavel aleatoria discreta . . .
3.6 Distribuicoes discretas mais comuns . . . . . . . . . . . .
3.6.1 Distribuicao uniforme discreta . . . . . . . . . . .
3.6.2 Distribuicao de Bernoulli . . . . . . . . . . . . . .
3.6.3 Distribuicao binomial . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

47
47
48
48
50
51
54
54
56
56

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.


SUMARIO

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

60
63
65
68
70

4 Vari
aveis Aleat
orias Contnuas
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Probabilidade: distribuicoes e funcao de densidade . . . . . . . . . . . . .
4.3 Funcao de distribuicao acumulada . . . . . . . . . . . . . . . . . . . . . .
4.4 Media e variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Distribuicao uniforme contnua . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Distribuicao normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Calculo de probabilidade . . . . . . . . . . . . . . . . . . . . . . .
4.6.2 Aproximacoes das distribuicoes binomial e de Poisson pela normal
4.7 Distribuicao exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Distribuicoes de Erlang e Gamma . . . . . . . . . . . . . . . . . . . . . . .
4.8.1 Distribuicao de Erlang . . . . . . . . . . . . . . . . . . . . . . . . .
4.8.2 Distribuicao Gamma . . . . . . . . . . . . . . . . . . . . . . . . . .
4.9 Distribuicao de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.10 Distribuicao Lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.11 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

73
73
73
76
77
80
82
84
88
91
94
94
94
95
96
97

5 Infer
encia
5.1 Inferencia estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Amostragem aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Estimacao de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1.1 Propriedades de estimadores . . . . . . . . . . . . . . . . . . . . . .
5.3.1.2 Desvio Padrao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1.3 Erro Quadratico Medio . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 Metodos de estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2.1 Metodo dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2.2 Metodo de Maxima Verossimilhanca . . . . . . . . . . . . . . . . . .
5.3.3 Distribuicoes amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.1 Distribuicao da media amostral - caso normal . . . . . . . . . . . .
5.3.3.2 Distribuicao da diferenca de medias . . . . . . . . . . . . . . . . . .
5.3.3.3 Distribuicao Quiquadrado . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.4 Distribuicao t de Student . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.5 Distribuicao F de Fisher . . . . . . . . . . . . . . . . . . . . . . . .
5.3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.5 Estimacao por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.5.1 Intervalo de confianca para a media de uma distribuicao normal . .
5.3.5.2 Intervalo de confianca para o parametro p da distribuicao binomial .
5.3.5.3 Intervalo de confianca para diferenca de duas medias - Caso normal
5.3.5.4 Intervalo de confianca para variancia de uma distribuicao normal . .
5.3.5.5 Intervalo de confianca para razao de variancias - Caso normal . . .
5.3.5.6 Intervalo de confianca para a media - distribuicao nao normal . . .
5.4 Teste de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.2 Teste sobre media - caso normal . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.2.1 Variancia conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

99
99
99
101
101
102
105
105
105
105
106
110
110
111
112
114
115
116
118
119
123
124
127
128
129
131
131
135
135

3.7

3.6.4 Distribuicao geometrica . . . .


3.6.5 Distribuicoes binomial negativa
3.6.6 Distribuicao hipergeometrica .
3.6.7 Distribuicao de Poisson . . . .
Exerccios . . . . . . . . . . . . . . . .

cpa/gsa

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


SUMARIO

cpa/gsa

5.4.2.2 Variancia desconhecida . . . . . . . . . . . . . . . . . .


Testes sobre a media, caso nao normal . . . . . . . . . . . . . . .
5.4.3.1 Um caso particular: testes sobre proporcoes . . . . . . .
5.4.4 Teste sobre variancia de uma populacao com distribuicao normal
5.4.5 Testes sobre diferenca de medias . . . . . . . . . . . . . . . . . .
5.4.5.1 Variancias conhecidas . . . . . . . . . . . . . . . . . . .
5.4.5.2 Variancias desconhecidas mas iguais . . . . . . . . . . .
5.4.5.3 Variancias desconhecidas e diferentes . . . . . . . . . .
5.4.6 Teste sobre razao de variancias . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.3

5.5

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

139
141
141
143
145
145
146
148
149
150

6 Bibliografia

154

7 Ap
endice

156

Captulo 1

Introduc
ao `
a An
alise de Dados
1.1

Conceitos

Estatstica: e uma ciencia que desenvolve metodologias para coletar, descrever, organizar, analisar e
uma ferramenta poderosa para tomada de decisao, resolucao de problemas, planejainterpretar dados. E
mento de produtos e processos, com in
umeras aplicacoes. Daremos aqui um maior enfoque `as aplicacoes
na engenharia.
Nessas notas abordaremos as seguintes areas:
1. Estatstica Descritiva: e utilizada na etapa inicial da analise para que possamos nos familiarizar
com os dados, e tirarmos conclusoes informais e diretas sobre a populacao com base nos dados
observados. Utilizamos as seguintes tecnicas (para resumir os dados):
graficos
tabelas
medidas
2. Probabilidade: Tecnicas que permitem medir incertezas sobre fenomenos aleatorios. Construmos
modelos probabilsticos para descrever o comportamento de objetos aleatorios.
3. Inferencia Estatstica: Tecnicas que permitem extrapolar para a populacao, conclusoes obtidas de
subconjuntos ou amostras desta populacao. As principais tecnicas usadas sao
Estimacao pontual
Intervalos de confianca
Testes de hipoteses
o conjunto de todos os elementos a serem estudados. Sao exemplos:
Populacao: E
1. a populacao brasileira.
2. a totalidade dos carros produzidos no Brasil.
3. uma jazida de minerio de ferro de determinada mina.
4. o sangue no corpo de uma pessoa.

1.1. CONCEITOS

cpa/gsa

um subconjunto desta populacao.


Amostra: E
1. a populacao do Parana.
2. carros produzidos pela Fiat.
3. um testemunho ou porcao retirada da mina.
4. uma ampola de sangue colhida para um exame.
Fenomeno aleatorio: Qualquer fenomeno cujo resultado nao pode ser previamente antecipado. Por
exemplo o resultado de uma partida de futebol. Em contraposicao temos os fen
omenos determinsticos
que sao regidos pelas leis da fsica e que nao possuem interesse estatstico, ja que se repetirmos a experiencia, sob as mesmas condicoes, elas apresentarao sempre o mesmo resultado. Por exemplo o tempo
de queda livre de um mesmo corpo de uma altura fixa.
Parametro: Resumo de uma caracterstica obtido a partir de todos os elementos de uma populacao.
Estatstica: Resumo da caracterstica de interesse levando-se em conta apenas os elementos da amostra.

Veja abaixo um croquis reprsentando simbolicamente os conceitos apresentados ate aqui:


parmetro: caracterstica populacional

Populao

Amostra (tcnicas de amostragem)


Estatstica descritiva

Modelos Probabilsticos

Tcnicas de Inferncia

Figura 1.1: Estatstica simbolicamente

DE DADOS
1.2. ORGANIZAC
AO

1.2

cpa/gsa

Organizac
ao de dados

Veremos nesta secao como podemos classificar dados e alguns recursos para simplificar sua apresentacao e organizacao.

1.2.1

Tipos de dados

Qualitativos: representam uma qualidadedos elementos da populacao, normalmente nao mensuraveis


numericamente. Podem ser:
Nominais: o conjunto das possveis respostas nao possui uma ordenacao natural. Ex: Sexo, Raca,
Religiao, etc.
Ordinais: e possvel ordenar o conjunto das possveis respostas. Ex: Classe Social, Escolaridade do
chefe da famlia, Faixa de renda familiar, etc.
Quantitativos: representam uma quantidadenumericamente mensuravel dos elementos da populacao.
Podem ser:
Discretos: em geral sao fruto de uma contagem. O conjunto de possveis respostas e enumeravel.
Ex: N
umero de filhos na famlia {0,1,2,...}, n
umero de pessoas chegando em uma fila {0,1,2,...},
n
umero de caras obtidas em 5 lancamentos de uma moeda {0,1,2,3,4,5} etc.
Contnuos: O conjunto de possveis respostas e um intervalo de n
umeros reais. Ex: peso [0, ),
altura [0, ) idade [0, ), etc.

1.2.2

Constru
c
ao de tabelas

O conjunto de informacoes disponveis apos tabulacao de questionario ou pesquisa de campo e denominado tabela de dados brutos. Nela sao listados individualmente cada elemento da populacao ou amostra,
com os valores de todas as variaveis estudadas.
Veja no exemplo da proxima pagina uma pesquisa realizada com alunos de duas turmas de determinada
escola (a ttulo de exerccio, classifique cada variavel desta tabela por tipo e subtipo, conforme visto na
subsecao 1.2.1).

DE DADOS
1.2. ORGANIZAC
AO

Id Turma Sexo Idade Altura


1
A
F
17
1,60
2
A
F
18
1,69
3
A
M
18
1,85
4
A
M
25
1,85
5
A
F
19
1,58
6
A
M
19
1,76
7
A
F
20
1,60
8
A
F
18
1,64
9
A
F
18
1,62
10
A
F
17
1,64
11
A
F
18
1,72
12
A
F
18
1,66
13
A
F
21
1,70
14
A
M
19
1,78
15
A
F
18
1,65
16
A
F
19
1,63
17
A
F
17
1,82
18
A
M
18
1,80
19
A
F
20
1,60
20
A
F
18
1,68
21
A
F
21
1,70
22
A
F
18
1,65
23
A
F
18
1,57
24
A
F
20
1,55
25
A
F
20
1,69
26
A
F
19
1,54
27
B
F
23
1,62
28
B
F
18
1,62
29
B
F
18
1,57
30
B
F
25
1,65
31
B
F
18
1,61
32
B
M
17
1,71
33
B
F
17
1,65
34
B
F
17
1,67
35
B
M
18
1,73
36
B
F
18
1,60
37
B
M
17
1,70
38
B
M
21
1,85
39
B
F
18
1,70
40
B
M
18
1,73
41
B
F
17
1,70
42
B
F
23
1,45
43
B
M
24
1,76
44
B
F
18
1,68
45
B
F
18
1,55
46
B
F
19
1,70
47
B
F
19
1,55
48
B
F
18
1,60
49
B
M
17
1,80
50
B
M
18
1,83

cpa/gsa

Peso Filh Fuma


60,5
2 NO
55,0
1 NO
72,8
2 NO
80,9
2 NO
55,0
1 NO
60,0
3 NO
58,0
1 NO
47,0
1
SIM
57,8
3 NO
58,0
2 NO
70,0
1
SIM
54,0
3 NO
58,0
2 NO
68,5
1
SIM
63,5
1 NO
47,4
3 NO
66,0
1 NO
85,2
2 NO
54,5
1 NO
52,5
3 NO
60,0
2 NO
58,2
1 NO
49,2
1
SIM
48,0
1
SIM
51,6
2 NO
57,0
2 NO
63,0
2 NO
52,0
1 NO
49,0
2 NO
59,0
4 NO
52,0
1 NO
73,0
1 NO
56,0
3 NO
58,0
1 NO
87,0
1 NO
47,0
1 NO
95,0
1 NO
84,0
1
SIM
60,0
1 NO
73,0
1 NO
55,0
1 NO
44,0
2 NO
75,0
2 NO
55,0
1 NO
49,0
1 NO
50,0
7 NO
54,5
2 NO
50,0
1 NO
71,0
1 NO
86,0
1 NO

Toler
P
M
P
P
M
M
P
I
M
M
I
M
M
I
I
P
P
P
P
M
P
M
I
I
P
I
M
P
P
M
P
P
M
M
M
P
P
I
P
M
I
M
I
P
M
M
M
P
P
P

Exer
0
0
5
5
2
2
3
2
3
2
10
0
6
5
4
0
3
3
3
7
8
0
5
0
8
6
8
1
3
1
2
1
2
4
7
5
10
6
5
4
5
2
7
5
0
0
4
2
7
7

Cine OpCine
1
B
1
B
2
M
2
B
2
B
1
B
1
B
2
M
3
M
2
M
2
B
2
B
1
M
1
M
1
B
1
B
1
B
4
B
2
B
2
B
2
B
3
B
4
B
1
M
5
M
2
B
2
M
1
M
1
B
2
M
2
M
1
B
1
B
2
B
1
B
1
M
2
M
4
B
2
B
1
B
4
B
2
B
0
M
1
B
1
M
1
B
3
B
1
B
0
M
0
M

TV
16
7
15
20
5
2
7
10
12
10
8
0
30
2
10
18
10
10
5
14
5
5
10
28
4
5
5
10
12
2
6
20
14
10
25
14
12
10
12
2
10
25
14
8
10
8
3
5
14
20

OpTV
R
R
R
R
R
R
R
R
R
R
N
R
R
N
R
R
N
R
R
M
R
R
R
R
N
R
R
R
R
R
N
R
R
R
B
R
N
R
R
R
B
R
N
R
R
R
R
R
R
B

Detalhes sobre campos da tabela Filh: no filhos na famlia - Toler: toler


ancia ao cigarro (I) ndiferente, (P) incomoda
pouco e (M) incomoda muito - Exerc: horas de atividade fsica por semana - Cine: n
umero de vezes que vai ao cinema por semana
- OpCine: opini
ao sobre qualidade das salas (B) regular a boa e (M) muito boa - TV: horas assistindo TV por semana - OpTV:
opini
ao sobre qualidade programa
ca
o na TV: (R) ruim, (M) m
edia, (B) boa e (N) n
ao sabe.

Apesar de conter muita informacao, a tabela de dados brutos nao e pratica para respondermos rapidamente a questoes de interesse. Assim, a partir da tabela de dados brutos normalmente construmos
uma nova tabela denominada tabela de de frequencia.
A tabela de frequencia mais simples e aquela que lista os valores observados para determinada variavel,
e o n
umero de ocorrencias (ou frequencia absoluta) de cada um destes valores.

DE DADOS
1.2. ORGANIZAC
AO

cpa/gsa

Ela possui a forma:


X
X1
X2
...
...
Xr
Total

freq. obs
n1
n2
...
...
nr
n

Denota-se por ni o n
umero de vezes que a resposta Xi apareceu na amostra de tamanho N (frequencia
absoluta).
Utilizando os dados da pesquisa apresentada na tabela da pagina anterior, temos por exemplo para
as variaveis Turma e Sexo:
Turma
A
B
Total

freq. obs
26
24
50

Sexo
M
F
Total

freq. obs
13
37
50

Para comparacao com outros grupos ou conjuntos de dados e conveniente acrescentarmos uma coluna
ni
de frequencia relativa definida por fi =
(frequencia observada dividida pelo total de observacoes).
n
Temos assim os percentuais em cada classe. Alem disso pode ser interessante a inclusao da frequencia
acumulada: para dados ordenados a frequencia acumulada ate a classe Xi e a soma de todas as frequencias
observadas ate ela inclusive. Da mesma forma, a frequencia relativa acumulada ate a classe Xi e a soma
de todas as frequencias relativas ate a da classe i. A tabela completa para a variavel idade da pesquisa e
apresentada a seguir:
Tabela 1.1: Frequencia da variavel idade
Idade
17
18
19
20
21
22
23
24
25
Total

freq. obs
9
22
7
4
3
0
2
1
2
50

freq. acum.
9
31
38
42
45
45
47
48
50

freq. relat.
0,18
0,44
0,14
0,08
0,06
0
0,04
0,02
0,04
1

fr. rel. acum.


0,18
0,62
0,76
0,84
0,90
0,90
0,94
0,96
1

Para representarmos variaveis contnuas, como elas podem assumir qualquer valor real em um certo
intervalo, ficaria inviavel criarmos tabelas de frequencia como as anteriores. Se tomarmos a variavel peso,
mesmo com o arredondamento de uma casa decimal apresentado na tabela, teramos quase o mesmo
n
umero de itens da tabela de dados brutos. Assim a alternativa e criarmos classes ou faixas de valores.
Para tanto siga o seguinte roteiro:
1. Ordene os valores do menor para o maior e identifique o maximo e o mnimo observado.
2. Calcule a amplitude total fazendo AT = max min.
10

DE DADOS
1.2. ORGANIZAC
AO

cpa/gsa

AT
3. Escolha o n
umero k de classes e defina h =
. Normalmente sao usadas entre 5 e 8 classes.
k
A literatura universal usa o valor k como o inteiro mais proxuimo do valor dado pela formula de
Sturges (k = 1 + 3,3log n), mas esse e apenas um valor referencial. Nao entraremos em mais
detalhes sobre a escolha do n
umero de classes. O leitor interessado nesse assunto pode consultar,
por exemplo [1] e referencias contidas naquele trabalho. O valor h sera chamado de amplitude de
classe.
4. Calcule as frequencias absolutas contando o n
umero de observacoes em cada classe, chame este
valor de ni , i = 1, . . . k.
5. Calcule entao:
ni
n
Pi
(b) frequencias acumuladas - f aci = j=1 nj
Pi
(c) frequencias relativas acumuladas - Fi = j=1 fj
(a) frequencias relativas - fi =

Exemplo:
Represente atraves de uma tabela de frequencia a variavel peso da pesquisa apresentada na tabela da
pagina 9.
Solucao:
1. Apos ordenacao vemos max = 95 kg e min = 44 kg.
2. AT = 95 44 = 51kg
3. O n
umero de observacoes e n = 50. De acordo com a formula de Sturges, k = 1+3,3log(50) = 6,61.
51
Usaremos entao 7 classes. Com k = 7, o valor de h sera dado por h =
= 7,28.... Usaremos
7
h = 7,3.
4.
5. Montamos a tabela, usando a convencao de classes abertas `a esquerda e fechadas `a direita:
Tabela 1.2: Distribuicao de frequencia variavel peso
Peso
44a 51,3
51,3a 58,6
58,6a 65,9
65,9a 73,2
73,2a 80,5
80,5a 87,8
87,8a 95,1
Total

ni
10
19
7
7
1
5
1
50

f aci
10
29
36
43
44
49
100

fi
0,20
0,38
0,14
0,14
0,02
0,10
0,02
1

Fi
0,20
0,58
0,72
0,86
0,88
0,98
1,00

Eventualmente mesmo dados discretos podem ser agrupados para serem representados em tabelas de
distribui
c
ao de frequ
encia.

11

DE DADOS
1.2. ORGANIZAC
AO

cpa/gsa

Outra representacao interessante e o chamado Diagrama de ramo e folhas, indicado para variaveis
que possuam valores com pelo menos dois dgitos. Para construir o diagrama de ramo e folhas, dividimos
cada valor da variavel em estudo em duas partes: um ramo, consistindo em um ou mais dgitos iniciais,
e uma folha, com os dgitos restantes.
O exemplo de um diagrama de ramo e folhas para as alturas dos alunos dza pesquisa:
Tabela 1.3: Diagrama Ramo e Folhas variavel altura
Ramo
14
15
16
17
18

Folha
5
8754
0904
6208
5520

7
2
0
5

5
4
1
0

5
6530859225157080
3003060
3

Frequencia
1
7
22
13
7

Eventualmente pode ser interessante aumentar o n


umero de ramos para facilitar a visualizacao dos
dados. No exemplo acima podemos dividir cada um dos ramos em 2 outros com as indicacoes por exemplo
de 16B (Baixo) com as folhas 0, 1, 2, 3 e 4 e 16A (Alto) com as folhas 5, 6, 7, 8 e 9. Ficaria entao:
Tabela 1.4: Ramo e Folhas variavel altura - mais ramos
Ramo
14A
15B
15A
16B
16A
17B
17A
18B
18A

Folha
5
4
8757
0042
9658
2001
686
2003
555

5
4
5
3

5
3022100
95578
00300

12

Frequencia
1
1
6
12
10
10
3
4
3

DE DADOS
1.2. ORGANIZAC
AO

1.2.3

cpa/gsa

Representa
c
ao gr
afica

A representacao dos dados em forma grafica e importante ferramenta de analise e apresentacao de resultados em qualquer analise estatstica. Apresentamos a seguir alguns tipos principais de representacao
grafica.
Diagrama circular, disco ou pizza - Tipo de grafico muito utilizado para representacao de variaveis
qualitativas. Como exemplo veja a variavel OpTV da tabela da pagina 9:

M
2%
B
6%
N
14%

R
78%

Figura 1.2: Grafico de disco da variavel OpTV


Gr
afico de barras - Utiliza o plano cartesiano com os valores da variavel no eixo das abcissas e as
frequencias ou porcentagens no eixo das ordenadas. Para cada valor da variavel desenha-se uma barra
com altura correspondendo `a sua frequencia ou porcentagem. Este tipo de grafico se adapta melhor
`as variaveis quantitativas discretas ou qualitativas ordinais. A representacao das idades dos alunos da
pesquisa seria:
25

Frequncia

20

15

10

0
17

18

19

20

21

22

23

24

Idade

Figura 1.3: Grafico de barras da variavel idade

13

25

DE DADOS
1.2. ORGANIZAC
AO

cpa/gsa

Histograma - A representacao grafica das tabelas de distribuicao de frequencia e chamada Histograma. Represente no eixo das abcissas a escala de medidas, desenhando os limites das classes. No eixo
vertical represente a frequencia absoluta (ou relativa) de cada classe. O histograma da tabela 1.2 (peso)
e:
20

Frequncia

15

10

0
44

51,3

58,6

65,9

Peso

73,2

80,5

87,8

95,1

Figura 1.4: Histograma da variavel peso

Durante a passagem dos dados da tabela de dados brutos ou do diagrama de ramos e folhas para a
tabela distribuicao de frequencia ou para histogramas, perde-se alguma informacao sobre nossos dados,
mas esta perda e plenamente compensada pelos ganhos de concisao e facilidade de interpretacao.
Polgono de frequ
encia - Este grafico e obtido unindo-se com segmentos de reta os pontos medios
da parte superior de cada barra no histograma. Os pontos medios da parte superior das barras da
primeira e u
ltima classes devem ser ligados respectivamentes ao pontos de coordenadas (LI1 h/2, 0) e
(LSk + h/2, 0), onde LI1 e o limite inferior da primeira classe, LSk o limite superior da u
ltima classe e
h a amplitude da classe.

Frequncia

20

15

10

44

51,3 58,6 65,9 73,2 80,5 87,8 95,1

Peso
Figura 1.5: Polgono de frequencia - Peso

14

DE DADOS
1.2. ORGANIZAC
AO

cpa/gsa

Gr
afico de frequ
encia acumulada - Uma variacao do Histograma e o grafico de frequencia acumulada. Neste grafico a altura de cada barra e o n
umero total de observacoes que e menor que o limite
superior de cada classe. O grafico de frequencia acumulada para mesma variavel (peso) da pesquisa fica
entao:

Frequncia acumulada

50

40

30

20

10

0
44

51,3

58,6

65,9

73,2

80,5

87,8

95,1

Peso

Figura 1.6: Distribuicao de frequencia acumulada para variavel peso

Ogiva - Um outro grafico, chamado de ogiva, e construdo a partir do grafico de frequencia acumulada, e definido pela poligonal formada por segmentos de reta unindo o ponto inicial inferior da primeira
barra e os pontos finais de cada classe. O nome dessse grafico advem da sua aparencia, conforme pode-se
verificar na figura abaixo:

Frequncia acumulada

50

40

30

20

10

0
44

51,3

58,6

65,9

73,2

80,5

Peso

Figura 1.7: Grafico de ogiva - peso

15

87,8

95,1

1.3. MEDIDAS

1.3

cpa/gsa

Medidas

Medidas sao resumos ou sumarios da informacao trazida pela amostra em um u


nico n
umero. Podem
ser classificadas em:
Posi
c
ao (ou tend
encia central): sao medidas de localizacao do meio ou do centro de uma distribuicao.
Ex: media, mediana, moda.
Variabilidade: medem o espalhamento ou variabilidade dos dados. Ex: amplitude total, variancia,
desvio padrao.
Associa
c
ao: medem relacoes entre variaveis. Ex: coeficiente de correlacao.
Assimetria e curtose: medidas relacionadas com alteracoes na forma da distribuicao, atraves das
relacoes entre suas medidas de tendencia central (moda, media e mediana) - assimetria ou o seu
achatamento - curtose.

1.3.1

Medidas de posic
ao

Tendem a representar os elementos comuns da populacao.


Media: e um valor que representa o centro de massa ou ponto de equilbrio da distribuicao (histo calculado por:
grama). E
Pn
= i=1 Xi = X1 + X2 + + Xn (dados brutos).
X
n
n
Para melhor compreensao do conceito de media como centro de massa, imagine uma amostra com
os seguintes valores {8, 9, 5, 5, 4, 3, 6, 4}. Facamos um Diagrama de pontos, que e um grafico u
til para
visualizacao de pequenas amostras. Para tanto simplesmente plotamos um ponto para cada valor da
amostra sobre um segmento de R que contenha todos os valores. Se houver repeticoes plotamos um
ponto sobre o outro. Note que a media pode ser pensada como um centro de massa porque se cada ponto
tivesse a mesma massa, digamos 1 kg, o triangulo representando a media equilibraria exatamente estes
pesos.
Mdia = 5,5

10

Se os dados estiverem agrupados em tabela de distribuicao de frequencia como no exemplo abaixo,


Variavel
X1
X2
...
...
Xr
fazemos:

freq. absoluta
n1
n2
...
...
nr

= n1 X1 + n2 X2 + + nr Xr =
X
n
16

Pr

ni Xi
.
n

i=1

1.3. MEDIDAS

cpa/gsa

Se conhecemos a frequencia relativa, o calculo da media passa a ser:


r

X
= n1 X1 + n2 X2 + + nr Xr = f r1 X1 + f r2 X2 + + f rr Xr =
X
fi Xi .
n
n
n
i=1
Exemplo: Para calcularmos a media dos dados abaixo:
X
1
2
3
5

freq. absoluta
3
4
2
1

freq. relativa
0,3
0,4
0,2
0,1

= 1 + 1 + 1 + 2 + 2 + 2 + 2 + 3 + 3 + 5 = 22 = 2,2 (pelos dados brutos)


X
10
10
= 1 3 + 2 4 + 3 2 + 5 1 = 2,2 (pela frequencia absoluta)
X
10
= 1 0,3 + 2 0,4 + 3 0,2 + 5 0,1 = 2,2 (pela frequencia relativa)
X

Dados agrupados em classe: Para calcularmos a media nestes casos devemos inicialmente calcular
o ponto medio de cada classe, denotando-o por P Mi . A partir disto calculamos a media usando a
frequencia absoluta ou a frequencia relativa com uma das seguintes expressoes:
=
X

Pn
i=1

P Mi ni
n

=
X

n
X

P Mi fi

i=1

Vamos calcular o peso medio dos alunos de nosso exemplo a partir da tabela de distribuicao de
frequencias (tabela 1.2), incluindo o ponto medio de cada classe;
Tabela 1.5: Peso - inclusao ponto medio da classe
Peso
44,0a 51,3
51,3a 58,6
58,6a 65,9
65,9a 73,2
73,2a 80,5
80,5a 87,8
87,8a 95,1
Total

P Mi
47,65
54,95
62,25
69,55
76,85
84,15
91,45
50

freq. abs.
10
19
7
7
1
5
1
1

freq. rel.
0,20
0,38
0,14
0,14
0,02
0,10
0,02

freq. acum.
0,20
0,58
0,72
0,86
0,88
0,98
1,00

Assim:
= 47,65 10 + 54,95 19 + 62,25 7 + 69,55 7 + 76,85 1 + 84,15 5 + 91,45 1 = 3032,2 = 60,64
X
50
50
ou:
= 47,650,20+54,950,38+62,250,14+69,550,14+76,850,02+84,150,10+91,450,02 = 60,64
X
17

1.3. MEDIDAS

cpa/gsa

Observacoes: a media e uma medida afetada por valores extremos. Veja no exemplo inicial em que a
media dos dados e 2,2, se retirarmos o valor 5 a media cai para 1,89.
Se pensarmos em calcular o valor medio de uma variavel para toda a populacao, teremos a media
populacional, normalmente designada pela letra grega (mi).
Mediana: e o valor que divide o conjunto de dados ao meio, de tal forma que pelo menos 50% dos valores observados sao menores ou iguais `a mediana e pelo menos 50% sao maiores ou iguais a ela. Notacao:
md ou M d. A mediana tambem caracteriza o elemento comum da amostra.
Exemplo: {1, 1, 1, 3, 3, 5, 3, 3, 2, 2}. Primeiro passo e ordenar os dados:
1

3 3

Os dois candidatos a md sao o 2 e o 3. entao tomamos o ponto medio entre eles como a mediana:
md = 2+3
2 = 2,5.
Se tivessemos:
1

4 4

Nesse caso, md = 3
Observacao: Sempre que houver um n
umero mpar de observacoes a mediana sera a observacao central na amostra ordenada da menor para a maior, e sempre que houver um n
umero par de observacoes a
mediana sera o ponto medio entre as duas observacoes centrais.
Dados agrupados em classe: Nesse caso os dados ja estao ordenados e os procedimentos sao:
1. Localize a classe mediana, que sera a primeira classe com frequencia relativa acumulada maior ou
igual a 0,5. Observe:
L - limite superior da classe mediana
l - limite inferior da classe mediana
2. Calcule a frequencia relativa da classe mediana. Chame-a de fmd
3. Determine a frequencia relativa acumulada ate a classe anterior `a classe mediana, ou famd
4. Calcule a diferenca 0,5 famd . Esta diferenca e a frequencia relativa da classe (l ` md)

50%

md

5. O valor da mediana e obtido resolvendo-se a seguinte equacao:


Ll
md l
=
0,5 famd
fmd

md = l + (L l)

18

0,5 famd
fmd

1.3. MEDIDAS

cpa/gsa

Assim para calcularmos a mediana dos pesos na tabela 1.5, seguimos o passo a passo:
1. Classe mediana: 51,3 a 58,6

L = 58,6

l = 51,3

2. fmd = 0,38
3. famd = 0,20
4. 0,5 famd = 0,30
5. md = 51,3 + (58,6 51,3)

30
(0,5 0,20)
= 51,3 + 7,3
= 57,06 kg
0,38
38

Observacao: a mediana nao e afetada por valores extremos.


Percentil: O percentil de ordem de um conjunto de dados e um valor P% tal que pelo menos %
dos valores sao inferiores ou iguais a ele e pelo menos (100 )% dos valores sao maiores ou iguais a ele.
Observacoes:
1. A mediana e o percentil de ordem 50.
2. Os percentis de ordem 25, 50 e 75 sao chamados respectivamente de Quartil 1, Quartil 2 e Quartil
3 (ou primeiro, segundo e terceiro quartis).
25%

75%

Q1
50%

50%

Q2
75%

25%

Q3
25%

25%

Q1

25%

Q2

25%

Q3

De forma similar ao calculo da mediana, para obtermos o percentil P a partir de uma tabela de
frequencia, seguimos os passos descritos abaixo:
1. Localizar a classe a qual pertence o percentil P .
2. Encontrar a frequencia relativa da classe onde esta P . Denote-a por fP .
3. Encontrar a frequencia acumulada ate a classe anterior `a classe do percentil P . Denote-a por faP .
4. Calcular a diferenca faP .
5. Fazendo a regra de tres:
L l
P l

fP
faP

P = l + (L l )

19

faP
f P

1.3. MEDIDAS

cpa/gsa

Exemplo:
Calcule o terceiro quartil da variavel peso da pesquisa, a partir da tabela 1.5.
Solucao:
1. Classe 65,9a 73,2
2. fP = 0,14
3. faP = 0,72
4. faP = 0,75 0,72 = 0,03
5. Q3 = P75 = 65,9 + 7,3

0,03
= 67,46 kg
0,14

o valor mais frequente na amostra. Notacao: mo ou M o. A moda representa tambem o


Moda: E
valor mais comum.
Exemplo:
No conjunto de observacoes {1, 1, 3, 3, 5, 3, 3, 2}, a moda e mo = 3.
Em um conjunto de dados pode haver mais de uma moda:
Exemplo:
Para o conjunto {1, 1, 1, 1, 3, 3, 3, 3, 5}, mo1 = 1 e mo2 = 3. Neste caso se diz que o conjunto e bimodal.
Se houver mais de duas modas diz-se que o conjunto e multimodal. Por outro lado se nenhum valor
se repete o conjunto nao tem moda.
Ponto medio: O valor que esta a meio caminho entre o menor e o maior valor de uma amostra:
ponto medio =

Maximo + Mnimo
2

Esta medida e menos usada, mas serve para ilustrar mais uma das diversas maneiras de se representar a
tendencia central de uma amostra.

1.3.2

Medidas de variabilidade

Medem o espalhamento ou dispersao dos dados. Complementam importantes informacoes escondidas


pelas medidas de tendencia central.
Amplitude total: A amplitude total de uma amostra e definida como a diferenca entre o maior e o
menor valor da amostra.
AT = M ax M in
Exemplo: a amplitude total da variavel altura da amostra dos alunos e AT = 1,85 1,45 = 0,40 m
(40 cm).

20

1.3. MEDIDAS

cpa/gsa

Variancia amostral (S 2 ): A variancia e uma medida de dispersao que leva em conta todas as observacoes feitas. Ela mede a dispersao em torno da media amostral x
.
Considere as observacoes: X1 , X2 , X3 , . . . , Xn :
Observacao

desvios

|desvios|

(desvios)2

X1
X2
...
...
Xn

(X1 X)

(X2 X)
...
...

(Xn X)

|X1 X|

|X2 X|
...
...

|Xn X|

2
(X1 X)
2
(X2 X)
...
...
2
(Xn X)

Temos:
Pn
n
n
n
n
n
n
n
X
X
X
X
X
X
X
Xi
=
=
=
(Xi X)
=
Xi
X
X i nX
Xi n i=1
Xi
Xi = 0
n
i=1
i=1
i=1
i=1
i=1
i=1
i=1
Assim define-se a variancia amostral como:
Pn
S2 =

2
X)
(n 1)

i=1 (Xi

Exemplo: Tome dois conjuntos a seguir, ambos com x


= 5 (Note tambem que ambos possuem a
mesma amplitude total e a mesma mediana):
conj. 1 = {3, 4, 5, 6, 7}

S12 =

conj. 2 = {3, 5, 5, 7}

(3 5)2 + (4 5)2 + (5 5)2 + (6 5)2 + (7 5)2


4+1+0+1+4
=
= 2,5
(n 1)
4
S22 =

(3 5)2 + (5 5)2 + (5 5)2 + (7 5)2


4+0+0+4
=
= 2,667
(n 1)
3

Observacao: Se tivessemos calculando a variancia de uma populacao de tamanho N teriamos:


PN
2

Variancia populacional = =

i=1 (Xi

)2

Alguns autores usam o denominador n na definicao da variancia amostral. Avaliaremos as vantagens


e desvantagens de cada denominador quando falarmos de Inferencia (captulo 5).
Inconvenientes da Variancia:
1. As unidades de medida da variancia amostral sao o quadrado da unidade original da variavel (m2
para altura, kg 2 para peso, etc.). Para evitar-se este desconforto estabeleceu-se o desvio padr
ao
definido por:
sP
n
2

i=1 (Xi X)
,
S = S2 =
(n 1)
que mostra a variabilidade medida na unidade original da variavel analisada.

21

1.3. MEDIDAS

cpa/gsa

2. A variancia nao permite comparar a variabilidade de dados medidos em diferentes unidades de


medida ou medidos na mesma unidade mas com medias diferentes. Aqui a solucao foi a criacao
de uma medida chamada coeficiente de variaca
o que nao sofre influencia nem da media nem da
unidade de medida. O coeficiente de variac
ao e definido como
S
CV amostral =
X
CV populacional =

(coef. variacao amostral= desvio padrao amostral dividido pela media amostral)

(coef. variacao populacional= desvio padrao dividido pela media populacional)

Exemplo: Em qual grupo ha mais variacao em torno da media:


Variavel
altura
peso

CVa =

media
1,70 m
60 kg

variancia
0,0025 m2
2,25 kg 2

0,0025
= 2,9%
1,70

CVp =

2,25
= 2,5%
60

Dados agrupados em classes Para calcular a variancia de dados agrupados em classes, considere
o ponto medio de cada classe, denotado por P Mi e faca;
Pk
2 ni
(P Mi X)
2
S = i=1
,
(n 1)
onde ni e a frequencia observada para a i-esima classe e k o n
umero de classes.
Se conhecemos apenas as frequencias relativas das classe, a variancia amostral poderia ser aproximada
por:
k

X
ni
2 fi
S2 =
(P Mi X)
fi =
e a frequencia relativa da classe i .
n
i=1
Exemplo: Determine a variabilidade em torno da media para o peso dos alunos da tabela da pagina
9, lembrando que ja calculamos o peso medio (60,64 kg):
Tabela 1.6: Peso - Calculo da variancia
P Mi
47,65
54,95
62,25
69,55
76,85
84,15
91,45
Total

freq. rel.
0,20
0,38
0,14
0,14
0,02
0,10
0,02

2
(P Mi X)
2
(47,65 60,64) = 168,740
(54,95 60,64)2 = 032,376
(62,25 60,64)2 = 002,592
(69,55 60,64)2 = 079,388
(76,85 60,64)2 = 262,764
(84,15 60,64)2 = 552,720
(91,45 60,64)2 = 949,256

2 fi
(P Mi X)
33,748
12,303
0,363
11,114
5,255
55,272
18,985
137,041

Assim vemos que S 2 = 137,041 kg 2 e por conseguinte S = s2 = 137,041 = 11,706 kg.


11,706
S
= 19,30 %.
E o coeficiente de variacao e CV = =
60,64
X
Observacao: A variancia tambem e afetada por valores extremos.

22

1.4. EXERCICIOS

cpa/gsa

Desvio medio: Medida de variabilidade em torno da media assim definida:


Pn

|Xi X|
DM = i=1
para dados nao agrupados,
n
DM =

n
X

i
(P Mi X)f

para dados agrupados em tabela de frequencia.

i=1

1.3.3

Propriedades da m
edia, mediana e vari
ancias amostrais

S 2 e medx representam
Considere a amostra X1 , X2 , . . . , Xn . Nas secoes anteriores, vimos que X,
X
respectivamente a media amostral, variancia amostral e mediana amostral; e definimos a formula de
calculo de cada uma dessas medidas.
Suponha agora que tenhamos de utilizar alguma relacao linear das observacoes dessa amostra. Como
exemplo, imagine que X seja o comprimento de parafusos e que o peso em gramas desses parafusos possa
ser calculado por Y = aX + b, onde a e b sao duas constantes qualquer. Pode-se provar que:
+b
Y = aX
medy = a medx + b
2
SY2 = a2 SX

1.4

Exerccios

Usando a tabela da pagina 25, com dados de 49 alunos de uma turma de engenharia civil do ICEX,
responda as questoes a seguir:
1. Defina o tipo e subtipo de cada uma das 8 variaveis da tabela.
2. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumulada para a variavel idade.
3. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumulada para a variavel peso. (Calcule o n
umero de classes pela formula de Sturges).
4. Construa um diagrama de Ramo e Folhas para a variavel altura. Utilize inicialmente 5 ramos e
depois, para melhor visualizacao, construa outro diagrama a partir do primeiro com 10 ramos.
5. Esboce um diagrama circular (ou pizza) para a variavel provedor.
6. Faca um grafico de barras com a variavel ano de incio do curso.

23

1.4. EXERCICIOS

cpa/gsa

7. Com auxlio da tabela do exerccio 3, esboce um histograma com a frequencia relativa da vari
avel
peso.
8. Calcule usando os dados brutos a media da variavel idade.
9. Usando a tabela construda no exerccio 3 encontre a media da variavel peso.
10. Usando o histograma abaixo, ache a mediana e o terceiro quartil (percentil 75%) da variavel altura.

Histograma da altura
30

0,306
0,265

Frequncia

25
20
15

0,122

10

0,102
0,082

0,082
5

0,041
0
1,55

1,61

1,67

1,73
1,79
Altura

1,85

1,91

1,97

11. Ache a(s) moda(s) da variavel bairro.


12. Usando a tabela construda no exerccio 3 encontre a variancia da variavel peso.
13. Usando a tabela construda no exerccio 2 ache o desvio padrao da variavel idade.

24

1.4. EXERCICIOS

No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49

cpa/gsa

Ano incio Idade


curso
(Anos)
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2008
2007
2007
2007
2008
2008
2008
2006
2008
2008
2008
2006
2007
2007
2008
2007
2008
2006
2008
2008
2008
2007
2007
2006
2009
2006
2006
2007

19
19
19
19
20
20
20
20
20
20
20
20
20
20
20
20
21
21
21
21
21
21
21
21
21
21
21
21
22
22
22
22
23
23
23
23
23
24
24
25
25
25
25
25
25
26
26
27
29

Peso
70
73
75
85
43
51
59
61
65
71
71
73
76
77
90
99
58
59
64
64
64
68
70
73
75
77
77
82
63
68
75
100
64
65
72
80
80
57
75
57
70
70
75
80
87
48
95
65
67

Altura
1,83
1,83
1,71
1,83
1,59
1,69
1,70
1,65
1,72
1,72
1,76
1,75
1,71
1,95
1,80
1,70
1,72
1,64
1,60
1,71
1,74
1,75
1,70
1,75
1,85
1,72
1,85
1,85
1,73
1,85
1,81
1,91
1,64
1,71
1,73
1,75
1,78
1,58
1,75
1,69
1,70
1,72
1,74
1,79
1,76
1,62
1,77
1,65
1,57

Naturalidade

Estado

Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Ipatinga
Belo Horizonte
Belo Horizonte
Varginha
Belo Horizonte
Belo Horizonte
Bom Despacho
Viosa
Belo Horizonte
Belo Horizonte
Patrocnio
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Salvador
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Formiga
Belo Horizonte
Itana
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Jaguarau
Montes Claros
Belo Horizonte
Santa Brbara
Sete Lagoas
Itabira
Belo Horizonte
Belo Horizonte
Sete Lagoas
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Santa Maria
Belo Horizonte
Timteo

MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
BA
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
RS
MG
MG

25

Bairro
Funcionrios
Prado
Anchieta
Nova Cachoeirinha
Betnia
Funcionrios
Serra
Ouro Preto
Liberdade
Santa Tereza
Corao Eucarstico
Prado
Sion
Santo Antnio
Nova Floresta
Ouro Preto
Dona Clara
Floresta
Barreiro
Serra
Jardim Amrica
Ouro Preto
Savassi
Buritis
Ferno Dias
Belvedere
Lourdes
Carlos Prates
Lourdes
Padre Eustquio
Luxemburgo
Caiara
Planalto
Nova Floresta
Floresta
So Joo Batista
Santa Ins
Liberdade
Santo Antnio
Dona Clara
Corao Eucarstico
Ouro Preto
Estoril
Padre Eustquio
Cento
Santo Andr
Sobradinho
Santa Cruz
Castelo

Provedor de internet
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
gmail.com
hotmail.com
gmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br
yahoo.com.br
hotmail.com
hotmail.com
gmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br
gmail.com
yahii.com.br
hotmail.com
hotmail.com
ig.com.br
hotmail.com
yahoo.com.br
hotmail.com
gmail.com
hotmail.com
yahoo.com.br
hotmail.com
yahoo.com.br
yahoo.com.br
gmail.com
yahoo.com.br
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br

Captulo 2

Probabilidade
2.1

Experimentos aleat
orios, espaco amostral e eventos

Experimento Aleat
orio - A ideia do que seja um experimento aleatorio e bastante intuitiva. Imaginemos dois times disputando a final de um campeonato de futebol. Se o jogo termina empatado, pode-se
jogar uma prorrogacao (tempo adicional), e no caso do empate persistir, pode-se decidir o campeao de
acordo com o historico de cada time, disputa de penaltes, etc. Persistindo o empate, pode-se decidir o
campeonato lancando uma moeda. Perante esses fatos, surge a pergunta: e justo definir o campeao dessa
forma? Milhares e ate milhoes de torcedores aceitam. Porque?
Pensemos em outro exemplo de experimento aleatorio. Suponha que um engenheiro observa a qualidade de um item (defeituoso ou nao defeituoso). Se a linha de producao estiver calibrada, espera-se que
uma proporc
ao muito pequena de itens apresentem defeito (1 em cada 100 ou em cada 1.000, por exemplo).
Os dois exemplos precedentes fornecem a ideia de um experimento aleatorio. No caso da moeda,
assumindo que ela seja honesta, nao temos argumento para acreditar que um dos resultados (cara ou
coroa) tenha maior chance de acontecer. No caso dos itens produzidos por uma linha de producao, naturalmente acreditamos que a proporcao de defeituosos seja muito pequena. Mas em ambos os casos, antes
de realizar o experimento, nao sabemos qual sera o resultado. Embora nao saibamos qual sera o resultado
na realizacao de um experimento, podemos ter certeza que no caso da moeda acontecera cara(C) ou coroa
(K), e no caso da linha de producao, sabemos que um item observado resultara defeituoso (D) ou nao
defeituoso (N). Alem do mais se realizarmos um n
umero n grande de cada experimento, espera-se que os
n
umeros de caras e coroas sejam proximos. Ja no caso dos itens observados, espera-se que a proporcao
de defeituosos seja pequena.
Nao daremos uma definicao formal de experimento aleatorio, mas os dois exemplos precedentes sao
ilustrativos. Ao nos referirmos a experimento aleatorio, usaremos a notacao . Exemplos:
1 : lancar uma moeda;
2 : observar a qualidade de um item de uma linha de producao
3 : observar a taxa de inflacao no mes de marco de 2010;
4 medir a altura de um aluno;
5 observar o tempo de vida de um equipamento;
6 contar o n
umero de alunos presentes na sala de aula.
26


2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS

cpa/gsa

No experimento 1 , ao lancarmos uma moeda, temos certeza que acontecera cara (C) ou coroa (K).
No experimento 2 temos certeza que o item observado sera defeituoso (D) ou nao defeituoso (N). isto e,
em cada caso sabemos qual e o conjunto de todos os resultados do experimento aleatorio. Chamamos a
esse conjunto de espa
co amostral e denotaremos por .
1 = {C, K} sera o espaco amostral associado ao experimento 1 ;
2 = {D, N} sera o espaco amostral associado ao experimento 2 .
analogamente temos,
3 = {r : r > 0};
4 = {X R : X > 0};
5 = {t R : t > 0};
6 = {0, 1, 2, . . . N }. Neste caso N sera o n
umero de alunos matriculados ou que frequentam as aulas.
O espaco amostral () foi definido como o conjunto de todos os resultados possveis de um experimento aleatorio. Quer dizer entao que representa o Conjunto Universo que conhecemos da Teoria
Elementar de Conjuntos. Dentro desse conjunto podemos definir subconjuntos e a cada desses subconjuntos chamaremos de evento.
No experimento 5 , podemos estar interessados em que o tempo de vida do equipamento atenda ao
tempo de garantia. Se o tempo e em anos, podemos estar interessados no evento em que t seja maior do
que 1.
Usaremos as primeiras letras do alfabeto em mai
usculas para representar eventos: A, B, C, . . . .
A = {t R : t > 1} representa o evento de que o equipamento atende ao tempo de garantia no experimento 5

2.1.1

Operaco
es com eventos

Uni
ao de eventos (AB) e o evento que ocorre se A ou B ou ambos eventos ocorrerem. O diagrama de
Venn utilizado para relacoes entre conjuntos pode ser utilizado para relacoes entre eventos. Imagine
que o espaco amostral seja representado pelos pontos no retangulo abaixo e que os eventos A e
B sao os subconjuntos nos pontos das regioes indicadas

Figura 2.1: Espaco amostral e eventos A e B

Figura 2.2: A B

Com auxlio dos operadores logicos ( ou e e) podemos descrever a operacao uniao de


eventos ilustrada na figura 2.2 como:
A B = { : A B}
27


2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS

cpa/gsa

Exemplo: Experimento: lancamento de um dado.


Evento A ocorre face par.
Evento B ocorre face par ou inferior a 4.

A B = {1, 2, 3, 4, 6}

Interse
c
ao de eventos (A B) e o evento que ocorre se A e B ocorrem simultaneamente.

W
Figura 2.3: A B
Podemos escrever:
A B = { : A B}
No mesmo exemplo anterior temos:
Evento A ocorre face par.
Evento B ocorre face par ou inferior a 4.

A B = {2}

Observacao 1: Se A B = , dizemos que A e B sao disjuntos ou mutuamente exclusivos.

W
Figura 2.4: A e B disjuntos
Observacao 2: As operacoes uniao e intersecao de eventos sao comutativas. Isto e:
AB =BA

AB =BA

formado
Eventos complementares (Notacao AC ) O evento AC ocorre se o evento A nao ocorre. E
C
por todos os pontos de que nao estao em A. Assim A = { :
/ A}

A
AC

Figura 2.5: AC e A sao complementares


A e AC sao eventos complementares se e somente se AC A = e AC A =
28


2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS

cpa/gsa

Exemplo: no lancamento de um dado, se A ocorrer face par, entao B ocorrer face mpar, e
evento complementar de A.
Diferen
ca de eventos (A B) e o evento em que A ocorre e B nao ocorre. Escrevemos:
A B = { : A
/ B}

W
Figura 2.6: A - B
Note que A B = A B C . Deixamos a prova como exerccio.
aquele evento em que A ou B ocorrem, mas nao ambos simultaneamente. ReDiferen
ca sim
etrica E
presentamos por:
A 4 B = (A B) (B A)

W
Figura 2.7: A 4 B

2.1.2

Operaco
es com mais de dois eventos

Propriedades Distributivas
PD1: A (B C) = (A B) (A C)
PD2: A (B C) = (A B) (A C)
As figuras abaixo ilustram as propriedades distributivas:

B
A

B
C

Figura 2.8: A (B C)

Figura 2.9: A (B C)

29


2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS

cpa/gsa

Leis de Morgan:
LM1: (A B)C = AC B C
LM2: (A B)C = AC B C

Figura 2.10: (A B)C

Figura 2.11: (A B)C

Provaremos PD1 e LM1 para ilustracao e deixaremos a prova dos outros dois resultados para o leitor.
Antes da prova, recordaremos as propriedades dos operadores logicos relacionando proposicoes.
Pensemos no exemplo seguinte: pela manha o aluno vai para a escola e `a tarde vai para a biblioteca
ou para o cinema. Essa proposicao composta e equivalente `a seguinte: Pela manha o aluno vai para a
escola e `a tarde vai para a biblioteca ou pela manha o aluno vai para a escola e `a tarde vai ao cinema.
Temos, no paragrafo precedente, um exemplo da propriedade distributiva dos operadores logicos. De
forma geral, sejam p, q e r tres proposicoes simples. Denotemos por p q e p q as proposicoes (p e q) e
(p ou q) respectivamente.
Pode-se provar que:
p (q r) (p q) (p r)
Omitimos a prova dessa propriedade, que pode ser feita atraves da construcao da tabela de valores
de verdade das duas proposicoes compostas p (q r) e (p q) (p r).
No exemplo do aluno, as proposicoes seriam:
p: O aluno vai para a escola pela manha;
q: o aluno vai para a biblioteca `a tarde;
r: o aluno vai ao cinema `a tarde.
Podemos provar a PD1 usando a propriedade distributiva dos operadores logicos. Uma forma de
provar igualdade de dois conjuntos e escolher um elemento arbitario de um deles e provar que pertence
ao outro.
Seja entao A (B C). Defina p : A, q : B e r : C. Entao:
A (B C) ( A) ( (B C))
( A) ( B C)
p (q r)
(p q) (p r)
( A B) ( A C)
( A B) ( A C)
{ (A B) (A C)}

30


2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS

cpa/gsa

Para provar LM1, apresentaremos outra propriedade dos operadores logicos. Sejam p e q duas
proposicoes. A negacao de p q e equivalente `a negacao de uma delas. Isto e, se N p representa a negacao
de p, entao:
N (p q) = (N p) (N q)
Aplicando essa propriedade e fazendo p : A e q : A podemos escrever:
(A B)C
/ (A B)
(
/ A) (
/ B)
( AC ) ( B C )
{ AC B C }

As propriedades distributivas e as leis de Morgan podem se estender para a uniao ou intersecao de


mais de dois eventos. Sejam B1 , B2 , . . . , Bn uma colecao de eventos e seja A um outro evento:
n

n
S
S
Bi =
PD1: A
(A Bi )
i=1

PD2: A

n
T

i=1

LM1:

n
T

i=1

LM2:

n
S

i=1

i=1

Bi

C
Bi

i=1
n
S
i=1

C
Bi

n
T

n
T
i=1

(A Bi )

BiC
BiC

B1

B2

B3

Figura 2.12: A

3
S

i=1

31

Bi

DE PROBABILIDADE
2.2. DEFINIC
AO

2.2

cpa/gsa

Definic
ao de probabilidade

2.2.1

Defini
c
ao frequentista de probabilidade

Como atribuirmos probabilidades a elementos do espaco amostral? A primeira ideia foi baseada em
caractersticas teoricas do fenomeno ou experimento e na observacao das frequencias de sua ocorrencia.
Da surgiu:
Defini
c
ao 1. Consideremos n repeticoes independentesde um experimento aleatorio . Seja A um
evento qualquer (A ). Defina
Pn (A) =

nA
n

(onde nA e o n
umero de vezes em que ocorre o evento A)

e defina
P(A) = lim Pn (A)
n

P(A) assim definida e chamada de probabilidade frequencial de A


Exemplos:
1. Num lancamento de um dado, a probabilidade de ocorrencia da face i e dada por
Pn ({i}) =

n{i}
# ocorrencia da face i
=
.
# total de lc. do dado
n

Quando o n
umero de lancamentos e muito grande, Pn ({i}) se estabiliza e voce toma esse valor como
a probabilidade de ocorrencia da face i.
2. Suponha que temos uma linha de producao em grande escala. Retiramos n itens desta linha de
producao, e a cada retirada contamos o n
umero de itens defeituosos (A= item defeituoso)
n
10
50
100
500
1000
5000

No defeituosos
0
2
6
29
51
249

Pn (A)
0/10 = 0
2/50 = 0,04
6/100 = 0,06
29/500 = 0,058
51/1000 = 0,051
249/5000 = 0,050

Observando a tabela acima vemos que P10 (A) = 0, P50 (A) = 0,04, P100 (A) = 0,06, e assim por
` medida que aumentamos o valor de n, espera-se que Pn (A) se aproxime da proporcao
diante. A
de defeituosos. Pela definicao frequentista de probabilidade vemos que a probabilidade de um item
defeituoso nesta linha de producao converge para 0,05.

32

DE PROBABILIDADE
2.2. DEFINIC
AO

2.2.2

cpa/gsa

Axiomas de probabilidade

A partir da definicao frequentista de probabilidade, apresentada na subsecao anterior, e imediato


observar que:
n
1. Pn () =
=1
n
2. Desde que 0 na n para todo n, entao 0 Pn (A) 1
3. Se A B = , entao Pn (A B) = Pn (A) + Pn (B)
Se em (1), (2) e (3) tomarmos o limite quando n , teremos:
A1) P() = 1
A2) 0 P(A) 1
A3) P(A B) = P(A) + P(B) se A B =
(A1), (A2) e (A3) sao chamdados Axiomas de probabilidade. Baseada nesses axiomas e construda
toda a Teoria de Probabilidade. (O leitor interessado em aprofundar estudos pode consultar, por exemplo, [5] ou [8]).
A seguir apresentaremos alguns resultados basicos que serao usados no decorrer da disciplina:
Proposi
c
ao 1.
n

n
S
P
P
Ai =
P(Ai ), se Ai Aj = para i 6= j : i,j = 1, . . . , n
i=1

i=1

Proposi
c
ao 2.
P() = 0
Proposi
c
ao 3.
P(AC ) = 1 P(A)
Proposi
c
ao 4.
Se A B, entao P(A) P(B)
Provas:
1. Faremos a prova para n = 3. O caso geral decorre do Princpio da Inducao Matematica. Se A1 , A2
e A3 sao tais que A1 A2 = A1 A3 = A2 A3 = entao
P(A1 A2 A3 ) = P(A1 (A2 A3 ))
= P(A1 ) + P(A2 A3 )
= P(A1 ) + P(A2 ) + P(A3 )
Observe que A1 (A2 A3 ) = (A1 A2 ) (A1 A3 ) =
2. e sao mutuamente exclusivos, e = . Assim pelo terceiro axioma P() = P() + P().
Mas pelo primeiro axioma P() = 1, logo P() = 0.
3. Como AC e A sao complementares temos A AC = e A AC = . Entao pelo axioma 3,
P(A) + P(AC ) = P() e pelo axioma 1, P(A) + P(AC ) = 1, logo P(AC ) = 1 P(A).
4. Podemos escrever B como B = A (AC B). Os eventos A e (AC B) sao disjuntos, entao pelo
axioma 3 podemos escrever P(B) = P(A) + P(AC B). Como, pelo axioma 2, P(AC B) 0 logo
P(B) P(A).
33

DE PROBABILIDADE
2.2. DEFINIC
AO

2.2.3

cpa/gsa

Regras de adi
c
ao

Uni
ao de dois eventos n
ao disjuntos: A probabilidade da uniao de dois eventos nao disjuntos e
dada por:
Proposi
c
ao 5.
P(A B) = P(A) + P(B) P(A B)
Podemos provar de maneira simples:
A B = A (B AC )

P(A B) = P(A) + P(B AC )

mas, B = (B A) (B AC )
assim P(B) = P(B A) + P(B AC )

ou P(B AC ) = P(B) P(B A)

Figura 2.13: A B C

levando em temos P(AB) = P(A)+P(B)P(AB).

Tr
es ou mais eventos: Expandindo o resultado da proposicao 5, podemos desenvolver formulas
para uniao de quantos eventos quisermos. Mas quanto maior o n
umero de eventos mais complexas ficam
estas formulas. Vamos registrar apenas para 3 eventos:
P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C)
Deixamos como exerccio a prova dessa proposicao (aplique duas vezes a proposicao 5).
Exemplo:
Todos os socios de um clube praticam pelo menos 1 esporte. Sabe-se que 60% deles praticam futebol,
55% praticam voleibol e 50% praticam peteca. Alem disso 30% praticam volei e peteca, 30% futebol e
volei e 25% futebol e peteca. Se voce escolher aleatoriamente um socio deste clube, qual a probabilidade
de que ele pratique os tres esportes?
Solucao:
Se chamarmos os eventos A = o socio pratica futebol, B = o socio pratica voleibol e C = o socio
pratica peteca, a probabilidade solicitada e P(A B C). Podemos escrever:
P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C) = 1
e da
0,60 + 0,55 + 0,50 0,30 0,30 0,25 + P(A B C) = 1

2.2.4

P(A B C) = 0,2

Defini
c
ao cl
assica de probabilidade

Defini
c
ao 2. Seja um experimento aleatorio com espaco amostral finito = {1 , 2 , . . . ,n }. Se temos
evidencias de que todos os resultados tem a mesma chance de acontecer, define-se
P(i ) =

1
n

i = 1, 2, . . . , n.
34

2.3. PROBABILIDADE CONDICIONAL

cpa/gsa

Para A , define-se
P(A) =

#A
n

onde #A = cardinal de A = n
umero de elementos de A.

Neste caso dizemos que os resultados i sao equiprovaveis.

2.3

Probabilidade Condicional

Defini
c
ao 3. Se B e um evento tal que P(B) > 0, a probabilidade condicional de um evento A dado
o evento B, denotada por P(A|B) e
P(A|B) =

P(A B)
P(B)

A probabilidade condicional de A dado B revela a incerteza que se tem sobre o evento A supondo a
ocorrencia do evento B. Podemos interpreta-la como a chance relativa de A restrita ao fato de que B
ocorreu.
Exemplos:
1. Uma classe de estatstica teve a seguinte distribuicao das notas finais:

Reprovados
Aprovados

Homens
4
8

Mulheres
6
14

Um aluno e sorteado na sala. Qual e a probabilidade de


(a) Se e mulher, ter sido aprovada.
(b) Ser mulher dado que foi aprovado.
(c) Ser mulher e ter sido aprovado.

Solucoes:
Defina os eventos A : ser aprovado e M : ser mulher, temos
(a) P(A|M ) =

P(AM )
P(M )

14/32
20/32

= 0,7

(b) P(M |A) =

P(M A)
P(A)

14/32
22/32

= 0,64

(c) P(A M ) = 14/32 = 0,4375

35

2.3. PROBABILIDADE CONDICIONAL

cpa/gsa

2. As informacoes abaixo referem-se aos candidatos que prestaram vestibular na UFMG em 2004:
Classe
Social
A
B
C
D
E
Total

Candidato foi
aprovado
Nao
Sim
2.974
393
17.394
1.725
17.618
1.040
8.034
265
2.482
64
48.502
3.487

Total
3.367
19.119
18.658
8.299
2.546
51.989

Um aluno e sorteado ao acaso. Qual e a probabilidade de:


(a) ter sido aprovado
(b) ser da classe A
(c) ser da classe A e ter sido aprovado
(d) ser da classe A ou ter sido aprovado
(e) ser da classe A uma vez que foi aprovado
(f) ter sido aprovado, uma vez que e da classe A
Solucoes:
Chamando os eventos A : o candidato ter sido aprovado e B : o candidato pertencer `a classe A,
temos
(a) P(A) =
(b) P(B) =

3.487
51.989
3.367
51.989

(c) P(A B) =

= 0,067
= 0,0647

393
51.989

= 0,0075

(d) P(A B) = P(A) + P(B) P(A B) = 0,067 + 0,0647 0,0075 0,1242


(e) P(B|A) =

P(AB)
P(A)

0,0075
0,067

= 0,1119

(f) P(A|B) =

P(BA)
P(B)

0,0075
0,0647

= 0,1159

36

E PROBABILIDADE TOTAL
2.4. REGRAS DA MULTIPLICAC
AO

2.4

2.4.1

cpa/gsa

Regras da multiplicac
ao e probabilidade total

Regra da multiplica
c
ao

Da mesma forma como foi definida P(A|B), se P(A) > 0 podemos definir
P(B|A) =

P(B A)
P(A)

Temos entao que:


P(A B) = P(A|B)P(B) = P(B|A)P(A)
Esta expressao e conhecida como regra da multiplica
c
ao.
Exemplo:
Acredita-se que na populacao de Belo Horizonte 20% de seus habitantes sofrem algum tipo de alergia,
sendo classificados como alergicos para fins de sa
ude p
ublica. Sendo alergico, a probabilidade de ter reacao
a certo antibiotico e de 0,5. Para os nao alergicos esta probabilidade e de apenas 0,05. Escolhendo-se
uma pessoa ao acaso da populacao de BH, qual a probabilidade de que ela:
(a) - Seja do grupo dos alergicos e tenha alergia ao ingerir o antibiotico?
(b) - Seja do grupo dos nao alergicos e nao tenha alergia ao ingerir o antibiotico?
Solucao:
Se fizermos A : ser do grupo dos alergicos e B : ter reacao, temos:
(a) P(A B) = P(B|A)P(A) = 0,5 0,2 = 0,1
(b) P(AC B C ) = P(B C |AC )P(AC ) = 0,95 0,8 = 0,76

2.4.2

Regra da probabilidade total

A regra da multiplicacao e u
til para determinarmos a probabilidade de um evento que dependa de
outros eventos.
Suponha que voce tenha duas linhas de producao de parafusos, 1 e 2, e que a primeira linha produza
1.000 parafusos por hora com uma taxa de defeitos de 0,02 e a segunda produza 500 parafusos por hora,
mas com uma taxa de defeitos 0,008. Escolhendo-se aleatoriamente um parafuso de um lote da producao
de uma hora das duas linhas, qual a probabilidade que ele seja defeituoso? Claramente a resposta depende
de qual linha saiu aquele parafuso.
Se chamarmos A parafuso saiu da linha 1, B parafuso saiu da linha 2 e C parafuso e defeituoso
podemos afirmar que
C = (C A) (C B)
e como (C A) e (C B) sao disjuntos podemos escrever que
P(C) = P(C A) + P(C B) = P(C|A)P(A) + P(C|B)P(B) = 0,02 2/3 + 0,008 1/3 = 0,016
37

E PROBABILIDADE TOTAL
2.4. REGRAS DA MULTIPLICAC
AO

cpa/gsa

De modo mais geral, para quaisquer 2 eventos A e B podemos escrever:


P(B) = P(B A) + P(B AC ) = P(B|A)P(A) + P(B|AC )P(AC )
Para generalizarmos o conceito da probabilidade total, definimos:
Defini
c
ao 4. Dizemos que os eventos A1 ,A2 , . . . ,An formam uma parti
c
ao do espaco amostral se
1. Ai Aj =
2.

n
S

i 6= j

i=1

3. P(Ai ) > 0

i = 1, 2, . . . , n

Figura 2.14: Exemplo de uma particao do espaco amostral

A1

A3

A2
A4

A5

A6

A7

Podemos assim enunciar o Teorema da Probabilidade Total:


Teorema 1. Seja {A1 ,A2 , . . . ,An } uma partic
ao do espaco amostral e seja B um evento qualquer,
ent
ao
n
X
P(B) =
P(Ai )P(B|Ai )
i=1

Figura 2.15: Teorema da probabilidade total

A1

A3

A2
A4
B

A5

A6

A7

Prova: Desde que os eventos A1 ,A2 , . . . ,An formam uma particao de , podemos escrever:
B = B (Ai ) = ni=1 (B Ai )

com [(B Ai ) (B Aj )] = para i 6= j.

Entao pelo axioma 3:


P(B) =

n
X

P(B Ai ).

i=1

38

2.5. TEOREMA DE BAYES

cpa/gsa

Se aplicarmos a regra do produto a cada termo da soma, temos:


P(B) =

n
X

P(Ai )P(B|Ai ).

i=1

Exemplo:
Uma montadora de veculos recebe diariamente em contrato de fornecimento just in time, 20% de
dado componente do fabricante A, 30% do fabricante B e 50% do fabricante C. Inspecoes anteriores nas
fabricas destes fornecedores mostraram que estes componentes produzidos por eles apresentavam taxas
de defeitos de 0,7%, 0,4% e 0,2% respectivamente. Cada veculo e equipado com um componente escolhido aleatoriamente entre os recebidos na vespera. Durante a vistoria final, o inspetor de qualidade da
montadora esta inspecionando este componente. Qual a probabilidade dele apresentar defeito?
Solucao:
Se chamarmos X o evento de que o componente inspecionado apresenta defeito, e A, B e C respectivamente o evento que o componente inspecionado foi fabricado respectivamente pelo fornecedor A, B ou
C, podemos escrever:
P(X) = P(A)P(X|A) + P(B)P(X|B) + P(C)P(X|C)
= 0,2 0,007 + 0,3 0,004 + 0,5 0,002
= 0,0014 + 0,0012 + 0,0010 = 0,0036

2.5

2.5.1

Teorema de Bayes

Independ
encia

Em alguns casos, a probabilidade condicional, P(B|A), pode ser igual a P(B). Neste caso especial, a
informacao da ocorrencia ou nao de A nao altera a probabilidade da ocorrencia de B. Assim podemos
definir:
Defini
c
ao 5. Dois eventos A e B sao independentes se qualquer uma das seguintes afirmacoes for
verdadeira:
1. P(A|B) = P(A)
2. P(B|A) = P(B)
3. P(A B) = P(A)P(B)
muito simples mostrar a equivalencia destas tres condicoes. Mostremos por exemplo a equivalencia
E
de (1) e (3): Suponha que (1) e verdadeira. Entao P(AB) = P(B)P(A|B) = P(B)P(A). Reciprocamente
P(A B)
= P(A).
se (3) e verdadeira, entao P (A|B) =
P(B)
Convidamos o leitor para demonstrar as outras equivalencias.

39

2.5. TEOREMA DE BAYES

cpa/gsa

Exemplos:
1. Usando os dados do vestibular de 2004 conclui-se que os eventos o candidato e aprovadoe o
candidato e da classe Anao sao independentes pois:
P(A) = 0,067

P(A|B) = 0,1159

2. Uma empresa produz pecas em duas maquinas (1 e 2). Estas maquinas podem apresentar desajustes
com probabilidades respectivamente 0,05 e 0,10. Suponha que as maquinas trabalhem de forma
independente. No incio do dia um teste e realizado e caso a maquina esteja fora do ajuste a
maquina para de operar e vai para manutencao. Para que se cumpra o nvel mnimo de producao
diaria e necessario que pelo menos uma maquina esteja funcionando. Qual a probabilidade de que
a empresa cumpra a producao do dia?
Solucao: Se fizermos O1 : maquina 1 esta operando e O2 : maquina 2 esta operando, a probabilidade
de que a producao seja cumprida e;
P(O1 ou O2 ) = 1 P[(O1 ou O2 )C ] = 1 P(O1C e O2C ) = 1 P(O1C O2C )
Mas pela independencia
P(O1C O2C ) = P(O1C )P(O2C ) = 0,05 0,10 = 0,005
E assim a probabilidade que a producao do dia seja cumprida e 1 0,005 = 0,995.
Quando consideramos tres ou mais eventos, podemos estender a definicao de independencia:
ao independentes, se e somente se para qualquer subconjunto
Defini
c
ao 6. Os eventos A1 ,A2 , . . . ,An s
destes eventos Ai1 , Ai2 , . . . , Aik
P(Ai1 Ai2 Aik ) = P(Ai1 ) P(Ai2 ) P(Aik )
Uma propriedade importante: Sejam A1 , A2 , . . . , An eventos independentes e seja B um evento
formado por operacoes entre os eventos Ai1 , . . . , Air e C um outro evento formado por operacao entre
alguns dos eventos restantes. Entao B e C sao eventos independentes. Essa e a chamada propriedade
hereditaria da independencia.
Exemplo:
Sejam A1 , A2 , . . . , A10 eventos independentes, entao
a- A1 (A5 A8 ) e A3 (A4 AC
ao independentes.
7 ) s
b- A1 A2 A3 e (A4 A5 ) (A6 A7 ) sao independentes.
Exemplo: O sistema mostrado a seguir so funciona se houver um caminho de componentes (numerados
de 1 a 6) funcionando do ponto A para o ponto B:
1
0,9
A

2
0,9
3
0,9

4
0,95
5
0,95

40

6
0,99

2.5. TEOREMA DE BAYES

cpa/gsa

A probabilidade de que cada componente funcione esta indicada. Assumindo que cada componente
funciona de forma independente, calcule a probabilidade que o sistema opere.
Solucao:
Defina:
Ai : componente i funciona, i = 1, . . . , 6;
B1 : subsistema formado pelos componentes 1, 2 e 3 funciona;
B2 : subsistema formado pelos componentes 4 e 5 funciona;
B3 : subsistema formado pelo componente 6 funciona;
A : sistema funciona.
Assim podemos escrever:
A = B1 B2 B3

= (A1 A2 A3 ) (A4 A5 ) (A6 )


Sabemos que P(A1 A2 A3 ) e dada por:
[P(A1 ) + P(A2 ) + P(A3 ) P(A1 A2 ) P(A1 A3 ) P(A2 A3 ) + P(A1 A2 A3 )]
e que como os componentes funcionam de forma independente e o mesmo que
[P(A1 ) + P(A2 ) + P(A3 ) P(A1 )P(A2 ) P(A1 )P(A3 ) P(A2 )P(A3 ) + P(A1 )P(A2 )P(A3 )]
assim:
P(B1 ) = 0,9 + 0,9 + 0,9 0,81 0,81 0,81 + 0,729 = 0,999
De forma equivalente:
P(A4 A5 ) = P(B2 ) = [P(A4 ) + P(A5 ) P(A4 )P(A5 )] = 0,95 + 0,95 0,9025 = 0,9975
Retornando a e usando a independencia podemos escrever:
P(A) = P(B1 ) P(B2 ) P(B3 ) = 0,999 0,9975 0,99 0,987

2.5.2

Teorema de Bayes

Partindo da definicao de probabilidade condicional e usando a comutatividade da intersecao podemos


escrever:
P(A B) = P(A|B)P(B) = P(B A) = P(B|A)P(A)
e agora, usando o segundo e quarto termos da igualdade vem um resultado u
til que nos permite escrever
a probabilidade de A dado B em termos da probabilidade de B dado A:
P(A|B) =

P(B|A)P(A)
P(B)

Partindo desta expressao, e escrevendo o denominador usando a regra da probabilidade total, obtemos
o Teorema de Bayes, que tem este nome em homenagem ao Reverendo Thomas Bayes, matematico ingles
da primeira metade do seculo XV I:
41

2.5. TEOREMA DE BAYES

cpa/gsa

Teorema 2 (Teorema de Bayes). Se A1 ,A2 , . . . ,An for uma partic


ao de e B qualquer evento, ent
ao
P(A1 |B) =

P(B|A1 )P(A1 )
P(B|A1 )P(A1 ) + P(B|A2 )P(A2 ) + + P(B|An )P(An )

Exemplos:
1. Suponha que um fabricante de sorvetes recebe 20% de todo o leite que consome da fazenda F 1,
30% da fazenda F 2 e o restante da F 3. A vigilancia sanitaria inspecionou as fazendas de surpresa
e observou que 20% dos galoes de leite produzidos na fazenda F 1 estavam adulterados por adicao
de agua, o mesmo ocorrendo com 5% e 2% dos galoes respectivamente produzidos nas fazendas F 2
e F 3. Na ind
ustria de sorvete os galoes de leite sao armazenados sem identificacao das fazendas
produtoras. Um galao e sorteado ao acaso na ind
ustria. Calcule:
(a) a probabilidade de que o galao esteja adulterado
(b) a probabilidade do galao estando adulterado ter vindo da fazenda F 1
Solucao:
(a) Seja A o leite esta adulterado e Fi o leite veio da fazenda Fi

A
F1

A = (A F1 ) (A F2 ) (A F3 )

F2

P(A) = P[(A F1 ) (A F2 ) (A F3 )]

F3

P(A) = P(A F1 ) + P(A F2 ) + P(A F3 )

Figura 2.16: 3 Fornecedores

P(A) = P(A|F1 )P(F1 )+P(A|F2 )P(F2 )+P(A|F3 )P(F3 )

Assim:
P(A) = 0,2 0,2 + 0,05 0,3 + 0,02 0,5 = 0,065
(b) Pelo teorema de Bayes temos
P(F1 |A) =

P(A|F1 )P(F1 )
0,2 0,2
=
= 0,6154
P(A|F1 )P(F1 ) + P(A|F2 )P(F2 ) + P(A|F3 )P(F3 )
0,065

2. Das pacientes da Clnica de Ginecologia com idade acima de 40 anos, 60% sao ou foram casadas e
40% sao solteiras. Sendo solteira, a probabilidade de ter tido um dist
urbio hormonal no u
ltimo ano
e de 10%, enquanto para as demais esta probabilidade aumenta para 30%. Pergunta-se:
(a) Qual a probabilidade de uma paciente escolhida ao acaso ter tido um dist
urbio hormonal no
u
ltimo ano?
(b) Se a paciente escolhida tiver tido um dist
urbio, qual a probabilidade dela ser solteira?
(c) Se escolhemos duas pacientes ao acaso e com reposicao, qual a probabilidade de pelo menos
uma ter o dist
urbio?

42

2.6. EXERCICIOS

cpa/gsa

Solucao:
Sejam os eventos S paciente e solteira e H paciente teve dist
urbio hormonal no u
ltimo ano.
(a) P(H) = P(H|S)P(S) + P(H|S C )P(S C ) = 0,10 0,40 + 0,3 0,6 = 0,22
(b) P(S|H) =

P(H|S)P(S)
P(H)

0,100,4
0,22

= 0,1878

(c) Seja Hi o evento de que a i-esima paciente tenha tido dist


urbio hormonal. Da:
P(H1 H2 ) =P(H1 ) + P(H2 ) P(H1 H2 )
=P(H1 ) + P(H2 ) P(H2 |H1 )P(H1 )
=0,22 + 0,22 0,222 = 0,3916

2.6

Exerccios

1. Prove que A (B C) = (A B) (A C).


2. Tres eventos sao mostrados no diagrama de Venn na Figura 2.17 a seguir:

B
C

Figura 2.17: Diagrama de Venn exerccio 2

Reproduza a figura e sombreie a regiao que corresponde a cada um dos seguintes eventos:
(a) Ac
(b) (A B) (A B c )
(c) (A B) C
(d) (B C)c
(e) (A B)c C

43

2.6. EXERCICIOS

cpa/gsa

3. Imagine o experimento aleatorio do lancamento de um dado honesto. O espaco amostral e {1, 2, 3, 4, 5, 6}.
Considere os eventos P : resultado e par, e Q : resultado e maior ou igual a 4. Calcule:
(a) P(P )
(b) P(Q)
(c) P(P C )
(d) P(P Q)
(e) P(P Q)

4. Se P(A) = 0,3 , P(B) = 0,2 e P (A B) = 0,1 determine:


(a) P(AC )
(b) P(A B)
(c) P(AC B)
(d) P(A B C )
(e) P[(A B)c ]
(f) P(AC B)

5. Discos de policarbonato plastico provenientes de um fornecedor sao analisados com relacao `a resistencia a arranhoes e a choques. Os resultados da analise de 100 discos estao resumidos a seguir:

resist
encia a
arranh
ao

alta
baixa

resist
encia a
choque
alta
baixa
80
9
6
5

Faca A denotar o evento em que um disco tenha alta resistencia a choque e B denotar o evento em
que um disco tenha alta resistencia a arranhao. Determine as seguintes probabilidades:
(a) P (A)
(b) P (B)
(c) P (A|B)
(d) P (B|A)

6. Uma empresa de embalagens trabalha com maquinas de corte de papelao. A aspereza nas bordas das
embalagens aumenta `a medida que as laminas da ferramenta de corte vao sendo gastas. Somente
1% das embalagens fabricadas com laminas novas exibem rugosidade. Esse percentual aumenta
para 3% se as laminas estiverem com meia-vida e para 5% no caso de laminas gastas. Se 25% das
laminas forem novas, 60% mediamente afiadas e 15% forem gastas, que proporcao de embalagens
produzidas pela empresa apresentarao aspereza nas bordas?
44

2.6. EXERCICIOS

cpa/gsa

7. Uma placa de aco contem 20 parafusos. Considere que cinco parafusos nao estejam apertados ate o
limite apropriado. Quatro parafusos sao selecionados ao acaso, sem reposicao, para verificacao do
torque.
(a) Qual e a probabilidade de que todos os quatros parafusos selecionados estejam apertados ate
o limite apropriado?
(b) Qual e a probabilidade de que no mnimo um dos parafusos selecionados nao tenha sido
apertado ate o limite apropriado?

8. O circuito a seguir opera se, e somente se, houver um caminho de equipamentos funcionais da
esquerda para a direita. Considere que os equipamentos falhem independentemente, sendo a probabilidade de falha de cada equipamento mostrada na Figura 2.18. Qual e a probabilidade de que
o circuito opere?

Figura 2.18: Circuito do Exerccio 8

9. Em uma operacao de enchimento automatico, a probabilidade de enchimento incorreto quando o


processo e operado a baixa velocidade e 0,001. Quando o processo e operado a alta velocidade, a
probabilidade de enchimento incorreto e 0,01. Suponha que 30% dos reservatorios sejam enchidos
quando o processo e operado a alta velocidade e o restante sejam enchidos a baixa velocidade.
(a) Qual e a probabilidade de um reservatorio incorretamente enchido?
(b) Se um reservatorio incorretamente enchido for encontrado, qual e a probabilidade de que ele
tenha sido enchido durante a operacao em alta velocidade?

10. Considere o circuito dado na Figura 2.19. Assuma que os equipamentos falhem independentemente,
sendo que a probabilidade de falha de cada equipamento esta indicada. Qual e a probabilidade de
que o circuito opere?

Figura 2.19: Circuito do Exerccio 10

45

2.6. EXERCICIOS

cpa/gsa

11. Sabe-se que 6%, 8% e 10% dos parafusos produzidos pelas empresas A, B e C respectivamente, sao
defeituosos. Uma empresa de montagens compra 40% dos parafusos que utiliza da empresa A, 40%
da empresa B e o restante da empresa C.
(a) Da compra realizada em um mes, um parafuso e inspecionado. Qual a probabilidade de que
ele seja defeituosa?
(b) Se o parafuso inspecionado apresentar defeito, qual a probabilidade de que tenha sido produzido
pela empresa B?
12. A u
ltima pesquisa de amostra de domiclios realizada em um bairro da periferia de Belo Horizonte
constatou que 80% das residencias possuiam televisao, 60% possuiam radio e 35% computador.
Alem disso 20% dos domiclios pesquisados possuiam TV e computador, 15% computador e radio, e
10% possuiam os tres itens da pesquisa (TV, radio e computador). Qual o percentual de domiclios
com TV e radio?
13. A U.F.M.G. recebe giz de tres fabricantes diferentes, digamos A, B e C, numa proporcao respectivamente de 60%, 30% e 10%. Testes anteriores demonstram que o percentual de quebra desses
fabricantes e de 2% (fabricante A), 5% (fabricante B) e 7% (fabricante C). Um professor retira
aleatoriamente de uma caixa um giz. Responda:
(a) Qual a probabilidade do giz retirado estar quebrado?
(b) Se o giz estiver quebrado, qual a probabilidade dele ter sido fabricado pelo fornecedor B?
(c) Se o giz estiver inteiro, qual a probabilidade de ter sido fabricado pelo fornecedor C?

14. A vari
avel aleatoria X assume os valores relacionados na tabela a seguir, com as correspondentes
probabilidades.
X
f(x)

0
0,04

1
0,18

2
0,31

3
0,28

4
0,14

5
0,04

6
0,01

(a) Calcule a funcao de probabilidade acumulada F (X), descreva-a detalhadamente e esboce seu
grafico.
(b) Calcule a P(X 3) e P(2 X < 5).
(c) Qual a media e a variancia dessa V.A.?

46

Captulo 3

Vari
aveis Aleat
orias Discretas
3.1

Introduc
ao

Nem todo espaco amostral e constitudo por n


umeros. O objetivo de uma variavel aleatoria e quantificar cada elemento do espaco amostral. Assim definimos:
Defini
c
ao 7. Uma vari
avel aleat
oria e uma funcao que associa um n
umero real a cada resultado do
espaco amostral de um experimento aleatorio
Suponha o experimento simples de inspecionar dois itens em uma linha de producao. O espaco
amostral desta experiencia e = {DD, DN, N D, N N } onde D representa item defeituoso e N item nao
defeituoso. Uma variavel aleatoria pode ser n
umero de itens defeituosos observados.

D D

D N

N D

N N

Uma variavel aleatoria e denotada por um letra mai


uscula (por exemplo X) e os valores que ela pode
assumir como xi . No exemplo anterior os valores que a varavel aleatoria n
umero de itens defeituosos
observadospode assumir sao x1 = 0, x2 = 1 e x3 = 2.
Desde que X e uma funcao, o conjunto dos valores possveis de uma variavel aleatoria X e referido
como contradomnio de X e sera denotado por RX , com RX R. A partir deste conceito divimos as
variaveis aleatorias em:
Defini
c
ao 8. Uma variavel aleatoria discreta e uma variavel aleatoria com contradomnio finito ou
infinito enumeravel.
Uma variavel aleatoria contnua e aquela cujo contradomnio e um intervalo ou um subconjunto dos
n
umeros reais.
47

3.2. VARIAVEIS
ALEATORIAS
DISCRETAS

cpa/gsa

Exemplos de variaveis aleatorias contnuas: peso, altura, corrente eletrica, pressao, temperatura,
tempo.
Exemplos de variaveis aleatorias discretas: n
umero de pecas defeituosas em um lote, bits transmitidos que foram recebidos com erros, pessoas doentes em uma amostra da populacao.

3.2

Vari
aveis aleat
orias discretas

Alguns exemplos de variaveis aleatorias discretas:


1. Um sistema de comunicacao por voz de uma empresa possui 48 linhas externas. A cada intervalo
de tempo o sistema e supervisionado e registra-se o n
umero de linhas em uso. Se fizermos X =
n
umero de linhas em uso. Os valores possveis de X = {0, 1, 2, . . . , 48}.
2. No processo de fabricacao de semicondutores, o fabricante deve se preocupar com o n
umero de
partculas contaminantes. Se definirmos a variavel aleatoria Y = n
umero de partculas contaminantes em uma pastilha, os valores possveis de Y = {0, 1, 2, . . . }
3. Na construcao de um predio as fundacoes de estacas cravadas devem atingir 15 metros de profundidade. A cada 5 metros o operador registra se houve alteracao no ritmo de perfuracao previamente
estabelecido. Cada alteracao registrada representa um custo adicional de 50 UPCs (unidade padrao
de construcao) no custo total da fundacao. Como se comporta a variavel Z = custo da fundac
ao?
4. O estabelecimento de polticas de abastecimento do Centro Comunitario Sa
ude Pediatrica de determinado bairro e estabelecido conforme o n
umero de criancas da regiao. O u
ltimo censo indicou
que 20% das famlias nao tem filhos, 30% possuem 1 filho, 35% possuem 2 filhos e as demais se
dividem igualmente entre 3, 4 ou 5 filhos. Definimos a variavel N = n
umero de filhos.

3.3

Distribuic
oes de probabilidades e func
oes de probabilidade

Frequentemente estamos interessados na probabilidade com que uma variavel aleatoria assume um
valor em particular.
Fun
c
ao de probabilidade Um modelo probabilstico consiste em atribuir a cada valor da v.a. X
a sua probabilidade de ocorrencia. A funcao que atribui a cada valor xi de X a sua probabilidade e
chamada de fun
c
ao de probabilidade ou fun
c
ao de massa. Assim, se X e uma variavel aleatoria
assumindo os valores x1 , x2 , x3 , . . . , xN a funcao de probabilidade fX () associada a X e:
fX (xi ) = P(X = xi )

i = 1, 2, 3, . . . , N

No exemplo da variavel aleatoria n


umero de pecas com defeito observadas, supondo que a linha de
producao e em grande escala e produz 6% de itens defeituosos, a funcao de probabilidade de X esta
representada na tabela abaixo:
X
pi

x1
0
0,8836

x2
1
0,1128

48

x3
2
0,0036

3.3. DISTRIBUIC
OES
DE PROBABILIDADES E FUNC
OES
DE PROBABILIDADE

Podemos escrever tambem:

cpa/gsa

0,8836 se x = 0,
0,1128 se x = 1,
fX (x) =

0,0036 se x = 2.

Sao propriedades da funcao de probabilidade:


fX (xi ) 0

xi

n
X

fX (xi ) = 1

i=1

Variaveis aleatorias sao tao importantes que algumas vezes ignoramos o espaco amostral original e
so trabalhamos com a distribuicao de probabilidades da v.a. Assim sendo no exemplo da inspecao dos
dois itens, resumimos o experimento nos valores possveis de X ({0, 1, 2}) e nao no espaco amostral
= {DD, DN, N D, N N }.
Exemplo:
Com os dados do u
ltimo censo a assistente social do centro de sa
ude constatou que na regiao 20% das
famlias nao tem filhos, 30% possuem 1 filho, 35% possuem 2 filhos e as demais se dividem igualmente
entre 3, 4 ou 5 filhos. Suponha que uma famlia seja escolhida aleatoriamente e defina a v.a. N como o
n
umero de filhos desta famlia.
(a) Construa a funcao de probabilidade para N e (b) Desenhe o seu grafico
Solucao:
Se N e o n
umero de filhos na famlia temos que os valores possveis de N sao: {0, 1, 2, 3, 4, 5}. Supondo
que todas as famlias tem chances iguais de serem sorteadas:
(a) Funcao de probabilidade
fN (0) = P(N = 0) = 0,20
fN (3) = fN (4) = fN (5) =

fN (1) = P(N = 1) = 0,30

fN (2) = P(N = 2) = 0,35

1 [fN (0) + fN (1) + fN (2)]


1 0,20 0,30 0,35
=
= 0,05
3
3

(b) Grafico:

fN(n)
0,35
0,30
0,20

0,05

49


ACUMULADAS
3.4. FUNC
OES
DE DISTRIBUIC
AO

3.4

cpa/gsa

Funco
es de distribuic
ao acumuladas

` vezes necessitamos de expressar probabilidades acumuladas. No exemplo anterior poderamos estar


As
interessados na probabilidade da famlia sorteada ter 2 ou menos filhos.
Este valor seria:
P(N 2) = P(N = 0) + P(N = 1) + P(N = 2) = 0,20 + 0,30 + 0,35 = 0,85
Vemos assim que o uso de probabilidades cumulativas e um metodo alternativo de descrever uma
variavel aleatoria. Assim definimos:
Defini
c
ao 9. A fun
c
ao de distribui
c
ao cumulativa de uma variavel aleatoria discreta X avaliada
em x, denotada por F (x), e
X
F (x) = P(X x) =
f (xi )
xi x

O grafico abaixo representa a funcao de distribuicao cumulativa da variavel aleatoria N do exemplo


anterior:

FN (n)
1,00
0,85

0,50

0,20

Note que, mesmo se a variavel aleatoria so pode assumir valores inteiros, a funcao de distribuicao
cumulativa podera ser definida em valores nao inteiros.
Na figura anterior:
F (2,5) = P(N 2,5) = P(N 2) = 0,85
Propriedades da fun
c
ao de distribui
c
ao cumulativa:
1. Se x < y F (x) F (y)
2. lim+ F (x) = F (a)

(F e contnua `a direita)

xa

3.

(F e nao decrescente)

lim F (x) = 0 e lim F (x) = 1

50

3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA

cpa/gsa

A prova de (1) e simples:


F (x) = P(X x).
Se x < y = [X y] = [X x] [x < X y].
A prova das propriedades (2) e (3) fogem do escopo deste curso. Detalhes podem ser encontrados em
[8].
Podemos, a partir da funcao de distribuicao, determinar a funcao de probabilidade de uma v.a. como
vemos no exemplo a seguir:
Exemplo:
Suponha que a funcao de distribuicao cumulativa da v.a. X e seu respectivo grafico sejam:
FX(x)
1,00

0,2
F (x) =
0,7

se
se
se
se

x < 2,
2 x < 0,
0 x < 2,
2 < x.

0,70

0,20

-2

Pelo grafico de F (x) podemos ver que os u


nicos pontos que recebem probabilidade diferente de zero
sao 2, 0 e 2 e assim:
f (2) = 0,2 0 = 0,2

f (0) = 0,7 0,2 = 0,5

f (2) = 1 0,7 = 0,3

Ou seja, a v.a. X assume os valores {2, 0, 2} com probabilidades respectivamente 0,2; 0,5 e 0,3.
Em geral se a variavel aleatoria pode assumir os valores x1 < x2 < x3 < . . . ; e se conhecemos F (xk )
para cada xk RX , podemos escrever:
f (xk ) = F (xk ) F (xk1 )

3.5

M
edia e vari
ancia de uma vari
avel aleat
oria discreta

Dois n
umeros sao frequentemente usados para resumir a distribuicao de uma variavel aleatoria. A
m
edia e a medida do centro ou meio da distribuicao de probabilidade e a vari
ancia e a medida da
dispersao ou variabilidade da distribuicao. Estas medidas nao sao caractersticas exclusivas de uma
distribuicao, ja que podemos ter duas distribuicoes diferentes com mesma media e mesma variancia (veja
figura 3.1) , mas mesmo assim sao importantes e u
teis.

51

3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA

10

cpa/gsa

10

Figura 3.1: Distribuicoes diferentes com mesma media e variancia


Vimos no captulo 1 que para uma amostra de dados a media e variancia amostrais eram
n

1X
x
=
xi
n i=1

X
1
S =
(xi x
)2 .
(n 1) i=1
2

Para uma variavel aleatoria discreta temos:


Defini
c
ao 10.
A m
edia ou valor esperado de uma variavel aleatoria discreta X, denotada(o) como ou E(X), e
X
= E(X) =
xk f (xk )
k

A vari
ancia de X, denotada por 2 ou V (X), e
X
X
2 = V (X) = E(X )2 =
(xk )2 f (xk ) =
x2k f (xk ) 2
k

O desvio padr
ao de X e
=

Vemos portanto que a media de uma variavel aleatoria discreta e a media ponderada dos valores
possveis de X, onde os pesos sao as probabilidades.
De forma similar a variancia usa f (x) como peso para multiplicar cada desvio quadrado (x )2 .
A igualdade das formulas da variancia apresentadas acima pode ser demonstrada usando propriedades
dos somatorios e a definicao de :
X
X
X
X
V (X) =
(x )2 f (x) =
x2 f (x) 2
xf (x) + 2
f (x)
x

x
2

x f (x) 2 + =

x
2

x
2

x f (x)

Quando mais de uma variavel aleatoria estiverem envolvidas em um estudo, nas medias e nas variancias
usaremos um subscrito para diferencia-las, ou seja:
X : sera a media da v.a. X

Y : sera a media da v.a. Y

2
X
: sera a variancia da v.a. X

52

Y2 : sera a media da v.a. Y

3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA

cpa/gsa

Exemplo:
Um canal digital transmite dados com certa probabilidade de erro. Seja X o n
umero de bits recebidos
com erro nos quatro proximos bits transmitidos. Os valores possveis de X sao {0,1,2,3,4}. Suponha que
tenhamos as seguintes probabilidades:
P(0) = 0,6561

P(1) = 0,2916

P(2) = 0,0486

P(3) = 0,0036

P(4) = 0,0001

Calcule a media e a variancia da v.a. X.


Solucao:
= E(X) = 0f (0) + 1f (1) + 2f (2) + 3f (3) + 4f (4)
= 0(0,6561) + 1(0,2916) + 2(0,0486) + 3(0,0036) + 4(0,0001)
= 0,4
Para calcularmos a variancia e conveniente montarmos a tabela:
x
0
1
2
3
4

x 0,4
0,4
0,6
1,6
2,6
3,6

(x 0,4)2
0,16
0,36
2,56
6,76
12,96

Assim:
V (X) = 2 =

5
X

f (x)
0,6561
0,2916
0,0486
0,0036
0,0001

f (x)(x 0,4)2
0,104976
0,104976
0,124416
0,024336
0,001296

f (xi )(xi 0,4)2 = 0,36

i=1

Algumas propriedades da media e da variancia:


1. Se X e uma v.a. nao negativa entao E(X) 0
P
Prova: E(X) = x xi pi como xi 0 e pi 0 logo E(X) 0
2. Se X = c entao E(X) = c
Prova: Como X = c P(X = c) = 1 e da E(X) = cP(X = c) = c
3. E(aX + b) = aE(X) + b
Prova: Podemos facilmente
ver que
P(X = x1 ) = P1 logo E(aX + b) =
1 + b) = P
P
Pn
PnP(aX + b =
Pax
n
n
n
i=1 (axi + b)pi =
i=1 (axi )pi +
i=1 bpi = a
i=1 xi pi + b
i=1 pi = aE(X) + b
4. E(X + Y ) = E(X) + E(Y )
5. Para qualquer variavel aleatoria X temos V (X) 0
6. Se X = c entao V (X) = 0
7. V (aX + b) = a2 V (X)
8. Se X e uma v. aleatoria discreta com funcao de probabilidade f () e h uma funcao de X, entao
X
h(xk )f (xk )
E[h(X)] =
k

53


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Exemplo:
Com os dados do exemplo anterior onde X e o n
umero de bits com erro nos proximos 4 transmitidos,
qual o valor esperado do quadrado do n
umero de erros?
Solucao:
h(x) = X 2 e portanto
E[h(X)] = E(X 2 ) = 02 0,6561 + 12 0,2916 + 22 0,0486 + 32 0,0036 + 42 0,0001 = 0,52.
(Note que este valor e diferente de E(X)2 = 0,42 = 0,16. A E(X 2 ) nao e, de modo geral, igual a E(X)2 ).

3.6

Distribuic
oes discretas mais comuns

Estudaremos nesta secao a distribuic


ao de probabilidade de algumas variaveis aleatorias, que por
possurem caractersticas especiais comuns sao agrupadas em famlias, que recebem denominacoes que
remetem a estas caractersticas especiais. Estas variaveis aparecem constantemente em aplicacoes e
experimentos reais, que podem ser modelados a partir do conhecimento das caractersticas destas variaveis
aleatorias.

3.6.1

Distribui
c
ao uniforme discreta

A v.a. discreta mais simples e aquela que assume apenas um n


umero finito de valores, cada qual com
a mesma probabilidade. Definimos
Defini
c
ao 11. Uma variavel aleatoria X tem uma distribui
c
ao uniforme discreta se cada um dos n
valores de seu contradomnio, isto e x1 , x2 , . . . , xN tiver igual probabilidade. Assim
f (xi ) = 1/N

i = 1, . . . , N

Suponha que X tem distribuicao uniforme e que assuma os valores {x1 , x2 , . . . , xN } temos
E(X) =

N
X

xi pi =

i=1

V (X) = E(X ) [E(X)] =

xi

i=1

PN
2

N
X

i=1

x2i

1
=
N

"P

N
i=1

xi

PN
i=1

xi

#2
=

PN
i=1

PN
x2i [ i=1 xi ]2
N2

Suponha agora que o contradomnio de X seja constitudo pelos inteiros consecutivos a, a + 1, a +


1
. Assim
2, . . . , b. Vemos que a v.a. assume (b a + 1) valores, cada um com probabilidade
(b a + 1)
podemos calcular:
b
!

b
b
a1
X
X
X
X
1
1
1
k
=
=
k=
k
k
(b a + 1)
(b a + 1)
(b a + 1)
k=a
k=a
k=1
k=1

1
b(b + 1) (a 1)a
b+a
=
=
(b a + 1)
2
2

54


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Observacao: Temos usado que:


1. A soma dos inteiros 1, 2, . . . , r e igual a

r(r + 1)
.
2

2. A soma dos quadrados 12 , 22 , . . . , r2 e igual a

r(r + 1)(2r + 1)
.
6

Essas sao propriedades que valem para todo n


umero natural e o leitor pode provar usando o Princpio de
Inducao Matematica.

2
b+a
1
V (X) = E(x ) [E(X)] =

k
(b a + 1)
2
k=a
" b
#
2
a1
X
X
1
b+a
2
2
=
k
k
(b a + 1)
2
k=1
k=1


2
1
b(b + 1)(2b + 1) (a 1)a(2a 1)
b+a
=

(b a + 1)
6
6
2
3

2
1
2b + 3b2 + b 2a3 + 3a2 a
b+a
=

(b a + 1)
6
2
2
2
2
2
2a + 2ab a + 2b + b b + 2ab + a
=

6
4
a2 2ab 2a + b2 + 2b
(b a + 1)2 1
=
=
12
12
2

b
X

Exemplos:
1. No lancamento de um dado honesto, seja a variavel aleatoria X o n
umero da face superior. Qual a
esperanca e a variancia de X?
Solucao
E(X) =

6+1
= 3,5
2

V (X) =

(6 1 + 1)2 1
2,92
12

umero de
2. A central telefonica de uma empresa possui 48 linhas externas. Defina a v.a. X como o n
linhas ocupadas em determinado instante, e considere que X tenha distribuicao uniforme discreta.
Se definirmos Y como a proporcao das linhas telefonicas que estao em uso em determinado instante,
qual a media e variancia de Y ?
Solucao
Em primeiro lugar note que se Y e a proporcao de linhas ocupadas, entao Y = X/48. Ou seja,
Y = aX onde a = 1/48. Pelas propriedades da media e variancia de variaveis aleatorias temos que
E(aX) = aE(X) e V ar(aX) = a2 V ar(X). Entao calculamos:
1 (0 + 48)
1
E(X) =
= 0,5
48
48
2
[(48 0 + 1)2 1]/12
2400/12
200
V (Y ) = V (X/48) = V (X)/482 =
=
=
0,087.
2304
2304
2304
E(Y ) = E(X/48) =

55


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

3.6.2

cpa/gsa

Distribui
c
ao de Bernoulli

Experimento de Bernoulli: Dizemos que o experimento e de Bernoulli se existem dois resultados


possveis: sucesso (S) com probabilidade p e fracasso (F ) com probabilidade (1 p).
Considere um experimento de Bernoulli com probabilidade p de sucesso. Defina X(S) = 1 e X(F ) = 0.
Sendo assim, P(X = 1) = p e P(X = 0) = 1 p , o que pode ser representado por
f (x) = px (1 p)1x ,

x = 0 ou x = 1

A variavel X assim definida tem Distribuicao de Bernoulli, notacao: X Bernoulli(p)


M
edia e vari
ancia: Podemos ver que
E(X) =

1
X

xf (x) = 0f (0) + 1f (1) = 0p0 (1 p)1 + 1P 1 (1 p)0 = p

x=0

V (X) = E(X 2 ) [E(X)]2 = 02 (1 p) + 12 (P ) p2 = p p2 = p(1 p)


Exemplos: lancamento de uma moeda, escolha de uma peca em um lote, etc.

3.6.3

Distribui
c
ao binomial

Se realizamos n repeticoes independentes de um experimento de Bernoulli com probabilidade p de


sucesso, ent
ao definimos a variavel aleatoria X: n
umero de sucessos ocorridos.
X : S RX

com RX R

Calculo da funcao de probabilidade de X: em primeiro lugar e facil ver que RX = {0,1,2 . . . ,n}.
Calculemos entao P(X = k). Para calcular esta probabilidade, precisamos contar o n
umero de sequencias
de tamanho n contendo k S 0 s e n k F 0 s. Se todos os S 0 s e todos os F 0 s fossem diferentes teramos n!
sequencias diferentes (n
umero de arranjos de n elementos diferentes).
Por simplicidade tomemos a sequencia S1 S2 S3 . . . Sk F1 F2 F3 ...Fnk . Por considerarmos os S 0 s diferentes, essa sequencia e diferente de S2 S1 S3 . . . Sk F1 F2 F3 ...Fnk e e diferente de qualquer outra sequencia
obtida trocando algumas posicoes dos S 0 s. Entao por considerarmos os S 0 s diferentes, cada sequencia
esta sendo repetida k! vezes. Pelo mesmo argumento cada sequencia esta sendo repetida (n k)! vezes
por considerarmos os F 0 s diferentes. Entao, como na realidade nao ha diferencas entre os S 0 s e nem entre
os F 0 s, o n
umero de sequencias com kS 0 s e (n k)F 0 s e igual a:

n!
n
=
k!(n k)!
k
Finalmente, desde que as repeticoes dos experimentos sao independentes, a probabilidade de uma
sequencia com kS 0 s e (n k)F 0 s e igual a pk (1 p)nk .
Conclui-se, entao, que:
n!
P(X = k) =
pk (1 p)nk =
k!(n k)!


n k
p (1 p)nk
k

56

para k = 0, 1, . . . , n.


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Podemos entao formalizar a:


Defini
c
ao 12. A variavel aleatoria X que conta o n
umero de sucessos em n repeticoes independentes
de experimentos de Bernoulli (somente dois resultados possveis designados como sucessoe fracassoe
a probabilidade de sucesso em cada tentativa, denotada por p, constante), tem distribui
c
ao binomial
com parametros n e p, notacao X b(n,p) e funcao de probabilidade:

n x
f (x) =
p (1 p)nx ,
x = 0, 1, . . . , n
x
O nome da distribuicao vem da expansao binomial. Lembre-se que para as constantes a e b temos:
(a + b)n =

n
X
n k nk
a b
k

k=0

Partindo da expansao binomial, fazendo a = p e b = 1 p podemos checar que a soma das probabilidades para uma variavel aleatoria binomial e igual a 1, conforme esperado, ja que
n
X
n k nk
a b
= (a + b)n = (p + 1 p)n = 1
k

k=0

Exemplos:
1. A eficiencia de uma vacina e de 80%. Sorteamos 3 indivduos em uma populacao vacinada, e estes
sao submetidos a um teste de imunizacao.
(a) Encontre a distribuicao do n
umero de individuos imunizados na amostra.
umero de indivduos imunizados na amostra ser maior ou igual a 1?
(b) Qual a probabilidade do n
Solucao:
(a) Se chamarmos de sucesso o fato do indivduo sorteado estar imunizado, vemos que p = 0,80.
A v.a. aleatoria X, n
umero de sucessos na amostra, pode assumir os valores {0,1,2,3} Vemos
entao que X b(3; 0,8), pois a probabilidade de cada indivduo ser imunizado e 0,8 e esta
probabilidade e fixa para todo indivduo. Alem disso, saber que um indivduo e imunizado
nao modifica a incerteza sobre os outros indivduos, ou seja, os eventos sao independentes.
(b)

3
P(x 1) = P(x = 1) + P(x = 2) + P(x = 3) = 1 P(x = 0) = 1
0,80 0,23
0

3!
=1
1 0,008
0!3!
= 1 0,008 = 0,992
2. Uma linha de producao em grande escala produz 6% de itens defeituosos. 30 itens da producao
semanal sao observados. Calcular a probabilidade de
(a) Observar no maximo 2 defeituosos?
(b) Observar entre 8 e 10 defeituosos?

57


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Solucao
(a) Se X e o n
umero de itens defeituosos na amostra, vemos que X b(30; 0,06) e assim
2
X
30
(0,06)k (0,94)30k
k
k=0



30
30
30
=
(0,06)0 (0,94)30 +
(0,06)1 (0,94)29 +
(0,06)2 (0,94)28
0
1
2

P(X 2) =

= 0,156256 + 0,299213 + 0,276931 = 0,7324


(b) A probabilidade de observarmos entre 8 e 10 defeituosos:
10
X
30
(0,06)k (0,94)30k
k
k=8



30
30
30
=
(0,06)8 (0,94)22 +
(0,06)9 (0,94)21 +
(0,06)1 0(0,94)20
8
9
10

P(8 X 10) =

= 0,000252 + 0,000039 + 0,000005 = 0,000297

As figuras a seguir mostram exemplos de distribuicoes binomiais. Para n fixo (no exemplo 20) `a
medida que p aumenta de 0 a 0,5 a distribuicao se torna mais simetrica.
Figura 3.2: Distribuicao Binomial com n fixo e p crescente
Binomial (20; 0,23)
0,30

0,25

0,25

0,20

0,20

f(x)

f(x)

Binomial (20; 0,1)


0,30

0,15

0,15

0,10

0,10

0,05

0,05

0,00

0,00
0

10

11

12

13

14

15

16

17

18

19

20

11

12

13

14

15

16

17

18

19

20

12

13

14

15

16

17

18

19

20

Binomial (20; 0,36)

Binomial (20; 0,5)

0,30

0,30

0,25

0,25

0,20

0,20

f(x)

f(x)

10

0,15

0,15

0,10

0,10

0,05

0,05

0,00

0,00
0

10

11

12

13

14

15

16

17

18

19

20

10

58

11


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Figura 3.3: Distribuicao Binomial com p fixo e n crescente


Binomial (50; 0,23)

Binomial (100; 0,23)

0,12

0,12

0,09

0,09

f(x)

0,15

f(x)

0,15

0,06

0,06

0,03

0,03

0,00

0,00
0

10

20

30

40

50

60

70

80

90

100 110

120 130 140 150 160 170 180 190 200

10

20

30

40

50

60

70

80

90

100 110

120 130 140 150 160 170 180 190 200

Binomial (150; 0,23)

Binomial (200; 0,23)

0,12

0,12

0,09

0,09

f(x)

0,15

f(x)

0,15

0,06

0,06

0,03

0,03

0,00

0,00
0

10

20

30

40

50

60

70

80

90

100 110

120 130 140 150 160 170 180 190 200

10

20

30

40

50

60

70

80

90

100 110

120 130 140 150 160 170 180 190 200

M
edia e vari
ancia: A media e a variancia de uma variavel aleatoria binomial dependem somente
dos parametros n e p. Imagine o exemplo anterior da linha de producao e para cada uma das 30 pecas
da amostra voce definisse novas v.as. X1 , X2 , . . . , X30 tais que:

1 se k-esima amostra fosse defeituosa,


Xk =
0 caso contrario.
Sabemos que cada nova variavel aleatoria Xk e uma Bernoulli de parametro p = 0,06, e que a esperanca
de Xk e p. Podemos escrever a v.a. X como:
X=

30
X

Xk

k=1

e agora calcular a media de X por (como os Xk0 s sao independentes):


30
!
30
30
X
X
X
E(X) = E
Xk =
E(Xk ) =
p = 30p = 30 0,06 = 1,8
k=1

k=1

k=1

Podemos generalizar entao para:


Se X b(n,p), entao
= E(X) = np
Alem disto pode-se provar (foge ao escopo deste curso) que
2 = V (X) = np(1 p)

59


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

3.6.4

cpa/gsa

Distribui
c
ao geom
etrica

Suponha novamente um experimento de Bernoulli , com probabilidade p de sucesso. Se repeticoes


independentes de sao realizadas ate que aconteca o primeiro sucesso, defina X : N
umero de repeticoes.
Neste caso o contradomnio e RX = {1,2,3, . . . }
Calculo da funcao de probabilidade de X: Observemos que X = k se nas primeiras k 1 repeticoes
acontecem F 0 s (fracassos) e na kesima acontece S (sucesso). Portanto a probabilidade de que X seja
igual a k sera (1 p)k1 p.
Podemos entao definir:
Defini
c
ao 13. Em uma serie de repeticoes de experimentos independentes de Bernoulli, com probabilidade p de sucesso, a variavel aleatoria X definida como o n
umero de repeticoes ate que o primeiro sucesso
ocorra tem distribui
c
ao geom
etrica com parametro p, notacao X G(p) e
f (x) = (1 p)x1 p

x = 1, 2, . . .

O motivo pelo qual essa distribuicao e conhecida como geometrica e obvio. Os termos f (1), f (2), f (3), . . .
formam uma progressao geometrica com razao (1 p).
Exemplos:
1. De uma linha de producao em grande escala, retiram-se itens ate encontrar o primeiro defeituoso. Se
a probabilidade da peca ser defeituosa e 0,01, qual a probabilidade de termos que observar 10 pecas?
Solucao:
X e n
umero de observacoes ate que o primeiro sucesso(neste caso uma peca defeituosa) ocorra.
Logo:
P(X = 10) = f (10) = (1 p)9 p = (0,99)9 0,01 = 0,009135
2. Um medico esta testando pessoas procurando uma pessoa com sangue tipo O . Se na populacao
7% possuem sangue tipo O ,
(a) Qual a probabilidade de que ele tenha que testar 20 pessoas ate achar a primeira com este tipo
particular de sangue?
Solucao:

P(X = 20) = f (20) = 0,9319 0,07 = 0,017631

(b) Qual a probabilidade de que ele tenha que testar menos de 10 pessoas para achar a primeira
com sangue O ?
Solucao:
9
X
P(X < 10) =
(1 p)i1 p
i=1

= 0,070000 + 0,065100 + 0,060543 + 0,056305 + 0,052364


+ 0,048698 + 0,045289 + 0,042119 + 0,039171
= 0,479589.

60


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Fun
c
ao de distribui
c
ao acumulada: A funcao de distribuicao da variavel geometrica pode ser
obtida por:

F (k) = P(X k) = 1 P(X > k) = 1 P(X k + 1) = 1

(1 p)j1 p

j=k+1

=1p

k1
X
X
(1 p)j = 1 p (1 p)j
(1 p)j

j=k

j=0

j=0

1 + (1 p)k 1
1 (1 p) 1

=1p
=1p
p
p
p

= 1 (1 p)k

Entao

F (k) = 1 (1 p)k

com k = 1,2, . . .

Propriedade da falta de mem


oria:
A partir da funcao de distribuicao da v.a.
P(X > k) = (1 p)k
com k = 1,2, . . .

geometrica calculada acima, podemos concluir que:

Baseado neste resultado, calculamos a probabilidade condicional de que X assuma valores maiores
que (k1 + k2 ), sabendo que X > k1 , para k1 e k2 inteiros positivos. Ou seja, estamos interessados em
calcular:
P(X > k1 + k2 |X > k1 )
Aplicando a definicao de probabilidade condicional podemos achar:
P(X > k1 + k2 ,X > k1 )
P(X > k1 )
P(X > k1 + k2 )
=
P(X > k1 )
(1 p)k1 +k2
=
(1 p)k1

P(X > k1 + k2 |X > k1 ) =

= (1 p)k2 = P(X > k2 )


Ou seja, se X G(p),
P(X > k1 + k2 |X > k1 ) = P(X > k2 )
Esta propriedade e conhecida como falta de memoria da distribuicao geometrica.
Deixamos como exerccio a prova de que:
P(X = k1 + k2 |X > k1 ) = P(X = k2 )
e
P(X k1 + k2 |X > k1 ) = P(X k2 )

61


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Exemplo:
Na linha de producao do exemplo anterior, em que a probabilidade de produzir item defeituoso e de
0,01 vimos que a probabilidade de se observar 10 pecas para achar a primeira defeituosa e de 0,017631.
Dado que observamos trinta pecas sem defeito, qual a probabilidade que achemos o primeiro defeito na
quadragesima observacao?
Solucao: Pela propriedade de falta de memoria, 0,017631.
M
edia e vari
ancia: Se X for uma variavel aleatoria geometrica com parametro p entao a media e
a variancia de X serao:
1p
1
2 = V (X) =
= E(X) =
p
p2
Exemplo:
No caso anterior em que o medico esta procurando um paciente com sangue tipo O quantas pessoas
ele espera testar ate achar o tipo de sangue desejado?
Solucao:
E(X) =

1
1
=
= 14,3
p
0,07

A figura abaixo mostra exemplos de distribuicoes geometricas para alguns valores de p


Figura 3.4: Distribuicao Geometrica - valores crescentes de p
Geomtrica (0,10)
0,90

0,80

0,80

0,70

0,70

0,60

0,60

0,50

0,50

f(x)

f(x)

Geomtrica (0,05)
0,90

0,40

0,40

0,30

0,30

0,20

0,20

0,10

0,10

0,00

0,00
0

10

12

14

16

18

20

22

24

26

28

30

10

12

14

Geomtrica (0,50)

18

20

22

24

26

28

30

18

20

22

24

26

28

30

Geomtrica (0,9)

0,90

0,90

0,80

0,80

0,70

0,70

0,60

0,60

0,50

0,50

f(x)

f(x)

16

0,40

0,40

0,30

0,30

0,20

0,20

0,10

0,10

0,00

0,00
0

10

12

14

16

18

20

22

24

26

28

30

10

12

14

16

62


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Observacao: Alguns autores definem a variavel com distribuicao geometrica como aquela que define o
n
umero de repeticoes independentes de experimentos de Bernoulli com probabilidade de sucesso p, antes
que aconteca o primeiro sucesso. Sob esta definicao f (x) = (1 p)x p
x = 0, 1, 2, . . . .

3.6.5

Distribui
c
oes binomial negativa

Uma generalizacao da distribuicao geometrica e aquela em que a variavel aleatoria e o n


umero de
repeticoes ate obtermos o ro sucesso.
Calcular a probabilidade P(X = k) significa calcular a probabilidade de que foram necessarias k
tentativas ate obtermos r sucessos, ou seja nas primeiras k 1 repeticoes tivemos r 1 sucessos e k r
fracassos. Alem do mais, a kesima repeticao resultou em sucesso.

k1
P(.|. . . . . . . . . . {z
. . . . . . . . . . . .}. S) =
(1 p)kr pr
r1
k-1 repeti
co
es, r-1 sucessos

Podemos entao definir:


Defini
c
ao 14. Em uma serie de tentativas independentes de Bernoulli, com probabilidade constante p
de sucesso, faca a variavel aleatoria X denotar o n
umero de tentativas ate que r sucessos ocorram. Entao
X tem distribui
c
ao binomial negativa, com parametros p e r, notacao X BN (r,p) e

x1
f (x) =
(1 p)xr pr
para x = r, r + 1, r + 2, . . .
r1
Como sao necessarias pelo menos r tentativas para se obter r sucessos, o contradomnio de X e
RX = {r, r + 1, r + 2, . . . }. No caso especial em que r = 1, uma variavel aleatoria binomial negativa e
uma v.a. geometrica.
Exemplos:
1. Um casal deseja ter duas filhas mulheres. Encontre a distribuicao do n
umero de filhos que eles
precisam ter para atingir esta meta, sabendo-se que a cada concepcao a chance e a mesma para
qualquer dos dois sexos.
Solucao:
Chamando X a variavel n
umero de filhos para que sejam 2 mulheres, vemos que X BN (2; 0,5)
com x 2. Assim

x1
P (X = x) =
(1 p)x2 p2
x = 2,3, . . .
1
P(2) = 1 0,50 (0,5)2 = 0,25

P(3) = 2 0,51 0,52 = 0,25

P(4) = 3 0,52 0,52 = 0,1875

P(5) = 4 0,53 0,52 = 0,125

P(6) = 5 0,54 0,52 = 0,078

P(7) = 6 0,55 0,52 = 0,047

2. Uma linha de producao em grande escala produz 6% de itens defeituosos. Retiramos sucessivamente amostras da producao ate que apareca o quarto item defeituoso. Qual a probabilidade de
que observemos pelo menos 30 itens?

63


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Solucao:
Se X e o n
umero de itens observados ate que apareca o quarto defeituoso entao X BN (4; 0,06) e
P(X 30) = 1 P(x < 30) = 1

29
X
x1
(0,94)x4 0,064 = 1 0,093143 = 0,906857
3
x=1

O nome Binomial Negativa advem do fato de que na distribuicao binomial o n


umero de repeticoes e
fixo e o n
umero de sucessos varia, na binomial negativa temos o contrario, o n
umero de sucessos e fixo e
o que varia e o n
umero de repeticoes.
M
edia e vari
ancia: Se X BN (r,p) entao:
= E(X) =

r
p

2 = V (X) =

r(1 p)
p2

Exemplos:
1. Quantos filhos em media o casal devera ter para ter duas filhas?
Solucao:

= E(X) =

2
0,5

=4

2. Qual o n
umero esperado de retiradas da linha de producao ate achar o quarto item defeituoso?
Solucao:

= E(X) =

4
0,06

= 66,7

A figura abaixo mostra alguns exemplos da distribuicao binomial negativa, para variacoes de p com r
fixo e para variacoes de r com p fixo:
Binomial Negativa (5; 0,2)
0,16

0,14

0,14

0,12

0,12

0,10

0,10

f(x)

f(x)

Binomial Negativa (5; 0,1)


0,16

0,08

0,08

0,06

0,06

0,04

0,04

0,02

0,02

0,00

0,00
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95 100 105 110 115 120

10

15

20

25

30

35

40

45

50

55

65

70

75

80

85

90

95 100 105 110 115 120

80

85

90

95 100 105 110 115 120

Binomial Negativa (5; 0,4)

Binomial Negativa (5; 0,5)

0,16

0,16

0,14

0,14

0,12

0,12

0,10

0,10

f(x)

f(x)

60

0,08

0,08

0,06

0,06

0,04

0,04

0,02

0,02

0,00

0,00
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95 100 105 110 115 120

10

15

20

25

30

35

40

45

50

55

60

64

65

70

75


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Binomial Negativa (10; 0,3)


0,08

0,07

0,07

0,06

0,06

0,05

0,05

f(x)

f(x)

Binomial Negativa (5; 0,3)


0,08

0,04

0,04

0,03

0,03

0,02

0,02

0,01

0,01

0,00

0,00
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95 100 105 110 115 120

10

15

20

25

30

35

40

45

50

55

Binomial Negativa (10; 0,3)

70

75

80

85

90

95 100 105 110 115 120

85

90

95 100 105 110 115 120

Binomial Negativa (30; 0,3)


0,08

0,07

0,07

0,06

0,06

0,05

0,05

f(x)

f(x)

65

0,08

0,04

0,04

0,03

0,03

0,02

0,02

0,01

0,01

0,00

0,00
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95 100 105 110 115 120

3.6.6

60

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

Distribui
c
ao hipergeom
etrica

Considere uma populacao formada por N objetos dos quais K sao do tipo A e N K do tipo B.
Suponha que uma amostra de tamanho n sera retirada, sem reposicao, desta populacao. Denote X a
variavel aleatoria que conta o n
umero de objetos tipo A na amostra.

Calculo da funcao de probabilidade de X: Em primeiro lugar, vemos que existem N
n formas de
K
escolher n objetos de uma populacao de N objetos. Existem x formas de escolhermos x elementos tipo
K
A de um grupo de K e Nnx
formas de escolher n x objetos tipo B de um total de (N K). Entao,
N k
pelo princpio da multiplicacao, existem K
x
nx formas de se escolher n objetos dos quais x do tipo A
e n x do tipo B. Temos entao:
umero de objetos do tipo A presentes em uma
Defini
c
ao 15. Uma variavel aleatoria X, que conta o n
amostra aleatoria de tamanho n retirada de uma populacao de tamanho N , contendo K objetos do tipo
A e N K objetos do tipo B; tem uma distribui
c
ao hipergeom
etrica, notacao X H(K,N,n) e

K
N K
x
nx

f (x) =
x = 0,1,2,...,n e max{0,n + K N } x mn{K,n}
N
n
As restricoes para o contradomnio de x se devem a:
Limite inferior: se amostra for maior que o n
umero de objetos tipo B, o menor valor de x sera
n (N K) = n + K N .
Limite superior: na amostra nao pode haver mais objetos tipo A que o total deles na populacao ou o
proprio tamanho da amostra.

65


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Exemplos:
1. Uma fabrica produz pecas que sao embaladas em caixas com 25 unidades. Para aceitar o lote recebido deste fabricante, o controle de qualidade de uma empresa faz o seguinte teste: sorteia uma
caixa do lote e desta caixa sorteia 5 pecas sem reposicao desta caixa. Se o n
umero maximo de defeituosas na amostra for 2 a empresa aceita o lote. Se a caixa sorteada contiver 4 pecas defeituosas,
qual a probabilidade do lote ser rejeitado?
Solucao:
Se X e o n
umero de pecas defeituosas na amostra, entao X H(4,25,5) e

4 21
4 21
4
21
4
X
3
2
4
1
x 5x

P(X > 2) =
= + = 0,015810 + 0,000395 = 0,016205
25
25
25
x=3
5
5
5
2. A sala tem 47 homens e 13 mulheres. Se quisermos formar aleatoriamente uma comissao de 6
pessoas, qual a probabilidade de metade serem mulheres?
Solucao:


13 47
3
3

P(X = 3) =
= 0,092631
60
6

M
edia e vari
ancia: Se uma variavel aleatoria tem distribuicao hipergeometrica, ou seja, se X
H(K,N,n) entao:
= E(X) = np

2 = V (X) = np(1 p)

N n
N 1

onde p = K/N

Exemplo:
Estima-se que na populacao de Belo Horizonte, de 2,5 milhoes de pessoas, 0,5% sejam hipertensos.
Uma pesquisa de um laboratorio sorteia 200 pessoas ao acaso na populacao, qual o n
umero esperado de
hipertensos entre os 200 sorteados?
Solucao:
Se X e o n
umero de hipertensos entre os 200 escolhidos, entao X H(12.500,2.500.000,200) e:
E(X) = 200

12.500
=1
2.500.000

Se compararmos uma variavel aleatoria hipergeometrica e uma binomial veremos que a media a
calculada da mesma forma e a variancia so difere pelo fator
N n
N 1
chamado de fator de corre
c
ao para popula
c
ao finita.

66


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

Este fator de correcao deve-se ao fato de que no experimento com distribuicao hipergeometrica a
amostragem e sem reposicao, isto e, a cada escolha a probabilidade de retirarmos um elemento do tipo
A se modifica, ao passo que no experimento binomial esta probabilidade e constante.
No entanto se n for muito pequeno em relacao a N esta correcao sera tao pequena que podemos
aproximar a distribuicao hipergeometrica pela binomial:
Veja no exemplo abaixo:
Se formos tirar uma amostra de 8 elementos de uma total de 10, a correcao sera 108
= 0,22. Se formos
9
retirar uma amostra de 8 elementos de uma populacao de 1000 o fator de correcao sera 10008
= 0,993.
999
Nesta circunstancia a distribuicao hipergeometrica com parametros K, N e n pode ser aproximada
por uma distribuicao binomial com parametros n e p = n/N .
Exemplo:
A populacao de um bairro e de 10.000 pessoas das quais 8.000 possuem televisao. Se escolhermos aleatoriamente uma amostra de 100 moradores, qual a probabilidade de que pelo menos 80 possuam televisao?
Solucao:
Seja X o n
umero de pessoas na amostra com televisao em casa. Entao X H(8.000,10.000,100) e a
probabilidade solicitada e:

8.000
2.000
100
X
x
100 x

P(X 80) =
10.000
x=80
100
Essa conta infindavel pode ser aproximada por uma variavel binomial com n = 100 e p = 8.000/10.000 =
0,8. A probabilidade solicitada e aproximadamente entao:
P(X 80) =

100
X

0,8x (1 0,8)100x

x=80

Com auxlio de computador achamos 0,4602 e 0,4598 para as duas probabilidades, valores muito
proximos um do outro. O grafico abaixo mostra a aproximacao da hipergeometrica pela binomial com os
dados do exemplo acima:
Comparao entre Hipergeomtrica e Binomial
0,10

0,08

H(8.000,10.000,100)
Bin(100;0,8)

f(x)

0,06

0,04

0,02

0,00

50

60

70

80

67

90

100


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

3.6.7

cpa/gsa

Distribui
c
ao de Poisson

Considere uma variavel aleatoria X com distribuicao binomial com parametros n e p. Quando n e
suficientemente grande e p suficientemente pequeno, defina = np, e a funcao de probabilidade de X
pode ser aproximada por
e k
com k = 0,1,2, . . .
P(X = k) =
k!
Esta e conhecida como funcao de probabilidade de Poisson. Notacao X P ()
Exemplos deste tipo de variavel aleatoria sao:
umero,
1. Na edicao de um texto, existe uma pequena probabilidade de se digitar um caracter (letra, n
etc) errado. Desde que existe um n
umero grande de caracteres em uma pagina de um livro, a funcao
de probabilidade do n
umero de erros em uma pagina segue uma distribuicao de Poisson.
2. Num jogo de futebol existem 30.480 de torcedores no estadio. Existe uma pequena probabilidade,
igual a 106 , de que uma pessoa sofra um acidente durante o jogo. Sob determinadas condicoes
podemos assumir que existe independencia no comportamento das pessoas dentro do estadio. Se
definirmos X : n
umero de pessoas que se acidentam durante o jogo, temos
X b(30.480,106 ) ou X P (0,03048)
e assim
P(X = k) =

e0,03048 0,03048k
k!

k = 0,1,2, . . .

A variavel aleatoria de Poison esta associada a eventos como:


umero de pessoas que chegam a uma fila em um minuto;
n
n
umero de buracos em um quilometro de estrada;
umero de raios que caram em uma regiao durante 1 dia;
n
n
umero de bacterias em 1 ml de agua;
n
umero de acessos a uma pagina de internet em um minuto;
n
umero de partculas emitidas por um metal radioativo por segundo;
n
umero de defeitos em 1 m2 de tecido.
Exemplos:
1. O n
umero de partculas emitidas por minuto por determinado elemento radioativo segue uma
distribuicao de Poisson com = 5. Qual a probabilidade de haver mais de 2 emissoes em um minuto?
Solucao:
Seja X o n
umero de partculas emitidas por minuto, entao X P (5) e
P (X > 2) = 1 P (X 2) = 1

2
X
e5 5x
x=0

x!

= 1 (0,006738 + 0,033690 + 0,084224)


= 1 0,124652 = 0,875348
68


3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS

cpa/gsa

2. O n
umero medio de erros de datilografia em um livro e de 1,5 por pagina. Supondo que o modelo
de Poisson sirva para modelar este processo, ache a probabilidade de que em uma pagina escolhida
ao acaso existam:
(a) nenhum erro
(b) mais de dois erros
Solucao:

e1,5 1,50
= e1,5 = 0,2231
0!
P(X > 2) = 1 P (x 2) = 1 [0,2231 + 0,334695 + 0,251021] = 0,191153
P(X = 0) =

M
edia e vari
ancia: Desde que a distribuicao de Poisson aparece como uma aproximacao da distribuicao binomial, e de se esperar que a media seja igual a np = e a variancia seja igual a np(1 p) = .
Este resultado pode ser provado usando-se as correspondentes definicoes.
Um resultado importante envolvendo a distribuicao de Poisson: se o n
umero de ocorrencias de um
evento por unidade de tempo tem distribuicao de Poisson com parametro , entao o n
umero de ocorrencias
deste evento em um intervalo de tempo de comprimento t tem distribuicao de Poisson com parametro t..
Isto e, defina X : n
umero de ocorrencias de um evento por unidade de tempo e Xt : n
umero de
ocorrencias deste evento em um intervalo de tempo de comprimento t. Se X P (), entao Xt P (t).
A prova deste resultado foge ao alcance de nossa disciplina. (O leitor interessado pode ver, por exemplo,
em [4]).
Observacao: O termo tempo no paragrafo anterior e mais amplo do que tempo no sentido literal.
Isto e, podemos contar, por exemplo, o n
umero de buracos por km de estrada; n
umero de erros por pagina
de um livro, n
umero de irregularidades por m2 de tecido, etc.
Exemplo:
O n
umero de acessos `a pagina da UFMG na internet pode ser modelado como uma variavel aleatoria
de Poisson com um n
umero medio de 3 acessos por minuto. Calcule:
1. Probabilidade de que a pagina tenha 190 acessos em uma hora.
Solucao Se = 3 em um minuto, em uma hora = 60 3 = 180 entao
P(X = 190) =

e180 180190
= 0,022023
190!

2. N
umero esperado de acessos em 1 dia
Solucao Se = 3 em um minuto, em um dia = 60 3 24 = 4.320 e como = E(X) = = 4.320

69

3.7. EXERCICIOS

cpa/gsa

A figura abaixo mostra alguns exemplos da distribuicao de Poisson, para valores crescentes de
Poisson (2)
0,40

0,35

0,35

0,30

0,30

0,25

0,25

f(x)

f(x)

Poisson (1)
0,40

0,20

0,20

0,15

0,15

0,10

0,10

0,05

0,05

0,00

0,00
0

10

11

12

13

14

15

16

17

18

19

20

12

13

14

15

16

17

18

19

20

12

13

14

15

16

17

18

19

20

Poisson (10)

0,40

0,40

0,35

0,35

0,30

0,30

0,25

0,25

f(x)

f(x)

11

Poisson (5)

0,20

0,20

0,15

0,15

0,10

0,10

0,05

0,05

0,00

0,00
0

10

11

12

13

14

15

16

17

18

19

20

3.7

10

10

11

Exerccios

1. Considere uma variavel aleatoria com a seguinte funcao de probabilidade:


f (x) = (8/7)(1/2)x ,

x = 1, 2, 3.

Calcule:
(a) P(X 1)
(b) P(X > 1)
(c) P(2 < X < 6)
(d) P(X 1 ou X > 1)

2. O espaco amostral de um experimento aleatorio e = {a,b,c,d,e,f } e cada resultado e igualmente


provavel. Uma variavel aleatoria e definida como segue:
resultado
x

a
0

b
0

c
1,5

d
1,5

e
2

f
3

Determine a funcao de distribuicao cumulativa da variavel aleatoria X e esboce seu grafico.


70

3.7. EXERCICIOS

cpa/gsa

3. Com os dados da variavel aleatoria X do exerccio anterior determine as seguintes probabilidades:


(a) P(X = 1,5)
(b) P(0,5 < X < 2,7)
(c) P(X > 3)
(d) P(0 X < 2)
(e) P(X = 0 ou X = 2)

4. Considere uma variavel aleatoria com a seguinte funcao de probabilidade:


f (x) =

2x + 1
,
25

x = 0, 1, 2, 3, 4.

Calcule:
(a) P(X = 4)
(b) P(X 1)
(c) P(2 X < 4)
(d) P(X > 10)

5. 6% das barras produzidas em grande escala nao suportam um peso de 350 kg. Da producao diaria
destas barras testam-se algumas ate encontrar a primeira a quebrar quando submetida a este peso.
(a) Calcule a probabilidade de termos que testar pelo menos 6 barras;
(b) Se as primeiras 4 barras nao quebraram, qual a probabilidade de termos que testar pelo menos
mais 3 ate que a primeira barra se quebre?.

6. Um voo tem capacidade para 175 passageiros. O gerente da empresa aerea sabe que apenas 92%
das pessoas que fazem reserva realmente viajam. Em funcao disto ele aceita 185 reservas para este
voo.
(a) Forneca uma expressao para a probabilidade de que todos os passageiros que comparecerem
ao embarque, tenham condicao de viajar;
(b) A probabilidade calculada pela expressao apresentada no item (a) e igual a 0,93162. De 10
voos realizados, qual a probabilidade de que em no maximo um deles algum(ns) passageiro(s)
que comparecem na hora de embarcar nao tenha(m) condicao de viajar?
(c) Quais sao as suposicoes que voce precisa fazer para abordar os itens (a) e (b)?

7. O n
umero de falhas por metro quadrado de um tecido e uma variavel aleatoria com distribuicao de
Poisson com media igual a 0,2.
(a) Qual a probabilidade de que uma peca de tecido de 10 metros quadrados de tecido tenha no
maximo 5 falhas?
(b) Se voce compra 100 pecas de tecido de 10 metros quadrados cada, qual a probabilidade, de
que no maximo 2 pecas tenham mais de 5 falhas?
71

3.7. EXERCICIOS

cpa/gsa

8. O n
umero de erros de digitacao em uma pagina de um livro e uma variavel aleatoria de Poisson
com parametro = 1. Encontre a probabilidade de que:
(a) Em uma pagina encontremos no maximo 2 erros.
(b) Em cinco paginas encontremos exatamente 5 erros.
9. A vari
avel aleatoria Y assume os valores {10, 2, 0, 5, y} com igual probabilidade.
(a) Qual o valor de y se E(Y ) = 0?
(b) Qual o desvio padrao da v.a. Y ?
10. Voce e o responsavel pela linha de producao de parafusos de uma metalurgia. A taxa nominal
de defeitos da linha de producao e de 2%. Para controlar a qualidade da linha, verificando se
efetivamente a taxa de defeitos esta dentro do previsto, voce quer comparar dois tipos de teste:
No primeiro voce retira aleatoriamente parafusos da linha de producao ate encontrar o primeiro
defeituoso. No segundo teste voce retira 30 parafusos da linha de producao e observa o n
umero de
parafusos defeituosos em sua amostra.
(a) No primeiro teste qual a probabilidade de voce retirar 20 parafusos?
(b) No segundo teste, qual a probabilidade de voce encontrar exatamente 3 defeituosos?
(c) Voce resolveu implantar o segundo teste, que passou a ser realizado todos os dias pela manha.
Se forem encontrados mais de 2 parafusos defeituosos a linha e parada e entra em manutencao.
Sabendo que a fabrica opera 7 dias por semana, qual a probabilidade de haver 2 paradas para
manutencao na mesma semana?

72

Captulo 4

Vari
aveis Aleat
orias Contnuas
4.1

Introduc
ao

Em diversos experimentos u
teis no nosso dia a dia, medidas de interesse como
corrente eletrica em um fio de cobre;
comprimento de uma peca usinada;
peso de uma viga de concreto;
tempo de falha de um componente eletronico;
podem ser representadas por variaveis aleatorias. O contradomnio destas variaveis aleatorias e um
intervalo (finito ou infinito) de n
umeros reais. Como o conjunto de valores possveis da variavel aleatoria
X e infinito nao enumeravel, este contradomnio pode ser pensado como um continuum, da o nome de
variaveis aleatorias contnuas.

4.2

Distribuic
oes de probabilidades e func
oes de densidade de
probabilidade

Consideremos a variavel X representando o comprimento das barras produzidas por uma empresa.
Se escolhemos 50 barras e medimos o comprimento destas barras podemos construir um histograma
e seu polgono de frequencia como o representado na figura 1a na proxima pagina. Se escolhemos
100, 200, 500, 1000 ou 5000 barras temos os histogramas com seus correspondentes polgonos de frequencia
representados nas figuras 1b a 1f .
Observemos que `a medida que aumentamos o tamanho da amostra, o polgonoR de frequencia torna-se

mais suave. Se fizermos n teremos uma funcao nao negativa f tal que f (x)dx = 1. Essa
funcao, f , obtida por construcao e chamada de funcao de densidade de probabilidade, ou simplesmente
densidade.

73


DE DENSIDADE
4.2. PROBABILIDADE: DISTRIBUIC
OES
E FUNC
AO

cpa/gsa

Histograma de X: comprimento da barra


para amostras sucessivamente crescentes
Histograma de X (n=50)

Histograma de X (n=100)

10
20
8
Frequncia

Frequncia

15
6

10

0
98,5

99,0

99,5
100,0
Comprimento em cm

100,5

101,0

98,5

99,0

99,5
100,0
100,5
Comprimento em cm

101,0

101,5

Fig 1b

Fig 1a

Histograma de X (n=200)

Histograma de X (n=500)

35

60

30
50

Frequncia

Frequncia

25
20
15

40
30
20

10

10

0
98,4

99,0

99,6
100,2
Comprimento em cm

100,8

101,4

98,55

99,00

99,45

99,90
100,35
100,80
Comprimento em cm

101,25

101,70

Fig 1d

Fig 1c

Histograma de X (n=5000)

Histograma de X (n=1000)

Normal

100
400
80

Frequncia

Frequncia

300
60

40

200

100

20

0
98,5

99,0

99,5

100,0
100,5
Comprimento em cm

101,0

101,5

102,0

98,5

99,0

Fig 1e

99,5
100,0
100,5
Comprimento em cm

101,0

101,5

102,0

Fig 1f

R
Desde que f (x)dx = 1, e muito natural definir a probabilidade de que X assuma valores no
intervalo [a,b] como a integral de f neste intervalo, isto e, definimos:
Z
P(a X b) =

f (x)dx.
a

Podemos provar que P assim definida satisfaz os 3 axiomas da probabilidade.

74


DE DENSIDADE
4.2. PROBABILIDADE: DISTRIBUIC
OES
E FUNC
AO

cpa/gsa

A figura a seguir ilustra a probabilidade de a X b:


f(x)
P(a < X < b)

Figura 4.1: Probabilidade determinada a partir da area sob f (x)

Se fizermos a = b, teremos:
Z

f (x)dx = 0

P(X = a) = P(a X a) =

a R.

Isto e, se X e uma variavel aleatoria contnua a probabilidade de que ela assuma o valor a e zero,
para qualquer valor de a, n
umero real.
Como consequencia disto, temos que:
P(a X b) = P(X = a) + P(a < X b) = P(a < X b)
Analogamente podemos ver que:
P(a X b) = P(a X < b) = P(a < X < b)
Exemplos:
1. Seja a variavel aleatoria X a corrente em miliamp`eres em um fio de cobre. Suponha que o contradomnio de X e [0; 20] e a func
ao de densidade de probabilidade de X e f (X) = 0,05 para
0 X 20 conforme figura abaixo:
f(x)

15

20

Qual a probabilidade que uma medida na corrente seja menor do que 15mA?
Solucao:

Z
P(X < 15) =

15

f (x)dx =
0

0,05dx = 15 0,05 = 0,75


0

75

15

DE DISTRIBUIC
ACUMULADA
4.3. FUNC
AO
AO

cpa/gsa

2. O diametro de um orifcio em uma placa metalica e influenciado por diversas alteracoes no processo
de perfuracao, podendo ser modelado por uma variavel aleatoria com densidade de probabilidade
f (x) = 20e20(x12,5) , x 12,5 mm.
f(x)

12,5

12,6

A tolerancia do comprador da placas e que o furo possa ter no maximo 12,6 mm. Qual a probabilidade de uma placa ser recusada pelo comprador?
Solucao:
Z

P(X > 12,60) =


12,6

4.3

f (x)dx =

20e20(x12,5) dx = e20(x12,5)
= 0,135335
12,6

12,6

Func
ao de distribuic
ao acumulada

A funcao de distribuicao acumulada, `as vezes referida apenas como funcao de distribuicao, tambem
pode ser usada para descrever uma variavel aleatoria contnua.
Defini
c
ao 16. A fun
c
ao de distribui
c
ao cumulativa de uma variavel aleatoria contnua X avaliada
em a e definida por:
Z a
F (a) = P(X a) =
f (x)dx
para < x < .

Exemplos:
1. No exemplo 1 da secao anterior em que X era a corrente em miliamp`eres em um fio de cobre, calcule
a func
ao de distribuicao cumulativa de X.
Solucao:
Em primeiro lugar se x < 0, f (x) = 0, entao
F (x) = 0,
e

para x < 0

F (a) =

f (x)dx = 0,05x

para 0 x < 20

finalmente

Z
F (x) =

f (x)dx = 1
0

76

para x 20

4.4. MEDIA
E VARIANCIA

cpa/gsa

Assim podemos escrever,

se x < 0,
0
0,05x se 0 x < 20.
F (x) =

1
se x 20.

O grafico abaixo mostra F (x):


F(x)

20

2. Achar a funcao de distribuicao para a variavel aleatoria diametro do furono exemplo 2 da secao
anterior.
Solucao:
Temos inicialmente,
F (x) = 0,
e

para x < 12,5

20e20(x12,5) dx = 1 e20(x12,5)

F (a) =

para x 12,5

12,5

obtemos entao

F (x) =

0
1 e20(x12,5)

se x < 12,5,
se x 12,5.

O grafico de F (x) e:
F(x)

12,5

4.4

M
edia e vari
ancia

A media e variancia de uma variavel aleatoria contnua sao definidas de modo similar a uma variavel
aleatoria discreta, substituindo-se a soma pela integracao, assim

77

4.4. MEDIA
E VARIANCIA

cpa/gsa

Defini
c
ao 17. Suponha que X seja uma variavel aleatoria contnua com funcao de densidade de probabilidade f ().
A m
edia ou o valor esperado de X denotado por ou E(X), e
Z
= E(X) =
xf (x)dx

A vari
ancia de X denotada por 2 ou V (X), e
Z
Z
2
2
= V (x) =
(x ) f (x)dx =

x2 f (x)dx 2

E o desvio-padr
ao de X e = [V (X)]1/2 .
As propriedades da media e variancia sao similares `aquelas enunciadas no caso discreto.
Alem disso definimos outras medidas de posicao para variaveis aleatorias contnuas como:
Mediana: a mediana e o valor md que tem a propriedade
P(X md) = 0,5 e P(X md) = 0,5
Moda: a moda e o valor mo tal que
f (mo) = max f (x)
x

Primeiro e terceiro quartis: Sao respectivamente os valores xq1 e xq3 tais que:
P(X xq1 ) = 0,25

P(X xq3 ) = 0,75

quantil xq : P(X xq ) = q
Exemplos:
1. Qual a media, variancia e mediana da v.a. X do exemplo da medida de corrente no fio de cobre?
Solucao:
Z

0,05x2 20
= 10
2
0
0
Z 20
0,05(x 10)3 20
50 50
+
= 33,33
2 = V (X) =
(x 10)2 f (x)dx =
=
3
3
3
0
0
Z md
md
0,5

f (x)dx = 0,5 0,05x = 0,5 md =


= 10
0,05
0
0
= E(X) =

20

xf (x)dx =

Neste caso como a funcao de densidade e simetrica em torno de 10, a media e mediana sao iguais.

78

4.4. MEDIA
E VARIANCIA

cpa/gsa

2. Qual a media e a variancia da v.a. X do exemplo do diametro do furo na placa metalica?


Solucao:

= E(X) =

x20e20(x12,5)

xf (x)dx =
12,5

12,5

dv = 20e20(x12,5)
v = e20(x12,5) , temos
Z

+
e20(x12,5) dx
= E(X) = xe20(x12,5)

Se fizermos u = x

du = dx

12,5

20(x12,5)

12,5

20
12,5
= 12,5 + 0,05 = 12,55

= 12,5

V (X) =

(x 12,55)2 f (x)dx = 0,0025

(integrando por partes).

12,5

Finalmente calculemos a mediana:


Z

md

md

f (x)dx = 0,5 e20(x12,5)


= 0,5 1 e20(md12,5) = 0,5
12,5

12,5

e20(md12,5) = 0,5 20(md 12,5) = ln(0,5) 20(md 12,5) = ln2


md 12,5 = 0,034657 md 12,53
Exemplo a ttulo de exerccio:

f (x) =

1 x
40 ( 10

+ 1)

se 0 x 20,
caso contrario.

(a) Verificar se f (x) e uma funcao densidade de probabilidade;


(b) Calcular a probabilidade de que X seja menor ou igual a 8;
(c) Calcular a media, mediana e variancia de X

Solucoes
O grafico da funcao e:
f(x)

3/40

1/40
0

10

20

79

UNIFORME CONTINUA
4.5. DISTRIBUIC
AO

cpa/gsa

(a) Para checar se e funcao de densidade, observemos primeiro que f (x) 0. Resta checar que
R 20
f (x)dx = 1.
0
Z

20
0

1 x
x2
x 20
400 20
+ 1 dx =
+ =
+
=1
40 10
800 40 0
800 40

(provando que e).

(b) A probabilidade pedida e:


Z 8

x2
x 8
64
8
1 x
+ 1 dx =
+ =
+
= 0,08 + 0,20 = 0,28
P(X 8) =
40
10
800
40
800
40
0
0
(c) Para calcularmos as medidas solicitadas
Z 20
Z 20

x x
x3
x2 20
8000 400
= E(X) =
xf (x) =
+ 1 dx =
+ =
+
= 6,67+5 = 11,67
40
10
1200
80
1200 80
0
0
0
Z md

x2
x md
1 x
+ 1 dx = 0,5
+ = 0,5 (md)2 + 20(md) 400 = 0 md 12,36
40 10
800 40 0
0
Z 20
2 = V (X) =
(x )2 f (x) = E(X 2 ) [E(X)2 ]
Z

20

E(X 2 ) =

Z
x2 f (x) =

0
20

x x
x4
x3 20
160000 8000
+ 1 dx =
+
+
= 266,67
=
40 10
1600 120 0
1600
120
2

V (X) = 266,67 (11,6667)2 30,56 ( = 5,53)

4.5

Distribuic
ao uniforme contnua

.
A distribuicao contnua uniforme e a mais simples, e analoga `a sua correspondente discreta
Defini
c
ao 18. Dizemos que uma variavel aleatoria contnua X tem distribuicao uniforme no intervalo
[a,b] se:
1
f (x) =
,
a x b.
(b a)
Notacao X U [a, b].
Podemos deduzir:
Z b
x
x2 b
a2
b2 a2
(b a)(a + b)
a+b
b2
= E(X) =
dx =

=
=
=
=
2(b a) a
2(b a) 2(b a)
2(b a)
2(b a)
2
a ba
e
Z

E(X 2 ) =
a

x3 b
a2 + ab + b2
b3 a3
x2
dx =
=
=
ba
3(b a) a
3(b a)
3

e portanto

2
a2 + ab + b2
a+b
4a2 + 4ab + 4b2 3a2 3b2 6ab
a2 2ab + b2
(b a)2
V (X) =

=
=
=
3
2
12
12
12
80

UNIFORME CONTINUA
4.5. DISTRIBUIC
AO

cpa/gsa

Em resumo temos:
A media e a variancia de uma variavel aleatoria contnua uniforme X sobre [a,b] sao:
= E(X) =

(a + b)
2

2 = V (X) =

(b a)2
12

A figura abaixo mostra um exemplo de uma variavel aleatoria contnua uniforme:


f(x)

1/(b-a)

Para obtermos a funcao de distribuicao da v.a. contnua uniforme, vemos que se a < x < b vale:
Z x
1
x x
x
a
F (x) =
dx =

=
(b a) a
(b a) (b a)
a ba
Assim a descricao completa de F e:

se x < a,
0
(x a)/(b a) se a x b,
F (x) =

1
se x > b.
F (x) esta representada na figura abaixo:
F(x)
1

Exemplo:
Para testar a resistencia de tubos de PVC tecnicos submetem os mesmos a grandes pressoes ate que
apareca o primeiro vazamento. Sabendo que os tubos possuem 6 m de comprimento e que o vazamento
tem probabilidade igual de ocorrer em intervalos de comprimento iguais, qual a probabilidade de que o
vazamento ocorra a no maximo 1 metro de uma das extremidades?
Solucao:
Se chamarmos X a variavel aleatoria que indica a distancia do vazamento a uma das extremidades
do tubo, vemos que X U [0,6], e a funcao de densidade de X e

1/6 se 0 x 6,
f (x) =
0
caso contrario.
81

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

A probabilidadde de que o vazamento esteja no maximo a um metro das extremidades pode ser escrita
como:
Z 1
Z 6
1
1
x 1 x 6
1
6 5
1
P(0 x 1) + P(5 x 6) =
dx +
dx = + = 0 + =
6 0 6 5
6
6 6
3
0 6
5 6

4.6

Distribuic
ao normal

A distribuicao normal e uma das distribuicoes mais importantes na estatstica. Esta distribuicao
descreve o comportamento de diversas variaveis aleatorias contnuas e tambem e u
til para aproximar a
distribuicao de diversas variaveis aleatorias discretas.
Diversos histogramas possuem formas similares `a forma da distribuicao normal. Toda vez que se
replica um experimento aleatorio, a variavel aleatoria que for igual ao resultado medio (ou total) das
replicas tendera a ter uma distribuicao normal, `a medida que o n
umero de repeticoes for se tornando
grande.
Outro exemplo da importancia da distribuicao normal e visto no seguinte exemplo: o erro no comprimento de uma peca usinada e uma soma de um grande n
umero de erros infinitesimais. Efeitos como
variacoes na temperatura e na umidade, vibracoes, mudancas no angulo de corte, desgates na ferramenta
de corte e nos mancais do torno, variacoes na velocidade de rotacao, variacoes na montagem e fixacao,
variacoes em in
umeras caractersticas da materia prima, diferentes nveis de contaminacao. Se cada componente produzir um erro de forma independente, em muitos casos pode-se demonstrar que o erro total
tem distribuicao normal.
Alem disso encontramos a distribuicao normal no estudo de diversos fenomenos fsicos basicos.
A figura abaixo mostra o histograma da variavel altura da tabela estudada em 1.2.2, com uma distribuicao normal ajustada aos dados.

82

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

Definimos entao:
Defini
c
ao 19. Uma variavel aleatoria X, com funcao de densidade de probabilidade
f (x) =

(x)2
1
e 22 ,
2

< x < ;

e dita ter distribui


c
ao normal, com parametros e 2 . O parametro e qualquer n
umero real e
precisa ser positivo. Notacao: X N (, 2 )
O valor determina o centro da da funcao de densidade e 2 a dispersao em torno da media. Os
parametros e sao conhecidos respectivamente como parametros de locacao e escala. Abaixo exemplos
de graficos da densidade de distribuicoes normais para alguns valores de e 2 :

Funo de Densidade de Probabilidade

Funo de Densidade de Probabilidade

Normal; Mdia=0

Normal
0,14

0,4

Varincia
1
4

0,3

0,10
Densidade

Densidade

Mdia Varincia
5
9
10
16

0,12

0,2

0,08
0,06
0,04

0,1

0,02
0,0

0,00
-5,0

-2,5

0,0

2,5

5,0

7,5

-5

10
X

15

20

25

Algumas propriedades da Distribuicao Normal:


1. Se X tem distribuicao normal, entao E(X) = e V (X) = 2 .
2. A distribuicao normal e simetrica em torno de , e por consequencia f ( + a) = f ( a).
2
3. Se X N (x , X
) e Y = aX + b, entao:
2
Y tem distribuicao normal com media Y = aX + b e variancia Y2 = a2 X
; isto e Y N (aX +
2 2
b, a X ).

4. Como caso particular, seja:


Z=

X
1

= X + ( )

.
Usando a propriedade 3 acima, vemos que Y N (0,1). A variavel Z e conhecida como normal
padr
ao e sua funcao densidade, representada por e:
1 2
1
(z) = e 2 z ,
2

<z <

Lembrando a propriedade 2 vemos que (z) = (z)


5. Em geral se uma variavel aleatoria tem funcao de densidade simetrica em torno da media, como e
o caso da distirbuicao normal, a mediana e igual `a media.
83

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

6. A densidade da distribuicao normal tem dois pontos de inflexao: e + .


7. Se X e uma variavel aleatoria com distribuicao normal,
lim f (x) = 0

4.6.1

lim f (x) = 0

x+

C
alculo de probabilidade

Para calcularmos a probabilidade no caso normal, considere X N (, 2 ). Para a e b, n


umeros reias,
calculemos P(a X b).
Funo de densidade
0,30

Densidade

0,25
0,20
0,15
0,10
0,05
0,00

Desde que e positivo,

a
X
b

a
b
=P
Z

b
a
=P Z
P Z <

P(a X b) = P

Desde que Z e contnua, esta u


ltima probabilidade e igual a

b
a
b
a
P Z
P Z
=

onde e a funcao de distribuicao normal padrao e e representada na tabela 1 do apendice. A tabela


referida foi construda pelo autor com auxlio do software Minitab. Existem outras tabelas para calculo
da distribuicao normal padrao, e devemos estar atentos a como consultar cada uma delas.
Observacoes:
1. Desde que (z) = (z), pode-se provar que para z > 0,
P(Z z) = P(Z z) = 1 P(Z z)

2. Tambem podemos provar que:


P(z Z z) = 2P(Z z) 1

84

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

Exemplo:
Suponha que X N (100; 1,2). Calcule a P(98,3 X 101,4)
Solucao:

98,3 100
X
101,4 100

P(98,3 X 101,4) = P

1,2
1,2
= P(1,55 Z 1,28)
= P(Z 1,28) P(Z 1,55)

= P(Z 1,28) [1 P(Z 1,55)]


= 0,899727 [1 0,939429] = 0,839156

Alguns resultados u
teis, relativos `a distribuicao normal, sao sumarizados na figura a seguir:
f(x)

:3F

:2F

:F

:+F

:+2F

:+3F

68%
95%
99,7%

Para qualquer variavel aleatoria normal,


P( < X < + ) = 0,6827

P( 2 < X < + 2) = 0,9545 P( 3 < X < + 3) = 0,9973

A seguir apresentamos alguns exerccios para auxiliar na pratica de utilizacao da tabela da Normal
Padrao (X N (0,1)):
f(x)

P(0 Z 1) = 0,341345
P(0 Z 2,13) = 0,483414
Se P(0 Z zc ) = 0,45
entao zc = 1,64 ou 1,65
Se P(0 Z zc ) = 0,49

Zc

entao zc = 2,33

85

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

f(x)

P(1 Z 1) = 2P(0 Z 1) = 0,682690


.
Se P(zc Z zc ) = 0,70
entao P(0 Z zc ) = 0,70/2 = 0,35
Zc

e zc = 1,04

Zc

f(x)

P(1 Z 0,5)
= P(1 Z 0) P(0,5 Z 0)
.
= P(0 Z 1) P(0 Z 0,5)
= 0,341345 0191462 = 0,149883

Z1 Z2 0

f(x)

P(Z > 2) = P(Z > 0) P(0 < Z < 2)


= 0,5 0,477250 = 0,02275
P(Z > 2,14) = P(Z > 0) + P(2,14 < Z < 0)
= 0,5 + 0,483823 = 0,983823
Se P(Z > zc ) = 0,95

entao P(Z < zc ) = 0,05 zc = 1,64

ZC

Exemplos de problemas com variaveis aleatorias com distribuicao normal:


1. O tempo de vida, em anos, de um certo tipo de bateria tem distribuicao normal com media = 3
e desvio padrao = 0,5. Qual a probabilidade de que uma bateria dure mais de 4 anos?
Solucao

4
X
>
P(X > 4) = P

43
=P Z>
0,5

= P(Z > 2) = 1 P(Z 2) = 1 0,977250 = 0,0228


ou seja, pouco mais de 2% das baterias duram mais de 4 anos.

86

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

2. Se X N (2,9) calcule
(a) P(X 4)
Solucao:

P(X 4) = P

X
42

= P(Z 0,6667) = 0,7486

(b) P(X > 4)


Solucao:
P(X > 4) = 1 P(Z 0,6667) = 0,2514
(c) P(X 0)
Solucao:

P(X 0) = P

X
02

= P(Z 0,6667)
= 1 P(Z 0,6667) = 1 0,748571 = 0,2514
(d) P(0 < X < 4)
Solucao:

P(0 < X < 4) = P

02
42
<z<
3
3

= P(0,6667 < Z < 0,6667)


= P(Z 0,6667) P(Z < 0,6667)
= P(Z 0,6667) P(Z > 0,6667)
= P(Z 0,6667) [1 P(Z 0,6667)]
= 2P(Z 0,6667) 1
= 1,497142 1 = 0,4971
(e) P(3 < X < 4)
Solucao:

P(3 < X < 4) = P

32
42
<Z<
3
3

= P(0,3333 < Z < 0,6667)


= P(Z 0,6667) P(Z 0,3333) =
= 0,748571 0,629300 = 0,1193
(f) valor de a tal que P(X > a) = 0,05
Solucao:
Pela regra de padronizacao sabemos que P(X > a) = P(Z >
a tabela temos:
a2
= 1,64
3

87

a
2 )

= 0,05, assim consultando

a = (1,64 3) + 2 = 6,92

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

3. Em uma prova, a nota media foi 74 e o desvio padrao foi 7. Se 12% da turma obteve conceito A, e
as notas possuem distribuicao normal, qual a menor nota da faixa A e a maior da B?
Solucao:

x 74
Temos que calcular o valor de x tal que P(X > x) = 0,12 que e o mesmo que P Z >
= 0,12
7
Pela tabela vemos que este valor e 1,175, assim resolvemos:
x 74
= 1,175
7

x = (1,175 7) + 74 = 82,225

Assim a menor nota com conceito A e 83 e a maior com conceito B e 82.

4.6.2

Aproxima
c
oes das distribuico
es binomial e de Poisson pela normal

Em diversos sistemas fsicos aparecem variaveis aleatorias com distribuicao binomial com valores de
n muito altos, tornando os calculos de probabilidade extremamente difceis mesmo para calculadoras e
computadores comuns. Nestes casos e conveniente utilizar a aproximacao da distribuicao binomial pela
normal. Veja a figura abaixo: a area de cada barra e igual `a probabilidade binomial de x que pode ser
aproximada pela area sob a funcao de densidade normal:
0,16

Distribuio n p
Binomial
30 0,5

0,14

Distribuio Mdia Varincia


Normal
15
7,5

0,12

f(x)

0,10
0,08
0,06
0,04
0,02
0,00
5

10

15
X

20

25

Quanto maior for n, melhor a aproximacao:


0,09
0,08
0,07

f(x)

0,06
0,05
0,04
0,03
0,02
0,01
0,00
30

40

50
X

88

60

70

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

Se lembramos que para uma variavel X Bin(n,p) nos temos


E(x) = np

V (X) = np(1 p)

entao usaremos para aproximar a distribuicao desta variavel uma distribuicao normal com media
= np e variancia 2 = np(1 p).
Exemplo:
Em um canal digital de comunicacao o n
umero de bits recebidos com erro e uma variavel aleatoria
binomial com probabilidade 110 5. Se 16 milhoes de bits forem transmitidos, qual sera a probabilidade
de se ter mais de 150 erros?
Solucao:
Como X Binomial(16.000.000; 1 10 5) temos
P(X > 150) =1 P(X 150)

150
X
16.000.000
=1
(105 )x (1 105 )16.000.000x
x
x=0
Como este e um calculo difcil, usamos a aproximacao por uma normal com
p
= np = 16.000.000 105 = 160 e = 160(1 105 ).
Usando a padronizacao podemos calcular:

P(X > 150) =P

X 160
160(1 105 )

>p

150 160

160(1 105 )

=P(Z > 0,79) = P(Z < 0,79) = 0,785

Cabe ressaltar que a distribuicao binomial so e simetrica para p = 0,5, e portanto a aproximacao pela
`
normal sera uma boa aproximacao para valores de p proximos a 0,5 com n suficientemente grande. A
medida que n aumenta a aproximacao vai melhorando mesmo para p nao proximos de 0,5

Tambem uma variavel aleatoria de Poisson pode ser aproximada pela distribuicao normal. Assim:
Se X for uma variavel aleatoria de Poisson com E(X) = e V (X) = entao
Z=

e aproximadamente uma variavel aleatoria normal padrao para valores de suficientemente grandes.
Exemplo:
O n
umero de veculos que entram por minuto no campus da UFMG pela portaria da Av. Ant
onio
Carlos tem distribuicao de Poisson com = 10. Calcule a probabilidade aproximada de que em uma
89

NORMAL
4.6. DISTRIBUIC
AO

cpa/gsa

hora entrem no maximo 650 veculos.


Solucao:
Seja X : n
umero de veculos que entram por aquela portaria em 60 minutos, entao X P (600).

X 600
650 600
50

P(X 650) P

P Z
= P(Z 2,04) = 0,9793325
24,495
600
600
A probabildade exata e:
P(X 650) =

650 600
X
e
600x

x!

x=0

= 0,979346

Alguns autores sugerem no caso binomial usar a aproximacao normal se np 5 e no caso da Poisson
quando > 15. Essas sugestoes foram dadas em epocas em que os recursos computacionais eram escassos
ou limitados. Atualmente essas sugestoes nao precisam ser seguidas pois , por exemplo, quaiquer pacotes
estatsticos assim como planilhas eletronicas calculam probabilidades envolvendo a variavel aleatoria de
Poisson com > 15.
Afigura abaixo ilustra a aproximacao de uma distribuicao de Poisson com = 15 por uma normal
(15, 15). Esta aproximacao melhora `a medida que aumenta.

Distribuio Lambda
Poisson
15

0,10

Distribuio Mdia Desv. Pad.


Normal
15
3,87298

f(x)

0,08

0,06

0,04

0,02

0,00
0

10

15
X

20

25

30

Exemplo:
Considere que o n
umero de bacterias em 1 cm3 de esgoto recebido por determinada estacao de tratamento tenha distribuicao Poisson com media de 700. Se analisarmos 1 cm3 qual a probabilidade de que
menos de 750 bacterias sejam encontradas?
Solucao:
A probabilidade exata e:
P(X 750) =

750 700
X
e
700x
x=0

90

x!

EXPONENCIAL
4.7. DISTRIBUIC
AO

cpa/gsa

Como os calculos sao complicados podemos aproximar por

750 700
P(X 750) = P Z
= P(Z 1,89) = 0,970621
700
O resultado exato da Poisson obtido pelo Minitab e 0,970799.

4.7

Distribuic
ao exponencial

Vimos que a variavel aleatoria discreta de Poisson contava o n


umero de ocorrencias em uma unidade
de medida como tempo, comprimento, area, etc.
Voltando `a subsecao 3.6.7, vimos que se o n
umero de ocorrencias por unidade de tempo tem distribuicao de Poisson com parametro , entao o n
umero de ocorrencias em um intervalo de tempo de
comprimento t tem distribuicao de Poisson com parametro t.
Consideremos agora a variavel aleatoria Y : tempo ate a primeira ocorrencia deste evento. Encontremos a funcao de distribuicao de Y :
Desde que Y e nao negativa, para y > 0,
P(Y > y) = P(Xy = 0) =

ey (y)0
= ey
0!

Observe que Y > y se e somente se o evento nao ocorreu ate o instante y; ou seja Xy = 0.
E assim

P(Y y) = F (y) =

0
1 ey

se y 0,
se y > 0.

Uma variavel aleatoria com essa funcao de distribuicao e dita ter distribuicao exponencial com
parametro . Notacao X exp(). A funcao de densidade e dada por:
f (x) = ex

x>0

Pode-se provar que o tempo entre duas ocorrencias consecutivas tem tambem distribuicao exponencial
com o mesmo parametro .
Observacao: Alguns textos usam a representacao
1 1x

se x > 0,
e
f (x) =
0
caso contrario.
Se a variavel aleatoria X tem distribuicao exponencial com parametro entao:
E(X) =

91

V (X) =

1
2

EXPONENCIAL
4.7. DISTRIBUIC
AO

cpa/gsa

A figura abaixo mostra a densidade de uma variavel exponencial para alguns valores de

0,5

Valores de

2
0,4

f(x)

0,3

0,5
0,2

0,1
0,1

0,05
0

Exemplos:
1. Suponha que a duracao de certo equipamento eletronico tenha distribuicao exponencial (em horas)
com taxa = 0,001. Calcule:
(a) A probabilidade de o equipamento dure pelo menos 2.000 horas.
Solucao:
Se X Exp(0,001) entao
Z

0,001e0,001x dx

P(X 2000) =
2000

2000

=1

0,001e0,001x dx

2000

= 1 + e0,001x
= 1 + e2 1 = e2 = 0,1353
0

(b) A media e mediana do tempo de duracao do equipamento.


Solucao:
E(X) = =
Z

md

f (x)dx = 0,5
0

md

1
= 1.000 horas.

0,001e0,001x dx = 0,5

92

md
e0,001x 0

EXPONENCIAL
4.7. DISTRIBUIC
AO

cpa/gsa

resolvendo a equacao:
1 e0,001md = 0,5
e0,001md = 0,5
ln(e0,001md ) = ln(0,5)
0,001md = ln(2)
0,69315
md =
= 693,15 horas
0,001

2. O tempo entre acessos a determinado servidor da web (em segundos) tem distribuicao exponencial
com parametro 2.
(a) Ache a media e o desvio padrao do tempo entre acessos.
Solucao:

Se X Exp(2) entao E(X) = 0,5 e S = 0,25 = 0,5 segundos.


(b) Calcule a probabilidade do tempo entre dois acessos ser menor que 0,5 segundos.
Solucao:
Z
P(X 0,5) =
0

0,5

0,5
2e2x dx = e2x 0 = 1 e1 = 0,6321

Defini
c
ao 20. Propriedade de Falta de Mem
oria
Para uma variavel aleatoria exponencial X, e t1 e t2 > 0
P(X > t1 + t2 , X > t1 )
P(X > t1 )
P(X > t1 + t2 )
=
P(X > t1 )

P(X > t1 + t2 |X > t1 ) =

e(t1 +t2 )
et1
t2
=e
= P(X > t2 )
=

Esta propriedade e conhecida como falta de memoria da distribuicao exponencial.


Na pratica, se dissessemos que o tempo ate a primeira falha de um equipamento tem distribuicao
exponencial, seria o mesmo que dizer que a probabilidade de falha num equipamento usado seria a mesma
de um equipamento novo, o que e impossvel. Outras distribuicoes sao usadas para modelar problemas
de tempo ate a falha ou confiabilidade de sistemas ou equipamentos. Apresentaremos algumas delas a
seguir.

93


4.8. DISTRIBUIC
OES
DE ERLANG E GAMMA

4.8

4.8.1

cpa/gsa

Distribuic
oes de Erlang e Gamma

Distribui
c
ao de Erlang

Como vimos na secao anterior a variavel aleatoria exponencial mede o tempo ate a primeira
ocorrencia de um processo de Poisson. Uma generalizacao desta distribuicao e aquela variavel aleatoria
que mede o tempo ate a r-esima ocorrencia deste evento. Definimos entao:
Defini
c
ao 21. A variavel aleatoria X, que e igual ao comprimento do intervalo de tempo ate que r
ocorrencias de um processo de Poisson com media > 0 acontecam tem uma distribui
c
ao de Erlang
com parametros e r. A funcao de densidade de probabilidade de X e:
f (x) =

r xr1 ex
,
(r 1)!

com x > 0 e r = 1, 2, . . .

A deducao dessa funcao de densidade escaa ao alcance da disciplina, o leitor interessado pode consultas, por exemplo, [8].
A media e variancia de uma variavel aleatoria de Erlang com parametros lambda e r sao:
= E(X) =

4.8.2

2 = V (X) =

r
2

Distribui
c
ao Gamma

A distribuicao de Erlang e um caso especial da distribuicao Gama. Se o parametro r de uma vari


avel
aleatoria de Erlang nao for inteiro, entao a variavel aleatoria tera uma distribuicao Gama. Como na
densidade de Erlang o parametro r aparece como fatorial, temos que generalizar a funcao fatorial, pelo
que chamamos funcao gama definida por:
Z x
(r) =
xr1 ex dx,
para r > 0
0

Pode-se demonstrar que a integral na definicao da funcao gama e finita e que:


(r) = (r 1)(r 1)
Assim se r for um inteiro positivo como na distribuicao de Erlang, temos
(r) = (r 1)!
A funcao de densidade de probabilidade da variavel aleatoria com distribuicao Gama e:
f (x) =

r xr1 ex
,
(r)

com x > 0 e r > 0

A media e variancia de uma distribuicao Gama tambem sao:


= E(X) =

94

2 = V (X) =

r
2

DE WEIBULL
4.9. DISTRIBUIC
AO

cpa/gsa

A figura abaixo mostra a funcao de densidade de uma variavel aleatoria Gama para alguns parametros
r e :
1

1
1
8,3
2
7,5 3,75

0,8

0,6

0,4

0,2

0
0

10

12

Veremos oportunamente um caso especial da distribuicao Gama, em que o parametro = 1/2 e r igual
a distribuicao Qui-quadrado, usada com frequencia na estimacao
a um dos valores 1/2, 1, 3/2, 2, . . . . E
por intervalos e testes de hipoteses, que serao estudados nos proximos captulos.

4.9

Distribuic
ao de Weibull

A distribuicao de Weibull e usada para modelar o tempo ate uma falha de muitos sistemas fsicos
diferentes. Os parametros da distribuicao sao flexveis e servem para modelar sistemas em que o n
umero
de falhas aumenta com o tempo, diminui com o tempo ou permanece constante.
Defini
c
ao 22. A variavel aleatoria X com funcao de probabilidade
f (x) =

x 1 (x/)
e

para x > 0

e dita ter distribui


c
ao de Weibull com parametros > 0 e > 0 e chamado parametro de escala e
parametro de forma.
Voce pode verificar que quando = 1 a distribuicao de Weibull se reduz `a distribuicao exponencial.
A funcao de distribuicao cumulativa e frequentemente utilizada para calcular as probabilidades. Podese obter o seguinte resultado:
Se X W eibull(, ) entao teremos:

F (x) =

0
x
1 e( )

95

se x 0,
se x > 0.

LOGNORMAL
4.10. DISTRIBUIC
AO

cpa/gsa

A flexibilidade da distribuicao Weibull pode ser atestada pelos graficos das funcoes de densidade
mostrados na figura abaixo.
1

1,0

1,0

3,4

2,0

0,8

6,2

11,5

19,0
2

f(x)

0,6

4,5

0,4

0,2

0
0

10

12

4.10

Distribuic
ao Lognormal

Outra distribuicao que aparece com frequencia na analise de experimentos de analise de falhas, confiabilidade e analise de sobrevivencia, e a distribuicao Lognormal.
Registramos a seguir a densidade, media e variancia da variavel aleatoria com distribuicao Lognormal,
com parametros de locacao e escala respectivamente e 2 , alem de ilustrarmos com o grafico de f (x)
para alguns valores de 2 :

(ln(x))2
1
f (x) =
e 22 ,
x 2 2

0 < x < ;

E(X) = e+(

/2)

2
V (X) = e 1 e2+ .

0,6

0,5

f(x)

0,4

s
2

1,0

0,500

1,0

0,250

1,0

0,125

1,0

5,000

0,3

0,2

0,1

0
0

96

10

12

4.11. EXERCICIOS

4.11

cpa/gsa

Exerccios

1. Uma empresa de construcao dispoe de 200 operarios para trabalhar nas suas obras. De acordo
com historico da empresa, 1% destes operarios faltam ao servico. A empresa enfrentara serias
dificuldades se mais de 4 operarios faltarem ao servico em um determinado dia.
(a) Forneca uma expressao para a probabilidade de que em um dia determinado a empresa enfrente
serias dificuldades. Aproxime convenientemente esta probabilidade;
(b) Calcule a probabilidade de que em 10 dias, a empresa nao tenha serias dificuldades em pelo
menos 8 deles. Que suposicao e necessario assumir neste item?

2. As notas de uma prova de um concurso nacional se distribuem de acordo a uma normal com media
igual a 120,6 e desvio padrao igual 5,8.
(a) Qual a probabilidade de que a nota de um estudante esteja entre 112,5 e 126,5?
(b) Se 65 candidatos sao escolhidos ao acaso, aproxime a probabilidade de que pelo menos 50 deles
tenham nota entre 112,5 e 126,5;
(c) Qual sera a nota mnima aprovatoria se 25% dos candidatos serao admitidos?.

3. O tempo, em horas, que uma equipe leva para realizar um tipo de tarefa tem distribuicao exponencial
com media igual a 200 horas.
(a) Qual a probabilidade de que a proxima tarefa deste tipo seja executada em menos de 150
horas?
(b) Se 10 equipes igualmente eficientes realizam, cada uma, uma destas tarefas, qual a probabilidade de que no maximo uma equipe leve mais de 150 horas para completa-la?

4. O tempo de vida, em anos, de certo tipo de equipamento tem distribuicao de Weibull com parametro
de forma = 2,274 e parametro de escala = 4,391.
(a) Se o tempo de garantia destes aparelhos e de 18 meses, qual a probabilidade de que um
aparelho, escolhido ao acaso, atenda `a garantia?
(b) Qual deve ser o tempo de garantia se quisermos que 90% dos aparelhos atendam esta garantia?.

5. O tempo, em minutos, de utilizacao de um caixa eletronico por clientes de um certo banco, foi
modelado por uma vari
avel T com densidade Exponencial(5). Calcule:
(a) P(T < 2);
(b) P(T 5|T > 3);
(c) Um n
umero a tal que P(T a) = 0,8. Qual o valor e a interpretacao de a?

6. O peso contido em pacotes de arroz tem distribuicao normal com media igual a 5.000 gramas e
variancia igual a 1600 gramas2
97

4.11. EXERCICIOS

cpa/gsa

a-) Qual a probabilidade de que um pacote contenha peso entre 4.944 e 5.056 gramas?
b-) Se 15 pacotes sao escolhidos ao acaso, qual a probabilidade de que no maximo dois deles
contenham peso fora dos limites dados em (a)?
c-) Se 150 pacotes sao escolhidos ao acaso, aproxime a probabilidade de que no mnimo 15 desses
pacotes e no maximo 30 contenham peso fora dos limites em (a).

7. O peso de ruptura de certo tipo de barras tem distribuicao normal. Mediu-se o peso de ruptura 16
dessas barras, encontrando-se uma media de x
= 289,2 kg e uma variancia amostral S = 18,49 kg 2 .
(a) Encontre um intervalo de 90% de confianca para a media do peso de ruptura dessas barras.
(b) Teste, ao nvel = 0,01, H0 : = 300 contra H1 : 6= 300.
(c) Teste, ao nvel = 0,05, H0 : 2 = 15 contra H1 : 2 6= 15.

8. Voce fabrica vergalhoes de aco para construcao cuja resistencia `a tracao e uma variavel aleatoria
normal com media 5.000 kg/cm2 e variancia 400 kg 2 /cm4 .
(a) Qual a probabilidade da resistencia da barra ficar entre 4.974 e 5.026kg/cm2 ?
(b) Qual o valor (r) da resistencia , se 95% das barras produzidas possuem resistencia maior que
(r)?
(c) Qual o percentual de barras produzidas com resistencia menor ou igual a 5.031 kg/cm2 ?

9. Voce esta submetendo corpos de prova de concreto, cuja resistencia `a compressao e uma vari
avel
aleatoria normal com media 400 kg/cm2 e variancia 25 kg 2 /cm4 , a testes de ruptura.
(a) Qual a probabilidade da resistencia do corpo de prova ficar entre 390 e 405kg/cm2 ?
(b) Qual o valor (r) da resistencia , se 95% dos corpos de prova apresentarem resistencia maior
que (r)?
(c) Qual o percentual de corpos de prova com resistencia menor ou igual a 405,4 kg/cm2 ?

10. O tempo de vida de um certo tipo de oleo isolante tem distribuicao Exponencial com parametro
= 0,2 anos.
(a) Se o fabricante desse equipamentos deseja oferecer uma garantia de tal forma que o tempo de
vida de 80% do oleo vendido ultrapasse o tempo de garantia, qual deve ser esse tempo?
(b) Se uma partida de oleo atendeu o tempo de garantia, qual a probabilidade que ele dure por
mais um ano?

11. Um estudante de pos-graduacao esta submetendo sua dissertacao para correcao de um revisor que
cobra R$0,50 por cada erro de digitacao encontrado. Sabendo-se que o n
umero de erros por pagina
e uma variavel de Poisson com parametro = 0,5; responda:
(a) Se a tese tem 100 paginas, indique a probabilidade do custo de revisao ser no maximo R$20,00?
(b) Qual e aproximadamente a probabilidade de que o custo de revisao seja no maximo R$20,00?

98

Captulo 5

Infer
encia
5.1

Infer
encia estatstica

Nesse u
ltimo captulo abordaremos os conceitos fundamentais de Inferencia. No captulo 1 descrevemos e representamos graficamente amostras obtidas de uma popula
c
ao. Nesse captulo mostraremos
como usar a informacao obtida a partir da amostra para inferir sobre a populacao. Infelizmente, ao
fazer inferencia estamos sujeitos a erros. Uma forma de medirmos esses erros e usando ferramentas de
probabilidade, algumas das quais vistas no captulo 2.
A Inferencia Estatstica pode ser dividida em duas partes: estima
c
ao de par
ametros, apresentada
na secao 5.3 e testes de hip
oteses, que serao estudados na secao 5.4.
Imagine que um engenheiro de estruturas esteja analisando a resistencia `a compressao do concreto
usado em uma obra. Esta resistencia sofre variacoes devidas a diferencas nas materias primas, erros de
dosagem, mudancas na forma de concretagem, etc. e portanto o engenheiro esta interessado em estabelecer a resistencia media. Na pratica ele ira usar corpos de prova (amostras) para calcular um n
umero
que seja um valor razoavel para a media verdadeira. Este n
umero e chamado de estimativa.
Considere agora que dois tipos de cimento c1 e c2 possam ser usados para preparacao do concreto. O
engenheiro conjectura que o cimento c1 resulta em uma mistura com maior resistencia do que a obtida
com o cimento c2 . O teste de hip
oteses estatsticas resolve problemas deste tipo. Neste caso a
hipotese seria que a resistencia media do concreto usando o cimento c1 seria maior que a do concreto
obtido com o cimento c2 .

5.2

Amostragem aleat
oria

Suponhamos que estamos produzindo parafusos e estes parafusos devem cumprir certas especificacoes
para serem aceitos no mercado. Estas exigencias implicam em que = 10 cm e = 0,2 cm, onde e
sao respectivamente a media e o desvio padrao da variavel aleatoria X = comprimento do parafuso
que estamos produzindo. Se atendermos `as especificacoes acreditamos que 95% de nossa producao sera
aceita no mercado. Nossa primeira tarefa sera fazer uma producao piloto, retirar uma amostra de ta n e Sn . Se estes valores ficarem perto de 10 e 0,2 respectivamente, temos
manho n dela, e calcular X
indcio de que podemos comecar a produzir em grande escala. Uma segunda tarefa sera achar duas
n ,n ) e S(X
n ,n ) tais que P(L(X
n ,n ) X S(X
n ,n )) = 0,95. Dependendo dos valores
funcoes L(X
de L e S nossa linha de producao sera liberada ou tera que ser submetida a algumas calibracoes adicionais.

99


5.2. AMOSTRAGEM ALEATORIA

cpa/gsa

Suponhamos finalmente que, depois de certo tempo de producao, verificamos que mais de 5% da nossa
producao nao esta sendo aceita no mercado. Um primeiro motivo da rejeicao de nosso produto poderia

ser o fato de que a media deixou de ser 10. Se um comprador devolveu uma caixa de parafusos, porque X
encontrada naquela caixa foi menor que 10, entao poderamos acreditar que precisamos reajustar nossa
linha de producao para recuperar = 10; mas faramos isto depois de verificar mediante um teste de
hipotesesa afirmacao do nosso comprador.
Podemos agora definir:
Defini
c
ao 23. Seja X uma variavel aleatoria com funcao de densidade (f.d.p.) fX (x; ). Sejam
X1 ,X2 , . . . ,Xn observacoes independentes de X. Dizemos entao que X1 ,X2 , . . . ,Xn e uma amostra
aleat
oria de tamanho n da variavel X.
Seja X uma variavel aleatoria com funcao de densidade f (). Se X1 ,X2 , . . . ,Xn e uma amostra aleatoria
de X, estabelecemos, sem prova, que a funcao de densidade conjunta do vetor X = (X1 ,X2 , . . . ,Xn )
avaliado no ponto (x1 ,x2 , . . . ,xn ) e dada por
f (X1 ,X2 , . . . ,Xn ) = f (x1 )f (x2 ) . . . f (xn )
Se a densidade depende de um parametro , denotaremos
f (X1 ,X2 , . . . ,Xn ; ) = f (x1 ; )f (x2 ; ) . . . f (xn ; )
Exemplo:
Supondo que X N (, 2 ), isto e, X tem distribuicao normal com media e variancia 2 e seja
X1 ,X2 , . . . ,Xn uma amostra aleatoria de X; entao a densidade conjunta avaliada no ponto (x1 ,x2 , . . . ,xn )
e dada por:

1 (x1 )2
1 (x2 )2
1 (xn )2



2
2
1
1
1
2

2
2

f (X1 ,X2 , . . . ,Xn ; ,) =


e
e
...
e
2
2
2

ou

f (X1 ,X2 , . . . ,Xn ; ,) =

n
e

Pn
i=1 (xi
2

1

2

)2

Nesse caso o parametro e bidimensional, = (, 2 ).

Chamamos a atencao para a diferenca entre uma amostra (x1 ,x2 , . . . ,xn ) como definido no captulo
1 e uma amostra aleat
oria X1 ,X2 , . . . ,Xn . Para ilustrar esta diferenca, imaginemos que estamos investigando o comprimento dos parafusos citados no paragrafo anterior. Entao X1 ,X2 , . . . ,Xn sao variaveis
aleatorias independentes representando o comprimento dos parafusos antes da medicao efetiva. Depois
de fazermos as medicoes teremos X1 = x1 , X2 = x2 , . . . , Xn = xn ; resumindo, amostra e a realizacao de
uma amostra aleatoria.
A finalidade principal de se tomar uma amostra aleatoria e obter informacoes sobre os parametros
desconhecidos da populacao. Para isto usamos estatsticas.
100

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Defini
c
ao 24. Uma estatstica e qualquer funcao das observacoes em uma amostra aleatoria.
Ja vimos o conceito de estatstica anteriormente. Se X1 ,X2 , . . . ,Xn for uma amostra aleatoria
a variancia da amostra S 2 , a amplitude da amostra
de tamanho n, entao a media da amostra X,
[max(X1 ,X2 , . . . ,Xn ) min(X1 ,X2 , . . . ,Xn )] sao exemplos de estatsticas.
Uma das principais aplicacoes da estatstica e obtencao de estimativas para parametros da populacao
(tais como media, variancia, proporcao, etc.). Normalmente usa-se a letra grega para representar o
parametro que se quer estimar.
Em geral, se X for uma variavel aleatoria com distribuicao de probabilidades f (x), caracterizada por
um parametro desconhecido e se X1 ,X2 , . . . ,Xn for uma amostra aleatoria de tamanho n de X, entao
a estatstica = h(X1 ,X2 , . . . ,Xn ) e chamada de um estimador de .
Exemplo:
Suponha que vamos colher uma amostra de tamanho n, denotada por X1 ,X2 , . . . ,Xn . Suponha que
desejamos estimar a media populacional (ou seja o parametro que se quer estimar e ).
Sao estimadores possveis para :
X1 + X2
1. =
2
= X1 + X2 + + Xn
2. = X
n
Xmax + Xmin
3. =
2
4. = X1
Note que e funcao de variaveis aleatorias, sendo portanto tambem uma variavel aleatoria. Depois
de selecionarmos uma amostra aleatoria, o estimador assume um valor numerico particular para aquela
X1 + X2
amostra, chamado de estimativa. Assim se o estimador escolhido for =
, uma estimativa
2
x
+
x
1
2
.
seria =
2

5.3
5.3.1

Estimac
ao de par
ametros
Estima
c
ao pontual

Seja X uma variavel aleatoria com funcao de (densidade de) probabilidade cuja forma funcional e
conhecida, mas dependendo de um parametro que pode assumir valores num conjunto parametrico
(espaco parametrico). pode ser unidimensional ou p-dimensional. Neste caso entao nao estamos perante
uma funcao de probabilidade, mas perante a uma classe de funcoes de probabilidade. A cada valor de
corresponde um elemento da classe.
Como exemplo, pensemos na classe de Distribuicoes Normais com media e variancia 1. Para cada
valor de R teremos uma distribuicao da classe:

(x)2
1
e 2
com < x < , = ( : < < )
1 = f (x; ,1) =

101

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Se a variancia nao fosse conhecida, a classe seria:

!
1 x 2

2 = f (x; , 2 ) =
e 2
com < x <

, = {(, 2 ) : < < e 2 > 0}

O parametro no primeiro caso e = e no segundo, = (, 2 ), e os respectivos espacos parametricos


descritos acima.
Nosso problema e determinar qual elemento da classe e a distribuicao da variavel da qual foi extrada
a amostra x1 ,x2 , . . . ,xn ; em outras palavras, qual e o valor do parametro que determina a distribuicao
de X. Certamente nao conseguiremos uma resposta absolutamente valida, mas sera uma resposta que,
dependendo dos criterios seguidos para obtencao da amostra, dara uma boa aproximacao para . Em
termos estatsticos estamos estimando por um ponto. O estimador sera denotado por e sera uma
funcao das observacoes.
Problemas de estimacao ocorrem com frequencia em engenharia. O quadro abaixo mostra uma relacao
de parametros que geralmente necessitamos estimar e algumas estimativas pontuais razoaveis para cada
um deles:
Parametro

Estimador

A media de uma u
nica populacao
A variancia 2 de uma u
nica populac
ao
A proporcao p de itens de uma classe de interesse em uma populacao
A diferenca das medias de duas populacoes,
1 2
A diferenca na proporcao de duas populacoes,
p1 p2

5.3.1.1

a media da amostra

= X,

2 = S 2 , a variancia da amostra
p = x/n, a proporcao na amostra, onde x e o
n
umero de itens da classe na amostra
1 X
2 , a diferenca entre as medias

1
2 = X
de duas amostras aleatorias independentes
p1
p2 , a diferenca entre duas proporcoes amostrais, calculadas a partir de duas amostras
aleatorias independentes.

Propriedades de estimadores

Gostaramos que os estimadores que vamos construir tenham algumas propriedades, que variam de
acordo com o problema em estudo. As principais propriedades sao:
1. N
ao viciado (nao viesado ou nao tendencioso): Um estimador e nao viciado para se
=
E()
e chamada de vcio do estimador.
Se o estimador for tendencioso, entao a diferenca E()
Exemplo:
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao com media e variancia 2 , ambas
e a variancia amostral S 2 sao estimadores nao viciados
finitas. Verifique se a media amostral X
2
para e respectivamente.

102

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Solucao:

=E
E(X)

1
(X1 + X2 + + Xn )
n

1
E(X1 + X2 + + Xn )
n
1
= nE(X1 )
n
=

Pn
E(S 2 ) = E
=
=
=
=
=
=
=

1
n1

2
X)
n1
n
X
2
E
(Xi X)

i=1 (Xi

i=1

n
X
1
2 2XX
i)
E
(X 2 + X
n 1 i=1 i
" n
#
n
n
X
X
X
1
2 2X

E
Xi2 +
X
Xi
n1
i=1
i=1
i=1
" n
#
n
X
X
X
1
i
2
2
2Xn

Xi + nX
E
n1
n
i=1
i=1
#
" n
X
1
2
Xi2 nX
E
n1
i=1
" n
#
X
1
2
2
)
E(Xi ) nE(X
n 1 i=1
#
" n
X
1
2
2
2
2
( + ) n( + /n)
n 1 i=1

1
(n2 + n 2 n2 2 )
n1
= 2

O pen
ultimo passo da resolucao acima advem de que:

V (X) = E(X 2 ) (E(X)2 )

E(X 2 ) = V (X) + (E(X)2 ) = 2 + 2

= E(X
2 ) (E(X)
2)
V (X)

2 ) = 2 /n + 2
2 ) = V (X)
+ (E(X)
E(X

e S 2 sao estimadores nao viciados para e 2 respectivamente.


Vemos portanto que X
2. Consist
encia: Um estimador e consistente para se:
=
lim E()

=0
lim V ar()

Isto e, `a medida que o tamanho da amostra vai aumentando, a media do estimador converge para
o parametro e a variancia do estimador converge para zero.

103

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Algumas vezes existem diversos estimadores nao viciados para determinado parametro da populacao. Por exemplo, suponha que geramos uma amostra aleatoria de tamanho n = 10 de uma
populacao normal e obtemos os dados:
x1 = 12,8; x2 = 9,4; x3 = 8,7; x4 = 11,6; x5 = 13,1; x6 = 9,8; x7 = 14,1; x8 = 8,5; x9 =
12,1; x10 = 10,3.
Podemos a partir da amostra obter:
12,8 + 9,4 + 8,7 + 11,6 + 13,1 + 9,8 + 14,1 + 8,5 + 12,1 + 10,3
= 11,04
10
10,3 + 11,6
Mediana: med =
= 10,95
2
8,7 + 9,4 + 9,8 + 10,3 + 11,6 + 12,1 + 12,8 + 13,1
Media truncada a 10%: =
= 10,98
8
Media: x
=

Podemos mostrar que a mediana e a media truncada sao estimadores nao viciados de . Como
nao existe um u
nico estimador nao viciado, nao podemos usar apenas o criterio de vcio zero para
selecionarmos o melhor estimador. Por isto usamos a propriedade:
3. Efici
encia: Dados dois estimadores 1 e 2 nao viciados para , dizemos que 1 e mais eficiente

que 2 se
V ar(1 ) < V ar(2 )
Nao existe um criterio absoluto para definir o melhor estimador. No entanto diremos que e
o melhor estimador para se ele e nao viciado e se alem disso, entre todos os estimadores nao
viciados, ele tiver variancia mnima. Neste caso o denominamos Estimador n
ao tendencioso de
vari
ancia mnima (ENTVM).
Exemplo:
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 1.
e 2 = X1 sao estimadores nao viciados para . Determine qual e o mais eficiente.
Os estimadores 1 = X
Solucao:

=V
V (1 ) = V (X)

X1 + X2 + , + Xn
n

1
V (X1 + X2 + , + Xn )
n2
1
= 2 nV (X)
n
1
=
n
=

V (2 ) = V (X1 ) = 1

e um estimador mais eficiente que X1 .


Logo 1 = X
Obs: Estamos usando, sem prova, que a variancia de uma soma de variaveis aleatorias independentes e
igual `a soma das variancias destas variaveis. A prova desta propriedade vai alem do alcance da disciplina.
O leitor interessado pode ver por exemplo [8] ou [3] ou ainda [2].
104

DE PARAMETROS

5.3. ESTIMAC
AO

5.3.1.2

cpa/gsa

Desvio Padr
ao

Quando calculamos o valor numerico ou a estimativa pontual de um parametro, e usualmente desejavel


darmos uma ideia da precisao da estimativa. A medida de precisao usualmente empregada e o erro padrao
do estimador utilizado.
q
Se o desvio padrao
Defini
c
ao 25. O desvio padr
ao de um estimador e dado por = V ().
envolve parametros desconhecidos que podem ser estimados, substitumos estes valores em e obtemos
um desvio padrao estimado, denotado por
.

5.3.1.3

Erro Quadr
atico M
edio

Eventualmente precisamos usar um estimador viciado. Nestes casos e importante medirmos o Erro
Quadratico Medio do estimador, definido como a media do quadrado da diferenca entre o estimador e o
valor real do parametro.
Defini
c
ao 26. O Erro Quadr
atico M
edio de um estimador do parametro e definido como
EQM = E( )2

(em ingles MSE - Mean Squared Error)

Outra forma de escrevermos o EQM e:


2 + [ E()]
2 = V ()
+ (Vcio)2
EQM = E[ E()]
Ou seja, o Erro Quadratico Medio do estimador e igual `a variancia do estimador mais o vcio ao qua
drado. Se e nao viciado, o Erro Quadratico Medio e igual `a variancia de .
Em certas situacoes podemos preferir um estimador viciado do que um nao viciado, pois aquele pode
ter um erro quadratico medio menor. Isto e, pode ser possvel reduzir consideravelmente a variancia do
estimator atraves da introducao de um vcio relativamente pequeno. Desde que a reducao na variancia
seja maior do que o quadrado do vcio, um estimador melhor, do ponto de vista do erro quadratico medio,
sera obtido.

5.3.2

M
etodos de estimac
ao

A definicao de nao viciado e as outras propriedades dos estimadores nao fornecem nenhuma indicacao
de como podemos obter bons estimadores pontuais. Veremos nesta secao dois metodos para isto.
5.3.2.1

M
etodo dos momentos

o metodo mais antigo e mais simples de estimacao pontual. Foi desenvolvido por Karl Pearson
E
no fim do seculo XIX. A ideia geral por tras do metodo e igualar os momentos populacionais, que sao
definidos em termos de valores esperados, com os momentos amostrais correspondentes.
Suponhamos que a distribuicao da variavel aleatoria X dependa de K parametros 1 ,2 , . . . ,k ; e
sejam:
n
1X i
x
i = 1,2, . . . ,k
Mi = E(X i )
i = 1,2, . . . ,k
mi =
n j=1 j
Igualamos agora os MI aos valores mi , comecando com com i = 1 e continuando ate que existam
equacoes suficientes para proporcionar solucoes u
nicas para 1 ,2 , . . . ,k .
105

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Exemplos:
1. Seja X uma variavel aleatoria com distribuicao normal e parametros desconhecidos (1 ; 2 ), e seja
x1 ,x2 , . . . ,xn uma amostra obtida desta distribuicao. Utilize o metodo dos momentos para obter
estimadores para estes parametros.
Solucao:
Calculamos primeiro
M2 = E(X 2 ) = (E(X))2 + V (X) = 12 + 2
Pn
Pn
x2
i=1 xi
m2 = i=1 i
m1 =
n
n

M1 = E(X) = 1

Igualando os momentos populacionais aos amostrais de mesma ordem temos:


Pn
x2
2

M1 = 1 = m1 = X
M2 = 1 + 2 = m2 = i=1 i
n

Da primeira igualdade obtemos diretamente que 1 = X.


Substituindo 1 por 1 na segunda igualdade temos 2 =

Pn
i=1

x2i

2
2 = 1 Pn (xi X)
X
n i=1

2. Suponha que X1 ,X2 , . . . ,Xn e uma amostra aleatoria de uma distribuicao exponencial com parametro
desconhecido . Qual o estimador para obtido pelo metodo dos momentos?
Solucao:
Calculamos
M1 = E(X) =
Igualando os dois momentos obtemos:

5.3.2.2

m1 =

1X

xi = X
n i=1

1
=
X

M
etodo de M
axima Verossimilhan
ca

Este e um dos melhores metodos para obter-se um estimador de um parametro. Para estuda-lo introduzimos:
Defini
c
ao 27. Seja x1 ,x2 , . . . ,xn uma amostra de uma variavel aleatoria X com funcao de (densidade)
de probabilidade f (x,), . Entao a fun
c
ao de verossimilhan
ca da amostra e definida por:
L(|x1 ,x2 , . . . ,xn ) = f (x1 ,)f (x2 ,) . . . f (xn ,)

106

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Quando x1 ,x2 , . . . ,xn sao conhecidos, a funcao de verossimilhanca e funcao somente do parametro
desconhecido . O estimador de maxima verossimilhanca de e o valor que maximiza a funcao de
verossimilhanca L.
Vejamos intuitivamente o significado deste estimador. Consideremos o caso de uma variavel discreta
com distribuicao binomial de parametros r e p, isto e

r x
f (x,p) =
p (1 p)rx
x = 0,1, . . . ,r
x



r
r
r
x1
rx1
x2
rx2
L(p|x1 ,x2 , . . . ,xn ) =
p (1 p)
p (1 p)
...
pxn (1 p)rxn
x1
x2
xn
P
P
r
r
r
=
...
p i xi (1 p)nr i xi
x1
x2
xn

Dizermos que L(
p|x1 ,x2 , . . . ,xn ) L(p|x1 ,x2 , . . . ,xn )
p : 0 < p < 1, e o mesmo que dizer que
p e tal que as observacoes x1 ,x2 , . . . ,xn tem mais probabilidade de vir de uma distribuicao binomial
com parametros r e p do que de uma distribuicao binomial com parametros r e p, 0 < p < 1. Isto e,
X1 = x1 , X2 = x2 , . . . Xn = xn tem probabilidade maxima quando p = p.
Para o caso de variaveis aleatorias contnuas, embora a analise seja mais complicada, pode-se chegar
1 ,x2 , . . . ,xn ) L(|x1 ,x2 , . . . ,xn )
`a mesma conclusao; isto e L(|x
.
Exemplos:
1. Seja x1 ,x2 , . . . ,xn uma amostra de uma distribuicao normal com media e variancia 1. Achar o
estimador de maxima verossimilhanca para .
Solucao:
2
2
2
1
1
1
1
1
1
L(|x1 ,x2 , . . . ,xn ) = e 2 (x1 ) e 2 (x2 ) . . . . . . e 2 (xn )
2
2
2
n

n 1 P
2
2
(xi )
1
=
e i=1
2

NotePque para uma amostra de tamanho n fixo, a funcao de verossimilhanca depende


apenas de
P
n
2
1
e 2 i=1 (xi ) . Podemos ver entao que L(|x1 ,x2 , . . . ,xn ) sera maxima quando i (xi )2 for
m
para acharmos o maximo da funcao de verossimilhanca temos que minimizar
Pnima. Assim,
2
(x

)
.
Para
calcularmos este mnimo fazemos:
i
i
X
X
(xi )2 = 2
(xi )
i
i

107

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Igualando a derivada a zero, obtemos:


2

n
X
i=1
n
X

(xi
) = 0
(xi
) = 0

i=1
n
X

xi =

i=1

n
X

i=1

=x

Portanto x
e um candidato para o EMV procurado. Para confirmarmos se e ponto de maximo ou
de mnimo fazemos:
2 X
(xi )2 = 2n > 0,
2 i
P
o que significa que
=x
e um ponto de mnimo para i (xi )2 e equivalentemente um ponto
de maximo para L(|x1 ,x2 , . . . ,xn ). Em outras palavras,
=x
e o estimador de maxima verossimilhanca (EMV) para .
2. Seja x1 ,x2 , . . . ,xn uma amostra de uma variavel aleatoria com distribuicao exponencial com parametro
. Achar o Estimador de Maxima Verossimilhanca para
Solucao:
L(|x1 ,x2 , . . . ,xn ) = n e

P
i

xi

maximiza L(|x1 ,x2 , . . . ,xn ),


tambem ira maximizar lnL(|x1 ,x2 , . . . ,xn ).
Podemos observar que se
Chamamos a funcao l(|x1 ,x2 , . . . ,xn ) = lnL(|x1 ,x2 , . . . ,xn ) de log-verossimilhanca.
Entao podemos escrever:
l(|x1 ,x2 , . . . ,xn ) = lnL(|x1 ,x2 , . . . ,xn ) = ln[n e

P
i

xi

] = nln

X
i

Derivando a log-verossimilhanca com respeito a temos:


n X
l(|x1 ,x2 , . . . ,xn )
=
xi

i
Igualando a zero temos:

= 1

Confirmamos que o ponto e maximo porque a derivada segunda e n/2 < 0

108

xi

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

3. Seja f (x; ) = 1, com 1/2 X +1/2 e seja X1 ,X2 , . . . ,Xn uma amostra aleatoria da vari
avel
X. Achar o estimador de maxima verossimilhanca para .
Solucao:
L(|x1 ,x2 , . . . ,xn ) = 1,
Sejam Xmin = min xi

1
1
xi +
2
2

para 1 i n e Xmax = max xi

1
xmin
2

ou de forma equivalente:

1
2

xmin +
Entao
L(|x1 ,x2 , . . . ,xn ) =

para 1 i n:
1
xmax
2

xmax

se xmax

1
2

1
2

xmin + 21 ,

caso contrario

Isto significa que L(|x1 ,x2 , . . . ,xn ) e maximo para qualquer valor de no intervalo [xmax 12 ,xmin +
1
axima verossimilhanca para pode nao ser
2 ]. Este exemplo ilustra o fato de que o estimador de m
u
nico.
O metodo de maxima verossimilhanca pode ser usado em situacoes onde existem diversos parametros
desconhecidos, digamos, 1 ,2 , . . . ,n para estimarmos. Nestes casos, a funcao de verossimilhanca e uma
i}
funcao dos n parametros desconhecidos 1 ,2 , . . . ,n , e os estimadores de maxima verossimilhanca {
podem ser obtidos igualando-se as n derivadas parciais L(1 ,2 , . . . ,n )/i , (para i = 1,2, . . . ,n) a zero,
e resolvendo o sistema de equacoes resultante.
Exemplo:
Seja X uma v.a. com distribuicao normal com media e variancia 2 , ambas desconhecidas. Ache o
EMV para e para 2 , a partir da mostra x1 ,x2 , . . . ,xn .
Solucao:
A funcao de maxima verossimilhanca para uma amostra de tamanho n e
n
P

n
Y

(1/2 2 )
(xi )2
2
2
1
1
i=1

L(, ; x1 ,x2 , . . . ,xn ) =


e(xi ) /(2 ) =
e
(2 2 )n/2
2
i=1
2

Para simplificar usamos a log-verossimilhanca que e:


log[L(, 2 ; x1 ,x2 , . . . ,xn )] = l(, 2 ; x1 ,x2 , . . . ,xn ) =

n
n
1 X
ln(2 2 ) 2
(xi )2
2
2 i=1

Calculando as derivadas parciais e igualando-as a zero obtemos :


n
l(, 2 )
1 X
= 2
(xi ) = 0

i=1

109

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

n
n
1 X
l(, 2 )
=

+
(xi )2 = 0
2
2 2
2 4 i=1

As solucoes das equacoes acima fornecem os estimadores de maxima verossimilhanca


n

2 =

=x

1X
(xi x
)2
n i=1

Repare que sao os mesmos estimadores obtidos pelo metodo dos momentos.
Exemplo:
Suponha que a amostra a seguir, obtida aleatoriamente, e de uma variavel aleatoria normal com media
e variancia 2 :
x1 = 1,92; x2 = 4,04; x3 = 2,27; x4 = 3,19; x5 = 4,28; x6 = 4,57; x7 = 2,25; x8 = 2,74; x9 = 3,87;
x10 = 4,56; x11 = 4,90; x12 = 3,57; x13 = 3,52; x14 = 4,95; x15 = 3,00.
Qual a estimativa para os parametros 1 = e 2 = 2 usando os estimadores de maxima verossimilhanca?
Solucao:
= 53,63 = 3,58
1 = X
15
n
1X
2 = 13,78 = 0,92
2 =
(Xi X)
n i=1
15

5.3.3

Distribui
c
oes amostrais

Conforme salientamos na secao 5.1, em inferencia estatstica usamos informacoes contidas em amostras
aleatorias para chegarmos a conclusoes sobre parametros da populacao. Estas informacoes ou estatsticas,
sao tambem variaveis aleatorias que dependem dos resultados obtidos em cada amostra em particular.
portanto de fundamental importancia conhecermos a distribuicao das estatsticas: esta distribuic
E
ao e
chamada distribui
c
ao amostral.
Nesta secao apresentaremos diversos resultados que serao usados nas proximas secoes. Alguns destes
resultados serao provados como ilustracao, mas na maioria deles omitiremos as demonstracoes, por fugirem do alcance do nosso curso. As provas podem ser vistas em [2].

5.3.3.1

Distribui
c
ao da m
edia amostral - caso normal

Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 . A
2

n tem distribuicao normal com media e variancia , ou de forma equivalente Zn = Xn n


media X
n

tem distribuicao normal com media 0 e variancia 1.

110

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Exemplos:
25 a media de uma amostra aleatoria de tamanho 25 de uma distribuicao normal com media
1. Seja X
25 assuma valores entre 71 e 79?
= 75 e variancia 2 = 100. Qual e a probabilidade de que X
Solucao:
25 tem distribuicao normal com media = 75 e variancia
Conforme resultado apresentado acima, X
100
igual a 25 = 4, ou seja:

25 < 79) = P
P(71 < X

75
X
79 75
71 75
<
<
2
2
2

= P(2 < Z < 2)


= P(Z < 2) P(Z < 2)
= P(Z < 2) P(Z > 2)
= P(Z < 2) [1 P(Z < 2)]
= 2P(Z < 2) 1 = 2 0,977250 1 = 0,9545

2. Suponha que a aceitacao de um lote de 1.000 pecas ocorre apenas se o comprimento medio de 10
pecas estiver entre 9,2 e 10,8 cm. Se o comprimento das pecas tem distribuicao normal com media
10 cm e variancia 2 cm2 o que pode ser dito sobre a aceitacao do lote?
Solucao:
< 10,8) onde X : comprimento da peca e X N (10, 2).
P(lote ser aceito)=P(9,2 < X
N (10, 2/10) e portanto:
Mas X

9,2 10
10,8 10

P(9,2 < X < 10,8) = P


Z
0,2
0,2
= P(1,79 Z 1,79)
= P(Z 1,79) P(Z 1,79)
= P(Z 1,79) [1 P(Z 1,79)
= 2P(Z 1,79) 1 = 0,9265

5.3.3.2

Distribui
c
ao da diferen
ca de m
edias

Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media 1 e variancia 12
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de uma distribuicao normal com media 2 e variancia 22 . Se X e
n Ym tem distribuicao normal com media 1 2
Y sao independentes, entao a diferenca das medias X
2
2

e variancia 1 + 2 , ou de forma equivalente:


n
m
Z=

n Ym (1 2 )
X
r
12
2
+ 2
n
m

111

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

tem distribuicao normal com media 0 e variancia 1. Se 12 = 22 = 2 , entao


Z=

n Ym (1 2 )
X
s

1
1
2

+
n m

Exemplo:
Suponha X1 ,X2 , . . . ,X10 uma amostra aleatoria de uma distribuicao normal com media = 10 e
variancia 2 = 9 e Y1 ,Y2 , . . . ,Y15 uma amostra aleatoria de uma distribuicao normal com media = 15 e
10 e Y15 as medias amostrais corresvariancia 2 = 9, independente da primeira distribuicao; e sejam X

pondentes. Calcular P(4 Y15 X10 4).


Solucao:

10 (2 1 )
4 (2 1 )
Y15 X
4 (2 1 )

s
P(4 Y15 X10 4) = P s
s

1
1
1
1
1
1
2
2
2
+
+
+
n m
n m
n m

45
4 5

s
s
= P

1
1
1
1
9
+
9
+
10 15
10 15
= P(7,35 Z 0,81)
= P(Z 0,81) P(Z 7,35)
= [1 P(Z 0,81)] [1 P(Z 7,35)]
= (1 0,791030) (1 1) = 0,2090

5.3.3.3

Distribui
c
ao Quiquadrado

1. Seja Z uma variavel aleatoria normal padrao, isto e, uma variavel com distribuicao normal com
media 0 e variancia 1; entao Z 2 tem distribuicao quiquadrado com 1 grau de liberdade.
2. Sejam Z1 ,Z2 , . . . ,Zn variaveis aleatorias independentes e normalmente distribudas com media 0 e
variancia 1, entao a variavel Xn2 = Z12 + Z22 + + Zn2 tem distribuicao quiquadrado com n graus
de liberdade.
Como aplicacao da segunda propriedade acima, se X1 ,X2 , . . . ,Xn e uma amostra aleatoria de uma
distribuicao normal com media e variancia 2 , entao
2
2

2
X2
Xn
X1
+
+ +

2
n
X
Xi

X2 =
=

i=1

tem distribuicao quiquadrado com n graus de liberdade.

112

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

n na expressao acima, a soma perde um grau de liberdade e temos que


Quando e substitudo por X
n
X
n 2
Xi X

i=1
tem distribuicao quiquadrado com n 1 graus de liberdade. Dizemos que a soma perde um grau de libern
P
= 0 (pois X
= 1 Pn Xi ); entao conhecidos X1 = x1 , X2 = x2 , . . . , Xn1 = xn1
(Xi X)
dade pois
n

i=1

i=1

n o valor de Xn sera determinado.


eX
Chamamos a atencao do leitor para a diferenca entre as expressoes
2
n
n
X
X
n 2
xi x
n
Xi X
e

i=1
i=1
. Observe que a primeira e uma variavel aleatoria; a segunda e um valor da variavel aleatoria.
Para ilustrar melhor a perda de um grau de liberdade, consideremos um vetor X = (X1 ,X2 ,X3 ) que
pode assumir valores em R3 , isto e, ele tem 3 graus de liberdade, ele varia no espaco de tres dimensoes.
3 = X1 + X2 + X3 , e facil ver que X1 X
+ X2 X
+ X3 X
= 0, equivalente a uma equacao da
Se X
3
forma
aX1 + bX2 + cX3 = 0
que e a equacao de um plano em R3 , isto e, o vetor (X1 ,X2 ,X3 ) agora pode variar num espaco de 2
dimensoes; diz-se que ele perdeu um grau de liberdade.
Observemos agora a expressao:

n
X
n 2
Xi X

i=1

que pode ser escrita como

n
X
n )2 (n 1)Sn2
1
(Xi X
(n

1)
=
2
(n 1)
2
i=1

onde Sn2 e a variancia amostral definida em 1.3.2. Pode-se provar que


o que nos traz ao seguinte resultado:

(n 1)Sn2
n,
e independente de X
2

n e a media
3. Seja X1 ,X2 , . . . ,Xn uma amostra de uma distribuicao normal com variancia 2 . Se X
(n 1)Sn2
desta amostra, entao
tem distribuicao qui-quadrado com n 1 graus de liberdade e e
2

independente de Xn .
Exemplo:
Suponha X1 ,X2 , . . . ,X10 uma amostra aleatoria de uma distribuicao normal com variancia 2 = 10.
Qual a probabilidade que a variancia da amostra seja menor que 16,31?
Solucao:

2
P(S10

< 16,31) = P

2
S10
(n 1)
16,31 9
<
2
10

= P(X92 < 14,68) = 0,9 (pela tabela 2 do apendice)

113

DE PARAMETROS

5.3. ESTIMAC
AO

5.3.3.4

cpa/gsa

Distribui
c
ao t de Student

Seja Z uma variavel aleatoria com distribuicao normal padrao e seja V uma variavel aleatoria com
distribuicao quiquadrado com n graus de liberdade. Se V e Z sao independentes, entao a variavel
Z
T =p
V /n
tem funcao de densidade dada por:

n+1

2
fT (t) =

n (n/2)

onde () =

R
0

1
t2
1+
n

,
n+1
2

<t<

x1 ex dx e a funcao gama.

Diz-se que T tem distribuicao t de Student com n graus de liberdade. Nao e importante se decorar
a funcao de densidade, mas sim saber lidar com probabilidades referentes a ela, especialmente usando a
1
1 2
tabela 3 (no apendice). Quando n aumenta, fT (t) converge para e 2 t , que e a funcao de densidade
2
de Z, normal padrao. Isto e, quando n aumenta a distribuicao t de Student pode ser aproximada por
uma distribuicao normal padrao.
Duas aplicacoes diretas deste resultado sao:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 ,
ent
ao:


Xn

n
n(Xn )

Tn = r
=
2
Sn
(n 1)Sn
/(n 1)
2

tem distribuicao t de Student com n 1 graus de liberdade. A prova deste resultado decorre de
claro que usaremos esta distribuicao quando 2 nao e conhecida.
5.3.3.1, 5.3.3.3 e de 5.3.3.4. E
2. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media 1 e variancia
2 ; e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de outra distribuicao normal com media 2 e variancia
2 , com 2 desconhecida, independente da primeira. Entao a variavel
n Ym (1 2 )
X
s

1
1
2
+
n m
Tn+m2 = s

(n 1)S12
(m 1)S22
+
/(n + m 2)
2
2
Tn+m2 = s

n Ym (1 2 )
X

(n 1)S12 + (m 1)S22 1
1
+
n+m2
n m

tem uma distribuicao t de Student com n + m 2 graus de liberdade.


Chamamos atencao para a diferenca entre a variavel Tn+m2 e a variavel Z definida em 5.3.3.2. Precisamos da variavel Tn+m2 quando nao conhecemos a variancia comum 2 .

114

DE PARAMETROS

5.3. ESTIMAC
AO

5.3.3.5

cpa/gsa

Distribui
c
ao F de Fisher

Agora consideremos uma variavel aleatoria U com distribuicao quiquadrado com m graus de liberdade
e uma variavel aleatoria V independente da primeira, com distribuicao quiquadrado com n graus de
liberdade. a variavel
U/m
F(m,n) =
V /n
tem uma distribuicao chamada F de Fisher com m graus de liberdade no numerador e n graus de liberdade
no denominador, e sua funcao de densidade e dada por:

m + n h m im/2

x(m/2)1
2
n
hmi hni
fF (x) =
h
,
0<x<
mx i(m+n)/2

1
+
2
2
n
Novamente, nao e importante memorizarmos a funcao de densidade; mas sim saber utilizar a tabela 4
(no apendice).
Uma aplicacao importante desta distribuicao e a seguinte:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria da distribuicao normal com media 1 e variancia 12 e
seja Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de outra distribuicao normal com media 2 e variancia
22 , independente da primeira, entao
F =

(n1)S12
/(n
12
(m1)S22
22

1)

/(m 1)

S12 22
S22 12

tem distribuicao F com n 1 e m 1 graus de liberdade. Esta variavel vai nos permitir construir
intervalos de confianca e fazer testes referentes `a razao de duas variancias.
As tabelas 4a a 4g fornecem os valores de f(m,n) tais que:
P(F(m,n) > f(m,n) ) =

para alguns valores de

Para calcularmos por exemplo para = 0,95 usamos o fato de que


f0,95(m,n) =

1
f0,05(n,m)

Esta igualdade pode ser demonstrada por:

U/m
1
1

f ) = P
f = P V /n f = P
f
V /n
F(n,m)

P(F(m,n)

U/m

Exemplos:
1. Achar o valor f0,95(4,5)
Solucao:
P[F(4,5) f0,95(4,5) ] = 0,95
f0,95(4,5) =

=
1
f0,05(5,4)

115

P[F(4,5)
=

1
= 0,16
6,26

1
] = 0,95
f0,05(5,4)

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

2. Considere uma variavel aleatoria com distribuicao F com 5 e 10 graus de liberdade. Determinar a
e b tais que P(a < F(5,10) < b) = 0,90.
Solucao:
claro que existe uma infinidade de valores a e b que atendem `a condicao.
E
f(x)

a1a2

b1 b2

Na figura acima (a1 ,b1 ) e (a2 ,b2 ) sao dois pares possveis. Por convencao escolhemos a e b tais que:
P(F(5,10) < a) = P(F(5,10) > b) = 0,05
O calculo do valor de b e direto da tabela 7 onde encontramos b = 3,33. Para encontrarmos o valor
de a fazemos:
P(F(5,10) < a) = 0,05
=
P(F(5,10) a) = 0,95
Como f0,95(5,10) =

5.3.4

1
f0,05(10,5)

na tabela achamos que a = 1/4,74 = 0,21

Teorema Central do Limite

As amostras consideradas ate aqui sao


extradas de populacoes normais. Em 5.3.3.1 (Distribuicao da
n )
n(X
n e a media
media amostral - caso normal) vimos que
tem distribuicao normal padrao, se X

de uma amostra aleatoria de tamanho n de uma distribuicao normal com media e variancia 2 . Em
(n 1)Sn2
5.3.3.3 (Distribuicao Quiquadrado) vimos que
tem distribuicao qui-quadrado com n 1 graus
2
2
de liberdade, se Sn e a variancia da mesma amostra. Nestes casos, independentemente do tamanho da
2
n e (n 1)Sn sao exatas.
amostra as distribuicoes para X
2

Quando a distribuicao de X nao e normal, precisamos de amostras grandes para aproximar a distri n , e esta aproximacao e dada pelo teorema estabelecido a seguir:
buicao de X
de uma vari
avel
Teorema 3. Teorema Central do Limite: seja X1 ,X2 , . . . ,Xn uma amostra aleat
oria
n )
n(
X
aleat
oria com media e vari
ancia 2 positiva e finita; ent
ao a vari
avel Zn =
tem uma

distribuica
o limite que e normal com media zero e vari
ancia um.
Nao damos prova do teorema, e sim uma ideia de seu significado. O que significa dizer que Zn tem
uma distribuicao que no limite e a normal padrao? Zn tem uma distribuicao, porem nao e nosso interesse
116

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

determina-la. O teorema diz que, para todo z R, P(Zn z) converge para P(Z z), `a medida que n
aumenta; sendo Z a normal padrao. Isto vai implicar que P(z1 Zn z2 ) converge para P(z1 Z z2 ).
Salientamos que para cada z R, {P(Zn z)}
encia de n
umeros reais e para
n=1 define uma sequ
cada par (z1 ,z2 ) de n
umeros reais {P(z1 Zn z2 )}
define
tamb
e
m
uma
sequ
e
ncia
de n
umeros reais:
n=1
o teorema nos diz que para todo z R, a primeira sequencia converge para P(Z z) e para cada par
(z1 ,z2 ) de n
umeros reais a segunda sequencia converge para P(z1 Zn z2 ).
Maiores detalhes podem ser encontrados em textos de nvel intermediario, sob o ttulo Convergencia
em Distribuicao
Exemplos:
a media de uma amostra aleatoria de tamanho 100 de uma distribuicao quiquadrado com
1. Seja X
< 51).
50 graus de liberdade. Aproximar o valor de P(49 < X
Solucao:

< 51) = P
P(49 < X


49
X
51
n<
n<
n

2
, = gl = 50 e 2 = 2gl = 100, entao
Como X X50

50
49 50
X
51 50

P(49 < X < 51) = P


100 <
100 <
100
10
10
10

50
X
= P 1 <
100 < 1
10

P(1 < Z < 1) 0,6826

a media de uma amostra aleatoria de tamanho 64 de uma distribuicao exponencial com


2. Seja X
1
seja maior que 75?
parametro =
. Qual a probabilidade de que X
80
Solucao:
A media e variancia de X sao respectivamente:
=

1
= 80

2 =

1
= 6400
2

Assim podemos calcular:


X 80
75 80
64 >
64
80
80

X 80
5
=P
>
10
10

> 75) = P
P(X

P(Z > 0,5) 0,6915



n(Xn )
O Teorema Central do Limite fornece a funcao de distribuicao aproximada de
, quando

e positivo e finito. A partir dele podemos, entre outras coisas, construir intervalos de confianca para .
117

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Quando nao conhecemos 2 surge um problema, que e superado com a utilizacao de S 2 , que como vimos
e o estimador de 2 .
Pode-se provar que S 2 converge estocasticamente para 2 . A nocao de convergencia estocastica
foge do escopo deste curso, porem vai nos permitir usar a estatstica:

X

n
n(X )

r
=
2
S
S
2

Pelo resultado estabelecido, o denominador da primeira expressao converge para 1 e pelo


Teorema
)
n(X
Central do Limite o numerador tem distribuicao aproximadamente normal padrao, entao
S
tem tambem uma distribuicao aproximadamente normal padrao. Mais
vez, nao e importante o
uma
)
n(X
entendimento dos conceitos, basta que se saiba utilizar o fato de que
tem uma distribuicao
S
que se aproxima da normal padrao quando o tamanho da amostra e grande.
Para terminar esta secao chamamos a atencao que na secao 5.3.3 definimos a distribuicao exata dos
estimadores e nesta secao (5.3.4) tratamos de distribuicoes aproximadas. Estas aproximacoes melhoram
quando aumenta n. Em outras palavras, na secao 5.3.3 os resultados valem mesmo se o tamanho das
amostras seja pequeno, ja na secao 5.3.4 precisamos de amostras grandes. (Para maiores detalhes ver [3])

5.3.5

Estima
c
ao por intervalos

Como vimos nas secoes anteriores, a Estimacao Pontual fornece como estimativa do parametro desconhecido um u
nico valor. Em muitas situacoes no entanto esta estimativa pontual de um parametro
nao fornece informacao completa necessaria para o estudo ou problema em questao. Quando se estima
determinado valor para, por exemplo, a media de uma variavel, e improvavel que a media verdadeira
da
seja exatamente igual a este valor. Assim uma questao importante aparece: quao proximo esta X
media verdadeira?
Uma das formas de resolver este problema e preestabelecer a margem maxima de erro que queremos
cometer. Define-se entao Erro de Estima
c
ao como a distancia entre o parametro e valor estimado (por
|).
exemplo |X
Outra abordagem e usar um intervalo estimado para o parametro populacional que expressasse o grau
de incerteza associado `a estimativa. Damos a este intervalo o nome de Intervalo de Confian
ca. Nos
nao teremos certeza de que o intervalo contem o valor correto do parametro populacional desconhecido.
Nos simplesmente usamos uma amostra aleatoria da populacao para calcular a estimativa pontual e o
intervalo. Entretanto o intervalo de confianca e construdo de tal forma que tenhamos alta confianca que
ele contem o parametro populacional desconhecido.
Assim dada uma amostra X1 ,X2 , . . . ,Xn de uma variavel aleatoria X com funcao de densidade de
probabilidade f (x,), com , vamos encontrar L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ), funcoes de
X1 ,X2 , . . . ,Xn tais que:
P[L(X1 ,X2 , . . . ,Xn ) u() S(X1 ,X2 , . . . ,Xn )] = 1
onde u() e uma funcao do parametro . Diremos entao que (L(X1 ,X2 , . . . ,Xn ), S(X1 ,X2 , . . . ,Xn )) e um
118

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

intervalo de confian
ca de 100(1)% para u(). (1) e chamado coeficiente de confianca do intervalo.
O metodo para resolver o problema e simples: consiste em encontrar uma variavel aleatoria que
dependa da funcao u() e cuja distribuicao seja conhecida. Ha varios casos a considerar, dos quais
discutiremos detalhadamente apenas a Distribuicao da media amostral - caso normal. Os demais casos
terao procedimentos analogos.
5.3.5.1

Intervalo de confian
ca para a m
edia de uma distribui
c
ao normal

Caso 1: 2 conhecida.
Queremos achar L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ) tais que
P[L(X1 ,X2 , . . . ,Xn ) S(X1 ,X2 , . . . ,Xn )] = 1
(neste caso u() = ).

n(X )
Sabemos que
tem distribuicao normal padrao, entao na tabela podemos encontrar a e

b que satisfacam `a equacao do intervalo de confianca. Existe uma infinidade de pares de valores a e b
satisfazendo esta condicao. [a1 ,b1 ] e [a1 ,b1 ] na figura abaixo sao dois destes pares.
f(z)

a1 a2

b1 b2

Mas aproveitamos a simetria da funcao de densidade normal e achamos a tal que


n(X )
P a
a =1

f(z)

-a

Olhando a figura acima, vemos que a = z(1 2 ) ; sendo z(1 2 ) tal que P(Z z(1 2 ) ) = 1 2 .
119

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Entao, levando na formula temos:


n(X )
P z(1 2 )
z(1 2 ) = 1

Manipulando as inequacoes acima temos:


n(X )
z(1 )
z(1 2 )
z(1 2 ) z(1 2 ) X
2

n
n

z(1 ) X
+ z(1 )
X
2
2
n
n

Assim podemos escrever:

z(1 ) X
+ z(1 ) = 1
P X
2
2
n
n
As funcoes procuradas sao portanto:
z(1 ) = X1 + + Xn z(1 )
L(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
+ z(1 ) = X1 + + Xn + z(1 )
S(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
Exemplos:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e 2 = 80. Se
n = 20 e x
= 81,20, encontrar um intervalo de confianca de 95% para (veja observacoes a seguir).
Solucao:
Temos que 1 = 0,95; entao z(1 2 ) = z0,975 = 1,96 e assim:

z(1 ) = 81,20 1,96 80 = 81,20 1,96 2 = 77,28


L(x1 , . . . ,x20 ) = X
n
2
20
z(1 ) = 81,20 + 1,96 2 = 85,12
S(x1 , . . . ,x20 ) = X
n
2
Entao (77,28; 85,12) e um intervalo de confianca de 95% para .
2. No exemplo 1, considere 2 = 20 e encontre um intervalo de confianca de 95% para .
Solucao:
Neste caso teremos:

L(x1 , . . . ,x20 ) = 81,20 1,96 20


= 81,20 1,96 = 79,24
20
S(x1 , . . . ,x20 ) = 81,20 + 1,96 = 83,16
e o intervalo e (79,24; 83,16). Observe que diminuindo o valor de 2 o comprimento do intervalo e
menor.

120

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

3. Sejam os dados:
79,38; 62,55; 65,13; 58,68; 70,25; 84,79; 62,43; 82,55; 72,84; 82,32
que correspondem a 10 observacoes de uma distribuicao normal com media e variancia 2 = 81.
Construa um intervalo de confianca de 90% para .
Solucao:
A partir dos dados, temos x
= 72,09. Como queremos 90% de confianca, 1 = 0,9; e assim
z(1 2 ) = z0,95 = 1,645. Podemos agora calcular os limites do intervalo:

z0,95 = 72,09 1,645 81 = 72,09 1,645 2,846 = 67,41


L(x1 , . . . ,x10 ) = X
n
10
S(x1 , . . . ,x10 ) = 72,09 + 1,645 2,846 = 76,77

O intervalo e portanto (67,41; 76,77)

Observacoes:
1. Observe que L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ) sao variaveis aleatorias antes da amostra ser
obtida e portanto tem sentido a expressao P[L(X1 ,X2 , . . . ,Xn ) S(X1 ,X2 , . . . ,Xn )] = 1 .
No entanto depois que a amostra e obtida, teremos L(X1 ,X2 , . . . ,Xn ) = l e S(X1 ,X2 , . . . ,Xn ) = s e
ja nao tem mais sentido dizer que P[l s] = 1 pois agora, dependendo do valor de , esta
probabilidade sera 1 ou 0. Mesmo assim, por abuso de linguagem, diremos que (l, s) e um intervalo
de confianca de 100(1 )% para .
2. Assim sendo um intervalo de confianca de 95% para media nao quer dizer que existe uma probabilidade de 0,95 de que pertenca ao intervalo. A interpretacao correta e: Se pudessemos obter
um n
umero infinito de amostras aleatorias de tamanho n e construssemos intervalos de confianca
de 95% para cada uma das amostras, temos a garantia de que 95% destes intervalos conteriam o
verdadeiro valor de .

3. O intervalo de confianca X z(1 2 ) , X + z(1 2 )


tem comprimento igual a 2z(1 2 ) .
n
n
n
Portanto podemos ver que quanto menor o valor de , menor o comprimento do intervalo, ou seja,
mais preciso e o intervalo.
4. Da mesma forma quanto menor o valor de z(1 2 ) maior a precisao. Por outro lado, se 1 < 2
ent
ao z(1 22 ) < z(1 21 ) . Assim se quisermos maior coeficiente de confianca para o intervalo, o seu
comprimento sera maior.
5. O comprimento do intervalo diminui `a medida que n aumenta. Na pratica, quando quisermos
intervalos mais precisos, podemos aumentar o tamanho da amostra. No entanto nao podemos
esquecer que aumento no tamanho da amostra implica em aumento de custo. Alem disso temos
sempre que ter em mente que na escolha de n e e tambem importante a opiniao da pessoa que
realiza a pesquisa. Esta u
ltima observacao deve ser levada em conta em todos os casos de intervalo
de confianca a serem discutidos.
Caso 2: 2 desconhecida.

)
n(X
pois o valor de nao e conhecido. Temos por

n(Xn )
tanto que usar um estimador de 2 para resolver o problema. Sabemos de 5.3.3.4 que Tn1 =
S
tem distribuicao t de Student com n 1 graus de liberdade.
Neste caso, nao podemos usar a estatstica

121

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Tambem foi visto que a funcao de densidade de Tn1 e simetrica em torno do zero, entao procuramos
na tabela o valor de T(n1,1 2 ) tal que:

n
X
n t(n1,1 2 ) = 1
P t(n1,1 2 )
S
e da temos:

S
S

=1
P Xn t(n1,1 2 ) Xn + t(n1,1 2 )
n
n

e nosso intervalo de confianca e definido por:


t(n1,1 ) S = X1 + + Xn t(n1,1 ) S
L(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
+ t(n1,1 ) S = X1 + + Xn + t(n1,1 ) S
S(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
Exemplos:
4. No exemplo 1, suponhamos nao conhecer 2 , mas um estimador S 2 = 78,45 nos e fornecido. Determine o intervalo de 95% de confianca.
Solucao:
t(19;0,975) S
L(x1 , . . . ,x20 ) = X
n

78,45
= 81,20 2,093
20
p
= 81,20 2,093 3,92
= 81,20 4,15 = 77,05
S(x1 , . . . ,x20 ) = 81,20 + 4,15 = 85,35
Portanto o intervalo e (77,05; 85,35).
5. No exemplo 3, suponhamos que nao conhecemos a variancia. Usando a amostra no entanto achamos
S 2 = 93,89. Calcule um intervalo de confianca de 90%.
Solucao:
t(9;0,95) S
L(x1 , . . . ,x10 ) = X
n

93,89
= 72,09 1,833
10
p
= 72,09 1,833 9,389
= 72,09 5,62 = 66,47
S(x1 , . . . ,x10 ) = 72,09 + 5,62 = 77,71
Portanto o intervalo e (66,47; 77,71).
122

DE PARAMETROS

5.3. ESTIMAC
AO

5.3.5.2

cpa/gsa

Intervalo de confian
ca para o par
ametro p da distribui
c
ao binomial

Vamos construir intervalos de confianca para o parametro p de distribuicao binomial com n conhecido.
X np
Se X b(n, p), o Teorema Central do Limite afirma que para n grande, p
tem distribuicao
np(1 p)
aproximadamente normal com media zero e variancia um. Entao:
#
"
X np
P z(1 2 ) p
z(1 2 ) 1
np(1 p)
que pode ser reescrito por:

X
n

P z(1 2 ) q

ou ainda

"

X
P
z(1 2 )
n

p(1p)
n

z(1 2 ) 1

p(1 p)
X
p
+ z(1 2 )
n
n

#
p(1 p)
1
n

Como os limites do intervalo dependem de p, substituimos por seu estimador dado por

X
L(X) =
n
X
S(X) =
n

v
uX
u (1
t

z(1 2 ) n
n
v
uX
u (1
t
+ z(1 2 ) n
n

X
e assim:
n

X
)
n
X
)
n

Observacao: Aparentemente, neste caso, estamos construindo um intervalo de confianca para p a


partir de uma observacao da variavel X. Mas na verdade pode ser provado que X possui a distribuicao
de uma soma de n variaveis aleatorias independentes X1 ,X2 , . . . ,Xn , onde cada uma destas variaveis tem
distribuicao binomial com parametros 1 e p.
Em outras palavras, X e Y = X1 + + Xn onde P(Xi = 1) = p e P(Xi = 0) = (1 p) possuem a
mesma distribuicao.
Entao na verdade:

X1 + + Xn
X

=
=X
N
n
e a media de uma amostra aleatoria de tamanho n de uma distribuicao binomial com parametros 1 e p.
Exemplo:
Seja X uma variavel aleatoria com distribuicao binomial de parametros 300 e p. Foi tomada uma
observacao e achou-se X = 75. Encontrar um intervalo de confianca de 90% para p.

123

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Solucao:
v
ux
u (1 x )
t
x
n
L(x) = z(1 2 ) n
n
n
v
u 75
75
u
(1
)
t
75
300
=
1,645 300
300
300
= 0,25 0,04 = 0,21
v
ux
u (1 x )
t
x
n
S(x) = + z(1 2 ) n
n
n
= 0,25 + 0,04 = 0,29

portanto o intervalo e (0,20; 0,30).

5.3.5.3

Intervalo de confian
ca para diferen
ca de duas m
edias - Caso normal

Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel X com distribuicao normal
com media 1 e variancia 12 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m de uma variavel Y
com distribuicao normal com media 2 e variancia 22 ; sendo as duas variaveis aleatorias independentes.
Nesta subsecao veremos como encontrar um intervalo de confianca para 2 1 , ou seja, encontrar
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) e S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) tais que:
P[L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) 2 1 S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym )] = 1

Este problema ocorre frequentemente na vida profissional do engenheiro. Consideremos o seguinte


exemplo: suponhamos que estamos produzindo barras de aco e calibramos a linha de producao de modo
que, se X representa o comprimento das barras, X tem distribuicao normal com media 1 e variancia
2 . Em determinado momento o mercado pede barras com comprimento maior do que o usual. Entao
faremos nova calibracao na linha de producao, para aumentarmos os comprimentos, de modo que 2 nao
varie. Apos a calibracao faremos uma producao previa e construiremos um intervalo de confianca para
2 1 , onde 2 sera a nova media. Se L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) e S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym )
sao ambos positivos, e razoavel pensar que estamos satisfazendo as novas exigencias do mercado.
Caso 1: As variancias sao conhecidas.
Para construir o intervalo de confianca para 2 1 no caso em que 12 e 22 sao conhecidas, usamos
a variavel aleatoria
n Ym (1 2 )
X
r
Z=
2
12
+ 2
n
m
definida em 5.3.3.2, que tem distribuicao normal padrao e os extremos do intervalo sao:

124

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa
r

z(1/2)
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
r
+ z(1/2)
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X

12
2
+ 2
n
m
12
2
+ 2
n
m

Exemplo:
Suponha que estamos testando a resistencia `a tracao de 10 barras de aco produzidas pelo fabricante
1 e 15 barras produzidas pelo fabricante 2. A partir de experiencias anteriores sabemos que o fabricante
1 produz barras de aco cuja resistencia `a tracao tem variancia de 900 kgf 2 /cm4 , enquanto para o fabricante 2 este valor e 625 kgf 2 /cm4 . As amostras nos forneceram resistencias medias de 5.000 kgf /cm2
e 4.800 kgf /cm2 respectivamente para os fabricantes 1 e 2. Construa um intervalo de confianca de 90%
para a diferenca entre as medias (2 1 ).
Solucao:
r
2 X
1 z(1/2)
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = X

r
2 X
1 + z(1/2)
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = X

2
12
+ 2 = 4.800 5000 1,645
n
m

900 625
+
10
15

12
2
+ 2 = 4.800 5000 + 1,645
n
m

900 625
+
10
15

E assim o intervalo procurado e


218,88 kgf /cm2 2 1 181,12 kgf /cm2

Caso 2: As variancias sao desconhecidas mas iguais.


Para construir o intervalo de confianca para 2 1 no caso em que 2 nao e conhecida usamos a
variavel aleatoria Tn+m2 definida em 5.3.3.4 e os extremos do intervalo sao:
r
t(n+m2,
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X

Sp
1
2)

r
+ t(n+m2,
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X

onde:

Sp
1
2)

1
1
+
n m

1
1
+
n m

s
Sp =

e alem disso:

(n 1)S12 + (m 1)S22
n+m2

h
e tal que P Tn+m2 t(n+m2,

2
e S12 e S22 s
ao as variancias amostrais correspondentes. Como 12 = 22 = 2 nao e conhecida usamos o
estimador Sp2 .
t(n+m2,

1
2)

125

1
2)

=1

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Exemplos:
= 31,24;
1. No exemplo da producao de barras de aco e da calibragem da maquina, suponha que X

S1 = 1,57; n = 10; Y = 26,69; S2 = 1,42; n = 15. Construa um intervalo de confianca de 95% para
2 1 .
Solucao:
r
Sp

s
1
1
+
=
n m

9(1,57)2 + 14(1,42)2 1
1
+
= 0,604
10 + 15 2
10 15

t(n+m2,

1
2)

= t23;0,975 = 2,069

entao:
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 26,69 31,24 (0,604)(2,069) = 2,80
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 26,69 31,24 + 1,25 = 0,30
portanto o intervalo procurado e (2,80; 0,30)
2. Uma linha de producao produz barras de aco cujo comprimento X e uma variavel aleatoria que
pelas caractersticas do processo de producao pode-se supor normalmente distribuda com media
1 e variancia 2 desconhecida. A linha de producao foi submetida a uma nova calibracao para
aumentar a media, porem conservando a variancia igual a 2 . Duas amostras, antes e depois da
calibracao foram obtidas e calculou-se x
= 3,82 m; S12 = 0,08 m2 ; y = 4,08 m; S22 = 0,10 m2 . Se
os tamanhos amostrais foram 15 e 20 respectivamente, encontre um intervalo de confianca de 95%
para 2 1 .
Solucao:
r
Sp

s
1
1
+
=
n m

14(0,08) + 19(0,10) 1
1
+
= 0,103
15 + 20 2
15 20

t(n+m2,

1
2)

= t33;0,975 = 2,03

entao:
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 4,08 3,82 (0,103)(2,03) = 0,26 0,21 = 0,05
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 0,26 + 0,21 = 0,47
portanto o intervalo procurado e (0,05; 0,47)
Caso 3: As variancias sao desconhecidas e diferentes.
Para construir o intervalo de confianca para 2 1 no caso em que 12 e 22 sao desconhecidas ainda
usamos a mesma variavel aleatoria Tn+m2 definida em 5.3.3.4 mas agora os extremos do intervalo sao:

126

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

r
t(n+m2,
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X

1
2)

r
+ t(n+m2,
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X

5.3.5.4

1
2)

S12
S2
+ 2
n
m

S12
S2
+ 2
n
m

Intervalo de confian
ca para vari
ancia de uma distribui
c
ao normal

Caso 1: desconhecida.
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 ,
(n 1)S 2
tem distribuicao quiquadrado com n 1
com e 2 desconhecidas. Sabemos de 5.3.3.3 que
2
graus de liberdade. Entao da tabela teremos que:

P
2
onde X(n1,

2)

2
e X(n1,

1
2)

2
X(n1,

2)

(n 1)S 2
2

X(n1,
2

1
2)

sao tais que:

2
2
P[Xn1
X(n1,

2)

]=

2
2
P[Xn1
X(n1,

]
1
2)

=1

Da obtemos os extremos do intervalo:


L(X1 ,X2 , . . . ,Xn ) =

(n 1)S 2
2
X(n1,
1 )
2

(n 1)
2
X(n1,

S(X1 ,X2 , . . . ,Xn ) =

n
X
(xi x
)2

1
2 ) i=1

n1

(n 1)S 2
2
X(n1,

)
2

n
(n 1) X (xi x
)2
= 2
X(n1, ) i=1 n 1
2

Caso 2: conhecida.
Quando e conhecida o procedimento para construcao do intervalo de confianca e o mesmo, so que

2
n
P
xi
usamos
que tambem tem distribuicao quiquadrado, mas com n graus de liberdade.

i=1
127

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Exemplo:
Uma amostra aleatoria de tamanho 15 de uma distribuicao normal com media e variancia 2 foi
obtida e calculou-se x
= 3,20; S 2 = 4,24. Determinar um intervalo de confianca de 90% para 2 .
Solucao:

L(X1 , . . . ,X15 ) =

(n 1)S 2
2
X(n1,
1 )
2

14 4,24
= 2
X(14; 0,95)
=

S(X1 , . . . ,X15 ) =
=

59,36
= 2,51
23,68
14 4,24
2
X(14;
0,05)
59,36
= 9,04
6,57

portanto o intervalo procurado e (2,51; 9,04)

5.3.5.5

Intervalo de confian
ca para raz
ao de vari
ancias - Caso normal

Sejam X uma variavel aleatoria com distribuicao normal com media 1 e variancia 12 ; Y uma variavel
aleatoria com distribuicao normal com media 2 e variancia 22 independente de X.
Sejam X1 ,X2 , . . . ,Xn e Y1 ,Y2 , . . . ,Ym amostras aleatorias das respectivas distribuicoes. Nesta subsecao
2
iremos construir um intervalo de confianca para 22 .
1
De 5.3.3.5 sabemos que
F =

S12 22
S22 12

tem distribuicao F com n 1 e m 1 graus de liberdade.


Entao na tabela encontramos F 2 ,(n1,
h
P F 2 ,(n1,

m1)

e F1 2 ,(n1,

m1)

tais que
i

m1)

F F1 2 ,(n1,

Da os extremos do intervalo sao:


S22
m1) 2
S1
S2
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = F1 2 ,(n1, m1) 22 .
S1
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = F 2 ,(n1,

128

m1)

=1

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

Como foi visto em 5.3.3.5 (Distribuicao F de Fisher),


F 2 ,(n1,

m1)

e assim podemos reescrever:


L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) =

1
F1 2 ,(m1,

1
F1 2 ,(m1,

n1)

S22
2
n1) S1

Os limites do intervalo de confianca para o caso em que as medias 1 e 2 sao conhecidas podem ser
obtidos com as modificacoes adequadas usando o mesmo modelo.
Exemplo:
Imagine que tenhamos as duas amostras de uma distribuicao normal de tamanhos 10 e 5 e que as
variancias amostrais sejam respectivamente s21 = 20,0 e s22 = 35,6. Qual seria o intervalo de confianca
com = 0,05 para 22 /12 ?
Solucao:
1
35,6
F0,975(4, 9) 20,0
1 35,6
=
4,72 20,0
= 0,38

L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) =

S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = F0,975(9,

4)

35,6
20,0

35,6
20,0
= 15,84
= 8,90

Assim o intervalo de 95% para 22 /12 e (0,38; 15,84).

5.3.5.6

Intervalo de confian
ca para a m
edia - distribui
c
ao n
ao normal

Todos os casos discutidos ate aqui envolveram distribuicoes normais. Vamos considerar agora um caso
em que nao temos distribuicao normal e no qual usaremos o Teorema Central do Limite.
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma variavel X com funcao de densidade
de proba
n(Xn )
bilidade f (x,), . Se a variancia de X e positiva e finita, sabemos que Zn =
tem

distribuicao aproximadamente normal com media zero e variancia um. Entao, na tabela da normal padrao
achamos z(1 2 ) tal que:

Xn
n z(1 2 ) = 1
P z(1 2 )

e obtemos um intervalo (aproximado) com coeficiente de confianca 100(1 )%, cujos extremos sao:

129

DE PARAMETROS

5.3. ESTIMAC
AO

cpa/gsa

z(1 )
L(X1 ,X2 , . . . ,Xn ) = X
2
n

S(X1 ,X2 , . . . ,Xn ) = X + z(1 2 )


n
Podemos observar que estes extremos sao iguais aos extremos achados no caso 5.3.5.1, mas aqui o
intervalo e aproximado, enquanto em 5.3.5.1 ele era exato.
Quando 2 nao e conhecida, usamos a estatstica

zn1

Xn

n
n(Xn )
=s
=
S
(n 1)S 2
2
(n 1)

Como ja vimos na secao 5.3.4, sabemos que a distribuicao de zn1 ainda e aproximadamente normal
padrao e neste caso o nosso intervalo aproximado tem os extremos:
z(1 ) S
L(X1 ,X2 , . . . ,Xn ) = X
2
n
+ z(1 ) S
S(X1 ,X2 , . . . ,Xn ) = X
2
n
Observe que f (x,) neste caso e uma funcao de densidade de probabilidade qualquer. A u
nica exigencia
que fazemos, alem de n ser grande,e que a variancia seja finita e positiva.
Exemplos:
1. Observou-se o tempo de vida de 65 lampadas produzidas pela fabrica A. Se x
= 321 dias e S = 18,4
dias, construa um intervalo de confianca de 95% para , a vida media das lampadas produzidas
pela fabrica A.
Solucao:

Neste caso nao conhecemos a variancia, entao usaremos a estatstica zn1 =


S
L(x1 , . . . ,x65 ) = x
z(1 2 )
n
18,4
= 321 z(0,975)
65
= 321 1,96 2,2822
= 321 4,47 = 316,96
S(x1 , . . . ,x65 ) = 321 + 4,47
= 325,47

e o intervalo de confianca e (316,96; 325,47)

130

n(Xn )
:
S


5.4. TESTE DE HIPOTESES

cpa/gsa

2. Suponha que no exemplo anterior a variancia e conhecida e igual a 400. Construa o novo intervalo
de confianca de 95% para
Solucao:

400
L(x1 , . . . ,x65 ) = 321 1,96
65
= 321 1,96(2,4807)
= 321 4,86 = 316,14
S(x1 , . . . ,x65 ) = 321 + 4,86
= 325,86

Intervalo e (316,14; 325,86)

5.4
5.4.1

Teste de Hip
oteses
Introduc
ao

Na secao anterior aprendemos a construir intervalos de confianca para parametros que estimamos a
partir de amostras. Como veremos a seguir esta e uma ferramenta fundamental no estudo de um dos
topicos mais importantes no dia a dia dos engenheiros: o teste de hipoteses. Apresentamos a seguir alguns
conceitos basicos.
Defini
c
ao 28. Hip
otese Estatstica - Uma hipotese estatstica e uma afirmacao sobre uma populacao.
A afirmacao pode ser referente `a distribuicao ou aos parametros que caracterizam a distribuicao.
Exemplos:
1. X tem distribuicao normal.
2. E(X) = = 100.
3. V (X) = 2 = 200.
Introduzimos os conceitos basicos sobre testes de hipotese atraves do seguinte exemplo:
Suponha que uma empresa produza vigotas premoldadas de concreto de comprimento X. De acordo
com o padrao de producao da empresa, X tem distribuicao normal com media = 120 cm e desvio
padrao = 0,5 cm.
Um cliente dessa empresa formula uma reclamacao alegando que as vigotas estao sendo produzidas
com comprimento menor e reinvindica a devolucao do dinheiro pago pela compra feita no u
ltimo mes.
Neste problema, a hipotese do fabricante e que = 120 cm. e a hipotese do cliente e que < 120
cm. Assim o fabricante precisa tomar uma decisao com respeito `a reclamacao do comprador. O que
muito
normalmente se faz e colher uma amostra aleatoria de tamanho n e observar a media amostral. E
natural, neste exemplo, decidir em favor do cliente se a media amostral for pequena e menor que 120.
n < 120 c para alguma constante positiva c.
Ou seja a reclamacao do cliente sera atendida se X

131


5.4. TESTE DE HIPOTESES

cpa/gsa

120

120-c
Regio Crtica

Neste problema = 120 e chamada Hip


otese Nula e sera denotada por H0 (H0 : = 120 cm no
exemplo). Ja < 120 e chamada de Hip
otese Alternativa e sera denotada por H1 (H1 : < 120 cm
no exemplo).
O procedimento que leva a tomar uma decisao com respeito `a media e chamado de Teste de Hip
otese.
n no exemplo e chamada de Estatstica do Teste. A regiao destacada na figura anterior, chama-se
X
n para os quais daremos razao ao cliente.
Regi
ao Crtica. Esta regiao contem todos os valores de X
Antes de continuarmos precisamos estabelecer uma diferenca entre uma Hipotese e uma Proposicao.
Uma proposicao e aceita universalmente e ela pode ser provada: O Teorema fundamental do calculo, o
Teorema de Pitagoras ou as Leis de Newton sao exemplos de proposicoes e elas podem ser provadas. Uma
hipotese nao pode ser provada. Em algumas situacoes, sob determinadas condicoes, a hipotese pode ser
verdadeira e sobre outras condicoes pode ser falsa.
Ao tomarmos uma decisao sobre uma hipotese estamos sujeitos a dois tipos de erro: o primeiro, chamado de erro tipo I e rejeitar H0 sendo ela verdadeira. O segundo, chamado de erro tipo II e nao
rejeitar H0 sendo ela falsa. Na literatura universal costuma ser usada a seguinte tabela:
Decisao
Rejeitar H0
Nao rejeitar H0

H0 e verdadeira
Erro tipo I
Decisao correta

H0 e falsa
Decisao correta
Erro tipo II

No exemplo de testar H0 : = 120 contra H1 : < 120, dissemos que podemos decidir em favor do
n < 120 c. Resta encontrar o valor da constante c. Para encontrar tal valor precisamos da
cliente se X
ancia: o nvel de significancia de um teste, representado por , e
Defini
c
ao 29. Nvel de signific
a probabilidade de cometer erro tipo I. O valor de e fixado de acordo `a seriedade do erro tipo I.
Geralmente = 0,01; 0,05; 0,1.
Entao
= P(cometer erro tipo I) = P(rejeitar H0 |H0 e verdadeira)
n < 120 c| = 120). Como sabemos que sob H0 , X
n N (120; 0,52 ) podemos
No exemplo, = P(X
n
escrever

n
n
n < 120 c| = 120) = P
(Xn 120) < [(120 c) 120]
| = 120
P(X
0,5
0,5

n
| = 120
= P Z < [(120 c) 120]
0,5

n
| = 120
= P Z < c
0,5

132


5.4. TESTE DE HIPOTESES

cpa/gsa

Da tabela normal padrao obtemos z tal que


n
P(Z < z ) = . Resolvendo a equacao c
= z ,
0,5
0,5
obtemos c = z .
n

Figura 5.1: z = P(Z z ) = 1


0,5
Para ilustracao, se = 0,05 e n = 25; entao z = 1,645 e c = (1,645) = 0,1645.
25

Ou seja, decidimos em favor do cliente se X < 120 0,1645 = 119,84 cm.


Resumindo: Se uma amostra aleatoria de tamanho 25 e obtida, ao nvel = 0,05 rejeitamos
< 119,84. A regiao crtica neste caso, para
H0 : = 120 e adotamos a hipotese H1 : < 120 se X

o nvel de significancia = 0,05 e C = {(X1 , . . . ,Xn ) : X < 119,84}


= 119,7. Qual a decisao a ser
Agora suponha que apos a amostra ter sido retirada encontra-se X

tomada? Desde que o valor observado de X e menor que 119,84; rejeitamos H0 ao nvel de = 0,05;
ou seja a reclamacao do cliente e procedente. Dissemos neste caso que ao nvel de = 0,05 a media e
significantemente menor que 120.
Uma outra forma de conduzir o teste e calcular o p-valor amostral que no exemplo e definido como
a probabilidade de que a media amostral seja menor que aquele valor realmente observado. No exemplo
25 = 119,7.
observa-se X
25 < 119,7| = 120)
p-valor amostral = P(X
5
5
(X25 120) <
(119,7 120)| = 120]
= P[
0,5
0,5
= P(Z < 3) = 0,001350

A decisao a ser tomada e rejeitar H0 para todo valor de maior ou igual ao p-valor amostral. Neste
caso rejeitamos H0 para todo valor de maior ou igual a 0,001350.
A vantagem de conduzirmos um teste usando o p-valor amostral e que este valor informa para nos
uma forte ou uma fraca evidencia contra a hipotese nula. Quanto menor e o p-valor amostral mais forte
sera a evidencia que temos para rejeitar a hipotese nula.
25 = 119,8. O p-valor
Suponha por exemplo que uma segunda amostra foi escolhida e observou-se X
neste u
ltimo caso e:
25 < 119,8| = 120)
p-valor amostral = P(X
5
5
= P[
(X25 120) <
(119,8 120)| = 120]
0,5
0,5
= P(Z < 2) = 0,018309

133


5.4. TESTE DE HIPOTESES

cpa/gsa

= 0,05

XA

X B 119,84

120

Ve-se portanto que em ambas as amostras temos evidencias para rejeitar H0 mas esta evidencia e
mais forte no caso da primeira amostra.
Veremos a seguir a probabilidade do erro tipo II. A probabilidade desse erro sera representada por
. Lembremos que a probabilidade de erro tipo II e a probabilidade de nao rejeitar H0 quando ela
e falsa. O espaco parametrico sob a hipotese alternativa, no exemplo, e representado pelo conjunto
= { R : < 120}. Precisamos avaliar a probabilidade de erro tipo II para cada valor de neste
conjunto.
Se o verdadeiro valor da media e igual a para algum valor de > 0 entao
(120 ) = P(nao rejeitar h0 | = 120 )
25 119,84| = 120 )
= P(X
Se o verdadeiro valor da media e = 120 entao

n
5
X25 (120 ) =
X25 (120 )

0,5
tem distribuicao normal padrao. Entao:

5
5
(120 ) = P
(X25 (120 ))
(119,84 (120 ))| = 120
0,5
0,5
= P[Z 10(0,16 + )]
= P(Z 1,6 + 10)
= 1 P(Z < 1,6 + 10)
Assim, no exemplo, se a media verdadeira fosse 119,75 entao = 120119,75 = 0,25 e a probabilidade
de erro tipo II seria:
(120 ) = 1 P(Z < 1,6 + 10) (119,75) = 1 P(Z < 0,9) = 1 0,815940 = 0,18406
Define-se o poder de um teste, avaliado em = 0 como a probabilidade de rejeitar H0
quando o verdadeiro valor da media e igual a = 0 . Representa-se o poder por K. Isto e
K(0 ) = 1 (0 ).
No exemplo, K(120 ) = 1 (120 ).
A seguir apresentamos as probabilidades de erro tipo II e os correspondentes valores do poder do teste
para alguns valores de no exemplo:

0,10
0,20
0,30
0,40

()
0,725747
0,344578
0,080757
0,008198

134

K()
0,274253
0,655422
0,919243
0,991802


5.4. TESTE DE HIPOTESES

cpa/gsa

Valor da funo

K(d)

Um bom exerccio para o leitor seria calcular os


valores de () e K() para diversos valores de
e fazer um grafico, que teria o aspecto da figura
mostrada ao lado, que foi calculada com de 0 a
0,45, com variacoes de 0,002.

b(d)

d
Ate aqui introduzimos, atraves de um exemplo, os conceitos basicos de testes de hipoteses. A partir
de agora generalizaremos estes conceitos para diferentes situacoes.

5.4.2

Testes sobre a m
edia de uma populac
ao com distribuic
ao normal

5.4.2.1

Vari
ancia conhecida

Considere X variavel aleatoria normalmente distribuda com media desconhecida e variancia 2


conhecida. Consideremos os seguintes testes:
Teste 1: H0 : = 0

H1 : < 0

Teste 2: H0 : = 0

H1 : > 0

Teste 3: H0 : = 0

H1 : 6= 0

Os testes 1 e 2 sao chamados testes unilaterais e o teste 3 e chamado bilateral. Naturalmente nos
n de uma amostra aleatoria de tamanho n. Teremos respectivamente:
testes sera usada X
Ao nvel , no teste 1, H0 sera rejeitada se

n < 0 z , onde P(Z < z ) = 1


X
n
Ao nvel , no teste 2, H0 sera rejeitada se

n > 0 + z
X

Ao nvel , no teste 3, H0 sera rejeitada se

ou Xn > 0 + z 2
Xn < 0 z 2
n
n
ou de forma equivalente se

n 0 | > z
|X
2

135


5.4. TESTE DE HIPOTESES

cpa/gsa

Exemplos:
1. Uma montadora de veculos anuncia que seu carro popular de 1.000 c.c. tem uma eficiencia
energetica media de 16 km/litro de gasolina rodando em estrada asfaltada. O editor do caderno
de veculos do jornal local afirma que a eficiencia energetica do carro e menor do que a anunciada
pela montadora, e para provar conduz um teste com 25 carros do tipo anunciado. Supondo que a
eficiencia energetica tem distribuicao normal com variancia de 11(km/l)2 responda:
(a) Formule um teste apropriado para o editor do jornal, e construa a regiao crtica com nvel de
significancia = 0,05.
= 15,6 km/l qual seria a sua conclusao? Qual
(b) Se o valor obtido pelo jornalista no teste foi X
o p-valor para a media obtida pelo editor? E qual seria se a media obtida fosse 14,8 km/litro?
(c) Se a eficiencia energetica media real destes carros fosse 15,4 km/l, qual seria a probabilidade
de erro tipo II e qual o poder do teste?
Solucao:
(a) A hipotese nula do teste seria H0 : = 16 km/l, e como o editor esta interessado em confirmar
que a eficiencia energetica e menor,
a hipotese alternativa seria H1 : < 16 km/l. H0 sera

< 0 z . Como dado pelo programa = 0,05; achamos na tabela da


rejeitada se X
n
normal padrao z0,05 = 1,645 e portanto a regiao crtica sera:
(
)

11
< 16 1,645 = 16 1,09 = 14,91
C = (X1 , . . . ,X25 ) : X
25
< 14,91.
Ou seja, a hipotese nula sera rejeitada para os valores de X
(b) Como a media observada 15,6 e maior que 14,9 nao podemos rejeitar a hipotese nula (H0 :
= 16 km/l), e portanto nao ha evidencias para apoiar a afirmacao do jornalista de que a
eficiencia energetica e menor que 16,0 km/l.
Sabemos que o p-valor amostral pode ser obtido por
25 < 15,6| = 16)
p-valor = P(X

n
n
= P(
(X25 ) <
(15,6 | = 16)

25
= P(Z < (15,6 16| = 16)
11
= P(Z < 0,6030) = 0,2743
25 = 15,6 esta fora
Como este valor e maior que o nvel de significancia = 0,05 vemos que X
da regiao crtica, e confirmando o teste feito em (a) nao rejeitamos H0 .
= 14,8 o p-valor amostral seria obtido por:
Ja se a media amostral fosse X
25 < 14,8| = 16)
p-valor = P(X

n
= P(Z <
(14,8 | = 16)

25
= P(Z < (14,8 16| = 16)
11
= P(Z < 1,81) = 0,0351
Nesse caso o p-valor e menor que o nvel de significancia e portanto rejeitaramos H0 . Se a
= 14,8 poderamos apoiar a afirmacao do jornalista de que a eficiencia
media amostral fosse X
energetica e menor que a anunciada pela montadora.
136


5.4. TESTE DE HIPOTESES

cpa/gsa

(c) Para calcularmos a probabilidade de cometer erro tipo II se a verdadeira media fosse 15,4
lembremos que:
25 > 14,91|X
25 = 15,4)
(15,40) = P(X

n
= P[Z >
(14,91 15,4)]

5
= P[Z > (14,91 15,4)]
11
= P(Z > 0,7387) = 0,7704
A probabilidade de cometer erro tipo II se a media for 15,4 e 0,7704 e portanto o poder do
teste e 0,2296.

2. Um engenheiro esta na fase de concretagem de diversos pilares em uma obra e encomenda concreto
pronto com resistencia media de 900kgf /cm2 . Uma empresa concorrente do fornecedor habitual se
dispoe a entregar por um preco mais barato um concreto pronto que alega fornecer uma resistencia
maior que o usado atualmente. O engenheiro solicita entao da E.E.U.F.M.G. um laudo tecnico
de teste de compressao em 36 corpos de prova fabricados com o concreto desta segunda empresa,
obtendo uma resistencia media de 930kgf /cm2 . Supondo que a resistencia `a compressao do concreto
tem distribuicao normal com variancia 5.625(kgf /cm2 )2 , e utilizando em nvel de significancia de
= 0,01 responda:
(a) O engenheiro deve trocar de fornecedor?
(b) Qual o p-valor amostral do concreto do segundo fornecedor?
(c) Qual o poder do teste se a media real do concreto do segundo fornecedor for 950kgf /cm2 ?

Solucao:
(a) Para avaliarmos a conveniencia da troca de fornecedor estabelecemos o teste H0 : = 900
contra H1 : > 900. A regiao crtica sera:
!
)
(

5.625

= 900 + 29,25 = 929,25


C = (X1 , . . . ,X36 ) : X > 0 + z
= 900 + 2,33
n
36
Como a media observada 930 e maior que 929,25, rejeitamos a hipotese nula, e portanto ha
evidencias para apoiar a afirmacao de que o concreto fornecido pelo concorrente aumenta a
resistencia `a compressao e portanto o engenheiro deve trocar de fornecedor.
(b) O p-valor amostral e
36 > 930| = 900)
p-valor = P(X

n
n
= P (X36 ) > (930 )| = 900
2
2
#
"

36
(930 900)| = 900
=P Z>
5.625
= P(Z > 2,4) = 0,0082
esta na regiao
Como este valor e menor que o nvel de significancia = 0,01 vemos que X
crtica, e confirmando o teste feito em (a) rejeitamos H0 .
137


5.4. TESTE DE HIPOTESES

cpa/gsa

(c) Para calcularmos o poder do teste, vejamos a probabilidade de cometer erro tipo II se a
verdadeira media fosse 950:
36 < 929,25| = 950)
(950) = P(X

n
n

=P
(X36 ) <
(929,25 )
2
2
"
#

6
36
=P
(X36 950) <
(929,25 950)
75
5.625

6
(929,25 950)
=P Z<
75
= P(Z < 1,66) = 0,0485
E portanto o poder do teste e K(950) = 1 0,4085 = 0,9515.

3. Como analista do controle de qualidade de uma fabrica de lampadas voce sabe que o tempo de
vida do produto tem distribuicao normal com variancia igual a 14.400 horas2 e que sua linha de
producao esta ajustada para que as lampadas possuam uma vida media de 1.600 horas.
(a) Construa um teste de hipotese bilateral para a duracao media da lampada, construindo a
regiao crtica para = 0,10.
100 = 1.615
(b) Qual sua conclusao se um lote de 100 lampadas da producao de um dia forneceu X
horas como duracao media da lampada? Qual o p-valor amostral para esta amostra?
(c) Se a media real fosse 1.620 horas qual seria o poder do teste?

Solucao:
(a) A hipotese nula e H0 = 1.600 e a hipotese alternativa e H1 6= 1.600. Rejeitamos a hipotese
nula se:

Xn < 0 z 2
ou
Xn > 0 + z 2
n
n
Como o valor de = 0,10, entao z 2 = 1,645 e assim a regiao crtica e

C=

< 1.600 1,645


(X1 , . . . ,X100 ) : X

120
10

> 1.600 + 1,645


ou X

120
10

< 1.580,26 ou X
> 1.619,74
C = (X1 , . . . ,X100 ) : X
100 = 1.615 nao esta na regiao crtica nao rejeitamos H0 , ou seja
(b) Como a media amostral X
nao ha evidencias amostrais para rejeitarmos a afirmacao de que a linha de producao produz
lampadas com duracao media de 1.600 horas.
No teste bilateral H0 : = 0 versus H1 : 6= 0 o p-valor amostral e calculado da seguinte
forma:
<x
obs < 0 , p-valor = 2P(X
obs | = 0 )
i. Se x
>x
ii. Se x
obs > 0 , p-valor = 2P(X
obs | = 0 )

138


5.4. TESTE DE HIPOTESES

cpa/gsa

Assim sendo o p-valor amostral e calculado por:


100 > 1.615| = 1.600)
p-valor = 2P(X

n
n

= 2P
(X100 ) >
(1.615 1.600)| = 1.600)
2
2

100
= 2P Z >
15 = P(Z > 1,25) = 0,2113
14.400
O p-valor e maior que = 0,10 confirmando entao que nao rejeitamos a hipotese nula.
(c) Para calcularmos o poder do teste, temos que calcular a probabilidade de cometer erro tipo II
se a verdadeira media fosse 1.620. Lembremos que a probabilidade de cometer erro tipo II e a
devera
probabilidade de nao rejeitarmos H0 quando ela e falsa. Para nao rejeitarmos H0 , X
cair na regiao de aceitacao, ou seja:
(1.620) = P(Nao rejeitar H0 | = 1.620)
100 < 1.619,74| = 1.620)
= P(1.580,26 < X

n
n
n

=P
(1.580,26 ) <
(X100 ) <
(1.619,74 )| = 1.620
2
2
2
"
#

100
100
=P
(1.580,26 1.620) < Z <
(1.619,74 1.620)
14.400
14.400
= P(3,31 < Z < 0,02)
= P(Z < 0,02) P(Z < 3,31) = 0,492022 0,000466 = 0,491556
Logo o poder do teste e K = 1 0,491556 = 0,508444
5.4.2.2

Vari
ancia desconhecida

No caso da variancia ser desconhecida, usamos seu estimador usual ou seja


n

S2 =

X
1
2
(Xi X)
(n 1) i=1

Na sub-secao 5.3.5.1 (caso 2) estabelecemos, sem prova, que a estatstica Tn =


buicao t de Student com n 1 graus de liberdade. Baseados nesta distribuicao:
Teste 1, H0 : = 0

H1 : < 0 , rejeitamos H0 , ao nvel , se

n < 0 t(n1;) S
X
n

Teste 2: H0 : = 0

H1 : > 0 , rejeitamos H0 , ao nvel , se

Xn > 0 + t(n1;)
n

Teste 3: H0 : = 0

H1 : 6= 0 , rejeitamos H0 , ao nvel , se

|Xn 0 | > t(n1; 2 )


n
139


n(Xn )
S

tem distri-


5.4. TESTE DE HIPOTESES

cpa/gsa

Para recordar, t(n1;) e tal que P(Tn1 > t(n1;) ) = . E t(n1; 2 ) e definido analogamente.
Exemplo
1. Num teste de resistencia de cordas (7 cm. de diametro) para uma amostra de tamanho n = 16,
16 = 4.482kg e S16 = 115kg.
foram obtidos os seguintes resultados para a tensao de ruptura: X
Suponha que a tensao de ruptura e uma variavel com distribuicao normal. Se o fabricante alega
que a resistencia media e = 4.500 e voce e responsavel pela seguranca de quem ira utilizar a
corda:
(a) Defina um teste apropriado e construa a regiao crtica com = 0,01.
(b) Qual a conclusao para os valores amostrais apresentados? Qual o p-valor amostral?
(c) Qual a probabilidade de se cometer erro tipo II se a media real fosse 4.475kg?
Solucao
(a) A hipotese nula e H0 : = 4.500 e a hipotese alternativa e H1 : < 4.500. Rejeitamos a
hipotese nula se:

n < 0 t(n1;) S
X
n
A regiao crtica e:

115

C = (X1 , . . . ,X16 ) : X16 < 4.500 t(15; 0,01)


4

C = (X1 , . . . ,X16 ) : X16 < 4.500 2,602 28,75 = 4.425,19


16 = 4.482kg > 4.425,19kg, nao rejeitamos a hipotese nula ou seja
(b) Como a media amostral e X
nao ha evidencias contrarias a que a resistencia media da corda seja = 4.500 kg O p-valor
amostral e calculado por:
16 < 4.482| = 4.500)
p-valor = P(X

n
n
=P
(X16 ) <
(4.482 4.500)| = 4.500)
S
S

16
= P T15 <
(18) = P(T15 < 0,63) 0,27
115
Como esperado pelo resultado de (a) o p-valor amostral e maior que o nvel de significancia
dado = 0,01, confirmando que nao rejeitamios H0 .
(c) Para calcularmos a probabilidade de erro tipo II
(4.475) = P(Nao rejeitar H0 | = 4.475)
16 > 4.425,19| = 4.475)
= P(X

n
n
=P
(X16 ) >
(4.425,19 )
S
S
"
#

16
= P T15 <
(4.425,19 4.475)
115
= P(T15 < 1,732)
= P(T15 > 1,732) 0,052

140


5.4. TESTE DE HIPOTESES

5.4.3

cpa/gsa

Testes sobre a m
edia, caso n
ao normal

Se X1 ,X2 , . . . ,Xn e uma amostra aleatoria de


n de uma variavel aleatoria X com media
tamanho
n )
n(
X
e variancia 2 e n e grande, a variavel Zn =
tem distribuicao aproximadamente normal

padrao. Se nao e conhecida,


usa-se o estimador S. Como estamos assumindo tamanhos amostrais
n )
n(X
grandes, a distribuicao de Zn0 =
ainda tem distribuicao aproximadamente normal padrao.
S
No teste 1: H0 : = 0
H1 : < 0 ; ao nvel de significancia , a regiao crtica aproximada e

C = (X1 , . . . Xn ) : Xn < 0 z
se e conhecido ou
n

n < 0 z S
C = (X1 , . . . Xn ) : X
se e desconhecido.
n
Observe que a regiao crtica usa o quantil da distribuicao normal padrao, ou seja, a regiao crtica
e similar `a regiao crtica no caso normal com variancia conhecida. A diferenca esta que neste caso
a regiao crtica e aproximada. Para usar esta aproximacao precisamos de amostras grandes. Quao
grande precisa ser esta amostra, depende da distribuicao dos dados. Um histograma pode nos auxiliar na avaliacao do tamanho amostral. Se o histograma e simetrico em torno de algum ponto,
precisamos de amostras relativamente pequenas (n = 30 pode ser suficiente), mas se o histograma
e assimetrico precisamos de tamanhos amostrais maiores.
Teste 2: H0 : = 0

H1 : > 0

Teste 3: H0 : = 0

H1 : 6= 0

As regioes crticas para os testes 2 e 3 sao obtidas de forma analoga ao teste 1, sendo importante
reforcar que as regioes sao aproximadas.
5.4.3.1

Um caso particular: testes sobre propor


c
oes

Imaginemos uma eleicao para presidente em que o candidato A deseja fazer inferencia sobre a proporcao de eleitores que apoiam sua candidatura. Assuma que existem dezenas de milhoes de eleitores e
que o candidato A escolhe uma amostra aleatoria de tamanho 3.500 e conta entre eles o n
umero de eleitores que apoiam sua candidatura. Podemos considerar o n
umero 3.500 muito pequeno quando comparado
`as dezenas de milhoes de eleitores que apoiam o candidato A. Sendo assim, se definirmos:

1 se o eleitor i apoia o candidato A,


Xi =
0 caso contrario.
pode-se assumir que X1 , X2 , . . . , X3500 sao independentes e identicamente distribudas com distribuicao
de Bernoulli com parametro p, sendo p a proporcao de eleitores na populacao que apoia o candidato A.
Neste caso = E(X) = p e 2 = V (X) = p(1 p).
Entao, de acordo com o Teorema Central do Limite, a variavel

n(Xn )
n(
p p)
Zn =
=p

p(1 p)

141


5.4. TESTE DE HIPOTESES

cpa/gsa

n = 1 Pn Xi define a proporcao estimada a partir da amostra, tem distribuicao aproximaonde p = X


i=1
n
damente normal padrao.
No teste de H0 : p = p0

H1 : p < p0 , H0 sera rejeitada, ao nvel de , se


r
p0 (1 p0 )
p < p0 z
n

Exemplos:
1. (continuacao) O candidato A afirma que p0 = 0,30. Se dos 3.500 eleitores entrevistados, 738 apoiam
sua candidatura, teste a hipotese nula com = 0,05.
Solucao:
A hipotese nula neste caso e H0 : p = 0,30 e a hipotese alternativa H1 : p < 0,30. Ao nvel de
= 0,05, H0 sera rejeitada se
r
p < p0 z

p0 (1 p0 )
= 0,30 z0,05
n

0,30(0,70)
= 0,30 1,642(0,007746) = 0,2873
3.500

Como o valor observado p = 738/3500 = 0,2109 e menor que 0,2873, rejeitamos a hipotese nula; isto
e, ha evidencias para rejeitar a afirmacao de que a proporcao de eleitores que apoiam o candidato
A seja 0,30.
2. Uma linha de producao em grande escala produz 8% de itens defeituosos. A empresa dona da linha,
visando reduzir a proporcao de defeituosos faz investimentos de grande porte na linha de producao
e antes de religa-la definitivamente produz para teste 800 itens dos quais 52 resultaram defeituosos.
Para avaliar o efeito dos investimentos, formule um teste apropriado e obtenha conclusoes ao nvel
= 0,05.
Solucao:
A hipotese nula neste caso e H0 : p = 0,08. Espera-se que, para justificar os investimentos, a
proporcao de itens defeituosos tenha diminudo, isto e H1 : p < 0,08. Ao nvel de = 0,05, H0 sera
rejeitada se
r
p < p0 z

p0 (1 p0 )
= 0,08 z0,05
n

0,08(0,92)
= 0,08 1,642(0,009592) = 0,06422
800

Como o valor observado p = 52/800 = 0,065 nao rejeitamos a hipotese nula, isto e, nao ha evidencias
para rejeitar a afirmacao de que a proporcao de defeituosos na linha apos os investimentos seja igual
a 0,08. Assim sendo os investimentos nao surtiram efeito.

142


5.4. TESTE DE HIPOTESES

5.4.4

cpa/gsa

Teste sobre vari


ancia de uma populac
ao com distribuic
ao normal

Considere uma amostra aleatoria X1 ,X2 , . . . ,Xn de uma variavel aleatoria X com distribuicao normal
com vari
ancia 2 . Abordamos nesta secao o problema de testes sobre variancia:
Teste 1: H0 : 2 = 02

H1 : 2 < 02

Teste 2: H0 : 2 = 02

H1 : 2 > 02

Teste 3: H0 : 2 = 02

H1 : 2 6= 02

Lembremos que a variavel

(n 1)S 2
tem distribuicao qui-quadrado com n 1 graus de liberdade.
2

No teste 1, H0 sera rejeitada se a variancia amostral for menor que um valor c, ou seja a regiao crtica
do teste e da forma {(x1 ,x2 , . . . ,xn ) : S 2 < c}. O valor de c e encontrado a partir do valor de :

(n 1)S 2
(n 1)c 2
2
= P(S 2 < c| 2 = 02 ) = P
<
|
=

0
02
02

(n 1)c
2
assim
= P Xn1 <
02

(n 1)c
2
>
ou de forma equivalente
1 = P Xn1

02
2
Da tabela da distribuicao qui-quadrado encontramos o valor X(1;n1)
tal que
2
2
P(Xn1
> X(1;n1)
)=1

De e tem-se que

02
(n 1)c
2
= X(1;n1)
e portanto c =
X2
.
2
0
n 1 (1;n1)

Conclumos entao que no teste 1, ao nvel rejeita-se H0 se


S2 <

02
X2
n 1 (1;n1)

Exemplo:
As notas de uma disciplina ajustam uma distribuicao normal. Historicamente a variancia e igual a 36.
Um novo metodo de ensino esta sendo proposto para tornar a turma mais homogenea no aprendizado.
20 alunos sao matriculados em uma disciplina em que e usado o novo metodo e observou-se que o valor
amostral de S 2 foi igual a 32. Formule um teste apropriado e avalie se o novo metodo atingiu o objetivo
(use = 0,10).
Solucao:
A hipotese nula e H0 : 2 = 36. Como espera-se que o metodo tenha surtido resultado temos a
hipotese alternativa H1 : 2 < 36. H0 ser
a rejeitada se
S2 <

36 2
02
X2
=
X
= 1,8947 11,65 = 22,07
n 1 (1;n1)
19 (0,9;19)

143


5.4. TESTE DE HIPOTESES

cpa/gsa

Nao podemos portanto rejeitar H0 , o que sugere que o novo metodo nao surtiu efeito.
Procedendo analogamente como feito no teste 1, conclui-se que no teste 2 H0 sera rejeitada, ao nvel
se
02
S2 >
X2
n 1 (;n1)
E no teste 3 H0 sera rejeitada, ao nvel se
S2 <

02
X2
n 1 (1 2 ;n1)

ou

S2 >

02
X 2
n 1 ( 2 ;n1)

Exemplo:
Para melhorar o processo de fabricac
ao de detergente de sua empresa, o dono adquiriu uma nova
maquina de enchimento de garrafas plasticas. O fabricante desta maquina garantia que com sua utilizacao, a variancia do volume de detergente em cada garrafa seria 8,75 ml2 . Apos sua intalacao, o
empresario retirou uma amostra aleatoria de 20 garrafas. O volume de cada garrafa nesta amostra resultou em uma variancia de 13,4 ml2 . Se o volume de enchimento tem distribuicao normal, ha evidencias de
que a maquina de enchimento esta atendendo `a performance de variabilidade informada pelo fabricante,
com = 0,05?
Solucao:
As hipoteses a serem testadas sao H0 : 2 = 8,75 ml2 contra H1 : 2 6= 8,75 ml2 e a regiao crtica
sera:

02
02
2
2
2
C : (X1 , . . . , X20 ) : S 2 <
X(1
ou
S
>
X

2 ;n1)
n1
n 1 ( 2 ;n1)
Na tabela da quiquadrado temos:
2
2
X(1

;n1) = X(0,975;19) = 8,91


2

2
X(2 ;n1) = X(0,025;19)
= 32,85
2

e a regiao crtica fica:

8,75
8,75
C : (X1 , . . . , X20 ) : S 2 <
8,91 ou S 2 >
32,85 = (X1 , . . . , X20 ) : S 2 < 4,10 ou S 2 > 15,12
19
19
Como a variancia amostral (S 2 = 13,4) esta fora da regiao crtica mao rejeitamos H0 , ou seja, nao ha
evidencias significativas de que a variancia seja diferente de 8,75 ml2 .

144


5.4. TESTE DE HIPOTESES

cpa/gsa

5.4.5

Testes sobre diferenca de m


edias

5.4.5.1

Vari
ancias conhecidas

Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com distribuicao normal com media 1 e variancia 12 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m de uma
variavel aleatoria Y com distribuicao normal com media 2 e variancia 22 ; X e Y independentes.
Como ja vimos a estatstica:
Z=

n Ym (1 2 )
X
r
12
2
+ 2
n
m

tem distribuicao normal padrao (media= 0 e variancia= 1).


Portanto para testarmos:
Teste 1: H0 : 1 2 = 0

H1 : 1 2 < 0

Teste 2: H0 : 1 2 = 0

H1 : 1 2 > 0

Teste 3: H0 : 1 2 = 0

H1 : 1 2 6= 0

usamos a estatstica Z e:
No teste 1: Ao nvel , rejeita-se H0 se
r
Y < z
X

12
2
+ 2
n
m

No teste 2: Ao nvel , rejeita-se H0 se


r
Y > z
X

12
2
+ 2
n
m

No teste 3: Ao nvel , rejeita-se H0 se


!
!
r
r
2
2
2
2

2
2
1
1
Y < z
Y > z
X
+
ou X
+
2
2
n
m
n
m
Exemplo:
Um empresa produz postes de ferro para padrao de energia eletrica, pintados com tinta prateada
especial. Um fabricante de produtos qumicos esta anunciando um catalisador especial que, misturado `a
tinta usada pelo fabricante dos padroes reduz o tempo de secagem. Sabe-se que o tempo de secagem e
uma vari
avel aleatoria com distribuicao normal com desvio padrao de 8 minutos e que este desvio padrao
nao deve se alterar pela adicao do novo produto qumico. Dez postes sao pintados com a tinta usual e
dez com a tinta misturada ao novo produto, simultaneamente. Os tempos medios de secagem das duas
= 121 minutos e Y = 112 minutos. Quais as conclusoes que o fabricante de postes pode
amostras foram X
145


5.4. TESTE DE HIPOTESES

cpa/gsa

tirar sobre a eficiencia do catalisador, com um nvel de significancia de = 0,05? Qual o p-valor amostral?
Solucao:
As hipoteses a serem testadas sao H0 : X Y = 0 e H0 : X Y > 0, e a regiao crtica
correspondente e:
(
r
!)
12
22

C : (X1 , . . . , X10 ; Y1 , . . . , Y10 ) : X Y > z


+
n
m
como z0,05 = 1,645 fica
(
C:

Y > 1,645
(X1 , . . . , X10 ; Y1 , . . . , Y10 ) : X

82
82
+
10 10

)
= 5,89

Y = 121 112 = 9 > 5,89, nos rejeitamos H0 e portanto a um nvel de significancia de 5%


Como X
podemos afirmar que ha evidencias para apoiar a afirmacao do fabricante de produtos qumicos de que o
novo ingrediente reduz o tempo de secagem.
Para o calculo do p-valor fazemos:

Y > 9|X Y = 0
p-valor =P X

Y (X Y )
X

9 (X Y )
r
> r
|X Y = 0
p-valor =P

12
12
2
2
+ 2
+ 2
n
m
n
m

p-valor =P
Z > r

5.4.5.2

9
2

8
8
+
10 10

= P(Z > 2,52) = 0,005868

Vari
ancias desconhecidas mas iguais

Tomemos agora X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com
distribuicao normal com media 1 e variancia 2 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma variavel aleatoria Y com distribuicao normal com media 2 e variancia 2 ; X e Y independentes
e variancias desconhecidas, mas iguais.
Nesse caso temos a estatstica:
T =

n Ym (1 2 )
X
r
1
1
+
Sp
n m

que tem distribuicao t de Student com (n + m 2) graus de liberdade.


Onde

s
Sp =

(n 1)S12 + (m 1)S22
n+m2

146


5.4. TESTE DE HIPOTESES

cpa/gsa

Portanto para testarmos:


Teste 1: H0 : 1 2 = 0

H1 : 1 2 < 0

Teste 2: H0 : 1 2 = 0

H1 : 1 2 > 0

Teste 3: H0 : 1 2 = 0

H1 : 1 2 6= 0

usamos a estatstica T e:
No teste 1: Ao nvel , rejeita-se H0 se
r
Y < t(n+m2;) Sp
X

1
1
+
n m

No teste 2: Ao nvel , rejeita-se H0 se


r
Y > t(n+m2;) Sp
X

1
1
+
n m

No teste 3: Ao nvel , rejeita-se H0 se


r
!
r
!
1
1
1
1
Y < t(m+n2; ) Sp
Y > t(m+n2; ) Sp
X
+
ou X
+
2
2
n m
n m
Exemplo:
Suponha que voce tenha duas amostras de populacoes normais independentes (X e Y ) sabidamente
de mesma variancia que produziram as seguintes estatsticas:
= 24,2 Variancia S 2 = 10
Amostra 1 : Tamanho n = 15 Media X
X
Amostra 2 : Tamanho m = 10 Media Y = 23,9 Variancia SY2 = 20
Teste H0 : X = Y contra H1 : X 6= Y e calcule o p-valor amostral, com = 0,10.
Solucao:
Calculemos inicialmente o desvio padrao amostral ponderado:
s
r
2
(n 1)SX
+ (m 1)SY2
14 10 + 9 20
Sp =
=
= 3,73
n+m2
15 + 10 2
e da tabela t obtemos:
t(m+n2; 2 ) = t(23;0,05) = 1,714
A regiao crtica entao e:
r
Y < t(m+n2; )
X
2

1
1
+
n m

ou

r
Y > t(m+n2; )
X
2

r
= 1,714 3,73

1
1
+
n m

1
1
+
15 10

!
= 2,61

147

= 1,714 3,73 0,408 = 2,61


5.4. TESTE DE HIPOTESES

cpa/gsa

Y = 24,2 23,9 = 0,3 esta fora da regiao crtica, nao rejeitamos H0 , ou seja, ha evidencias
Como X
para apoiar a afirmacao de que as populacoes possuem a mesma media.
Para calcularmos o p-valor amostral fazemos:
Y > 0,3|X Y = 0)
p-valor =P(X

0,3

p-valor =P t23 > q


1
1
Sp n + m

0,3
0,42
p-valor =P t23 >
1,5228

5.4.5.3

Vari
ancias desconhecidas e diferentes

Se tivermos X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com
2
distribuicao normal com media 1 e variancia X
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma variavel aleatoria Y com distribuicao normal com media 2 e variancia Y2 ; X e Y independentes
e variancias desconhecidas e diferentes, para testarmos:
Teste 1: H0 : 1 2 = 0

H1 : 1 2 < 0

Teste 2: H0 : 1 2 = 0

H1 : 1 2 > 0

Teste 3: H0 : 1 2 = 0

H1 : 1 2 6= 0

teremos agora:
Teste 1: Ao nvel , rejeita-se H0 se
r
Y < t(;)
X

2
SX
S2
+ Y
n
m

Teste 2: Ao nvel , rejeita-se H0 se


r
Y > t(;)
X

2
SX
S2
+ Y
n
m

Teste 3: Ao nvel , rejeita-se H0 se


r
r
!
!
2
2
SX
SY2
SX
SY2

X Y < t(; 2 )
+
ou X Y > t(; 2 )
+
n
m
n
m
onde , o n
umero de graus de liberdade da estatstica T nesse caso e calculado por:
2
2
SY2
SX
+
n
m
=
2
2 2
2
2
SY /m
SX /n
+
n+1
m+1

148


5.4. TESTE DE HIPOTESES

5.4.6

cpa/gsa

Teste sobre raz


ao de vari
ancias

Suponha que X1 ,X2 , . . . ,Xn seja uma amostra aleatoria de tamanho n de uma populacao com dis2
tribuicao normal com media X e variancia X
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma populacao com distribuicao normal com media Y e variancia Y2 . Se as duas populacoes sao
independentes e quisermos comparar as variancias das duas populacoes com os testes:
2
2

X
X
2
2
2
<

= Y2
=
1
contra
H
:

<
1
Teste 1: H0 : X
1
Y
X
Y2
Y2
2

X
X
2
2
2
Teste 2: H0 : X
= Y2
=
1
contra
H
:

>

>
1
1
X
Y
Y2
Y2

2
2
X
X
2
2
2
2
Teste 3: H0 : X = Y
=1
contra
H1 : X 6= Y
6= 1
Y2
Y2
Lembremos que a estatstica

S12 22
S22 12

tem distribuicao F de Fisher com n 1 e m 1 graus de liberdade. Assim podemos escrever que as
regioes crticas de cada um dos tres testes, a um nvel de significancia sao:
Teste 1:

C:

S2
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
< f(n1;m1;1)
SY2

ou de forma equivalente, como vimos:

2
1
SX
C : (X1 , . . . , Xn ; Y1 , . . . , Ym ) : 2 <
SY
f(m1;n1;)
Teste 2:

S2
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
> f(n1;m1;)
SY2

C:
Teste 3:
C:
ou

S2
1
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
<
SY2
f(m1;n1; 2 )

C:

(X1 , . . . , Xn ; Y1 , . . . , Ym ) :

2
SX
> f(n1;m1; 2 )
SY2

Exemplo:
Duas ind
ustrias qumicas produzem uma materia prima cuja concentracao de um elemento em particular e muito importante. A media da concentracao deste elemento nos produtos dos dois fabricantes
e a mesma, mas suspeita-se que a variabilidade possa diferir entre os dois produtos. Sao colhidas duas
amostras, uma de cada fabricante, com o seguinte resultado:
1. Amostra do fabricante X: n = 10 e SX = 4,7 gr/l
2. Amostra do fabricante Y : n = 16 e SX = 5,8 gr/l

149

5.5. EXERCICIOS

cpa/gsa

Ha evidencias para concluirmos que a variancia da concentracao do elemento em estudo seja diferente
para os dois fabricantes (use = 0,05)?
Solucao:

2
2
X
X
=
1
contra
H
:
6= 1. Neste caso sabemos que a regiao crtica sera:
1
Y2
Y2
(
)
2
2
SX
1
SX
C : (X1 , . . . , X10 ; Y1 , . . . , Y16 ) : 2 <
ou 2 > f(n1;m1; 2 )
SY
f(m1;n1; 2 )
SY

Temos que testar H0 :

Na tabela F de Fisher achamos:


f(m1;n1; 2 ) = f(15;9;0,0025) = 3,77 e f(n1;m1; 2 ) = f(9;15;0,0025) = 3,12
e assim a regiao crtica fica

2
2
1
SX
SX
C : (X1 , . . . , X10 ; Y1 , . . . , Y16 ) : 2 <
= 0,265 ou 2 > 3,12
SY
3,77
SY
Como

2
4,72
22,09
SX
=
=
= 0,6564
SY2
5,82
33,64

esta fora da regiao crtica, nao rejeitamos H0 ou seja, nao ha evidencias para rejeitar a afirmacao que a
variancia das duas populacoes sejam iguais.

Observa
c
ao Final: Vimos no item 5.4.5 que existem tres opcoes diferentes para testarmos diferenca
de medias de duas amostras de populacoes normais:
2
e Y2 conhecidas;
X
2
X
e Y2 desconhecidas mas iguais
2
X
e Y2 conhecidas e diferentes.

Se nao tivermos nenhuma informacao sobre as variancias, devemos inicialmete testar a igualdade das
2
mesmas, conforme visto no item 5.4.6 e a sim, apos rejeitarmos ou nao a hipotese H0 : X
= Y2 ,
escolhemos adequadamente o teste para diferenca de medias.

5.5

Exerccios

1. O peso de ruptura de certo tipo de barras tem distribuicao normal. Este peso foi medido para
18 destas barras. A media obtida foi 137,1 kg e a variancia amostral S 2 igual a 4,62kg 2 (desvio
padrao= 2,15 kg). Encontre um intervalo de 95% de confianca para a media de ruptura destas
barras.
2. Uma variavel aleatoria tem distribuicao normal com media desconhecida e variancia= 9. Deseja-se
testar, ao nvel = 0,05, a hipotese H0 : = 80 contra a alternativa H1 : 6= 80 . Defina a regiao
crtica deste teste, a partir de uma amostra aleatoria de tamanho 16. Se o valor observado de foi
x
16 = 82,6, qual a decisao que voce tomaria?

150

5.5. EXERCICIOS

cpa/gsa

3. Uma empresa produz barras de aco de 120 cm. O padrao de qualidade exige que as barras produzidas
tenham distribuicao normal com desvio padrao = 0,5 cm (Variancia=0,25 cm2 ). A secao de
controle de qualidade da empresa testa, a partir de amostra retirada aleatoriamente da procucao
no incio de cada semana, esta hipotese. No incio da primeira semana de julho obteve os dados
registrados a seguir:
121,2 119,6 120,9 119,8 121,6 120,0 120,2 118,9 119,9 119,7
120,0 120,4 121,0 119,4 120,3 119,7 120,4 120,6 120,4
Supondo que a hipotese de normalidade nao seja rejeitada, teste ao nvel de significancia = 0,05,
a hipotese especificada pelo padrao de qualidade, ou seja:
(a) Testar H0 : = 120 contra H1 : > 120;
(b) testar H0 : = 120 contra H1 :6= 120;
(c) assuma que a variancia populacional e 2 = 0,25 e encontre o p-valor amostral no teste do
item (b).

4. Uma variavel aleatoria tem distribuicao normal com media desconhecida e variancia=9. Deseja-se
testar, ao nvel = 0,01, H0 : = 100 contra H1 : 6= 100.
(a) Defina a regiao crtica para este teste a partir de uma amostra aleatoria de tamanho 20;
20 = 104,6; qual a decisao que voce tomaria? Calcule o p-valor
(b) Se o valor observado de foi x
amostral;
(c) Calcule o poder do teste se o verdadeiro valor da media e 103.

5. Uma empresa produz barras de aco que de acordo a especificacoes do mercado precisam ter media
igual a 100 e desvio padrao igual a 1. Foi medido o comprimento de 15 barras e obteve-se:
99,9 101,2 99,4 101,2 102,1 101,2 99,8 99,5 102,0 103,5 100,1 103,8 101,6 100,7 99,3
Feito o teste de normalidade, esta hipotese nao foi rejeitada.
(a) Teste a hipotese H0 : = 100 contra H1 : 6= 120 ao nvel = 0,10;
(b) Teste a hipoteseH0 : 2 = 1 contra 2 6= 1 ao nvel = 0,10;
(c) Calcule o p-valor amostral do teste descrito em (a) e calcule o poder do teste se o verdadeiro
valor da media for igual a 101.
(d) Construa um intervalo de confianca de 90% para a media.

6. Voce e proprietario de uma empresa que produz vergalhoes de aco para construcao civil. Utililiza o
aco grau AO01 cuja resistencia nominal `a tracao tem distribuicao normal com media 50 kgf /mm2
e desvio padrao 2,5 kgf /mm2 . Um cliente tradicional de sua empresa alega que seu aco esta fornecendo uma resistencia `a tracao inferior `a nominal. Suponha que voce tem que julgar a reclamacao
de seu cliente.
(a) Formule um teste apropriado e defina a regiao crtica ao nvel de = 0,01; usando uma amostra
de tamanho 25.
151

5.5. EXERCICIOS

cpa/gsa

(b) Se o valor observado de x


25 = 47,5 kgf /mm2 , qual a sua decisao?
(c) Calcule o poder do teste se o verdadeiro valor da media e igual a 48 kgf /mm2 .

7. Lampadas para veculos eram tradicionalmente produzidas por um u


nico fabricante. Uma nova
fabrica aparece no mercado, alegando que as lampadas por ela produzidas tem tempo de vida
maior. Duas lampadas, uma de cada fabrica, sao colocadas nos farois de 15 veculos e os tempos de
vida, em milhares de horas, das correspondentes lampadas observados. Os resultados obtidos estao
contidos na tabela abaixo:
Veculo
Fab. A
Fab. B

1
3,6
4,4

2
2,5
3,3

3
2,2
2,8

4
3,4
4,4

5
3,3
3,6

6
2,6
3,7

7
2,0
2,1

8
3,9
4,6

9
3,9
5,1

10
3,4
4,6

11
4,4
3,6

12
3,7
4,6

13
2,9
2,7

14
5,9
5,6

15
4,2
3,9

(a) Formule um teste para avaliar a alegacao da nova fabrica.


(b) Voce compraria a nova lampada, sendo que ela e mais cara que a antiga? (use um nvel de
significancia de 0,05).

8. Voce e responsavel pelo envazamento de latas de refrigerante de uma fabrica e semanalmente inspeciona a linha de producao para saber se ela esta bem ajustada. A amostra da u
ltima semana
forneceu os seguintes volumes ( em ml.):
299

309

302

298

302

291

296

302

306

303

301

303

(a) Teste ao nvel = 0,10; H0 : = 300 vs H1 : 6= 300.


(b) Teste ao nvel = 0,10; H0 : 2 = 12 vs H1 : 2 6= 12.

9. O diametro de rodas ferroviarias produzidas por duas forjas esta sendo investigado. Amostras
aleatorias de tamanhos n = 9 e m = 16 respectivamente das forjas X e Y , foram obtidas e apurouse o seguinte resultado

Forja X =

x
= 670mm
2
SX
= 49mm2

Forja Y =

y = 665mm
SY2 = 36mm2

(a) Existe alguma evidencia para apoiar a afirmacao de que as rodas da forja Y possuem diametro
menor que as rodas da forja X? Suponha que as variancias sao iguais e use = 0,10.
(b) Encontre o p-valor para a estatstica calculada em a.

10. Um pesquisador do departamento de estatstica da UFMG estudou modelos de degradacao para


analisar o tempo de vida de pneus automotivos. Para uma amostra de 51 pneus ele encontrou uma
distancia media percorrida ate o desgaste limite de 49.500 km, com desvio padrao igual a 1.600 km.
Suponha que a distancia percorrida ate o desgaste limite tenha distribuicao normal.
(a) Encontre a regiao crtica para testar H0 : = 50.000 km contra H1 : < 50.000 km,
considerando um nvel de significancia de 5%. A que conclusao voce chega com o resultado
obtido pelo pesquisador?
152

5.5. EXERCICIOS

cpa/gsa

(b) Qual o p-valor amostral da experiencia relatada?


(c) Calcule o poder do teste feito em a, se o verdadeiro valor da media e igual a 49.815 km.

11. O peso de 9 alunos sorteados aleatoriamente na turma A1 de Estatstica e Probabilidade resultou


em:
68
80
80
70
82
87
73
80
65
Supondo que o peso e uma variavel aleatoria com distribuicao normal:
(a) Construa um intervalo de confianca de 95% para a media.
(b) Teste a hipotese H0 : = 73 contra H1 : 6= 73 ao nvel = 0,10 (Construa a regiao crtica e
explique o resultado).
(c) Teste a hipotese H0 : 2 = 120 contra H1 : 2 6= 120 ao nvel = 0,05 (Construa a regiao
crtica e explique o resultado).

12. A chapa que tenta reconstruir o DA do Icex afirma contar com apoio de 80% dos estudantes do
Instituto. Um enquete e realizada com 100 estudantes escolhidos aleatoriamente, e 72 afirmaram
apoiar a chapa. Se p e a proporcao dos alunos que apoiam a chapa:
(a) Defina; ao nvel de significancia = 0,01; a regiao crtica para testar H0 : p = 0,8 contra
H1 : p < 0,8.
(b) Construa um intervalo de confianca de 95% de confianca para a real proporcao de pessoas que
apoiam a chapa com base na amostra da enquete.

153

Captulo 6

Bibliografia

154

Refer
encias Bibliogr
aficas
ao do n
umero
otimo de classes em um histograma. Relatorios
[1] Atuncar, G. S. e Amorim, F. G. Estimac
de Projetos em Estatstica, Depto de Estatstica UFMG, Belo Horizonte. 2003
[2] Casella, George & Berger, Roger L Statistical Inference, 2nd Edition Duxbury, Thompson Learning.
2002.
[3] Hogg, R & Craig, A Introduction to Mathematical Statistics, 5th Edition. Prentice Hall. 1994.
[4] Karlin, S & Taylor, H A first course in stochastic process, Academic Press. 1975.
[5] Kolmogorov, A. N., Foundations of the theory of probability, Grundbegriffe der Wahrscheinlichkeitsrechnung. 1933.
[6] Magalhaes Marcos Nascimento, Noc
oes de Probabilidade e Estatstica, Marcos Nascimento Magalhaes, Antonio Carlos Pedros de Lima. 6a ed. Editora Universidade de Sao Paulo. 2008.
[7] Montgomery D. C. e Runger G. C., Estatstica aplicada e probabilidade para engenheiros; traducao
Veronica Calado. LTC Livros Tecnicos e Cientficos Editora S.A. 2008.
[8] Ross, Sheldon, A First course in probability, 5th Edition. Prentice Hall, Inc. 1998.

155

Captulo 7

Ap
endice

156

cpa/gsa

Tabela 1: TABELA NORMAL


0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,00
0,500000
0,539828
0,579260
0,617911
0,655422
0,691462
0,725747
0,758036
0,788145
0,815940
0,841345
0,864334
0,884930
0,903200
0,919243
0,933193
0,945201
0,955435
0,964070
0,971283
0,977250
0,982136
0,986097
0,989276
0,991802
0,993790
0,995339
0,996533
0,997445
0,998134
0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952

0,01
0,503989
0,543795
0,583166
0,621720
0,659097
0,694974
0,729069
0,761148
0,791030
0,818589
0,843752
0,866500
0,886861
0,904902
0,920730
0,934478
0,946301
0,956367
0,964852
0,971933
0,977784
0,982571
0,986447
0,989556
0,992024
0,993963
0,995473
0,996636
0,997523
0,998193
0,998694
0,999065
0,999336
0,999534
0,999675
0,999776
0,999847
0,999896
0,999931
0,999954

0,02
0,507978
0,547758
0,587064
0,625516
0,662757
0,698468
0,732371
0,764238
0,793892
0,821214
0,846136
0,868643
0,888768
0,906582
0,922196
0,935745
0,947384
0,957284
0,965620
0,972571
0,978308
0,982997
0,986791
0,989830
0,992240
0,994132
0,995604
0,996736
0,997599
0,998250
0,998736
0,999096
0,999359
0,999550
0,999687
0,999784
0,999853
0,999900
0,999933
0,999956

0,03
0,511966
0,551717
0,590954
0,629300
0,666402
0,701944
0,735653
0,767305
0,796731
0,823814
0,848495
0,870762
0,890651
0,908241
0,923641
0,936992
0,948449
0,958185
0,966375
0,973197
0,978822
0,983414
0,987126
0,990097
0,992451
0,994297
0,995731
0,996833
0,997673
0,998305
0,998777
0,999126
0,999381
0,999566
0,999698
0,999792
0,999858
0,999904
0,999936
0,999958

0,04
0,515953
0,555670
0,594835
0,633072
0,670031
0,705401
0,738914
0,770350
0,799546
0,826391
0,850830
0,872857
0,892512
0,909877
0,925066
0,938220
0,949497
0,959070
0,967116
0,973810
0,979325
0,983823
0,987455
0,990358
0,992656
0,994457
0,995855
0,996928
0,997744
0,998359
0,998817
0,999155
0,999402
0,999581
0,999709
0,999800
0,999864
0,999908
0,999938
0,999959

157

0,05
0,519939
0,559618
0,598706
0,636831
0,673645
0,708840
0,742154
0,773373
0,802337
0,828944
0,853141
0,874928
0,894350
0,911492
0,926471
0,939429
0,950529
0,959941
0,967843
0,974412
0,979818
0,984222
0,987776
0,990613
0,992857
0,994614
0,995975
0,997020
0,997814
0,998411
0,998856
0,999184
0,999423
0,999596
0,999720
0,999807
0,999869
0,999912
0,999941
0,999961

0,06
0,523922
0,563559
0,602568
0,640576
0,677242
0,712260
0,745373
0,776373
0,805105
0,831472
0,855428
0,876976
0,896165
0,913085
0,927855
0,940620
0,951543
0,960796
0,968557
0,975002
0,980301
0,984614
0,988089
0,990863
0,993053
0,994766
0,996093
0,997110
0,997882
0,998462
0,998893
0,999211
0,999443
0,999610
0,999730
0,999815
0,999874
0,999915
0,999943
0,999963

0,07
0,527903
0,567495
0,606420
0,644309
0,680822
0,715661
0,748571
0,779350
0,807850
0,833977
0,857690
0,879000
0,897958
0,914657
0,929219
0,941792
0,952540
0,961636
0,969258
0,975581
0,980774
0,984997
0,988396
0,991106
0,993244
0,994915
0,996207
0,997197
0,997948
0,998511
0,998930
0,999238
0,999462
0,999624
0,999740
0,999822
0,999879
0,999918
0,999946
0,999964

0,08
0,531881
0,571424
0,610261
0,648027
0,684386
0,719043
0,751748
0,782305
0,810570
0,836457
0,859929
0,881000
0,899727
0,916207
0,930563
0,942947
0,953521
0,962462
0,969946
0,976148
0,981237
0,985371
0,988696
0,991344
0,993431
0,995060
0,996319
0,997282
0,998012
0,998559
0,998965
0,999264
0,999481
0,999638
0,999749
0,999828
0,999883
0,999922
0,999948
0,999966

0,09
0,535856
0,575345
0,614092
0,651732
0,687933
0,722405
0,754903
0,785236
0,813267
0,838913
0,862143
0,882977
0,901475
0,917736
0,931888
0,944083
0,954486
0,963273
0,970621
0,976705
0,981691
0,985738
0,988989
0,991576
0,993613
0,995201
0,996427
0,997365
0,998074
0,998605
0,998999
0,999289
0,999499
0,999651
0,999758
0,999835
0,999888
0,999925
0,999950
0,999967

GL

9,89

10,52

11,16

11,81

12,46

13,12

13,79

20,71

27,99

35,53

43,28

51,17

25

26

27

28

29

30

40

50

60

70

80

5,14

16

24

4,60

15

9,26

4,07

14

23

3,57

13

8,64

3,07

12

22

2,60

11

8,03

2,16

10

21

1,73

7,43

1,34

20

0,99

6,84

0,68

19

0,41

6,26

0,21

18

0,07

5,70

0,01

17

0,00

0,995

158

53,54

45,44

37,48

29,71

22,16

14,95

14,26

13,56

12,88

12,20

11,52

10,86

10,20

9,54

8,90

8,26

7,63

7,01

6,41

5,81

5,23

4,66

4,11

3,57

3,05

2,56

2,09

1,65

1,24

0,87

0,55

0,30

0,11

0,02

0,00

0,990

57,15

48,76

40,48

32,36

24,43

16,79

16,05

15,31

14,57

13,84

13,12

12,40

11,69

10,98

10,28

9,59

8,91

8,23

7,56

6,91

6,26

5,63

5,01

4,40

3,82

3,25

2,70

2,18

1,69

1,24

0,83

0,48

0,22

0,05

0,00

0,975

57,96

49,50

41,15

32,95

24,94

17,21

16,45

15,70

14,96

14,22

13,48

12,75

12,03

11,31

10,60

9,90

9,20

8,51

7,83

7,16

6,50

5,86

5,22

4,60

4,00

3,41

2,85

2,31

1,80

1,33

0,90

0,54

0,25

0,06

0,00

0,970

60,39

51,74

43,19

34,76

26,51

18,49

17,71

16,93

16,15

15,38

14,61

13,85

13,09

12,34

11,59

10,85

10,12

9,39

8,67

7,96

7,26

6,57

5,89

5,23

4,57

3,94

3,33

2,73

2,17

1,64

1,15

0,71

0,35

0,10

0,00

0,950

64,28

55,33

46,46

37,69

29,05

20,60

19,77

18,94

18,11

17,29

16,47

15,66

14,85

14,04

13,24

12,44

11,65

10,86

10,09

9,31

8,55

7,79

7,04

6,30

5,58

4,87

4,17

3,49

2,83

2,20

1,61

1,06

0,58

0,21

0,02

0,900

69,21

59,90

50,64

41,45

32,34

23,36

22,48

21,59

20,70

19,82

18,94

18,06

17,19

16,31

15,44

14,58

13,72

12,86

12,00

11,15

10,31

9,47

8,63

7,81

6,99

6,18

5,38

4,59

3,82

3,07

2,34

1,65

1,01

0,45

0,06

0,800

72,92

63,35

53,81

44,31

34,87

25,51

24,58

23,65

22,72

21,79

20,87

19,94

19,02

18,10

17,18

16,27

15,35

14,44

13,53

12,62

11,72

10,82

9,93

9,03

8,15

7,27

6,39

5,53

4,67

3,83

3,00

2,19

1,42

0,71

0,15

0,700

76,19

66,40

56,62

46,86

37,13

27,44

26,48

25,51

24,54

23,58

22,62

21,65

20,69

19,73

18,77

17,81

16,85

15,89

14,94

13,98

13,03

12,08

11,13

10,18

9,24

8,30

7,36

6,42

5,49

4,57

3,66

2,75

1,87

1,02

0,27

0,600

79,33

69,33

59,33

49,33

39,34

29,34

28,34

27,34

26,34

25,34

24,34

23,34

22,34

21,34

20,34

19,34

18,34

17,34

16,34

15,34

14,34

13,34

12,34

11,34

10,34

9,34

8,34

7,34

6,35

5,35

4,35

3,36

2,37

1,39

0,45

0,500

82,57

72,36

62,13

51,89

41,62

31,32

30,28

29,25

28,21

27,18

26,14

25,11

24,07

23,03

21,99

20,95

19,91

18,87

17,82

16,78

15,73

14,69

13,64

12,58

11,53

10,47

9,41

8,35

7,28

6,21

5,13

4,04

2,95

1,83

0,71

0,400

86,12

75,69

65,23

54,72

44,16

33,53

32,46

31,39

30,32

29,25

28,17

27,10

26,02

24,94

23,86

22,77

21,69

20,60

19,51

18,42

17,32

16,22

15,12

14,01

12,90

11,78

10,66

9,52

8,38

7,23

6,06

4,88

3,66

2,41

1,07

0,300

88,13

77,58

66,98

56,33

45,62

34,80

33,71

32,62

31,53

30,43

29,34

28,24

27,14

26,04

24,93

23,83

22,72

21,60

20,49

19,37

18,25

17,12

15,98

14,85

13,70

12,55

11,39

10,22

9,04

7,84

6,63

5,39

4,11

2,77

1,32

0,250

90,41

79,71

68,97

58,16

47,27

36,25

35,14

34,03

32,91

31,79

30,68

29,55

28,43

27,30

26,17

25,04

23,90

22,76

21,61

20,47

19,31

18,15

16,98

15,81

14,63

13,44

12,24

11,03

9,80

8,56

7,29

5,99

4,64

3,22

1,64

0,200

93,11

82,26

71,34

60,35

49,24

37,99

36,85

35,71

34,57

33,43

32,28

31,13

29,98

28,82

27,66

26,50

25,33

24,16

22,98

21,79

20,60

19,41

18,20

16,99

15,77

14,53

13,29

12,03

10,75

9,45

8,12

6,74

5,32

3,79

2,07

0,150

96,58

85,53

74,40

63,17

51,81

40,26

39,09

37,92

36,74

35,56

34,38

33,20

32,01

30,81

29,62

28,41

27,20

25,99

24,77

23,54

22,31

21,06

19,81

18,55

17,28

15,99

14,68

13,36

12,02

10,64

9,24

7,78

6,25

4,61

2,71

0,100

101,88

90,53

79,08

67,50

55,76

43,77

42,56

41,34

40,11

38,89

37,65

36,42

35,17

33,92

32,67

31,41

30,14

28,87

27,59

26,30

25,00

23,68

22,36

21,03

19,68

18,31

16,92

15,51

14,07

12,59

11,07

9,49

7,81

5,99

3,84

0,050

106,63

95,02

83,30

71,42

59,34

46,98

45,72

44,46

43,19

41,92

40,65

39,36

38,08

36,78

35,48

34,17

32,85

31,53

30,19

28,85

27,49

26,12

24,74

23,34

21,92

20,48

19,02

17,53

16,01

14,45

12,83

11,14

9,35

7,38

5,02

0,025

112,33

100,43

88,38

76,15

63,69

50,89

49,59

48,28

46,96

45,64

44,31

42,98

41,64

40,29

38,93

37,57

36,19

34,81

33,41

32,00

30,58

29,14

27,69

26,22

24,73

23,21

21,67

20,09

18,48

16,81

15,09

13,28

11,34

9,21

6,63

0,010

116,32

104,21

91,95

79,49

66,77

53,67

52,34

50,99

49,65

48,29

46,93

45,56

44,18

42,80

41,40

40,00

38,58

37,16

35,72

34,27

32,80

31,32

29,82

28,30

26,76

25,19

23,59

21,95

20,28

18,55

16,75

14,86

12,84

10,60

7,88

0,005

Tabela 2
Qui-quadrado

cpa/gsa

159

0,051

0,45

0,126

0,050

0,050

120

100000

0,126

0,050

0,050

50

60

0,127

0,126

0,126

0,126

0,051

0,050

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,127

0,128

0,128

0,128

0,128

0,128

0,128

0,129

0,129

0,129

0,130

0,130

0,131

0,132

0,134

0,137

0,142

0,158

30

0,051

0,051

28

29

0,051

0,051

26

27

0,051

0,051

24

25

0,051

0,051

22

23

0,051

0,051

20

21

0,051

0,051

18

19

0,051

16

17

0,051

0,051

14

15

0,051

0,051

12

13

0,051

0,051

10

11

0,052

0,052

0,052

0,052

0,053

0,054

0,053

0,057

0,48

0,063

40

GL

0,40

0,253

0,254

0,254

0,255

0,255

0,256

0,256

0,256

0,256

0,256

0,256

0,256

0,256

0,256

0,257

0,257

0,257

0,257

0,257

0,258

0,258

0,258

0,259

0,259

0,260

0,260

0,261

0,262

0,263

0,265

0,267

0,271

0,277

0,289

0,325

0,35

0,385

0,386

0,387

0,388

0,388

0,389

0,389

0,389

0,389

0,390

0,390

0,390

0,390

0,390

0,391

0,391

0,391

0,392

0,392

0,392

0,393

0,393

0,394

0,395

0,396

0,397

0,398

0,399

0,402

0,404

0,408

0,414

0,424

0,445

0,510

0,30

0,524

0,526

0,527

0,528

0,529

0,530

0,530

0,530

0,531

0,531

0,531

0,531

0,532

0,532

0,532

0,533

0,533

0,534

0,534

0,535

0,536

0,537

0,538

0,539

0,540

0,542

0,543

0,546

0,549

0,553

0,559

0,569

0,584

0,617

0,727

0,25

0,674

0,677

0,679

0,679

0,681

0,683

0,683

0,683

0,684

0,684

0,684

0,685

0,685

0,686

0,686

0,687

0,688

0,688

0,689

0,690

0,691

0,692

0,694

0,695

0,697

0,700

0,703

0,706

0,711

0,718

0,727

0,741

0,765

0,816

1,000

0,20

0,842

0,845

0,848

0,849

0,851

0,854

0,854

0,855

0,855

0,856

0,856

0,857

0,858

0,858

0,859

0,860

0,861

0,862

0,863

0,865

0,866

0,868

0,870

0,873

0,876

0,879

0,883

0,889

0,896

0,906

0,920

0,941

0,978

1,061

1,376

0,15

1,036

1,041

1,045

1,047

1,050

1,055

1,055

1,056

1,057

1,058

1,058

1,059

1,060

1,061

1,063

1,064

1,066

1,067

1,069

1,071

1,074

1,076

1,079

1,083

1,088

1,093

1,100

1,108

1,119

1,134

1,156

1,190

1,250

1,386

1,963

0,10

1,282

1,289

1,296

1,299

1,303

1,310

1,311

1,313

1,314

1,315

1,316

1,318

1,319

1,321

1,323

1,325

1,328

1,330

1,333

1,337

1,341

1,345

1,350

1,356

1,363

1,372

1,383

1,397

1,415

1,440

1,476

1,533

1,638

1,886

3,078

0,08

1,405

1,414

1,423

1,426

1,432

1,441

1,442

1,443

1,445

1,446

1,448

1,450

1,452

1,454

1,457

1,459

1,462

1,466

1,469

1,474

1,478

1,484

1,490

1,498

1,507

1,518

1,532

1,549

1,572

1,603

1,649

1,723

1,859

2,189

3,895

0,06

1,555

1,566

1,577

1,582

1,589

1,600

1,602

1,604

1,606

1,608

1,610

1,612

1,615

1,618

1,621

1,624

1,628

1,632

1,637

1,642

1,649

1,656

1,664

1,674

1,686

1,700

1,718

1,740

1,770

1,812

1,873

1,971

2,156

2,620

5,242

0,05

1,645

1,658

1,671

1,676

1,684

1,697

1,699

1,701

1,703

1,706

1,708

1,711

1,714

1,717

1,721

1,725

1,729

1,734

1,740

1,746

1,753

1,761

1,771

1,782

1,796

1,812

1,833

1,860

1,895

1,943

2,015

2,132

2,353

2,920

6,314

0,04

1,751

1,766

1,781

1,787

1,796

1,812

1,814

1,817

1,819

1,822

1,825

1,828

1,832

1,835

1,840

1,844

1,850

1,855

1,862

1,869

1,878

1,887

1,899

1,912

1,928

1,948

1,973

2,004

2,046

2,104

2,191

2,333

2,605

3,320

7,916

0,03

1,881

1,899

1,917

1,924

1,936

1,955

1,957

1,960

1,963

1,967

1,970

1,974

1,978

1,983

1,988

1,994

2,000

2,007

2,015

2,024

2,034

2,046

2,060

2,076

2,096

2,120

2,150

2,189

2,241

2,313

2,422

2,601

2,951

3,896

10,579

0,025

1,960

1,980

2,000

2,009

2,021

2,042

2,045

2,048

2,052

2,056

2,060

2,064

2,069

2,074

2,080

2,086

2,093

2,101

2,110

2,120

2,131

2,145

2,160

2,179

2,201

2,228

2,262

2,306

2,365

2,447

2,571

2,776

3,182

4,303

12,706

0,01

2,326

2,358

2,390

2,403

2,423

2,457

2,462

2,467

2,473

2,479

2,485

2,492

2,500

2,508

2,518

2,528

2,539

2,552

2,567

2,583

2,602

2,624

2,650

2,681

2,718

2,764

2,821

2,896

2,998

3,143

3,365

3,747

4,541

6,965

31,821

0,005

2,576

2,617

2,660

2,678

2,704

2,750

2,756

2,763

2,771

2,779

2,787

2,797

2,807

2,819

2,831

2,845

2,861

2,878

2,898

2,921

2,947

2,977

3,012

3,055

3,106

3,169

3,250

3,355

3,499

3,707

4,032

4,604

5,841

9,925

63,656

0,0025

2,807

2,860

2,915

2,937

2,971

3,030

3,038

3,047

3,057

3,067

3,078

3,091

3,104

3,119

3,135

3,153

3,174

3,197

3,222

3,252

3,286

3,326

3,372

3,428

3,497

3,581

3,690

3,833

4,029

4,317

4,773

5,598

7,453

14,089

127,32

0,001

3,090

3,160

3,232

3,261

3,307

3,385

3,396

3,408

3,421

3,435

3,450

3,467

3,485

3,505

3,527

3,552

3,579

3,610

3,646

3,686

3,733

3,787

3,852

3,930

4,025

4,144

4,297

4,501

4,785

5,208

5,894

7,173

10,214

22,328

318,29

0,0005

3,291

3,373

3,460

3,496

3,551

3,646

3,660

3,674

3,689

3,707

3,725

3,745

3,768

3,792

3,819

3,850

3,883

3,922

3,965

4,015

4,073

4,140

4,221

4,318

4,437

4,587

4,781

5,041

5,408

5,959

6,869

8,610

12,924

31,600

636,58

Tabela 3
T de Student

cpa/gsa

160

8,53

4,79

6,85

6,64

120

100000

4,98

7,17

7,08

50

60

5,39

4,61

5,06

5,18

7,56

7,31

5,42

5,45

5,49

5,53

5,57

5,61

5,66

5,72

5,78

5,85

5,93

6,01

6,11

6,23

6,36

6,51

6,70

6,93

7,21

7,56

8,02

8,65

9,55

10,92

13,27

18,00

30,82

99,00

4999

30

7,64

7,60

28

29

7,72

7,68

26

27

7,82

7,77

24

25

7,95

7,88

22

23

8,10

8,02

20

21

8,29

8,18

18

19

8,40

16

17

8,86

8,68

14

15

9,33

9,07

9,65

12

10,04

10

11

13

11,26

10,56

12,25

13,75

21,20

16,26

98,50

34,12

4052

GL 1

40

GL 2

3,78

3,95

4,13

4,20

4,31

4,51

4,54

4,57

4,60

4,64

4,68

4,72

4,76

4,82

4,87

4,94

5,01

5,09

5,19

5,29

5,42

5,56

5,74

5,95

6,22

6,55

6,99

7,59

8,45

9,78

12,06

16,69

29,46

99,16

5404

3,32

3,48

3,65

3,72

3,83

4,02

4,04

4,07

4,11

4,14

4,18

4,22

4,26

4,31

4,37

4,43

4,50

4,58

4,67

4,77

4,89

5,04

5,21

5,41

5,67

5,99

6,42

7,01

7,85

9,15

11,39

15,98

28,71

99,25

5624

3,02

3,17

3,34

3,41

3,51

3,70

3,73

3,75

3,78

3,82

3,85

3,90

3,94

3,99

4,04

4,10

4,17

4,25

4,34

4,44

4,56

4,69

4,86

5,06

5,32

5,64

6,06

6,63

7,46

8,75

10,97

15,52

28,24

99,30

5764

2,80

2,96

3,12

3,19

3,29

3,47

3,50

3,53

3,56

3,59

3,63

3,67

3,71

3,76

3,81

3,87

3,94

4,01

4,10

4,20

4,32

4,46

4,62

4,82

5,07

5,39

5,80

6,37

7,19

8,47

10,67

15,21

27,91

99,33

5859

2,64

2,79

2,95

3,02

3,12

3,30

3,33

3,36

3,39

3,42

3,46

3,50

3,54

3,59

3,64

3,70

3,77

3,84

3,93

4,03

4,14

4,28

4,44

4,64

4,89

5,20

5,61

6,18

6,99

8,26

10,46

14,98

27,67

99,36

5928

2,51

2,66

2,82

2,89

2,99

3,17

3,20

3,23

3,26

3,29

3,32

3,36

3,41

3,45

3,51

3,56

3,63

3,71

3,79

3,89

4,00

4,14

4,30

4,50

4,74

5,06

5,47

6,03

6,84

8,10

10,29

14,80

27,49

99,38

5981

2,41

2,56

2,72

2,78

2,89

3,07

3,09

3,12

3,15

3,18

3,22

3,26

3,30

3,35

3,40

3,46

3,52

3,60

3,68

3,78

3,89

4,03

4,19

4,39

4,63

4,94

5,35

5,91

6,72

7,98

10,16

14,66

27,34

99,39

6022

10

2,32

2,47

2,63

2,70

2,80

2,98

3,00

3,03

3,06

3,09

3,13

3,17

3,21

3,26

3,31

3,37

3,43

3,51

3,59

3,69

3,80

3,94

4,10

4,30

4,54

4,85

5,26

5,81

6,62

7,87

10,05

14,55

27,23

99,40

6056

12

2,18

2,34

2,50

2,56

2,66

2,84

2,87

2,90

2,93

2,96

2,99

3,03

3,07

3,12

3,17

3,23

3,30

3,37

3,46

3,55

3,67

3,80

3,96

4,16

4,40

4,71

5,11

5,67

6,47

7,72

9,89

14,37

27,05

99,42

6107

14

2,08

2,23

2,39

2,46

2,56

2,74

2,77

2,79

2,82

2,86

2,89

2,93

2,97

3,02

3,07

3,13

3,19

3,27

3,35

3,45

3,56

3,70

3,86

4,05

4,29

4,60

5,01

5,56

6,36

7,60

9,77

14,25

26,92

99,43

6143

15

2,04

2,19

2,35

2,42

2,52

2,70

2,73

2,75

2,78

2,81

2,85

2,89

2,93

2,98

3,03

3,09

3,15

3,23

3,31

3,41

3,52

3,66

3,82

4,01

4,25

4,56

4,96

5,52

6,31

7,56

9,72

14,20

26,87

99,43

6157

16

2,00

2,15

2,31

2,38

2,48

2,66

2,69

2,72

2,75

2,78

2,81

2,85

2,89

2,94

2,99

3,05

3,12

3,19

3,27

3,37

3,49

3,62

3,78

3,97

4,21

4,52

4,92

5,48

6,28

7,52

9,68

14,15

26,83

99,44

6170

18

1,93

2,09

2,25

2,32

2,42

2,60

2,63

2,65

2,68

2,72

2,75

2,79

2,83

2,88

2,93

2,99

3,05

3,13

3,21

3,31

3,42

3,56

3,72

3,91

4,15

4,46

4,86

5,41

6,21

7,45

9,61

14,08

26,75

99,44

6191

20

1,88

2,03

2,20

2,27

2,37

2,55

2,57

2,60

2,63

2,66

2,70

2,74

2,78

2,83

2,88

2,94

3,00

3,08

3,16

3,26

3,37

3,51

3,66

3,86

4,10

4,41

4,81

5,36

6,16

7,40

9,55

14,02

26,69

99,45

6209

30

1,70

1,86

2,03

2,10

2,20

2,39

2,41

2,44

2,47

2,50

2,54

2,58

2,62

2,67

2,72

2,78

2,84

2,92

3,00

3,10

3,21

3,35

3,51

3,70

3,94

4,25

4,65

5,20

5,99

7,23

9,38

13,84

26,50

99,47

6260

40

1,59

1,76

1,94

2,01

2,11

2,30

2,33

2,35

2,38

2,42

2,45

2,49

2,54

2,58

2,64

2,69

2,76

2,84

2,92

3,02

3,13

3,27

3,43

3,62

3,86

4,17

4,57

5,12

5,91

7,14

9,29

13,75

26,41

99,48

6286

60

1,47

1,66

1,84

1,91

2,02

2,21

2,23

2,26

2,29

2,33

2,36

2,40

2,45

2,50

2,55

2,61

2,67

2,75

2,83

2,93

3,05

3,18

3,34

3,54

3,78

4,08

4,48

5,03

5,82

7,06

9,20

13,65

26,32

99,48

6313

120

1,32

1,53

1,73

1,80

1,92

2,11

2,14

2,17

2,20

2,23

2,27

2,31

2,35

2,40

2,46

2,52

2,58

2,66

2,75

2,84

2,96

3,09

3,25

3,45

3,69

4,00

4,40

4,95

5,74

6,97

9,11

13,56

26,22

99,49

6340

1,01

1,38

1,60

1,68

1,80

2,01

2,03

2,06

2,10

2,13

2,17

2,21

2,26

2,31

2,36

2,42

2,49

2,57

2,65

2,75

2,87

3,00

3,17

3,36

3,60

3,91

4,31

4,86

5,65

6,88

9,02

13,46

26,13

99,50

6366

1000000

a = 0,01

Tabela 4a
F de Fisher

cpa/gsa

161

5,69

5,66

5,63

5,61

5,59

5,57

5,42

5,34

5,29

5,15

5,02

25

26

27

28

29

30

40

50

60

120

100000

5,72

24

6,12

16

5,75

6,20

15

23

6,30

14

5,79

6,41

13

22

6,55

12

5,83

6,72

11

21

6,94

5,87

7,21

10

20

7,57

5,92

8,07

19

8,81

5,98

10,01

18

5,71

12,22

6,04

6,06

17,44

3,69

3,80

3,93

3,97

4,05

4,18

4,20

4,22

4,24

4,27

4,29

4,32

4,35

4,38

4,42

4,46

4,51

4,56

4,62

4,69

4,77

4,86

4,97

5,10

5,26

5,46

6,54

7,26

8,43

10,65

16,04

39,00

38,51

799,48

647,79

GL 1

17

GL 2

3,12

3,23

3,34

3,39

3,46

3,59

3,61

3,63

3,65

3,67

3,69

3,72

3,75

3,78

3,82

3,86

3,90

3,95

4,01

4,08

4,15

4,24

4,35

4,47

4,63

4,83

5,08

5,42

5,89

6,60

7,76

9,98

15,44

39,17

864,15

2,79

2,89

3,01

3,05

3,13

3,25

3,27

3,29

3,31

3,33

3,35

3,38

3,41

3,44

3,48

3,51

3,56

3,61

3,66

3,73

3,80

3,89

4,00

4,12

4,28

4,47

4,72

5,05

5,52

6,23

7,39

9,60

15,10

39,25

899,60

2,57

2,67

2,79

2,83

2,90

3,03

3,04

3,06

3,08

3,10

3,13

3,15

3,18

3,22

3,25

3,29

3,33

3,38

3,44

3,50

3,58

3,66

3,77

3,89

4,04

4,24

4,48

4,82

5,29

5,99

7,15

9,36

14,88

39,30

921,83

2,41

2,52

2,63

2,67

2,74

2,87

2,88

2,90

2,92

2,94

2,97

2,99

3,02

3,05

3,09

3,13

3,17

3,22

3,28

3,34

3,41

3,50

3,60

3,73

3,88

4,07

4,32

4,65

5,12

5,82

6,98

9,20

14,73

39,33

937,11

2,29

2,39

2,51

2,55

2,62

2,75

2,76

2,78

2,80

2,82

2,85

2,87

2,90

2,93

2,97

3,01

3,05

3,10

3,16

3,22

3,29

3,38

3,48

3,61

3,76

3,95

4,20

4,53

4,99

5,70

6,85

9,07

14,62

39,36

948,20

2,19

2,30

2,41

2,46

2,53

2,65

2,67

2,69

2,71

2,73

2,75

2,78

2,81

2,84

2,87

2,91

2,96

3,01

3,06

3,12

3,20

3,29

3,39

3,51

3,66

3,85

4,10

4,43

4,90

5,60

6,76

8,98

14,54

39,37

956,64

2,11

2,22

2,33

2,38

2,45

2,57

2,59

2,61

2,63

2,65

2,68

2,70

2,73

2,76

2,80

2,84

2,88

2,93

2,98

3,05

3,12

3,21

3,31

3,44

3,59

3,78

4,03

4,36

4,82

5,52

6,68

8,90

14,47

39,39

963,28

10

2,05

2,16

2,27

2,32

2,39

2,51

2,53

2,55

2,57

2,59

2,61

2,64

2,67

2,70

2,73

2,77

2,82

2,87

2,92

2,99

3,06

3,15

3,25

3,37

3,53

3,72

3,96

4,30

4,76

5,46

6,62

8,84

14,42

39,40

968,63

11

1,99

2,10

2,22

2,26

2,33

2,46

2,48

2,49

2,51

2,54

2,56

2,59

2,62

2,65

2,68

2,72

2,76

2,81

2,87

2,93

3,01

3,09

3,20

3,32

3,47

3,66

3,91

4,24

4,71

5,41

6,57

8,79

14,37

39,41

973,03

12

1,94

2,05

2,17

2,22

2,29

2,41

2,43

2,45

2,47

2,49

2,51

2,54

2,57

2,60

2,64

2,68

2,72

2,77

2,82

2,89

2,96

3,05

3,15

3,28

3,43

3,62

3,87

4,20

4,67

5,37

6,52

8,75

14,34

39,41

976,72

13

1,90

2,01

2,13

2,18

2,25

2,37

2,39

2,41

2,43

2,45

2,48

2,50

2,53

2,56

2,60

2,64

2,68

2,73

2,79

2,85

2,92

3,01

3,12

3,24

3,39

3,58

3,83

4,16

4,63

5,33

6,49

8,72

14,30

39,42

979,84

15

1,83

1,94

2,06

2,11

2,18

2,31

2,32

2,34

2,36

2,39

2,41

2,44

2,47

2,50

2,53

2,57

2,62

2,67

2,72

2,79

2,86

2,95

3,05

3,18

3,33

3,52

3,77

4,10

4,57

5,27

6,43

8,66

14,25

39,43

984,87

20

1,71

1,82

1,94

1,99

2,07

2,20

2,21

2,23

2,25

2,28

2,30

2,33

2,36

2,39

2,42

2,46

2,51

2,56

2,62

2,68

2,76

2,84

2,95

3,07

3,23

3,42

3,67

4,00

4,47

5,17

6,33

8,56

14,17

39,45

993,08

24
30
40
60
120

1000000

1,64

1,76

1,88

1,93

2,01

2,14

2,15

2,17

2,19

2,22

2,24

2,27

2,30

2,33

2,37

2,41

2,45

2,50

2,56

2,63

2,70

2,79

2,89

3,02

3,17

3,37

3,61

3,95

4,41

5,12

6,28

8,51

14,12

39,46

1,57

1,69

1,82

1,87

1,94

2,07

2,09

2,11

2,13

2,16

2,18

2,21

2,24

2,27

2,31

2,35

2,39

2,44

2,50

2,57

2,64

2,73

2,84

2,96

3,12

3,31

3,56

3,89

4,36

5,07

6,23

8,46

14,08

39,46

1,48

1,61

1,74

1,80

1,88

2,01

2,03

2,05

2,07

2,09

2,12

2,15

2,18

2,21

2,25

2,29

2,33

2,38

2,44

2,51

2,59

2,67

2,78

2,91

3,06

3,26

3,51

3,84

4,31

5,01

6,18

8,41

14,04

39,47

1,39

1,53

1,67

1,72

1,80

1,94

1,96

1,98

2,00

2,03

2,05

2,08

2,11

2,14

2,18

2,22

2,27

2,32

2,38

2,45

2,52

2,61

2,72

2,85

3,00

3,20

3,45

3,78

4,25

4,96

6,12

8,36

13,99

39,48

1,27

1,43

1,58

1,64

1,72

1,87

1,89

1,91

1,93

1,95

1,98

2,01

2,04

2,08

2,11

2,16

2,20

2,26

2,32

2,38

2,46

2,55

2,66

2,79

2,94

3,14

3,39

3,73

4,20

4,90

6,07

8,31

13,95

39,49

1,01

1,31

1,48

1,55

1,64

1,79

1,81

1,83

1,85

1,88

1,91

1,94

1,97

2,00

2,04

2,09

2,13

2,19

2,25

2,32

2,40

2,49

2,60

2,72

2,88

3,08

3,33

3,67

4,14

4,85

6,02

8,26

13,90

39,50

997,27 1001,40 1005,60 1009,79 1014,04 1018,26

a = 0,025

Tabela 4b
F de Fisher

cpa/gsa

162

4,49

4,30

3,44

3,47

3,49

3,52

3,55

3,59

3,63

3,68

3,74

3,81

3,89

3,98

4,10

4,26

4,46

4,74

5,14

5,79

6,94

9,55

19,00

199,50

3,05

3,07

3,10

3,13

3,16

3,20

3,24

3,29

3,34

3,41

3,49

3,59

3,71

3,86

4,07

4,35

4,76

5,41

6,59

9,28

19,16

215,71

2,82

2,84

2,87

2,90

2,93

2,96

3,01

3,06

3,11

3,18

3,26

3,36

3,48

3,63

3,84

4,12

4,53

5,19

6,39

9,12

19,25

224,58

2,66

2,68

2,71

2,74

2,77

2,81

2,85

2,90

2,96

3,03

3,11

3,20

3,33

3,48

3,69

3,97

4,39

5,05

6,26

9,01

19,30

230,16

2,55

2,57

2,60

2,63

2,66

2,70

2,74

2,79

2,85

2,92

3,00

3,09

3,22

3,37

3,58

3,87

4,28

4,95

6,16

8,94

19,33

233,99

2,46

2,49

2,51

2,54

2,58

2,61

2,66

2,71

2,76

2,83

2,91

3,01

3,14

3,29

3,50

3,79

4,21

4,88

6,09

8,89

19,35

236,77

2,40

2,42

2,45

2,48

2,51

2,55

2,59

2,64

2,70

2,77

2,85

2,95

3,07

3,23

3,44

3,73

4,15

4,82

6,04

8,85

19,37

238,88

2,34

2,37

2,39

2,42

2,46

2,49

2,54

2,59

2,65

2,71

2,80

2,90

3,02

3,18

3,39

3,68

4,10

4,77

6,00

8,81

19,38

240,54

10

2,30

2,32

2,35

2,38

2,41

2,45

2,49

2,54

2,60

2,67

2,75

2,85

2,98

3,14

3,35

3,64

4,06

4,74

5,96

8,79

19,40

241,88

11

2,26

2,28

2,31

2,34

2,37

2,41

2,46

2,51

2,57

2,63

2,72

2,82

2,94

3,10

3,31

3,60

4,03

4,70

5,94

8,76

19,40

242,98

12

2,23

2,25

2,28

2,31

2,34

2,38

2,42

2,48

2,53

2,60

2,69

2,79

2,91

3,07

3,28

3,57

4,00

4,68

5,91

8,74

19,41

243,90

13

2,20

2,22

2,25

2,28

2,31

2,35

2,40

2,45

2,51

2,58

2,66

2,76

2,89

3,05

3,26

3,55

3,98

4,66

5,89

8,73

19,42

244,69

15

2,15

2,18

2,20

2,23

2,27

2,31

2,35

2,40

2,46

2,53

2,62

2,72

2,85

3,01

3,22

3,51

3,94

4,62

5,86

8,70

19,43

245,95

20

2,07

2,10

2,12

2,16

2,19

2,23

2,28

2,33

2,39

2,46

2,54

2,65

2,77

2,94

3,15

3,44

3,87

4,56

5,80

8,66

19,45

248,02

24

2,03

2,05

2,08

2,11

2,15

2,19

2,24

2,29

2,35

2,42

2,51

2,61

2,74

2,90

3,12

3,41

3,84

4,53

5,77

8,64

19,45

249,05

30

1,98

2,01

2,04

2,07

2,11

2,15

2,19

2,25

2,31

2,38

2,47

2,57

2,70

2,86

3,08

3,38

3,81

4,50

5,75

8,62

19,46

250,10

40

1,94

1,96

1,99

2,03

2,06

2,10

2,15

2,20

2,27

2,34

2,43

2,53

2,66

2,83

3,04

3,34

3,77

4,46

5,72

8,59

19,47

251,14

60

1,89

1,92

1,95

1,98

2,02

2,06

2,11

2,16

2,22

2,30

2,38

2,49

2,62

2,79

3,01

3,30

3,74

4,43

5,69

8,57

19,48

252,20

120

1,84

1,87

1,90

1,93

1,97

2,01

2,06

2,11

2,18

2,25

2,34

2,45

2,58

2,75

2,97

3,27

3,70

4,40

5,66

8,55

19,49

253,25

1,78

1,81

1,84

1,88

1,92

1,96

2,01

2,07

2,13

2,21

2,30

2,40

2,54

2,71

2,93

3,23

3,67

4,37

5,63

8,53

19,50

254,32

1000000

3,39

3,84

100000

3,15

4,00

3,92

60

3,18

4,08

4,03

40

50

3,33

3,00

3,07

3,23

3,32

4,18

4,17

29

3,34

3,35

3,37

30

4,21

4,20

27

28

4,24

4,23

25

26

2,60

2,68

2,76

2,79

2,84

2,92

2,93

2,95

2,96

2,98

2,99

2,37

2,45

2,53

2,56

2,61

2,69

2,70

2,71

2,73

2,74

2,76

2,21

2,29

2,37

2,40

2,45

2,53

2,55

2,56

2,57

2,59

2,60

2,10

2,18

2,25

2,29

2,34

2,42

2,43

2,45

2,46

2,47

2,49

2,01

2,09

2,17

2,20

2,25

2,33

2,35

2,36

2,37

2,39

2,40

1,94

2,02

2,10

2,13

2,18

2,27

2,28

2,29

2,31

2,32

2,34

1,88

1,96

2,04

2,07

2,12

2,21

2,22

2,24

2,25

2,27

2,28

1,83

1,91

1,99

2,03

2,08

2,16

2,18

2,19

2,20

2,22

2,24

1,79

1,87

1,95

1,99

2,04

2,13

2,14

2,15

2,17

2,18

2,20

1,75

1,83

1,92

1,95

2,00

2,09

2,10

2,12

2,13

2,15

2,16

1,72

1,80

1,89

1,92

1,97

2,06

2,08

2,09

2,10

2,12

2,14

1,67

1,75

1,84

1,87

1,92

2,01

2,03

2,04

2,06

2,07

2,09

1,57

1,66

1,75

1,78

1,84

1,93

1,94

1,96

1,97

1,99

2,01

1,52

1,61

1,70

1,74

1,79

1,89

1,90

1,91

1,93

1,95

1,96

1,46

1,55

1,65

1,69

1,74

1,84

1,85

1,87

1,88

1,90

1,92

1,39

1,50

1,59

1,63

1,69

1,79

1,81

1,82

1,84

1,85

1,87

1,32

1,43

1,53

1,58

1,64

1,74

1,75

1,77

1,79

1,80

1,82

1,22

1,35

1,47

1,51

1,58

1,68

1,70

1,71

1,73

1,75

1,77

1,01

1,25

1,39

1,44

1,51

1,62

1,64

1,65

1,67

1,69

1,71

4,28
3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,32
2,27
2,24
2,20
2,18
2,13
2,05
2,01
1,96
1,91
1,86
1,81
1,76
24 4,25968 3,40283 3,00879 2,77629 2,62065 2,50819 2,42263 2,35508 2,30024 2,25474 2,21631 2,18338 2,15482 2,10768 2,02666 1,98376 1,93896 1,89196 1,84236 1,78964 1,73306

22

23

4,35

4,32

20

21

4,41

4,38

18

19

4,45

16

17

4,60

4,54

14

15

4,75

4,67

12

13

4,96

4,84

10

11

5,32

5,12

5,59

6,61

5,99

7,71

10,13

18,51

161,45

GL 1

120

GL 2

a = 0,05

Tabela 4c
F de Fisher

cpa/gsa

163

2,86

2,71

100000

2,39

2,79

2,75

60

2,41

2,84

2,81

40

50

2,50

2,30

2,35

2,44

2,49

2,89

2,88

29

2,50

2,51

2,52

2,53

2,54

2,55

2,56

2,57

2,59

2,61

2,62

2,64

2,67

2,70

2,73

2,76

2,81

3,26

30

2,90

2,89

27

28

2,92

2,91

25

26

2,94

2,93

23

24

2,96

2,95

21

22

2,99

2,97

19

20

3,03

3,01

17

3,07

3,05

15

16

18

3,14

3,10

13

14

3,23

3,18

11

3,01

2,92

3,36

3,29

10

12

3,11

3,59

3,46

3,78

3,46

4,06

3,78

4,32

5,46

9,00

49,50

5,54

4,54

8,53

39,86

GL 1

120

GL 2

2,08

2,13

2,18

2,20

2,23

2,28

2,28

2,29

2,30

2,31

2,32

2,33

2,34

2,35

2,36

2,38

2,40

2,42

2,44

2,46

2,49

2,52

2,56

2,61

2,66

2,73

2,81

2,92

3,07

3,29

3,62

4,19

5,39

9,16

53,59

1,94

1,99

2,04

2,06

2,09

2,14

2,15

2,16

2,17

2,17

2,18

2,19

2,21

2,22

2,23

2,25

2,27

2,29

2,31

2,33

2,36

2,39

2,43

2,48

2,54

2,61

2,69

2,81

2,96

3,18

3,52

4,11

5,34

9,24

55,83

1,85

1,90

1,95

1,97

2,00

2,05

2,06

2,06

2,07

2,08

2,09

2,10

2,11

2,13

2,14

2,16

2,18

2,20

2,22

2,24

2,27

2,31

2,35

2,39

2,45

2,52

2,61

2,73

2,88

3,11

3,45

4,05

5,31

9,29

57,24

1,77

1,82

1,87

1,90

1,93

1,98

1,99

2,00

2,00

2,01

2,02

2,04

2,05

2,06

2,08

2,09

2,11

2,13

2,15

2,18

2,21

2,24

2,28

2,33

2,39

2,46

2,55

2,67

2,83

3,05

3,40

4,01

5,28

9,33

58,20

1,72

1,77

1,82

1,84

1,87

1,93

1,93

1,94

1,95

1,96

1,97

1,98

1,99

2,01

2,02

2,04

2,06

2,08

2,10

2,13

2,16

2,19

2,23

2,28

2,34

2,41

2,51

2,62

2,78

3,01

3,37

3,98

5,27

9,35

58,91

1,67

1,72

1,77

1,80

1,83

1,88

1,89

1,90

1,91

1,92

1,93

1,94

1,95

1,97

1,98

2,00

2,02

2,04

2,06

2,09

2,12

2,15

2,20

2,24

2,30

2,38

2,47

2,59

2,75

2,98

3,34

3,95

5,25

9,37

59,44

1,63

1,68

1,74

1,76

1,79

1,85

1,86

1,87

1,87

1,88

1,89

1,91

1,92

1,93

1,95

1,96

1,98

2,00

2,03

2,06

2,09

2,12

2,16

2,21

2,27

2,35

2,44

2,56

2,72

2,96

3,32

3,94

5,24

9,38

59,86

10

1,60

1,65

1,71

1,73

1,76

1,82

1,83

1,84

1,85

1,86

1,87

1,88

1,89

1,90

1,92

1,94

1,96

1,98

2,00

2,03

2,06

2,10

2,14

2,19

2,25

2,32

2,42

2,54

2,70

2,94

3,30

3,92

5,23

9,39

60,19

11

1,57

1,63

1,68

1,70

1,74

1,79

1,80

1,81

1,82

1,83

1,84

1,85

1,87

1,88

1,90

1,91

1,93

1,95

1,98

2,01

2,04

2,07

2,12

2,17

2,23

2,30

2,40

2,52

2,68

2,92

3,28

3,91

5,22

9,40

60,47

12

1,55

1,60

1,66

1,68

1,71

1,77

1,78

1,79

1,80

1,81

1,82

1,83

1,84

1,86

1,87

1,89

1,91

1,93

1,96

1,99

2,02

2,05

2,10

2,15

2,21

2,28

2,38

2,50

2,67

2,90

3,27

3,90

5,22

9,41

60,71

13

1,52

1,58

1,64

1,66

1,70

1,75

1,76

1,77

1,78

1,79

1,80

1,81

1,83

1,84

1,86

1,87

1,89

1,92

1,94

1,97

2,00

2,04

2,08

2,13

2,19

2,27

2,36

2,49

2,65

2,89

3,26

3,89

5,21

9,41

60,90

15

1,49

1,55

1,60

1,63

1,66

1,72

1,73

1,74

1,75

1,76

1,77

1,78

1,80

1,81

1,83

1,84

1,86

1,89

1,91

1,94

1,97

2,01

2,05

2,10

2,17

2,24

2,34

2,46

2,63

2,87

3,24

3,87

5,20

9,42

61,22

20

1,42

1,48

1,54

1,57

1,61

1,67

1,68

1,69

1,70

1,71

1,72

1,73

1,74

1,76

1,78

1,79

1,81

1,84

1,86

1,89

1,92

1,96

2,01

2,06

2,12

2,20

2,30

2,42

2,59

2,84

3,21

3,84

5,18

9,44

61,74

24

1,38

1,45

1,51

1,54

1,57

1,64

1,65

1,66

1,67

1,68

1,69

1,70

1,72

1,73

1,75

1,77

1,79

1,81

1,84

1,87

1,90

1,94

1,98

2,04

2,10

2,18

2,28

2,40

2,58

2,82

3,19

3,83

5,18

9,45

62,00

30

1,34

1,41

1,48

1,50

1,54

1,61

1,62

1,63

1,64

1,65

1,66

1,67

1,69

1,70

1,72

1,74

1,76

1,78

1,81

1,84

1,87

1,91

1,96

2,01

2,08

2,16

2,25

2,38

2,56

2,80

3,17

3,82

5,17

9,46

62,26

40

1,30

1,37

1,44

1,46

1,51

1,57

1,58

1,59

1,60

1,61

1,63

1,64

1,66

1,67

1,69

1,71

1,73

1,75

1,78

1,81

1,85

1,89

1,93

1,99

2,05

2,13

2,23

2,36

2,54

2,78

3,16

3,80

5,16

9,47

62,53

60

1,24

1,32

1,40

1,42

1,47

1,54

1,55

1,56

1,57

1,58

1,59

1,61

1,62

1,64

1,66

1,68

1,70

1,72

1,75

1,78

1,82

1,86

1,90

1,96

2,03

2,11

2,21

2,34

2,51

2,76

3,14

3,79

5,15

9,47

62,79

120

1,17

1,26

1,35

1,38

1,42

1,50

1,51

1,52

1,53

1,54

1,56

1,57

1,59

1,60

1,62

1,64

1,67

1,69

1,72

1,75

1,79

1,83

1,88

1,93

2,00

2,08

2,18

2,32

2,49

2,74

3,12

3,78

5,14

9,48

63,06

1,01

1,19

1,29

1,33

1,38

1,46

1,47

1,48

1,49

1,50

1,52

1,53

1,55

1,57

1,59

1,61

1,63

1,66

1,69

1,72

1,76

1,80

1,85

1,90

1,97

2,06

2,16

2,29

2,47

2,72

3,11

3,76

5,13

9,49

63,33

1000000

a = 0,10

Tabela 4d
F de Fisher

cpa/gsa

Você também pode gostar