Escolar Documentos
Profissional Documentos
Cultura Documentos
INSTITUTO DE CIENCIAS
EXATAS
DEPARTAMENTO DE ESTATISTICA
Notas de aula
2010
cpa/gsa
Introduc
ao
A ideia para esse trabalho surgiu da vontade de se reunir em uma u
nica fonte, e em portugues, material
que atendesse `as ementas dos cursos basicos de estatstica e probabilidade ministrados pelo Departamento
de Estatstica do Instituto de Ciencias Exatas (ICEX) da UFMG para os ciclos basicos dos diversos cursos
de engenharia.
O conte
udo utilizou como fontes, notas de aula do curso de Introduc
ao `
a Estatstica ministrado pela
professora Rosangela Loschi e notas de aula do curso de Estatstica e Probabilidade ministrado pela professora Denise Duarte, alem da bibliografia basica apresentada no captulo 6.
Esperamos que sirva para despertar nos alunos que o utilizarem a consciencia da importancia dessas
ciencias (Estatstica e Probabilidade) para todas as areas do conhecimento humano, especialmente para
as ciencias exatas.
Os Autores
Belo Horizonte, agosto de 2010
Sum
ario
1 Introdu
c
ao `
a An
alise de Dados
1.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Organizacao de dados . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Tipos de dados . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Construcao de tabelas . . . . . . . . . . . . . . . . . . .
1.2.3 Representacao grafica . . . . . . . . . . . . . . . . . . .
1.3 Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Medidas de posicao . . . . . . . . . . . . . . . . . . . . .
1.3.2 Medidas de variabilidade . . . . . . . . . . . . . . . . .
1.3.3 Propriedades da media, mediana e variancias amostrais
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
8
8
8
13
16
16
20
23
23
2 Probabilidade
2.1 Experimentos aleatorios, espaco amostral e eventos
2.1.1 Operacoes com eventos . . . . . . . . . . .
2.1.2 Operacoes com mais de dois eventos . . . .
2.2 Definicao de probabilidade . . . . . . . . . . . . . .
2.2.1 Definicao frequentista de probabilidade . .
2.2.2 Axiomas de probabilidade . . . . . . . . . .
2.2.3 Regras de adicao . . . . . . . . . . . . . . .
2.2.4 Definicao classica de probabilidade . . . . .
2.3 Probabilidade Condicional . . . . . . . . . . . . . .
2.4 Regras da multiplicacao e probabilidade total . . .
2.4.1 Regra da multiplicacao . . . . . . . . . . . .
2.4.2 Regra da probabilidade total . . . . . . . .
2.5 Teorema de Bayes . . . . . . . . . . . . . . . . . .
2.5.1 Independencia . . . . . . . . . . . . . . . .
2.5.2 Teorema de Bayes . . . . . . . . . . . . . .
2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
26
26
27
29
32
32
33
34
34
35
37
37
37
39
39
41
43
3 Vari
aveis Aleat
orias Discretas
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Variaveis aleatorias discretas . . . . . . . . . . . . . . . .
3.3 Distribuicoes de probabilidades e funcoes de probabilidade
3.4 Funcoes de distribuicao acumuladas . . . . . . . . . . . .
3.5 Media e variancia de uma variavel aleatoria discreta . . .
3.6 Distribuicoes discretas mais comuns . . . . . . . . . . . .
3.6.1 Distribuicao uniforme discreta . . . . . . . . . . .
3.6.2 Distribuicao de Bernoulli . . . . . . . . . . . . . .
3.6.3 Distribuicao binomial . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
48
48
50
51
54
54
56
56
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SUMARIO
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
60
63
65
68
70
4 Vari
aveis Aleat
orias Contnuas
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Probabilidade: distribuicoes e funcao de densidade . . . . . . . . . . . . .
4.3 Funcao de distribuicao acumulada . . . . . . . . . . . . . . . . . . . . . .
4.4 Media e variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Distribuicao uniforme contnua . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Distribuicao normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Calculo de probabilidade . . . . . . . . . . . . . . . . . . . . . . .
4.6.2 Aproximacoes das distribuicoes binomial e de Poisson pela normal
4.7 Distribuicao exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Distribuicoes de Erlang e Gamma . . . . . . . . . . . . . . . . . . . . . . .
4.8.1 Distribuicao de Erlang . . . . . . . . . . . . . . . . . . . . . . . . .
4.8.2 Distribuicao Gamma . . . . . . . . . . . . . . . . . . . . . . . . . .
4.9 Distribuicao de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.10 Distribuicao Lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.11 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
73
76
77
80
82
84
88
91
94
94
94
95
96
97
5 Infer
encia
5.1 Inferencia estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Amostragem aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Estimacao de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1.1 Propriedades de estimadores . . . . . . . . . . . . . . . . . . . . . .
5.3.1.2 Desvio Padrao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1.3 Erro Quadratico Medio . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 Metodos de estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2.1 Metodo dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2.2 Metodo de Maxima Verossimilhanca . . . . . . . . . . . . . . . . . .
5.3.3 Distribuicoes amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.1 Distribuicao da media amostral - caso normal . . . . . . . . . . . .
5.3.3.2 Distribuicao da diferenca de medias . . . . . . . . . . . . . . . . . .
5.3.3.3 Distribuicao Quiquadrado . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.4 Distribuicao t de Student . . . . . . . . . . . . . . . . . . . . . . . .
5.3.3.5 Distribuicao F de Fisher . . . . . . . . . . . . . . . . . . . . . . . .
5.3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.5 Estimacao por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.5.1 Intervalo de confianca para a media de uma distribuicao normal . .
5.3.5.2 Intervalo de confianca para o parametro p da distribuicao binomial .
5.3.5.3 Intervalo de confianca para diferenca de duas medias - Caso normal
5.3.5.4 Intervalo de confianca para variancia de uma distribuicao normal . .
5.3.5.5 Intervalo de confianca para razao de variancias - Caso normal . . .
5.3.5.6 Intervalo de confianca para a media - distribuicao nao normal . . .
5.4 Teste de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.2 Teste sobre media - caso normal . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.2.1 Variancia conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
99
99
101
101
102
105
105
105
105
106
110
110
111
112
114
115
116
118
119
123
124
127
128
129
131
131
135
135
3.7
cpa/gsa
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SUMARIO
cpa/gsa
5.5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
139
141
141
143
145
145
146
148
149
150
6 Bibliografia
154
7 Ap
endice
156
Captulo 1
Introduc
ao `
a An
alise de Dados
1.1
Conceitos
Estatstica: e uma ciencia que desenvolve metodologias para coletar, descrever, organizar, analisar e
uma ferramenta poderosa para tomada de decisao, resolucao de problemas, planejainterpretar dados. E
mento de produtos e processos, com in
umeras aplicacoes. Daremos aqui um maior enfoque `as aplicacoes
na engenharia.
Nessas notas abordaremos as seguintes areas:
1. Estatstica Descritiva: e utilizada na etapa inicial da analise para que possamos nos familiarizar
com os dados, e tirarmos conclusoes informais e diretas sobre a populacao com base nos dados
observados. Utilizamos as seguintes tecnicas (para resumir os dados):
graficos
tabelas
medidas
2. Probabilidade: Tecnicas que permitem medir incertezas sobre fenomenos aleatorios. Construmos
modelos probabilsticos para descrever o comportamento de objetos aleatorios.
3. Inferencia Estatstica: Tecnicas que permitem extrapolar para a populacao, conclusoes obtidas de
subconjuntos ou amostras desta populacao. As principais tecnicas usadas sao
Estimacao pontual
Intervalos de confianca
Testes de hipoteses
o conjunto de todos os elementos a serem estudados. Sao exemplos:
Populacao: E
1. a populacao brasileira.
2. a totalidade dos carros produzidos no Brasil.
3. uma jazida de minerio de ferro de determinada mina.
4. o sangue no corpo de uma pessoa.
1.1. CONCEITOS
cpa/gsa
Populao
Modelos Probabilsticos
Tcnicas de Inferncia
DE DADOS
1.2. ORGANIZAC
AO
1.2
cpa/gsa
Organizac
ao de dados
Veremos nesta secao como podemos classificar dados e alguns recursos para simplificar sua apresentacao e organizacao.
1.2.1
Tipos de dados
1.2.2
Constru
c
ao de tabelas
O conjunto de informacoes disponveis apos tabulacao de questionario ou pesquisa de campo e denominado tabela de dados brutos. Nela sao listados individualmente cada elemento da populacao ou amostra,
com os valores de todas as variaveis estudadas.
Veja no exemplo da proxima pagina uma pesquisa realizada com alunos de duas turmas de determinada
escola (a ttulo de exerccio, classifique cada variavel desta tabela por tipo e subtipo, conforme visto na
subsecao 1.2.1).
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
Toler
P
M
P
P
M
M
P
I
M
M
I
M
M
I
I
P
P
P
P
M
P
M
I
I
P
I
M
P
P
M
P
P
M
M
M
P
P
I
P
M
I
M
I
P
M
M
M
P
P
P
Exer
0
0
5
5
2
2
3
2
3
2
10
0
6
5
4
0
3
3
3
7
8
0
5
0
8
6
8
1
3
1
2
1
2
4
7
5
10
6
5
4
5
2
7
5
0
0
4
2
7
7
Cine OpCine
1
B
1
B
2
M
2
B
2
B
1
B
1
B
2
M
3
M
2
M
2
B
2
B
1
M
1
M
1
B
1
B
1
B
4
B
2
B
2
B
2
B
3
B
4
B
1
M
5
M
2
B
2
M
1
M
1
B
2
M
2
M
1
B
1
B
2
B
1
B
1
M
2
M
4
B
2
B
1
B
4
B
2
B
0
M
1
B
1
M
1
B
3
B
1
B
0
M
0
M
TV
16
7
15
20
5
2
7
10
12
10
8
0
30
2
10
18
10
10
5
14
5
5
10
28
4
5
5
10
12
2
6
20
14
10
25
14
12
10
12
2
10
25
14
8
10
8
3
5
14
20
OpTV
R
R
R
R
R
R
R
R
R
R
N
R
R
N
R
R
N
R
R
M
R
R
R
R
N
R
R
R
R
R
N
R
R
R
B
R
N
R
R
R
B
R
N
R
R
R
R
R
R
B
Apesar de conter muita informacao, a tabela de dados brutos nao e pratica para respondermos rapidamente a questoes de interesse. Assim, a partir da tabela de dados brutos normalmente construmos
uma nova tabela denominada tabela de de frequencia.
A tabela de frequencia mais simples e aquela que lista os valores observados para determinada variavel,
e o n
umero de ocorrencias (ou frequencia absoluta) de cada um destes valores.
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
freq. obs
n1
n2
...
...
nr
n
Denota-se por ni o n
umero de vezes que a resposta Xi apareceu na amostra de tamanho N (frequencia
absoluta).
Utilizando os dados da pesquisa apresentada na tabela da pagina anterior, temos por exemplo para
as variaveis Turma e Sexo:
Turma
A
B
Total
freq. obs
26
24
50
Sexo
M
F
Total
freq. obs
13
37
50
Para comparacao com outros grupos ou conjuntos de dados e conveniente acrescentarmos uma coluna
ni
de frequencia relativa definida por fi =
(frequencia observada dividida pelo total de observacoes).
n
Temos assim os percentuais em cada classe. Alem disso pode ser interessante a inclusao da frequencia
acumulada: para dados ordenados a frequencia acumulada ate a classe Xi e a soma de todas as frequencias
observadas ate ela inclusive. Da mesma forma, a frequencia relativa acumulada ate a classe Xi e a soma
de todas as frequencias relativas ate a da classe i. A tabela completa para a variavel idade da pesquisa e
apresentada a seguir:
Tabela 1.1: Frequencia da variavel idade
Idade
17
18
19
20
21
22
23
24
25
Total
freq. obs
9
22
7
4
3
0
2
1
2
50
freq. acum.
9
31
38
42
45
45
47
48
50
freq. relat.
0,18
0,44
0,14
0,08
0,06
0
0,04
0,02
0,04
1
Para representarmos variaveis contnuas, como elas podem assumir qualquer valor real em um certo
intervalo, ficaria inviavel criarmos tabelas de frequencia como as anteriores. Se tomarmos a variavel peso,
mesmo com o arredondamento de uma casa decimal apresentado na tabela, teramos quase o mesmo
n
umero de itens da tabela de dados brutos. Assim a alternativa e criarmos classes ou faixas de valores.
Para tanto siga o seguinte roteiro:
1. Ordene os valores do menor para o maior e identifique o maximo e o mnimo observado.
2. Calcule a amplitude total fazendo AT = max min.
10
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
AT
3. Escolha o n
umero k de classes e defina h =
. Normalmente sao usadas entre 5 e 8 classes.
k
A literatura universal usa o valor k como o inteiro mais proxuimo do valor dado pela formula de
Sturges (k = 1 + 3,3log n), mas esse e apenas um valor referencial. Nao entraremos em mais
detalhes sobre a escolha do n
umero de classes. O leitor interessado nesse assunto pode consultar,
por exemplo [1] e referencias contidas naquele trabalho. O valor h sera chamado de amplitude de
classe.
4. Calcule as frequencias absolutas contando o n
umero de observacoes em cada classe, chame este
valor de ni , i = 1, . . . k.
5. Calcule entao:
ni
n
Pi
(b) frequencias acumuladas - f aci = j=1 nj
Pi
(c) frequencias relativas acumuladas - Fi = j=1 fj
(a) frequencias relativas - fi =
Exemplo:
Represente atraves de uma tabela de frequencia a variavel peso da pesquisa apresentada na tabela da
pagina 9.
Solucao:
1. Apos ordenacao vemos max = 95 kg e min = 44 kg.
2. AT = 95 44 = 51kg
3. O n
umero de observacoes e n = 50. De acordo com a formula de Sturges, k = 1+3,3log(50) = 6,61.
51
Usaremos entao 7 classes. Com k = 7, o valor de h sera dado por h =
= 7,28.... Usaremos
7
h = 7,3.
4.
5. Montamos a tabela, usando a convencao de classes abertas `a esquerda e fechadas `a direita:
Tabela 1.2: Distribuicao de frequencia variavel peso
Peso
44a 51,3
51,3a 58,6
58,6a 65,9
65,9a 73,2
73,2a 80,5
80,5a 87,8
87,8a 95,1
Total
ni
10
19
7
7
1
5
1
50
f aci
10
29
36
43
44
49
100
fi
0,20
0,38
0,14
0,14
0,02
0,10
0,02
1
Fi
0,20
0,58
0,72
0,86
0,88
0,98
1,00
Eventualmente mesmo dados discretos podem ser agrupados para serem representados em tabelas de
distribui
c
ao de frequ
encia.
11
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
Outra representacao interessante e o chamado Diagrama de ramo e folhas, indicado para variaveis
que possuam valores com pelo menos dois dgitos. Para construir o diagrama de ramo e folhas, dividimos
cada valor da variavel em estudo em duas partes: um ramo, consistindo em um ou mais dgitos iniciais,
e uma folha, com os dgitos restantes.
O exemplo de um diagrama de ramo e folhas para as alturas dos alunos dza pesquisa:
Tabela 1.3: Diagrama Ramo e Folhas variavel altura
Ramo
14
15
16
17
18
Folha
5
8754
0904
6208
5520
7
2
0
5
5
4
1
0
5
6530859225157080
3003060
3
Frequencia
1
7
22
13
7
Folha
5
4
8757
0042
9658
2001
686
2003
555
5
4
5
3
5
3022100
95578
00300
12
Frequencia
1
1
6
12
10
10
3
4
3
DE DADOS
1.2. ORGANIZAC
AO
1.2.3
cpa/gsa
Representa
c
ao gr
afica
A representacao dos dados em forma grafica e importante ferramenta de analise e apresentacao de resultados em qualquer analise estatstica. Apresentamos a seguir alguns tipos principais de representacao
grafica.
Diagrama circular, disco ou pizza - Tipo de grafico muito utilizado para representacao de variaveis
qualitativas. Como exemplo veja a variavel OpTV da tabela da pagina 9:
M
2%
B
6%
N
14%
R
78%
Frequncia
20
15
10
0
17
18
19
20
21
22
23
24
Idade
13
25
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
Histograma - A representacao grafica das tabelas de distribuicao de frequencia e chamada Histograma. Represente no eixo das abcissas a escala de medidas, desenhando os limites das classes. No eixo
vertical represente a frequencia absoluta (ou relativa) de cada classe. O histograma da tabela 1.2 (peso)
e:
20
Frequncia
15
10
0
44
51,3
58,6
65,9
Peso
73,2
80,5
87,8
95,1
Durante a passagem dos dados da tabela de dados brutos ou do diagrama de ramos e folhas para a
tabela distribuicao de frequencia ou para histogramas, perde-se alguma informacao sobre nossos dados,
mas esta perda e plenamente compensada pelos ganhos de concisao e facilidade de interpretacao.
Polgono de frequ
encia - Este grafico e obtido unindo-se com segmentos de reta os pontos medios
da parte superior de cada barra no histograma. Os pontos medios da parte superior das barras da
primeira e u
ltima classes devem ser ligados respectivamentes ao pontos de coordenadas (LI1 h/2, 0) e
(LSk + h/2, 0), onde LI1 e o limite inferior da primeira classe, LSk o limite superior da u
ltima classe e
h a amplitude da classe.
Frequncia
20
15
10
44
Peso
Figura 1.5: Polgono de frequencia - Peso
14
DE DADOS
1.2. ORGANIZAC
AO
cpa/gsa
Gr
afico de frequ
encia acumulada - Uma variacao do Histograma e o grafico de frequencia acumulada. Neste grafico a altura de cada barra e o n
umero total de observacoes que e menor que o limite
superior de cada classe. O grafico de frequencia acumulada para mesma variavel (peso) da pesquisa fica
entao:
Frequncia acumulada
50
40
30
20
10
0
44
51,3
58,6
65,9
73,2
80,5
87,8
95,1
Peso
Ogiva - Um outro grafico, chamado de ogiva, e construdo a partir do grafico de frequencia acumulada, e definido pela poligonal formada por segmentos de reta unindo o ponto inicial inferior da primeira
barra e os pontos finais de cada classe. O nome dessse grafico advem da sua aparencia, conforme pode-se
verificar na figura abaixo:
Frequncia acumulada
50
40
30
20
10
0
44
51,3
58,6
65,9
73,2
80,5
Peso
15
87,8
95,1
1.3. MEDIDAS
1.3
cpa/gsa
Medidas
1.3.1
Medidas de posic
ao
10
freq. absoluta
n1
n2
...
...
nr
= n1 X1 + n2 X2 + + nr Xr =
X
n
16
Pr
ni Xi
.
n
i=1
1.3. MEDIDAS
cpa/gsa
X
= n1 X1 + n2 X2 + + nr Xr = f r1 X1 + f r2 X2 + + f rr Xr =
X
fi Xi .
n
n
n
i=1
Exemplo: Para calcularmos a media dos dados abaixo:
X
1
2
3
5
freq. absoluta
3
4
2
1
freq. relativa
0,3
0,4
0,2
0,1
Dados agrupados em classe: Para calcularmos a media nestes casos devemos inicialmente calcular
o ponto medio de cada classe, denotando-o por P Mi . A partir disto calculamos a media usando a
frequencia absoluta ou a frequencia relativa com uma das seguintes expressoes:
=
X
Pn
i=1
P Mi ni
n
=
X
n
X
P Mi fi
i=1
Vamos calcular o peso medio dos alunos de nosso exemplo a partir da tabela de distribuicao de
frequencias (tabela 1.2), incluindo o ponto medio de cada classe;
Tabela 1.5: Peso - inclusao ponto medio da classe
Peso
44,0a 51,3
51,3a 58,6
58,6a 65,9
65,9a 73,2
73,2a 80,5
80,5a 87,8
87,8a 95,1
Total
P Mi
47,65
54,95
62,25
69,55
76,85
84,15
91,45
50
freq. abs.
10
19
7
7
1
5
1
1
freq. rel.
0,20
0,38
0,14
0,14
0,02
0,10
0,02
freq. acum.
0,20
0,58
0,72
0,86
0,88
0,98
1,00
Assim:
= 47,65 10 + 54,95 19 + 62,25 7 + 69,55 7 + 76,85 1 + 84,15 5 + 91,45 1 = 3032,2 = 60,64
X
50
50
ou:
= 47,650,20+54,950,38+62,250,14+69,550,14+76,850,02+84,150,10+91,450,02 = 60,64
X
17
1.3. MEDIDAS
cpa/gsa
Observacoes: a media e uma medida afetada por valores extremos. Veja no exemplo inicial em que a
media dos dados e 2,2, se retirarmos o valor 5 a media cai para 1,89.
Se pensarmos em calcular o valor medio de uma variavel para toda a populacao, teremos a media
populacional, normalmente designada pela letra grega (mi).
Mediana: e o valor que divide o conjunto de dados ao meio, de tal forma que pelo menos 50% dos valores observados sao menores ou iguais `a mediana e pelo menos 50% sao maiores ou iguais a ela. Notacao:
md ou M d. A mediana tambem caracteriza o elemento comum da amostra.
Exemplo: {1, 1, 1, 3, 3, 5, 3, 3, 2, 2}. Primeiro passo e ordenar os dados:
1
3 3
Os dois candidatos a md sao o 2 e o 3. entao tomamos o ponto medio entre eles como a mediana:
md = 2+3
2 = 2,5.
Se tivessemos:
1
4 4
Nesse caso, md = 3
Observacao: Sempre que houver um n
umero mpar de observacoes a mediana sera a observacao central na amostra ordenada da menor para a maior, e sempre que houver um n
umero par de observacoes a
mediana sera o ponto medio entre as duas observacoes centrais.
Dados agrupados em classe: Nesse caso os dados ja estao ordenados e os procedimentos sao:
1. Localize a classe mediana, que sera a primeira classe com frequencia relativa acumulada maior ou
igual a 0,5. Observe:
L - limite superior da classe mediana
l - limite inferior da classe mediana
2. Calcule a frequencia relativa da classe mediana. Chame-a de fmd
3. Determine a frequencia relativa acumulada ate a classe anterior `a classe mediana, ou famd
4. Calcule a diferenca 0,5 famd . Esta diferenca e a frequencia relativa da classe (l ` md)
50%
md
md = l + (L l)
18
0,5 famd
fmd
1.3. MEDIDAS
cpa/gsa
Assim para calcularmos a mediana dos pesos na tabela 1.5, seguimos o passo a passo:
1. Classe mediana: 51,3 a 58,6
L = 58,6
l = 51,3
2. fmd = 0,38
3. famd = 0,20
4. 0,5 famd = 0,30
5. md = 51,3 + (58,6 51,3)
30
(0,5 0,20)
= 51,3 + 7,3
= 57,06 kg
0,38
38
75%
Q1
50%
50%
Q2
75%
25%
Q3
25%
25%
Q1
25%
Q2
25%
Q3
De forma similar ao calculo da mediana, para obtermos o percentil P a partir de uma tabela de
frequencia, seguimos os passos descritos abaixo:
1. Localizar a classe a qual pertence o percentil P .
2. Encontrar a frequencia relativa da classe onde esta P . Denote-a por fP .
3. Encontrar a frequencia acumulada ate a classe anterior `a classe do percentil P . Denote-a por faP .
4. Calcular a diferenca faP .
5. Fazendo a regra de tres:
L l
P l
fP
faP
P = l + (L l )
19
faP
f P
1.3. MEDIDAS
cpa/gsa
Exemplo:
Calcule o terceiro quartil da variavel peso da pesquisa, a partir da tabela 1.5.
Solucao:
1. Classe 65,9a 73,2
2. fP = 0,14
3. faP = 0,72
4. faP = 0,75 0,72 = 0,03
5. Q3 = P75 = 65,9 + 7,3
0,03
= 67,46 kg
0,14
Maximo + Mnimo
2
Esta medida e menos usada, mas serve para ilustrar mais uma das diversas maneiras de se representar a
tendencia central de uma amostra.
1.3.2
Medidas de variabilidade
20
1.3. MEDIDAS
cpa/gsa
Variancia amostral (S 2 ): A variancia e uma medida de dispersao que leva em conta todas as observacoes feitas. Ela mede a dispersao em torno da media amostral x
.
Considere as observacoes: X1 , X2 , X3 , . . . , Xn :
Observacao
desvios
|desvios|
(desvios)2
X1
X2
...
...
Xn
(X1 X)
(X2 X)
...
...
(Xn X)
|X1 X|
|X2 X|
...
...
|Xn X|
2
(X1 X)
2
(X2 X)
...
...
2
(Xn X)
Temos:
Pn
n
n
n
n
n
n
n
X
X
X
X
X
X
X
Xi
=
=
=
(Xi X)
=
Xi
X
X i nX
Xi n i=1
Xi
Xi = 0
n
i=1
i=1
i=1
i=1
i=1
i=1
i=1
Assim define-se a variancia amostral como:
Pn
S2 =
2
X)
(n 1)
i=1 (Xi
S12 =
conj. 2 = {3, 5, 5, 7}
Variancia populacional = =
i=1 (Xi
)2
i=1 (Xi X)
,
S = S2 =
(n 1)
que mostra a variabilidade medida na unidade original da variavel analisada.
21
1.3. MEDIDAS
cpa/gsa
(coef. variacao amostral= desvio padrao amostral dividido pela media amostral)
CVa =
media
1,70 m
60 kg
variancia
0,0025 m2
2,25 kg 2
0,0025
= 2,9%
1,70
CVp =
2,25
= 2,5%
60
Dados agrupados em classes Para calcular a variancia de dados agrupados em classes, considere
o ponto medio de cada classe, denotado por P Mi e faca;
Pk
2 ni
(P Mi X)
2
S = i=1
,
(n 1)
onde ni e a frequencia observada para a i-esima classe e k o n
umero de classes.
Se conhecemos apenas as frequencias relativas das classe, a variancia amostral poderia ser aproximada
por:
k
X
ni
2 fi
S2 =
(P Mi X)
fi =
e a frequencia relativa da classe i .
n
i=1
Exemplo: Determine a variabilidade em torno da media para o peso dos alunos da tabela da pagina
9, lembrando que ja calculamos o peso medio (60,64 kg):
Tabela 1.6: Peso - Calculo da variancia
P Mi
47,65
54,95
62,25
69,55
76,85
84,15
91,45
Total
freq. rel.
0,20
0,38
0,14
0,14
0,02
0,10
0,02
2
(P Mi X)
2
(47,65 60,64) = 168,740
(54,95 60,64)2 = 032,376
(62,25 60,64)2 = 002,592
(69,55 60,64)2 = 079,388
(76,85 60,64)2 = 262,764
(84,15 60,64)2 = 552,720
(91,45 60,64)2 = 949,256
2 fi
(P Mi X)
33,748
12,303
0,363
11,114
5,255
55,272
18,985
137,041
22
1.4. EXERCICIOS
cpa/gsa
|Xi X|
DM = i=1
para dados nao agrupados,
n
DM =
n
X
i
(P Mi X)f
i=1
1.3.3
Propriedades da m
edia, mediana e vari
ancias amostrais
S 2 e medx representam
Considere a amostra X1 , X2 , . . . , Xn . Nas secoes anteriores, vimos que X,
X
respectivamente a media amostral, variancia amostral e mediana amostral; e definimos a formula de
calculo de cada uma dessas medidas.
Suponha agora que tenhamos de utilizar alguma relacao linear das observacoes dessa amostra. Como
exemplo, imagine que X seja o comprimento de parafusos e que o peso em gramas desses parafusos possa
ser calculado por Y = aX + b, onde a e b sao duas constantes qualquer. Pode-se provar que:
+b
Y = aX
medy = a medx + b
2
SY2 = a2 SX
1.4
Exerccios
Usando a tabela da pagina 25, com dados de 49 alunos de uma turma de engenharia civil do ICEX,
responda as questoes a seguir:
1. Defina o tipo e subtipo de cada uma das 8 variaveis da tabela.
2. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumulada para a variavel idade.
3. Construa uma tabela com a frequencia observada, frequencia relativa e frequencia relativa acumulada para a variavel peso. (Calcule o n
umero de classes pela formula de Sturges).
4. Construa um diagrama de Ramo e Folhas para a variavel altura. Utilize inicialmente 5 ramos e
depois, para melhor visualizacao, construa outro diagrama a partir do primeiro com 10 ramos.
5. Esboce um diagrama circular (ou pizza) para a variavel provedor.
6. Faca um grafico de barras com a variavel ano de incio do curso.
23
1.4. EXERCICIOS
cpa/gsa
7. Com auxlio da tabela do exerccio 3, esboce um histograma com a frequencia relativa da vari
avel
peso.
8. Calcule usando os dados brutos a media da variavel idade.
9. Usando a tabela construda no exerccio 3 encontre a media da variavel peso.
10. Usando o histograma abaixo, ache a mediana e o terceiro quartil (percentil 75%) da variavel altura.
Histograma da altura
30
0,306
0,265
Frequncia
25
20
15
0,122
10
0,102
0,082
0,082
5
0,041
0
1,55
1,61
1,67
1,73
1,79
Altura
1,85
1,91
1,97
24
1.4. EXERCICIOS
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
cpa/gsa
19
19
19
19
20
20
20
20
20
20
20
20
20
20
20
20
21
21
21
21
21
21
21
21
21
21
21
21
22
22
22
22
23
23
23
23
23
24
24
25
25
25
25
25
25
26
26
27
29
Peso
70
73
75
85
43
51
59
61
65
71
71
73
76
77
90
99
58
59
64
64
64
68
70
73
75
77
77
82
63
68
75
100
64
65
72
80
80
57
75
57
70
70
75
80
87
48
95
65
67
Altura
1,83
1,83
1,71
1,83
1,59
1,69
1,70
1,65
1,72
1,72
1,76
1,75
1,71
1,95
1,80
1,70
1,72
1,64
1,60
1,71
1,74
1,75
1,70
1,75
1,85
1,72
1,85
1,85
1,73
1,85
1,81
1,91
1,64
1,71
1,73
1,75
1,78
1,58
1,75
1,69
1,70
1,72
1,74
1,79
1,76
1,62
1,77
1,65
1,57
Naturalidade
Estado
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Ipatinga
Belo Horizonte
Belo Horizonte
Varginha
Belo Horizonte
Belo Horizonte
Bom Despacho
Viosa
Belo Horizonte
Belo Horizonte
Patrocnio
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Salvador
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Formiga
Belo Horizonte
Itana
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Jaguarau
Montes Claros
Belo Horizonte
Santa Brbara
Sete Lagoas
Itabira
Belo Horizonte
Belo Horizonte
Sete Lagoas
Belo Horizonte
Belo Horizonte
Belo Horizonte
Belo Horizonte
Santa Maria
Belo Horizonte
Timteo
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
BA
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
MG
RS
MG
MG
25
Bairro
Funcionrios
Prado
Anchieta
Nova Cachoeirinha
Betnia
Funcionrios
Serra
Ouro Preto
Liberdade
Santa Tereza
Corao Eucarstico
Prado
Sion
Santo Antnio
Nova Floresta
Ouro Preto
Dona Clara
Floresta
Barreiro
Serra
Jardim Amrica
Ouro Preto
Savassi
Buritis
Ferno Dias
Belvedere
Lourdes
Carlos Prates
Lourdes
Padre Eustquio
Luxemburgo
Caiara
Planalto
Nova Floresta
Floresta
So Joo Batista
Santa Ins
Liberdade
Santo Antnio
Dona Clara
Corao Eucarstico
Ouro Preto
Estoril
Padre Eustquio
Cento
Santo Andr
Sobradinho
Santa Cruz
Castelo
Provedor de internet
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
gmail.com
hotmail.com
gmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br
yahoo.com.br
hotmail.com
hotmail.com
gmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br
gmail.com
yahii.com.br
hotmail.com
hotmail.com
ig.com.br
hotmail.com
yahoo.com.br
hotmail.com
gmail.com
hotmail.com
yahoo.com.br
hotmail.com
yahoo.com.br
yahoo.com.br
gmail.com
yahoo.com.br
hotmail.com
hotmail.com
hotmail.com
hotmail.com
yahoo.com.br
Captulo 2
Probabilidade
2.1
Experimentos aleat
orios, espaco amostral e eventos
Experimento Aleat
orio - A ideia do que seja um experimento aleatorio e bastante intuitiva. Imaginemos dois times disputando a final de um campeonato de futebol. Se o jogo termina empatado, pode-se
jogar uma prorrogacao (tempo adicional), e no caso do empate persistir, pode-se decidir o campeao de
acordo com o historico de cada time, disputa de penaltes, etc. Persistindo o empate, pode-se decidir o
campeonato lancando uma moeda. Perante esses fatos, surge a pergunta: e justo definir o campeao dessa
forma? Milhares e ate milhoes de torcedores aceitam. Porque?
Pensemos em outro exemplo de experimento aleatorio. Suponha que um engenheiro observa a qualidade de um item (defeituoso ou nao defeituoso). Se a linha de producao estiver calibrada, espera-se que
uma proporc
ao muito pequena de itens apresentem defeito (1 em cada 100 ou em cada 1.000, por exemplo).
Os dois exemplos precedentes fornecem a ideia de um experimento aleatorio. No caso da moeda,
assumindo que ela seja honesta, nao temos argumento para acreditar que um dos resultados (cara ou
coroa) tenha maior chance de acontecer. No caso dos itens produzidos por uma linha de producao, naturalmente acreditamos que a proporcao de defeituosos seja muito pequena. Mas em ambos os casos, antes
de realizar o experimento, nao sabemos qual sera o resultado. Embora nao saibamos qual sera o resultado
na realizacao de um experimento, podemos ter certeza que no caso da moeda acontecera cara(C) ou coroa
(K), e no caso da linha de producao, sabemos que um item observado resultara defeituoso (D) ou nao
defeituoso (N). Alem do mais se realizarmos um n
umero n grande de cada experimento, espera-se que os
n
umeros de caras e coroas sejam proximos. Ja no caso dos itens observados, espera-se que a proporcao
de defeituosos seja pequena.
Nao daremos uma definicao formal de experimento aleatorio, mas os dois exemplos precedentes sao
ilustrativos. Ao nos referirmos a experimento aleatorio, usaremos a notacao . Exemplos:
1 : lancar uma moeda;
2 : observar a qualidade de um item de uma linha de producao
3 : observar a taxa de inflacao no mes de marco de 2010;
4 medir a altura de um aluno;
5 observar o tempo de vida de um equipamento;
6 contar o n
umero de alunos presentes na sala de aula.
26
2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS
cpa/gsa
No experimento 1 , ao lancarmos uma moeda, temos certeza que acontecera cara (C) ou coroa (K).
No experimento 2 temos certeza que o item observado sera defeituoso (D) ou nao defeituoso (N). isto e,
em cada caso sabemos qual e o conjunto de todos os resultados do experimento aleatorio. Chamamos a
esse conjunto de espa
co amostral e denotaremos por .
1 = {C, K} sera o espaco amostral associado ao experimento 1 ;
2 = {D, N} sera o espaco amostral associado ao experimento 2 .
analogamente temos,
3 = {r : r > 0};
4 = {X R : X > 0};
5 = {t R : t > 0};
6 = {0, 1, 2, . . . N }. Neste caso N sera o n
umero de alunos matriculados ou que frequentam as aulas.
O espaco amostral () foi definido como o conjunto de todos os resultados possveis de um experimento aleatorio. Quer dizer entao que representa o Conjunto Universo que conhecemos da Teoria
Elementar de Conjuntos. Dentro desse conjunto podemos definir subconjuntos e a cada desses subconjuntos chamaremos de evento.
No experimento 5 , podemos estar interessados em que o tempo de vida do equipamento atenda ao
tempo de garantia. Se o tempo e em anos, podemos estar interessados no evento em que t seja maior do
que 1.
Usaremos as primeiras letras do alfabeto em mai
usculas para representar eventos: A, B, C, . . . .
A = {t R : t > 1} representa o evento de que o equipamento atende ao tempo de garantia no experimento 5
2.1.1
Operaco
es com eventos
Uni
ao de eventos (AB) e o evento que ocorre se A ou B ou ambos eventos ocorrerem. O diagrama de
Venn utilizado para relacoes entre conjuntos pode ser utilizado para relacoes entre eventos. Imagine
que o espaco amostral seja representado pelos pontos no retangulo abaixo e que os eventos A e
B sao os subconjuntos nos pontos das regioes indicadas
Figura 2.2: A B
2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS
cpa/gsa
A B = {1, 2, 3, 4, 6}
Interse
c
ao de eventos (A B) e o evento que ocorre se A e B ocorrem simultaneamente.
W
Figura 2.3: A B
Podemos escrever:
A B = { : A B}
No mesmo exemplo anterior temos:
Evento A ocorre face par.
Evento B ocorre face par ou inferior a 4.
A B = {2}
W
Figura 2.4: A e B disjuntos
Observacao 2: As operacoes uniao e intersecao de eventos sao comutativas. Isto e:
AB =BA
AB =BA
formado
Eventos complementares (Notacao AC ) O evento AC ocorre se o evento A nao ocorre. E
C
por todos os pontos de que nao estao em A. Assim A = { :
/ A}
A
AC
2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS
cpa/gsa
Exemplo: no lancamento de um dado, se A ocorrer face par, entao B ocorrer face mpar, e
evento complementar de A.
Diferen
ca de eventos (A B) e o evento em que A ocorre e B nao ocorre. Escrevemos:
A B = { : A
/ B}
W
Figura 2.6: A - B
Note que A B = A B C . Deixamos a prova como exerccio.
aquele evento em que A ou B ocorrem, mas nao ambos simultaneamente. ReDiferen
ca sim
etrica E
presentamos por:
A 4 B = (A B) (B A)
W
Figura 2.7: A 4 B
2.1.2
Operaco
es com mais de dois eventos
Propriedades Distributivas
PD1: A (B C) = (A B) (A C)
PD2: A (B C) = (A B) (A C)
As figuras abaixo ilustram as propriedades distributivas:
B
A
B
C
Figura 2.8: A (B C)
Figura 2.9: A (B C)
29
2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS
cpa/gsa
Leis de Morgan:
LM1: (A B)C = AC B C
LM2: (A B)C = AC B C
Provaremos PD1 e LM1 para ilustracao e deixaremos a prova dos outros dois resultados para o leitor.
Antes da prova, recordaremos as propriedades dos operadores logicos relacionando proposicoes.
Pensemos no exemplo seguinte: pela manha o aluno vai para a escola e `a tarde vai para a biblioteca
ou para o cinema. Essa proposicao composta e equivalente `a seguinte: Pela manha o aluno vai para a
escola e `a tarde vai para a biblioteca ou pela manha o aluno vai para a escola e `a tarde vai ao cinema.
Temos, no paragrafo precedente, um exemplo da propriedade distributiva dos operadores logicos. De
forma geral, sejam p, q e r tres proposicoes simples. Denotemos por p q e p q as proposicoes (p e q) e
(p ou q) respectivamente.
Pode-se provar que:
p (q r) (p q) (p r)
Omitimos a prova dessa propriedade, que pode ser feita atraves da construcao da tabela de valores
de verdade das duas proposicoes compostas p (q r) e (p q) (p r).
No exemplo do aluno, as proposicoes seriam:
p: O aluno vai para a escola pela manha;
q: o aluno vai para a biblioteca `a tarde;
r: o aluno vai ao cinema `a tarde.
Podemos provar a PD1 usando a propriedade distributiva dos operadores logicos. Uma forma de
provar igualdade de dois conjuntos e escolher um elemento arbitario de um deles e provar que pertence
ao outro.
Seja entao A (B C). Defina p : A, q : B e r : C. Entao:
A (B C) ( A) ( (B C))
( A) ( B C)
p (q r)
(p q) (p r)
( A B) ( A C)
( A B) ( A C)
{ (A B) (A C)}
30
2.1. EXPERIMENTOS ALEATORIOS,
ESPAC
O AMOSTRAL E EVENTOS
cpa/gsa
Para provar LM1, apresentaremos outra propriedade dos operadores logicos. Sejam p e q duas
proposicoes. A negacao de p q e equivalente `a negacao de uma delas. Isto e, se N p representa a negacao
de p, entao:
N (p q) = (N p) (N q)
Aplicando essa propriedade e fazendo p : A e q : A podemos escrever:
(A B)C
/ (A B)
(
/ A) (
/ B)
( AC ) ( B C )
{ AC B C }
n
S
S
Bi =
PD1: A
(A Bi )
i=1
PD2: A
n
T
i=1
LM1:
n
T
i=1
LM2:
n
S
i=1
i=1
Bi
C
Bi
i=1
n
S
i=1
C
Bi
n
T
n
T
i=1
(A Bi )
BiC
BiC
B1
B2
B3
Figura 2.12: A
3
S
i=1
31
Bi
DE PROBABILIDADE
2.2. DEFINIC
AO
2.2
cpa/gsa
Definic
ao de probabilidade
2.2.1
Defini
c
ao frequentista de probabilidade
Como atribuirmos probabilidades a elementos do espaco amostral? A primeira ideia foi baseada em
caractersticas teoricas do fenomeno ou experimento e na observacao das frequencias de sua ocorrencia.
Da surgiu:
Defini
c
ao 1. Consideremos n repeticoes independentesde um experimento aleatorio . Seja A um
evento qualquer (A ). Defina
Pn (A) =
nA
n
(onde nA e o n
umero de vezes em que ocorre o evento A)
e defina
P(A) = lim Pn (A)
n
n{i}
# ocorrencia da face i
=
.
# total de lc. do dado
n
Quando o n
umero de lancamentos e muito grande, Pn ({i}) se estabiliza e voce toma esse valor como
a probabilidade de ocorrencia da face i.
2. Suponha que temos uma linha de producao em grande escala. Retiramos n itens desta linha de
producao, e a cada retirada contamos o n
umero de itens defeituosos (A= item defeituoso)
n
10
50
100
500
1000
5000
No defeituosos
0
2
6
29
51
249
Pn (A)
0/10 = 0
2/50 = 0,04
6/100 = 0,06
29/500 = 0,058
51/1000 = 0,051
249/5000 = 0,050
Observando a tabela acima vemos que P10 (A) = 0, P50 (A) = 0,04, P100 (A) = 0,06, e assim por
` medida que aumentamos o valor de n, espera-se que Pn (A) se aproxime da proporcao
diante. A
de defeituosos. Pela definicao frequentista de probabilidade vemos que a probabilidade de um item
defeituoso nesta linha de producao converge para 0,05.
32
DE PROBABILIDADE
2.2. DEFINIC
AO
2.2.2
cpa/gsa
Axiomas de probabilidade
n
S
P
P
Ai =
P(Ai ), se Ai Aj = para i 6= j : i,j = 1, . . . , n
i=1
i=1
Proposi
c
ao 2.
P() = 0
Proposi
c
ao 3.
P(AC ) = 1 P(A)
Proposi
c
ao 4.
Se A B, entao P(A) P(B)
Provas:
1. Faremos a prova para n = 3. O caso geral decorre do Princpio da Inducao Matematica. Se A1 , A2
e A3 sao tais que A1 A2 = A1 A3 = A2 A3 = entao
P(A1 A2 A3 ) = P(A1 (A2 A3 ))
= P(A1 ) + P(A2 A3 )
= P(A1 ) + P(A2 ) + P(A3 )
Observe que A1 (A2 A3 ) = (A1 A2 ) (A1 A3 ) =
2. e sao mutuamente exclusivos, e = . Assim pelo terceiro axioma P() = P() + P().
Mas pelo primeiro axioma P() = 1, logo P() = 0.
3. Como AC e A sao complementares temos A AC = e A AC = . Entao pelo axioma 3,
P(A) + P(AC ) = P() e pelo axioma 1, P(A) + P(AC ) = 1, logo P(AC ) = 1 P(A).
4. Podemos escrever B como B = A (AC B). Os eventos A e (AC B) sao disjuntos, entao pelo
axioma 3 podemos escrever P(B) = P(A) + P(AC B). Como, pelo axioma 2, P(AC B) 0 logo
P(B) P(A).
33
DE PROBABILIDADE
2.2. DEFINIC
AO
2.2.3
cpa/gsa
Regras de adi
c
ao
Uni
ao de dois eventos n
ao disjuntos: A probabilidade da uniao de dois eventos nao disjuntos e
dada por:
Proposi
c
ao 5.
P(A B) = P(A) + P(B) P(A B)
Podemos provar de maneira simples:
A B = A (B AC )
mas, B = (B A) (B AC )
assim P(B) = P(B A) + P(B AC )
Figura 2.13: A B C
Tr
es ou mais eventos: Expandindo o resultado da proposicao 5, podemos desenvolver formulas
para uniao de quantos eventos quisermos. Mas quanto maior o n
umero de eventos mais complexas ficam
estas formulas. Vamos registrar apenas para 3 eventos:
P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C)
Deixamos como exerccio a prova dessa proposicao (aplique duas vezes a proposicao 5).
Exemplo:
Todos os socios de um clube praticam pelo menos 1 esporte. Sabe-se que 60% deles praticam futebol,
55% praticam voleibol e 50% praticam peteca. Alem disso 30% praticam volei e peteca, 30% futebol e
volei e 25% futebol e peteca. Se voce escolher aleatoriamente um socio deste clube, qual a probabilidade
de que ele pratique os tres esportes?
Solucao:
Se chamarmos os eventos A = o socio pratica futebol, B = o socio pratica voleibol e C = o socio
pratica peteca, a probabilidade solicitada e P(A B C). Podemos escrever:
P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C) = 1
e da
0,60 + 0,55 + 0,50 0,30 0,30 0,25 + P(A B C) = 1
2.2.4
P(A B C) = 0,2
Defini
c
ao cl
assica de probabilidade
Defini
c
ao 2. Seja um experimento aleatorio com espaco amostral finito = {1 , 2 , . . . ,n }. Se temos
evidencias de que todos os resultados tem a mesma chance de acontecer, define-se
P(i ) =
1
n
i = 1, 2, . . . , n.
34
cpa/gsa
Para A , define-se
P(A) =
#A
n
onde #A = cardinal de A = n
umero de elementos de A.
2.3
Probabilidade Condicional
Defini
c
ao 3. Se B e um evento tal que P(B) > 0, a probabilidade condicional de um evento A dado
o evento B, denotada por P(A|B) e
P(A|B) =
P(A B)
P(B)
A probabilidade condicional de A dado B revela a incerteza que se tem sobre o evento A supondo a
ocorrencia do evento B. Podemos interpreta-la como a chance relativa de A restrita ao fato de que B
ocorreu.
Exemplos:
1. Uma classe de estatstica teve a seguinte distribuicao das notas finais:
Reprovados
Aprovados
Homens
4
8
Mulheres
6
14
Solucoes:
Defina os eventos A : ser aprovado e M : ser mulher, temos
(a) P(A|M ) =
P(AM )
P(M )
14/32
20/32
= 0,7
P(M A)
P(A)
14/32
22/32
= 0,64
35
cpa/gsa
2. As informacoes abaixo referem-se aos candidatos que prestaram vestibular na UFMG em 2004:
Classe
Social
A
B
C
D
E
Total
Candidato foi
aprovado
Nao
Sim
2.974
393
17.394
1.725
17.618
1.040
8.034
265
2.482
64
48.502
3.487
Total
3.367
19.119
18.658
8.299
2.546
51.989
3.487
51.989
3.367
51.989
(c) P(A B) =
= 0,067
= 0,0647
393
51.989
= 0,0075
P(AB)
P(A)
0,0075
0,067
= 0,1119
(f) P(A|B) =
P(BA)
P(B)
0,0075
0,0647
= 0,1159
36
E PROBABILIDADE TOTAL
2.4. REGRAS DA MULTIPLICAC
AO
2.4
2.4.1
cpa/gsa
Regras da multiplicac
ao e probabilidade total
Regra da multiplica
c
ao
Da mesma forma como foi definida P(A|B), se P(A) > 0 podemos definir
P(B|A) =
P(B A)
P(A)
2.4.2
A regra da multiplicacao e u
til para determinarmos a probabilidade de um evento que dependa de
outros eventos.
Suponha que voce tenha duas linhas de producao de parafusos, 1 e 2, e que a primeira linha produza
1.000 parafusos por hora com uma taxa de defeitos de 0,02 e a segunda produza 500 parafusos por hora,
mas com uma taxa de defeitos 0,008. Escolhendo-se aleatoriamente um parafuso de um lote da producao
de uma hora das duas linhas, qual a probabilidade que ele seja defeituoso? Claramente a resposta depende
de qual linha saiu aquele parafuso.
Se chamarmos A parafuso saiu da linha 1, B parafuso saiu da linha 2 e C parafuso e defeituoso
podemos afirmar que
C = (C A) (C B)
e como (C A) e (C B) sao disjuntos podemos escrever que
P(C) = P(C A) + P(C B) = P(C|A)P(A) + P(C|B)P(B) = 0,02 2/3 + 0,008 1/3 = 0,016
37
E PROBABILIDADE TOTAL
2.4. REGRAS DA MULTIPLICAC
AO
cpa/gsa
n
S
i 6= j
i=1
3. P(Ai ) > 0
i = 1, 2, . . . , n
A1
A3
A2
A4
A5
A6
A7
A1
A3
A2
A4
B
A5
A6
A7
Prova: Desde que os eventos A1 ,A2 , . . . ,An formam uma particao de , podemos escrever:
B = B (Ai ) = ni=1 (B Ai )
n
X
P(B Ai ).
i=1
38
cpa/gsa
n
X
P(Ai )P(B|Ai ).
i=1
Exemplo:
Uma montadora de veculos recebe diariamente em contrato de fornecimento just in time, 20% de
dado componente do fabricante A, 30% do fabricante B e 50% do fabricante C. Inspecoes anteriores nas
fabricas destes fornecedores mostraram que estes componentes produzidos por eles apresentavam taxas
de defeitos de 0,7%, 0,4% e 0,2% respectivamente. Cada veculo e equipado com um componente escolhido aleatoriamente entre os recebidos na vespera. Durante a vistoria final, o inspetor de qualidade da
montadora esta inspecionando este componente. Qual a probabilidade dele apresentar defeito?
Solucao:
Se chamarmos X o evento de que o componente inspecionado apresenta defeito, e A, B e C respectivamente o evento que o componente inspecionado foi fabricado respectivamente pelo fornecedor A, B ou
C, podemos escrever:
P(X) = P(A)P(X|A) + P(B)P(X|B) + P(C)P(X|C)
= 0,2 0,007 + 0,3 0,004 + 0,5 0,002
= 0,0014 + 0,0012 + 0,0010 = 0,0036
2.5
2.5.1
Teorema de Bayes
Independ
encia
Em alguns casos, a probabilidade condicional, P(B|A), pode ser igual a P(B). Neste caso especial, a
informacao da ocorrencia ou nao de A nao altera a probabilidade da ocorrencia de B. Assim podemos
definir:
Defini
c
ao 5. Dois eventos A e B sao independentes se qualquer uma das seguintes afirmacoes for
verdadeira:
1. P(A|B) = P(A)
2. P(B|A) = P(B)
3. P(A B) = P(A)P(B)
muito simples mostrar a equivalencia destas tres condicoes. Mostremos por exemplo a equivalencia
E
de (1) e (3): Suponha que (1) e verdadeira. Entao P(AB) = P(B)P(A|B) = P(B)P(A). Reciprocamente
P(A B)
= P(A).
se (3) e verdadeira, entao P (A|B) =
P(B)
Convidamos o leitor para demonstrar as outras equivalencias.
39
cpa/gsa
Exemplos:
1. Usando os dados do vestibular de 2004 conclui-se que os eventos o candidato e aprovadoe o
candidato e da classe Anao sao independentes pois:
P(A) = 0,067
P(A|B) = 0,1159
2. Uma empresa produz pecas em duas maquinas (1 e 2). Estas maquinas podem apresentar desajustes
com probabilidades respectivamente 0,05 e 0,10. Suponha que as maquinas trabalhem de forma
independente. No incio do dia um teste e realizado e caso a maquina esteja fora do ajuste a
maquina para de operar e vai para manutencao. Para que se cumpra o nvel mnimo de producao
diaria e necessario que pelo menos uma maquina esteja funcionando. Qual a probabilidade de que
a empresa cumpra a producao do dia?
Solucao: Se fizermos O1 : maquina 1 esta operando e O2 : maquina 2 esta operando, a probabilidade
de que a producao seja cumprida e;
P(O1 ou O2 ) = 1 P[(O1 ou O2 )C ] = 1 P(O1C e O2C ) = 1 P(O1C O2C )
Mas pela independencia
P(O1C O2C ) = P(O1C )P(O2C ) = 0,05 0,10 = 0,005
E assim a probabilidade que a producao do dia seja cumprida e 1 0,005 = 0,995.
Quando consideramos tres ou mais eventos, podemos estender a definicao de independencia:
ao independentes, se e somente se para qualquer subconjunto
Defini
c
ao 6. Os eventos A1 ,A2 , . . . ,An s
destes eventos Ai1 , Ai2 , . . . , Aik
P(Ai1 Ai2 Aik ) = P(Ai1 ) P(Ai2 ) P(Aik )
Uma propriedade importante: Sejam A1 , A2 , . . . , An eventos independentes e seja B um evento
formado por operacoes entre os eventos Ai1 , . . . , Air e C um outro evento formado por operacao entre
alguns dos eventos restantes. Entao B e C sao eventos independentes. Essa e a chamada propriedade
hereditaria da independencia.
Exemplo:
Sejam A1 , A2 , . . . , A10 eventos independentes, entao
a- A1 (A5 A8 ) e A3 (A4 AC
ao independentes.
7 ) s
b- A1 A2 A3 e (A4 A5 ) (A6 A7 ) sao independentes.
Exemplo: O sistema mostrado a seguir so funciona se houver um caminho de componentes (numerados
de 1 a 6) funcionando do ponto A para o ponto B:
1
0,9
A
2
0,9
3
0,9
4
0,95
5
0,95
40
6
0,99
cpa/gsa
A probabilidade de que cada componente funcione esta indicada. Assumindo que cada componente
funciona de forma independente, calcule a probabilidade que o sistema opere.
Solucao:
Defina:
Ai : componente i funciona, i = 1, . . . , 6;
B1 : subsistema formado pelos componentes 1, 2 e 3 funciona;
B2 : subsistema formado pelos componentes 4 e 5 funciona;
B3 : subsistema formado pelo componente 6 funciona;
A : sistema funciona.
Assim podemos escrever:
A = B1 B2 B3
2.5.2
Teorema de Bayes
P(B|A)P(A)
P(B)
Partindo desta expressao, e escrevendo o denominador usando a regra da probabilidade total, obtemos
o Teorema de Bayes, que tem este nome em homenagem ao Reverendo Thomas Bayes, matematico ingles
da primeira metade do seculo XV I:
41
cpa/gsa
P(B|A1 )P(A1 )
P(B|A1 )P(A1 ) + P(B|A2 )P(A2 ) + + P(B|An )P(An )
Exemplos:
1. Suponha que um fabricante de sorvetes recebe 20% de todo o leite que consome da fazenda F 1,
30% da fazenda F 2 e o restante da F 3. A vigilancia sanitaria inspecionou as fazendas de surpresa
e observou que 20% dos galoes de leite produzidos na fazenda F 1 estavam adulterados por adicao
de agua, o mesmo ocorrendo com 5% e 2% dos galoes respectivamente produzidos nas fazendas F 2
e F 3. Na ind
ustria de sorvete os galoes de leite sao armazenados sem identificacao das fazendas
produtoras. Um galao e sorteado ao acaso na ind
ustria. Calcule:
(a) a probabilidade de que o galao esteja adulterado
(b) a probabilidade do galao estando adulterado ter vindo da fazenda F 1
Solucao:
(a) Seja A o leite esta adulterado e Fi o leite veio da fazenda Fi
A
F1
A = (A F1 ) (A F2 ) (A F3 )
F2
P(A) = P[(A F1 ) (A F2 ) (A F3 )]
F3
Assim:
P(A) = 0,2 0,2 + 0,05 0,3 + 0,02 0,5 = 0,065
(b) Pelo teorema de Bayes temos
P(F1 |A) =
P(A|F1 )P(F1 )
0,2 0,2
=
= 0,6154
P(A|F1 )P(F1 ) + P(A|F2 )P(F2 ) + P(A|F3 )P(F3 )
0,065
2. Das pacientes da Clnica de Ginecologia com idade acima de 40 anos, 60% sao ou foram casadas e
40% sao solteiras. Sendo solteira, a probabilidade de ter tido um dist
urbio hormonal no u
ltimo ano
e de 10%, enquanto para as demais esta probabilidade aumenta para 30%. Pergunta-se:
(a) Qual a probabilidade de uma paciente escolhida ao acaso ter tido um dist
urbio hormonal no
u
ltimo ano?
(b) Se a paciente escolhida tiver tido um dist
urbio, qual a probabilidade dela ser solteira?
(c) Se escolhemos duas pacientes ao acaso e com reposicao, qual a probabilidade de pelo menos
uma ter o dist
urbio?
42
2.6. EXERCICIOS
cpa/gsa
Solucao:
Sejam os eventos S paciente e solteira e H paciente teve dist
urbio hormonal no u
ltimo ano.
(a) P(H) = P(H|S)P(S) + P(H|S C )P(S C ) = 0,10 0,40 + 0,3 0,6 = 0,22
(b) P(S|H) =
P(H|S)P(S)
P(H)
0,100,4
0,22
= 0,1878
2.6
Exerccios
B
C
Reproduza a figura e sombreie a regiao que corresponde a cada um dos seguintes eventos:
(a) Ac
(b) (A B) (A B c )
(c) (A B) C
(d) (B C)c
(e) (A B)c C
43
2.6. EXERCICIOS
cpa/gsa
3. Imagine o experimento aleatorio do lancamento de um dado honesto. O espaco amostral e {1, 2, 3, 4, 5, 6}.
Considere os eventos P : resultado e par, e Q : resultado e maior ou igual a 4. Calcule:
(a) P(P )
(b) P(Q)
(c) P(P C )
(d) P(P Q)
(e) P(P Q)
5. Discos de policarbonato plastico provenientes de um fornecedor sao analisados com relacao `a resistencia a arranhoes e a choques. Os resultados da analise de 100 discos estao resumidos a seguir:
resist
encia a
arranh
ao
alta
baixa
resist
encia a
choque
alta
baixa
80
9
6
5
Faca A denotar o evento em que um disco tenha alta resistencia a choque e B denotar o evento em
que um disco tenha alta resistencia a arranhao. Determine as seguintes probabilidades:
(a) P (A)
(b) P (B)
(c) P (A|B)
(d) P (B|A)
6. Uma empresa de embalagens trabalha com maquinas de corte de papelao. A aspereza nas bordas das
embalagens aumenta `a medida que as laminas da ferramenta de corte vao sendo gastas. Somente
1% das embalagens fabricadas com laminas novas exibem rugosidade. Esse percentual aumenta
para 3% se as laminas estiverem com meia-vida e para 5% no caso de laminas gastas. Se 25% das
laminas forem novas, 60% mediamente afiadas e 15% forem gastas, que proporcao de embalagens
produzidas pela empresa apresentarao aspereza nas bordas?
44
2.6. EXERCICIOS
cpa/gsa
7. Uma placa de aco contem 20 parafusos. Considere que cinco parafusos nao estejam apertados ate o
limite apropriado. Quatro parafusos sao selecionados ao acaso, sem reposicao, para verificacao do
torque.
(a) Qual e a probabilidade de que todos os quatros parafusos selecionados estejam apertados ate
o limite apropriado?
(b) Qual e a probabilidade de que no mnimo um dos parafusos selecionados nao tenha sido
apertado ate o limite apropriado?
8. O circuito a seguir opera se, e somente se, houver um caminho de equipamentos funcionais da
esquerda para a direita. Considere que os equipamentos falhem independentemente, sendo a probabilidade de falha de cada equipamento mostrada na Figura 2.18. Qual e a probabilidade de que
o circuito opere?
10. Considere o circuito dado na Figura 2.19. Assuma que os equipamentos falhem independentemente,
sendo que a probabilidade de falha de cada equipamento esta indicada. Qual e a probabilidade de
que o circuito opere?
45
2.6. EXERCICIOS
cpa/gsa
11. Sabe-se que 6%, 8% e 10% dos parafusos produzidos pelas empresas A, B e C respectivamente, sao
defeituosos. Uma empresa de montagens compra 40% dos parafusos que utiliza da empresa A, 40%
da empresa B e o restante da empresa C.
(a) Da compra realizada em um mes, um parafuso e inspecionado. Qual a probabilidade de que
ele seja defeituosa?
(b) Se o parafuso inspecionado apresentar defeito, qual a probabilidade de que tenha sido produzido
pela empresa B?
12. A u
ltima pesquisa de amostra de domiclios realizada em um bairro da periferia de Belo Horizonte
constatou que 80% das residencias possuiam televisao, 60% possuiam radio e 35% computador.
Alem disso 20% dos domiclios pesquisados possuiam TV e computador, 15% computador e radio, e
10% possuiam os tres itens da pesquisa (TV, radio e computador). Qual o percentual de domiclios
com TV e radio?
13. A U.F.M.G. recebe giz de tres fabricantes diferentes, digamos A, B e C, numa proporcao respectivamente de 60%, 30% e 10%. Testes anteriores demonstram que o percentual de quebra desses
fabricantes e de 2% (fabricante A), 5% (fabricante B) e 7% (fabricante C). Um professor retira
aleatoriamente de uma caixa um giz. Responda:
(a) Qual a probabilidade do giz retirado estar quebrado?
(b) Se o giz estiver quebrado, qual a probabilidade dele ter sido fabricado pelo fornecedor B?
(c) Se o giz estiver inteiro, qual a probabilidade de ter sido fabricado pelo fornecedor C?
14. A vari
avel aleatoria X assume os valores relacionados na tabela a seguir, com as correspondentes
probabilidades.
X
f(x)
0
0,04
1
0,18
2
0,31
3
0,28
4
0,14
5
0,04
6
0,01
(a) Calcule a funcao de probabilidade acumulada F (X), descreva-a detalhadamente e esboce seu
grafico.
(b) Calcule a P(X 3) e P(2 X < 5).
(c) Qual a media e a variancia dessa V.A.?
46
Captulo 3
Vari
aveis Aleat
orias Discretas
3.1
Introduc
ao
D D
D N
N D
N N
3.2. VARIAVEIS
ALEATORIAS
DISCRETAS
cpa/gsa
Exemplos de variaveis aleatorias contnuas: peso, altura, corrente eletrica, pressao, temperatura,
tempo.
Exemplos de variaveis aleatorias discretas: n
umero de pecas defeituosas em um lote, bits transmitidos que foram recebidos com erros, pessoas doentes em uma amostra da populacao.
3.2
Vari
aveis aleat
orias discretas
3.3
Distribuic
oes de probabilidades e func
oes de probabilidade
Frequentemente estamos interessados na probabilidade com que uma variavel aleatoria assume um
valor em particular.
Fun
c
ao de probabilidade Um modelo probabilstico consiste em atribuir a cada valor da v.a. X
a sua probabilidade de ocorrencia. A funcao que atribui a cada valor xi de X a sua probabilidade e
chamada de fun
c
ao de probabilidade ou fun
c
ao de massa. Assim, se X e uma variavel aleatoria
assumindo os valores x1 , x2 , x3 , . . . , xN a funcao de probabilidade fX () associada a X e:
fX (xi ) = P(X = xi )
i = 1, 2, 3, . . . , N
x1
0
0,8836
x2
1
0,1128
48
x3
2
0,0036
3.3. DISTRIBUIC
OES
DE PROBABILIDADES E FUNC
OES
DE PROBABILIDADE
cpa/gsa
0,8836 se x = 0,
0,1128 se x = 1,
fX (x) =
0,0036 se x = 2.
xi
n
X
fX (xi ) = 1
i=1
Variaveis aleatorias sao tao importantes que algumas vezes ignoramos o espaco amostral original e
so trabalhamos com a distribuicao de probabilidades da v.a. Assim sendo no exemplo da inspecao dos
dois itens, resumimos o experimento nos valores possveis de X ({0, 1, 2}) e nao no espaco amostral
= {DD, DN, N D, N N }.
Exemplo:
Com os dados do u
ltimo censo a assistente social do centro de sa
ude constatou que na regiao 20% das
famlias nao tem filhos, 30% possuem 1 filho, 35% possuem 2 filhos e as demais se dividem igualmente
entre 3, 4 ou 5 filhos. Suponha que uma famlia seja escolhida aleatoriamente e defina a v.a. N como o
n
umero de filhos desta famlia.
(a) Construa a funcao de probabilidade para N e (b) Desenhe o seu grafico
Solucao:
Se N e o n
umero de filhos na famlia temos que os valores possveis de N sao: {0, 1, 2, 3, 4, 5}. Supondo
que todas as famlias tem chances iguais de serem sorteadas:
(a) Funcao de probabilidade
fN (0) = P(N = 0) = 0,20
fN (3) = fN (4) = fN (5) =
(b) Grafico:
fN(n)
0,35
0,30
0,20
0,05
49
ACUMULADAS
3.4. FUNC
OES
DE DISTRIBUIC
AO
3.4
cpa/gsa
Funco
es de distribuic
ao acumuladas
FN (n)
1,00
0,85
0,50
0,20
Note que, mesmo se a variavel aleatoria so pode assumir valores inteiros, a funcao de distribuicao
cumulativa podera ser definida em valores nao inteiros.
Na figura anterior:
F (2,5) = P(N 2,5) = P(N 2) = 0,85
Propriedades da fun
c
ao de distribui
c
ao cumulativa:
1. Se x < y F (x) F (y)
2. lim+ F (x) = F (a)
(F e contnua `a direita)
xa
3.
(F e nao decrescente)
50
3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA
cpa/gsa
0,2
F (x) =
0,7
se
se
se
se
x < 2,
2 x < 0,
0 x < 2,
2 < x.
0,70
0,20
-2
Ou seja, a v.a. X assume os valores {2, 0, 2} com probabilidades respectivamente 0,2; 0,5 e 0,3.
Em geral se a variavel aleatoria pode assumir os valores x1 < x2 < x3 < . . . ; e se conhecemos F (xk )
para cada xk RX , podemos escrever:
f (xk ) = F (xk ) F (xk1 )
3.5
M
edia e vari
ancia de uma vari
avel aleat
oria discreta
Dois n
umeros sao frequentemente usados para resumir a distribuicao de uma variavel aleatoria. A
m
edia e a medida do centro ou meio da distribuicao de probabilidade e a vari
ancia e a medida da
dispersao ou variabilidade da distribuicao. Estas medidas nao sao caractersticas exclusivas de uma
distribuicao, ja que podemos ter duas distribuicoes diferentes com mesma media e mesma variancia (veja
figura 3.1) , mas mesmo assim sao importantes e u
teis.
51
3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA
10
cpa/gsa
10
1X
x
=
xi
n i=1
X
1
S =
(xi x
)2 .
(n 1) i=1
2
A vari
ancia de X, denotada por 2 ou V (X), e
X
X
2 = V (X) = E(X )2 =
(xk )2 f (xk ) =
x2k f (xk ) 2
k
O desvio padr
ao de X e
=
Vemos portanto que a media de uma variavel aleatoria discreta e a media ponderada dos valores
possveis de X, onde os pesos sao as probabilidades.
De forma similar a variancia usa f (x) como peso para multiplicar cada desvio quadrado (x )2 .
A igualdade das formulas da variancia apresentadas acima pode ser demonstrada usando propriedades
dos somatorios e a definicao de :
X
X
X
X
V (X) =
(x )2 f (x) =
x2 f (x) 2
xf (x) + 2
f (x)
x
x
2
x f (x) 2 + =
x
2
x
2
x f (x)
Quando mais de uma variavel aleatoria estiverem envolvidas em um estudo, nas medias e nas variancias
usaremos um subscrito para diferencia-las, ou seja:
X : sera a media da v.a. X
2
X
: sera a variancia da v.a. X
52
3.5. MEDIA
E VARIANCIA
DE UMA VARIAVEL
ALEATORIA
DISCRETA
cpa/gsa
Exemplo:
Um canal digital transmite dados com certa probabilidade de erro. Seja X o n
umero de bits recebidos
com erro nos quatro proximos bits transmitidos. Os valores possveis de X sao {0,1,2,3,4}. Suponha que
tenhamos as seguintes probabilidades:
P(0) = 0,6561
P(1) = 0,2916
P(2) = 0,0486
P(3) = 0,0036
P(4) = 0,0001
x 0,4
0,4
0,6
1,6
2,6
3,6
(x 0,4)2
0,16
0,36
2,56
6,76
12,96
Assim:
V (X) = 2 =
5
X
f (x)
0,6561
0,2916
0,0486
0,0036
0,0001
f (x)(x 0,4)2
0,104976
0,104976
0,124416
0,024336
0,001296
i=1
53
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Exemplo:
Com os dados do exemplo anterior onde X e o n
umero de bits com erro nos proximos 4 transmitidos,
qual o valor esperado do quadrado do n
umero de erros?
Solucao:
h(x) = X 2 e portanto
E[h(X)] = E(X 2 ) = 02 0,6561 + 12 0,2916 + 22 0,0486 + 32 0,0036 + 42 0,0001 = 0,52.
(Note que este valor e diferente de E(X)2 = 0,42 = 0,16. A E(X 2 ) nao e, de modo geral, igual a E(X)2 ).
3.6
Distribuic
oes discretas mais comuns
3.6.1
Distribui
c
ao uniforme discreta
i = 1, . . . , N
Suponha que X tem distribuicao uniforme e que assuma os valores {x1 , x2 , . . . , xN } temos
E(X) =
N
X
xi pi =
i=1
xi
i=1
PN
2
N
X
i=1
x2i
1
=
N
"P
N
i=1
xi
PN
i=1
xi
#2
=
PN
i=1
PN
x2i [ i=1 xi ]2
N2
b
b
a1
X
X
X
X
1
1
1
k
=
=
k=
k
k
(b a + 1)
(b a + 1)
(b a + 1)
k=a
k=a
k=1
k=1
1
b(b + 1) (a 1)a
b+a
=
=
(b a + 1)
2
2
54
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
r(r + 1)
.
2
r(r + 1)(2r + 1)
.
6
k
(b a + 1)
2
k=a
" b
#
2
a1
X
X
1
b+a
2
2
=
k
k
(b a + 1)
2
k=1
k=1
2
1
b(b + 1)(2b + 1) (a 1)a(2a 1)
b+a
=
(b a + 1)
6
6
2
3
2
1
2b + 3b2 + b 2a3 + 3a2 a
b+a
=
(b a + 1)
6
2
2
2
2
2
2a + 2ab a + 2b + b b + 2ab + a
=
6
4
a2 2ab 2a + b2 + 2b
(b a + 1)2 1
=
=
12
12
2
b
X
Exemplos:
1. No lancamento de um dado honesto, seja a variavel aleatoria X o n
umero da face superior. Qual a
esperanca e a variancia de X?
Solucao
E(X) =
6+1
= 3,5
2
V (X) =
(6 1 + 1)2 1
2,92
12
umero de
2. A central telefonica de uma empresa possui 48 linhas externas. Defina a v.a. X como o n
linhas ocupadas em determinado instante, e considere que X tenha distribuicao uniforme discreta.
Se definirmos Y como a proporcao das linhas telefonicas que estao em uso em determinado instante,
qual a media e variancia de Y ?
Solucao
Em primeiro lugar note que se Y e a proporcao de linhas ocupadas, entao Y = X/48. Ou seja,
Y = aX onde a = 1/48. Pelas propriedades da media e variancia de variaveis aleatorias temos que
E(aX) = aE(X) e V ar(aX) = a2 V ar(X). Entao calculamos:
1 (0 + 48)
1
E(X) =
= 0,5
48
48
2
[(48 0 + 1)2 1]/12
2400/12
200
V (Y ) = V (X/48) = V (X)/482 =
=
=
0,087.
2304
2304
2304
E(Y ) = E(X/48) =
55
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
3.6.2
cpa/gsa
Distribui
c
ao de Bernoulli
x = 0 ou x = 1
1
X
x=0
3.6.3
Distribui
c
ao binomial
com RX R
Calculo da funcao de probabilidade de X: em primeiro lugar e facil ver que RX = {0,1,2 . . . ,n}.
Calculemos entao P(X = k). Para calcular esta probabilidade, precisamos contar o n
umero de sequencias
de tamanho n contendo k S 0 s e n k F 0 s. Se todos os S 0 s e todos os F 0 s fossem diferentes teramos n!
sequencias diferentes (n
umero de arranjos de n elementos diferentes).
Por simplicidade tomemos a sequencia S1 S2 S3 . . . Sk F1 F2 F3 ...Fnk . Por considerarmos os S 0 s diferentes, essa sequencia e diferente de S2 S1 S3 . . . Sk F1 F2 F3 ...Fnk e e diferente de qualquer outra sequencia
obtida trocando algumas posicoes dos S 0 s. Entao por considerarmos os S 0 s diferentes, cada sequencia
esta sendo repetida k! vezes. Pelo mesmo argumento cada sequencia esta sendo repetida (n k)! vezes
por considerarmos os F 0 s diferentes. Entao, como na realidade nao ha diferencas entre os S 0 s e nem entre
os F 0 s, o n
umero de sequencias com kS 0 s e (n k)F 0 s e igual a:
n!
n
=
k!(n k)!
k
Finalmente, desde que as repeticoes dos experimentos sao independentes, a probabilidade de uma
sequencia com kS 0 s e (n k)F 0 s e igual a pk (1 p)nk .
Conclui-se, entao, que:
n!
P(X = k) =
pk (1 p)nk =
k!(n k)!
n k
p (1 p)nk
k
56
para k = 0, 1, . . . , n.
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
n
X
n k nk
a b
k
k=0
Partindo da expansao binomial, fazendo a = p e b = 1 p podemos checar que a soma das probabilidades para uma variavel aleatoria binomial e igual a 1, conforme esperado, ja que
n
X
n k nk
a b
= (a + b)n = (p + 1 p)n = 1
k
k=0
Exemplos:
1. A eficiencia de uma vacina e de 80%. Sorteamos 3 indivduos em uma populacao vacinada, e estes
sao submetidos a um teste de imunizacao.
(a) Encontre a distribuicao do n
umero de individuos imunizados na amostra.
umero de indivduos imunizados na amostra ser maior ou igual a 1?
(b) Qual a probabilidade do n
Solucao:
(a) Se chamarmos de sucesso o fato do indivduo sorteado estar imunizado, vemos que p = 0,80.
A v.a. aleatoria X, n
umero de sucessos na amostra, pode assumir os valores {0,1,2,3} Vemos
entao que X b(3; 0,8), pois a probabilidade de cada indivduo ser imunizado e 0,8 e esta
probabilidade e fixa para todo indivduo. Alem disso, saber que um indivduo e imunizado
nao modifica a incerteza sobre os outros indivduos, ou seja, os eventos sao independentes.
(b)
3
P(x 1) = P(x = 1) + P(x = 2) + P(x = 3) = 1 P(x = 0) = 1
0,80 0,23
0
3!
=1
1 0,008
0!3!
= 1 0,008 = 0,992
2. Uma linha de producao em grande escala produz 6% de itens defeituosos. 30 itens da producao
semanal sao observados. Calcular a probabilidade de
(a) Observar no maximo 2 defeituosos?
(b) Observar entre 8 e 10 defeituosos?
57
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Solucao
(a) Se X e o n
umero de itens defeituosos na amostra, vemos que X b(30; 0,06) e assim
2
X
30
(0,06)k (0,94)30k
k
k=0
30
30
30
=
(0,06)0 (0,94)30 +
(0,06)1 (0,94)29 +
(0,06)2 (0,94)28
0
1
2
P(X 2) =
P(8 X 10) =
As figuras a seguir mostram exemplos de distribuicoes binomiais. Para n fixo (no exemplo 20) `a
medida que p aumenta de 0 a 0,5 a distribuicao se torna mais simetrica.
Figura 3.2: Distribuicao Binomial com n fixo e p crescente
Binomial (20; 0,23)
0,30
0,25
0,25
0,20
0,20
f(x)
f(x)
0,15
0,15
0,10
0,10
0,05
0,05
0,00
0,00
0
10
11
12
13
14
15
16
17
18
19
20
11
12
13
14
15
16
17
18
19
20
12
13
14
15
16
17
18
19
20
0,30
0,30
0,25
0,25
0,20
0,20
f(x)
f(x)
10
0,15
0,15
0,10
0,10
0,05
0,05
0,00
0,00
0
10
11
12
13
14
15
16
17
18
19
20
10
58
11
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
0,12
0,12
0,09
0,09
f(x)
0,15
f(x)
0,15
0,06
0,06
0,03
0,03
0,00
0,00
0
10
20
30
40
50
60
70
80
90
100 110
10
20
30
40
50
60
70
80
90
100 110
0,12
0,12
0,09
0,09
f(x)
0,15
f(x)
0,15
0,06
0,06
0,03
0,03
0,00
0,00
0
10
20
30
40
50
60
70
80
90
100 110
10
20
30
40
50
60
70
80
90
100 110
M
edia e vari
ancia: A media e a variancia de uma variavel aleatoria binomial dependem somente
dos parametros n e p. Imagine o exemplo anterior da linha de producao e para cada uma das 30 pecas
da amostra voce definisse novas v.as. X1 , X2 , . . . , X30 tais que:
30
X
Xk
k=1
k=1
k=1
59
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
3.6.4
cpa/gsa
Distribui
c
ao geom
etrica
x = 1, 2, . . .
O motivo pelo qual essa distribuicao e conhecida como geometrica e obvio. Os termos f (1), f (2), f (3), . . .
formam uma progressao geometrica com razao (1 p).
Exemplos:
1. De uma linha de producao em grande escala, retiram-se itens ate encontrar o primeiro defeituoso. Se
a probabilidade da peca ser defeituosa e 0,01, qual a probabilidade de termos que observar 10 pecas?
Solucao:
X e n
umero de observacoes ate que o primeiro sucesso(neste caso uma peca defeituosa) ocorra.
Logo:
P(X = 10) = f (10) = (1 p)9 p = (0,99)9 0,01 = 0,009135
2. Um medico esta testando pessoas procurando uma pessoa com sangue tipo O . Se na populacao
7% possuem sangue tipo O ,
(a) Qual a probabilidade de que ele tenha que testar 20 pessoas ate achar a primeira com este tipo
particular de sangue?
Solucao:
(b) Qual a probabilidade de que ele tenha que testar menos de 10 pessoas para achar a primeira
com sangue O ?
Solucao:
9
X
P(X < 10) =
(1 p)i1 p
i=1
60
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Fun
c
ao de distribui
c
ao acumulada: A funcao de distribuicao da variavel geometrica pode ser
obtida por:
(1 p)j1 p
j=k+1
=1p
k1
X
X
(1 p)j = 1 p (1 p)j
(1 p)j
j=k
j=0
j=0
1 + (1 p)k 1
1 (1 p) 1
=1p
=1p
p
p
p
= 1 (1 p)k
Entao
F (k) = 1 (1 p)k
com k = 1,2, . . .
Baseado neste resultado, calculamos a probabilidade condicional de que X assuma valores maiores
que (k1 + k2 ), sabendo que X > k1 , para k1 e k2 inteiros positivos. Ou seja, estamos interessados em
calcular:
P(X > k1 + k2 |X > k1 )
Aplicando a definicao de probabilidade condicional podemos achar:
P(X > k1 + k2 ,X > k1 )
P(X > k1 )
P(X > k1 + k2 )
=
P(X > k1 )
(1 p)k1 +k2
=
(1 p)k1
61
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Exemplo:
Na linha de producao do exemplo anterior, em que a probabilidade de produzir item defeituoso e de
0,01 vimos que a probabilidade de se observar 10 pecas para achar a primeira defeituosa e de 0,017631.
Dado que observamos trinta pecas sem defeito, qual a probabilidade que achemos o primeiro defeito na
quadragesima observacao?
Solucao: Pela propriedade de falta de memoria, 0,017631.
M
edia e vari
ancia: Se X for uma variavel aleatoria geometrica com parametro p entao a media e
a variancia de X serao:
1p
1
2 = V (X) =
= E(X) =
p
p2
Exemplo:
No caso anterior em que o medico esta procurando um paciente com sangue tipo O quantas pessoas
ele espera testar ate achar o tipo de sangue desejado?
Solucao:
E(X) =
1
1
=
= 14,3
p
0,07
0,80
0,80
0,70
0,70
0,60
0,60
0,50
0,50
f(x)
f(x)
Geomtrica (0,05)
0,90
0,40
0,40
0,30
0,30
0,20
0,20
0,10
0,10
0,00
0,00
0
10
12
14
16
18
20
22
24
26
28
30
10
12
14
Geomtrica (0,50)
18
20
22
24
26
28
30
18
20
22
24
26
28
30
Geomtrica (0,9)
0,90
0,90
0,80
0,80
0,70
0,70
0,60
0,60
0,50
0,50
f(x)
f(x)
16
0,40
0,40
0,30
0,30
0,20
0,20
0,10
0,10
0,00
0,00
0
10
12
14
16
18
20
22
24
26
28
30
10
12
14
16
62
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Observacao: Alguns autores definem a variavel com distribuicao geometrica como aquela que define o
n
umero de repeticoes independentes de experimentos de Bernoulli com probabilidade de sucesso p, antes
que aconteca o primeiro sucesso. Sob esta definicao f (x) = (1 p)x p
x = 0, 1, 2, . . . .
3.6.5
Distribui
c
oes binomial negativa
k1
P(.|. . . . . . . . . . {z
. . . . . . . . . . . .}. S) =
(1 p)kr pr
r1
k-1 repeti
co
es, r-1 sucessos
x1
f (x) =
(1 p)xr pr
para x = r, r + 1, r + 2, . . .
r1
Como sao necessarias pelo menos r tentativas para se obter r sucessos, o contradomnio de X e
RX = {r, r + 1, r + 2, . . . }. No caso especial em que r = 1, uma variavel aleatoria binomial negativa e
uma v.a. geometrica.
Exemplos:
1. Um casal deseja ter duas filhas mulheres. Encontre a distribuicao do n
umero de filhos que eles
precisam ter para atingir esta meta, sabendo-se que a cada concepcao a chance e a mesma para
qualquer dos dois sexos.
Solucao:
Chamando X a variavel n
umero de filhos para que sejam 2 mulheres, vemos que X BN (2; 0,5)
com x 2. Assim
x1
P (X = x) =
(1 p)x2 p2
x = 2,3, . . .
1
P(2) = 1 0,50 (0,5)2 = 0,25
2. Uma linha de producao em grande escala produz 6% de itens defeituosos. Retiramos sucessivamente amostras da producao ate que apareca o quarto item defeituoso. Qual a probabilidade de
que observemos pelo menos 30 itens?
63
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Solucao:
Se X e o n
umero de itens observados ate que apareca o quarto defeituoso entao X BN (4; 0,06) e
P(X 30) = 1 P(x < 30) = 1
29
X
x1
(0,94)x4 0,064 = 1 0,093143 = 0,906857
3
x=1
r
p
2 = V (X) =
r(1 p)
p2
Exemplos:
1. Quantos filhos em media o casal devera ter para ter duas filhas?
Solucao:
= E(X) =
2
0,5
=4
2. Qual o n
umero esperado de retiradas da linha de producao ate achar o quarto item defeituoso?
Solucao:
= E(X) =
4
0,06
= 66,7
A figura abaixo mostra alguns exemplos da distribuicao binomial negativa, para variacoes de p com r
fixo e para variacoes de r com p fixo:
Binomial Negativa (5; 0,2)
0,16
0,14
0,14
0,12
0,12
0,10
0,10
f(x)
f(x)
0,08
0,08
0,06
0,06
0,04
0,04
0,02
0,02
0,00
0,00
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
10
15
20
25
30
35
40
45
50
55
65
70
75
80
85
90
80
85
90
0,16
0,16
0,14
0,14
0,12
0,12
0,10
0,10
f(x)
f(x)
60
0,08
0,08
0,06
0,06
0,04
0,04
0,02
0,02
0,00
0,00
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
10
15
20
25
30
35
40
45
50
55
60
64
65
70
75
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
0,07
0,07
0,06
0,06
0,05
0,05
f(x)
f(x)
0,04
0,04
0,03
0,03
0,02
0,02
0,01
0,01
0,00
0,00
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
10
15
20
25
30
35
40
45
50
55
70
75
80
85
90
85
90
0,07
0,07
0,06
0,06
0,05
0,05
f(x)
f(x)
65
0,08
0,04
0,04
0,03
0,03
0,02
0,02
0,01
0,01
0,00
0,00
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
3.6.6
60
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
Distribui
c
ao hipergeom
etrica
Considere uma populacao formada por N objetos dos quais K sao do tipo A e N K do tipo B.
Suponha que uma amostra de tamanho n sera retirada, sem reposicao, desta populacao. Denote X a
variavel aleatoria que conta o n
umero de objetos tipo A na amostra.
Calculo da funcao de probabilidade de X: Em primeiro lugar, vemos que existem N
n formas de
K
escolher n objetos de uma populacao de N objetos. Existem x formas de escolhermos x elementos tipo
K
A de um grupo de K e Nnx
formas de escolher n x objetos tipo B de um total de (N K). Entao,
N k
pelo princpio da multiplicacao, existem K
x
nx formas de se escolher n objetos dos quais x do tipo A
e n x do tipo B. Temos entao:
umero de objetos do tipo A presentes em uma
Defini
c
ao 15. Uma variavel aleatoria X, que conta o n
amostra aleatoria de tamanho n retirada de uma populacao de tamanho N , contendo K objetos do tipo
A e N K objetos do tipo B; tem uma distribui
c
ao hipergeom
etrica, notacao X H(K,N,n) e
K
N K
x
nx
f (x) =
x = 0,1,2,...,n e max{0,n + K N } x mn{K,n}
N
n
As restricoes para o contradomnio de x se devem a:
Limite inferior: se amostra for maior que o n
umero de objetos tipo B, o menor valor de x sera
n (N K) = n + K N .
Limite superior: na amostra nao pode haver mais objetos tipo A que o total deles na populacao ou o
proprio tamanho da amostra.
65
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Exemplos:
1. Uma fabrica produz pecas que sao embaladas em caixas com 25 unidades. Para aceitar o lote recebido deste fabricante, o controle de qualidade de uma empresa faz o seguinte teste: sorteia uma
caixa do lote e desta caixa sorteia 5 pecas sem reposicao desta caixa. Se o n
umero maximo de defeituosas na amostra for 2 a empresa aceita o lote. Se a caixa sorteada contiver 4 pecas defeituosas,
qual a probabilidade do lote ser rejeitado?
Solucao:
Se X e o n
umero de pecas defeituosas na amostra, entao X H(4,25,5) e
4 21
4 21
4
21
4
X
3
2
4
1
x 5x
P(X > 2) =
= + = 0,015810 + 0,000395 = 0,016205
25
25
25
x=3
5
5
5
2. A sala tem 47 homens e 13 mulheres. Se quisermos formar aleatoriamente uma comissao de 6
pessoas, qual a probabilidade de metade serem mulheres?
Solucao:
13 47
3
3
P(X = 3) =
= 0,092631
60
6
M
edia e vari
ancia: Se uma variavel aleatoria tem distribuicao hipergeometrica, ou seja, se X
H(K,N,n) entao:
= E(X) = np
2 = V (X) = np(1 p)
N n
N 1
onde p = K/N
Exemplo:
Estima-se que na populacao de Belo Horizonte, de 2,5 milhoes de pessoas, 0,5% sejam hipertensos.
Uma pesquisa de um laboratorio sorteia 200 pessoas ao acaso na populacao, qual o n
umero esperado de
hipertensos entre os 200 sorteados?
Solucao:
Se X e o n
umero de hipertensos entre os 200 escolhidos, entao X H(12.500,2.500.000,200) e:
E(X) = 200
12.500
=1
2.500.000
Se compararmos uma variavel aleatoria hipergeometrica e uma binomial veremos que a media a
calculada da mesma forma e a variancia so difere pelo fator
N n
N 1
chamado de fator de corre
c
ao para popula
c
ao finita.
66
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
Este fator de correcao deve-se ao fato de que no experimento com distribuicao hipergeometrica a
amostragem e sem reposicao, isto e, a cada escolha a probabilidade de retirarmos um elemento do tipo
A se modifica, ao passo que no experimento binomial esta probabilidade e constante.
No entanto se n for muito pequeno em relacao a N esta correcao sera tao pequena que podemos
aproximar a distribuicao hipergeometrica pela binomial:
Veja no exemplo abaixo:
Se formos tirar uma amostra de 8 elementos de uma total de 10, a correcao sera 108
= 0,22. Se formos
9
retirar uma amostra de 8 elementos de uma populacao de 1000 o fator de correcao sera 10008
= 0,993.
999
Nesta circunstancia a distribuicao hipergeometrica com parametros K, N e n pode ser aproximada
por uma distribuicao binomial com parametros n e p = n/N .
Exemplo:
A populacao de um bairro e de 10.000 pessoas das quais 8.000 possuem televisao. Se escolhermos aleatoriamente uma amostra de 100 moradores, qual a probabilidade de que pelo menos 80 possuam televisao?
Solucao:
Seja X o n
umero de pessoas na amostra com televisao em casa. Entao X H(8.000,10.000,100) e a
probabilidade solicitada e:
8.000
2.000
100
X
x
100 x
P(X 80) =
10.000
x=80
100
Essa conta infindavel pode ser aproximada por uma variavel binomial com n = 100 e p = 8.000/10.000 =
0,8. A probabilidade solicitada e aproximadamente entao:
P(X 80) =
100
X
0,8x (1 0,8)100x
x=80
Com auxlio de computador achamos 0,4602 e 0,4598 para as duas probabilidades, valores muito
proximos um do outro. O grafico abaixo mostra a aproximacao da hipergeometrica pela binomial com os
dados do exemplo acima:
Comparao entre Hipergeomtrica e Binomial
0,10
0,08
H(8.000,10.000,100)
Bin(100;0,8)
f(x)
0,06
0,04
0,02
0,00
50
60
70
80
67
90
100
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
3.6.7
cpa/gsa
Distribui
c
ao de Poisson
Considere uma variavel aleatoria X com distribuicao binomial com parametros n e p. Quando n e
suficientemente grande e p suficientemente pequeno, defina = np, e a funcao de probabilidade de X
pode ser aproximada por
e k
com k = 0,1,2, . . .
P(X = k) =
k!
Esta e conhecida como funcao de probabilidade de Poisson. Notacao X P ()
Exemplos deste tipo de variavel aleatoria sao:
umero,
1. Na edicao de um texto, existe uma pequena probabilidade de se digitar um caracter (letra, n
etc) errado. Desde que existe um n
umero grande de caracteres em uma pagina de um livro, a funcao
de probabilidade do n
umero de erros em uma pagina segue uma distribuicao de Poisson.
2. Num jogo de futebol existem 30.480 de torcedores no estadio. Existe uma pequena probabilidade,
igual a 106 , de que uma pessoa sofra um acidente durante o jogo. Sob determinadas condicoes
podemos assumir que existe independencia no comportamento das pessoas dentro do estadio. Se
definirmos X : n
umero de pessoas que se acidentam durante o jogo, temos
X b(30.480,106 ) ou X P (0,03048)
e assim
P(X = k) =
e0,03048 0,03048k
k!
k = 0,1,2, . . .
2
X
e5 5x
x=0
x!
3.6. DISTRIBUIC
OES
DISCRETAS MAIS COMUNS
cpa/gsa
2. O n
umero medio de erros de datilografia em um livro e de 1,5 por pagina. Supondo que o modelo
de Poisson sirva para modelar este processo, ache a probabilidade de que em uma pagina escolhida
ao acaso existam:
(a) nenhum erro
(b) mais de dois erros
Solucao:
e1,5 1,50
= e1,5 = 0,2231
0!
P(X > 2) = 1 P (x 2) = 1 [0,2231 + 0,334695 + 0,251021] = 0,191153
P(X = 0) =
M
edia e vari
ancia: Desde que a distribuicao de Poisson aparece como uma aproximacao da distribuicao binomial, e de se esperar que a media seja igual a np = e a variancia seja igual a np(1 p) = .
Este resultado pode ser provado usando-se as correspondentes definicoes.
Um resultado importante envolvendo a distribuicao de Poisson: se o n
umero de ocorrencias de um
evento por unidade de tempo tem distribuicao de Poisson com parametro , entao o n
umero de ocorrencias
deste evento em um intervalo de tempo de comprimento t tem distribuicao de Poisson com parametro t..
Isto e, defina X : n
umero de ocorrencias de um evento por unidade de tempo e Xt : n
umero de
ocorrencias deste evento em um intervalo de tempo de comprimento t. Se X P (), entao Xt P (t).
A prova deste resultado foge ao alcance de nossa disciplina. (O leitor interessado pode ver, por exemplo,
em [4]).
Observacao: O termo tempo no paragrafo anterior e mais amplo do que tempo no sentido literal.
Isto e, podemos contar, por exemplo, o n
umero de buracos por km de estrada; n
umero de erros por pagina
de um livro, n
umero de irregularidades por m2 de tecido, etc.
Exemplo:
O n
umero de acessos `a pagina da UFMG na internet pode ser modelado como uma variavel aleatoria
de Poisson com um n
umero medio de 3 acessos por minuto. Calcule:
1. Probabilidade de que a pagina tenha 190 acessos em uma hora.
Solucao Se = 3 em um minuto, em uma hora = 60 3 = 180 entao
P(X = 190) =
e180 180190
= 0,022023
190!
2. N
umero esperado de acessos em 1 dia
Solucao Se = 3 em um minuto, em um dia = 60 3 24 = 4.320 e como = E(X) = = 4.320
69
3.7. EXERCICIOS
cpa/gsa
A figura abaixo mostra alguns exemplos da distribuicao de Poisson, para valores crescentes de
Poisson (2)
0,40
0,35
0,35
0,30
0,30
0,25
0,25
f(x)
f(x)
Poisson (1)
0,40
0,20
0,20
0,15
0,15
0,10
0,10
0,05
0,05
0,00
0,00
0
10
11
12
13
14
15
16
17
18
19
20
12
13
14
15
16
17
18
19
20
12
13
14
15
16
17
18
19
20
Poisson (10)
0,40
0,40
0,35
0,35
0,30
0,30
0,25
0,25
f(x)
f(x)
11
Poisson (5)
0,20
0,20
0,15
0,15
0,10
0,10
0,05
0,05
0,00
0,00
0
10
11
12
13
14
15
16
17
18
19
20
3.7
10
10
11
Exerccios
x = 1, 2, 3.
Calcule:
(a) P(X 1)
(b) P(X > 1)
(c) P(2 < X < 6)
(d) P(X 1 ou X > 1)
a
0
b
0
c
1,5
d
1,5
e
2
f
3
3.7. EXERCICIOS
cpa/gsa
2x + 1
,
25
x = 0, 1, 2, 3, 4.
Calcule:
(a) P(X = 4)
(b) P(X 1)
(c) P(2 X < 4)
(d) P(X > 10)
5. 6% das barras produzidas em grande escala nao suportam um peso de 350 kg. Da producao diaria
destas barras testam-se algumas ate encontrar a primeira a quebrar quando submetida a este peso.
(a) Calcule a probabilidade de termos que testar pelo menos 6 barras;
(b) Se as primeiras 4 barras nao quebraram, qual a probabilidade de termos que testar pelo menos
mais 3 ate que a primeira barra se quebre?.
6. Um voo tem capacidade para 175 passageiros. O gerente da empresa aerea sabe que apenas 92%
das pessoas que fazem reserva realmente viajam. Em funcao disto ele aceita 185 reservas para este
voo.
(a) Forneca uma expressao para a probabilidade de que todos os passageiros que comparecerem
ao embarque, tenham condicao de viajar;
(b) A probabilidade calculada pela expressao apresentada no item (a) e igual a 0,93162. De 10
voos realizados, qual a probabilidade de que em no maximo um deles algum(ns) passageiro(s)
que comparecem na hora de embarcar nao tenha(m) condicao de viajar?
(c) Quais sao as suposicoes que voce precisa fazer para abordar os itens (a) e (b)?
7. O n
umero de falhas por metro quadrado de um tecido e uma variavel aleatoria com distribuicao de
Poisson com media igual a 0,2.
(a) Qual a probabilidade de que uma peca de tecido de 10 metros quadrados de tecido tenha no
maximo 5 falhas?
(b) Se voce compra 100 pecas de tecido de 10 metros quadrados cada, qual a probabilidade, de
que no maximo 2 pecas tenham mais de 5 falhas?
71
3.7. EXERCICIOS
cpa/gsa
8. O n
umero de erros de digitacao em uma pagina de um livro e uma variavel aleatoria de Poisson
com parametro = 1. Encontre a probabilidade de que:
(a) Em uma pagina encontremos no maximo 2 erros.
(b) Em cinco paginas encontremos exatamente 5 erros.
9. A vari
avel aleatoria Y assume os valores {10, 2, 0, 5, y} com igual probabilidade.
(a) Qual o valor de y se E(Y ) = 0?
(b) Qual o desvio padrao da v.a. Y ?
10. Voce e o responsavel pela linha de producao de parafusos de uma metalurgia. A taxa nominal
de defeitos da linha de producao e de 2%. Para controlar a qualidade da linha, verificando se
efetivamente a taxa de defeitos esta dentro do previsto, voce quer comparar dois tipos de teste:
No primeiro voce retira aleatoriamente parafusos da linha de producao ate encontrar o primeiro
defeituoso. No segundo teste voce retira 30 parafusos da linha de producao e observa o n
umero de
parafusos defeituosos em sua amostra.
(a) No primeiro teste qual a probabilidade de voce retirar 20 parafusos?
(b) No segundo teste, qual a probabilidade de voce encontrar exatamente 3 defeituosos?
(c) Voce resolveu implantar o segundo teste, que passou a ser realizado todos os dias pela manha.
Se forem encontrados mais de 2 parafusos defeituosos a linha e parada e entra em manutencao.
Sabendo que a fabrica opera 7 dias por semana, qual a probabilidade de haver 2 paradas para
manutencao na mesma semana?
72
Captulo 4
Vari
aveis Aleat
orias Contnuas
4.1
Introduc
ao
Em diversos experimentos u
teis no nosso dia a dia, medidas de interesse como
corrente eletrica em um fio de cobre;
comprimento de uma peca usinada;
peso de uma viga de concreto;
tempo de falha de um componente eletronico;
podem ser representadas por variaveis aleatorias. O contradomnio destas variaveis aleatorias e um
intervalo (finito ou infinito) de n
umeros reais. Como o conjunto de valores possveis da variavel aleatoria
X e infinito nao enumeravel, este contradomnio pode ser pensado como um continuum, da o nome de
variaveis aleatorias contnuas.
4.2
Distribuic
oes de probabilidades e func
oes de densidade de
probabilidade
Consideremos a variavel X representando o comprimento das barras produzidas por uma empresa.
Se escolhemos 50 barras e medimos o comprimento destas barras podemos construir um histograma
e seu polgono de frequencia como o representado na figura 1a na proxima pagina. Se escolhemos
100, 200, 500, 1000 ou 5000 barras temos os histogramas com seus correspondentes polgonos de frequencia
representados nas figuras 1b a 1f .
Observemos que `a medida que aumentamos o tamanho da amostra, o polgonoR de frequencia torna-se
mais suave. Se fizermos n teremos uma funcao nao negativa f tal que f (x)dx = 1. Essa
funcao, f , obtida por construcao e chamada de funcao de densidade de probabilidade, ou simplesmente
densidade.
73
DE DENSIDADE
4.2. PROBABILIDADE: DISTRIBUIC
OES
E FUNC
AO
cpa/gsa
Histograma de X (n=100)
10
20
8
Frequncia
Frequncia
15
6
10
0
98,5
99,0
99,5
100,0
Comprimento em cm
100,5
101,0
98,5
99,0
99,5
100,0
100,5
Comprimento em cm
101,0
101,5
Fig 1b
Fig 1a
Histograma de X (n=200)
Histograma de X (n=500)
35
60
30
50
Frequncia
Frequncia
25
20
15
40
30
20
10
10
0
98,4
99,0
99,6
100,2
Comprimento em cm
100,8
101,4
98,55
99,00
99,45
99,90
100,35
100,80
Comprimento em cm
101,25
101,70
Fig 1d
Fig 1c
Histograma de X (n=5000)
Histograma de X (n=1000)
Normal
100
400
80
Frequncia
Frequncia
300
60
40
200
100
20
0
98,5
99,0
99,5
100,0
100,5
Comprimento em cm
101,0
101,5
102,0
98,5
99,0
Fig 1e
99,5
100,0
100,5
Comprimento em cm
101,0
101,5
102,0
Fig 1f
R
Desde que f (x)dx = 1, e muito natural definir a probabilidade de que X assuma valores no
intervalo [a,b] como a integral de f neste intervalo, isto e, definimos:
Z
P(a X b) =
f (x)dx.
a
74
DE DENSIDADE
4.2. PROBABILIDADE: DISTRIBUIC
OES
E FUNC
AO
cpa/gsa
Se fizermos a = b, teremos:
Z
f (x)dx = 0
P(X = a) = P(a X a) =
a R.
Isto e, se X e uma variavel aleatoria contnua a probabilidade de que ela assuma o valor a e zero,
para qualquer valor de a, n
umero real.
Como consequencia disto, temos que:
P(a X b) = P(X = a) + P(a < X b) = P(a < X b)
Analogamente podemos ver que:
P(a X b) = P(a X < b) = P(a < X < b)
Exemplos:
1. Seja a variavel aleatoria X a corrente em miliamp`eres em um fio de cobre. Suponha que o contradomnio de X e [0; 20] e a func
ao de densidade de probabilidade de X e f (X) = 0,05 para
0 X 20 conforme figura abaixo:
f(x)
15
20
Qual a probabilidade que uma medida na corrente seja menor do que 15mA?
Solucao:
Z
P(X < 15) =
15
f (x)dx =
0
75
15
DE DISTRIBUIC
ACUMULADA
4.3. FUNC
AO
AO
cpa/gsa
2. O diametro de um orifcio em uma placa metalica e influenciado por diversas alteracoes no processo
de perfuracao, podendo ser modelado por uma variavel aleatoria com densidade de probabilidade
f (x) = 20e20(x12,5) , x 12,5 mm.
f(x)
12,5
12,6
A tolerancia do comprador da placas e que o furo possa ter no maximo 12,6 mm. Qual a probabilidade de uma placa ser recusada pelo comprador?
Solucao:
Z
4.3
f (x)dx =
20e20(x12,5) dx = e20(x12,5)
= 0,135335
12,6
12,6
Func
ao de distribuic
ao acumulada
A funcao de distribuicao acumulada, `as vezes referida apenas como funcao de distribuicao, tambem
pode ser usada para descrever uma variavel aleatoria contnua.
Defini
c
ao 16. A fun
c
ao de distribui
c
ao cumulativa de uma variavel aleatoria contnua X avaliada
em a e definida por:
Z a
F (a) = P(X a) =
f (x)dx
para < x < .
Exemplos:
1. No exemplo 1 da secao anterior em que X era a corrente em miliamp`eres em um fio de cobre, calcule
a func
ao de distribuicao cumulativa de X.
Solucao:
Em primeiro lugar se x < 0, f (x) = 0, entao
F (x) = 0,
e
para x < 0
F (a) =
f (x)dx = 0,05x
para 0 x < 20
finalmente
Z
F (x) =
f (x)dx = 1
0
76
para x 20
4.4. MEDIA
E VARIANCIA
cpa/gsa
se x < 0,
0
0,05x se 0 x < 20.
F (x) =
1
se x 20.
20
2. Achar a funcao de distribuicao para a variavel aleatoria diametro do furono exemplo 2 da secao
anterior.
Solucao:
Temos inicialmente,
F (x) = 0,
e
20e20(x12,5) dx = 1 e20(x12,5)
F (a) =
para x 12,5
12,5
obtemos entao
F (x) =
0
1 e20(x12,5)
se x < 12,5,
se x 12,5.
O grafico de F (x) e:
F(x)
12,5
4.4
M
edia e vari
ancia
A media e variancia de uma variavel aleatoria contnua sao definidas de modo similar a uma variavel
aleatoria discreta, substituindo-se a soma pela integracao, assim
77
4.4. MEDIA
E VARIANCIA
cpa/gsa
Defini
c
ao 17. Suponha que X seja uma variavel aleatoria contnua com funcao de densidade de probabilidade f ().
A m
edia ou o valor esperado de X denotado por ou E(X), e
Z
= E(X) =
xf (x)dx
A vari
ancia de X denotada por 2 ou V (X), e
Z
Z
2
2
= V (x) =
(x ) f (x)dx =
x2 f (x)dx 2
E o desvio-padr
ao de X e = [V (X)]1/2 .
As propriedades da media e variancia sao similares `aquelas enunciadas no caso discreto.
Alem disso definimos outras medidas de posicao para variaveis aleatorias contnuas como:
Mediana: a mediana e o valor md que tem a propriedade
P(X md) = 0,5 e P(X md) = 0,5
Moda: a moda e o valor mo tal que
f (mo) = max f (x)
x
Primeiro e terceiro quartis: Sao respectivamente os valores xq1 e xq3 tais que:
P(X xq1 ) = 0,25
quantil xq : P(X xq ) = q
Exemplos:
1. Qual a media, variancia e mediana da v.a. X do exemplo da medida de corrente no fio de cobre?
Solucao:
Z
0,05x2 20
= 10
2
0
0
Z 20
0,05(x 10)3 20
50 50
+
= 33,33
2 = V (X) =
(x 10)2 f (x)dx =
=
3
3
3
0
0
Z md
md
0,5
20
xf (x)dx =
Neste caso como a funcao de densidade e simetrica em torno de 10, a media e mediana sao iguais.
78
4.4. MEDIA
E VARIANCIA
cpa/gsa
= E(X) =
x20e20(x12,5)
xf (x)dx =
12,5
12,5
dv = 20e20(x12,5)
v = e20(x12,5) , temos
Z
+
e20(x12,5) dx
= E(X) = xe20(x12,5)
Se fizermos u = x
du = dx
12,5
20(x12,5)
12,5
20
12,5
= 12,5 + 0,05 = 12,55
= 12,5
V (X) =
12,5
md
md
12,5
f (x) =
1 x
40 ( 10
+ 1)
se 0 x 20,
caso contrario.
Solucoes
O grafico da funcao e:
f(x)
3/40
1/40
0
10
20
79
UNIFORME CONTINUA
4.5. DISTRIBUIC
AO
cpa/gsa
(a) Para checar se e funcao de densidade, observemos primeiro que f (x) 0. Resta checar que
R 20
f (x)dx = 1.
0
Z
20
0
1 x
x2
x 20
400 20
+ 1 dx =
+ =
+
=1
40 10
800 40 0
800 40
x2
x 8
64
8
1 x
+ 1 dx =
+ =
+
= 0,08 + 0,20 = 0,28
P(X 8) =
40
10
800
40
800
40
0
0
(c) Para calcularmos as medidas solicitadas
Z 20
Z 20
x x
x3
x2 20
8000 400
= E(X) =
xf (x) =
+ 1 dx =
+ =
+
= 6,67+5 = 11,67
40
10
1200
80
1200 80
0
0
0
Z md
x2
x md
1 x
+ 1 dx = 0,5
+ = 0,5 (md)2 + 20(md) 400 = 0 md 12,36
40 10
800 40 0
0
Z 20
2 = V (X) =
(x )2 f (x) = E(X 2 ) [E(X)2 ]
Z
20
E(X 2 ) =
Z
x2 f (x) =
0
20
x x
x4
x3 20
160000 8000
+ 1 dx =
+
+
= 266,67
=
40 10
1600 120 0
1600
120
2
4.5
Distribuic
ao uniforme contnua
.
A distribuicao contnua uniforme e a mais simples, e analoga `a sua correspondente discreta
Defini
c
ao 18. Dizemos que uma variavel aleatoria contnua X tem distribuicao uniforme no intervalo
[a,b] se:
1
f (x) =
,
a x b.
(b a)
Notacao X U [a, b].
Podemos deduzir:
Z b
x
x2 b
a2
b2 a2
(b a)(a + b)
a+b
b2
= E(X) =
dx =
=
=
=
=
2(b a) a
2(b a) 2(b a)
2(b a)
2(b a)
2
a ba
e
Z
E(X 2 ) =
a
x3 b
a2 + ab + b2
b3 a3
x2
dx =
=
=
ba
3(b a) a
3(b a)
3
e portanto
2
a2 + ab + b2
a+b
4a2 + 4ab + 4b2 3a2 3b2 6ab
a2 2ab + b2
(b a)2
V (X) =
=
=
=
3
2
12
12
12
80
UNIFORME CONTINUA
4.5. DISTRIBUIC
AO
cpa/gsa
Em resumo temos:
A media e a variancia de uma variavel aleatoria contnua uniforme X sobre [a,b] sao:
= E(X) =
(a + b)
2
2 = V (X) =
(b a)2
12
1/(b-a)
Para obtermos a funcao de distribuicao da v.a. contnua uniforme, vemos que se a < x < b vale:
Z x
1
x x
x
a
F (x) =
dx =
=
(b a) a
(b a) (b a)
a ba
Assim a descricao completa de F e:
se x < a,
0
(x a)/(b a) se a x b,
F (x) =
1
se x > b.
F (x) esta representada na figura abaixo:
F(x)
1
Exemplo:
Para testar a resistencia de tubos de PVC tecnicos submetem os mesmos a grandes pressoes ate que
apareca o primeiro vazamento. Sabendo que os tubos possuem 6 m de comprimento e que o vazamento
tem probabilidade igual de ocorrer em intervalos de comprimento iguais, qual a probabilidade de que o
vazamento ocorra a no maximo 1 metro de uma das extremidades?
Solucao:
Se chamarmos X a variavel aleatoria que indica a distancia do vazamento a uma das extremidades
do tubo, vemos que X U [0,6], e a funcao de densidade de X e
1/6 se 0 x 6,
f (x) =
0
caso contrario.
81
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
A probabilidadde de que o vazamento esteja no maximo a um metro das extremidades pode ser escrita
como:
Z 1
Z 6
1
1
x 1 x 6
1
6 5
1
P(0 x 1) + P(5 x 6) =
dx +
dx = + = 0 + =
6 0 6 5
6
6 6
3
0 6
5 6
4.6
Distribuic
ao normal
A distribuicao normal e uma das distribuicoes mais importantes na estatstica. Esta distribuicao
descreve o comportamento de diversas variaveis aleatorias contnuas e tambem e u
til para aproximar a
distribuicao de diversas variaveis aleatorias discretas.
Diversos histogramas possuem formas similares `a forma da distribuicao normal. Toda vez que se
replica um experimento aleatorio, a variavel aleatoria que for igual ao resultado medio (ou total) das
replicas tendera a ter uma distribuicao normal, `a medida que o n
umero de repeticoes for se tornando
grande.
Outro exemplo da importancia da distribuicao normal e visto no seguinte exemplo: o erro no comprimento de uma peca usinada e uma soma de um grande n
umero de erros infinitesimais. Efeitos como
variacoes na temperatura e na umidade, vibracoes, mudancas no angulo de corte, desgates na ferramenta
de corte e nos mancais do torno, variacoes na velocidade de rotacao, variacoes na montagem e fixacao,
variacoes em in
umeras caractersticas da materia prima, diferentes nveis de contaminacao. Se cada componente produzir um erro de forma independente, em muitos casos pode-se demonstrar que o erro total
tem distribuicao normal.
Alem disso encontramos a distribuicao normal no estudo de diversos fenomenos fsicos basicos.
A figura abaixo mostra o histograma da variavel altura da tabela estudada em 1.2.2, com uma distribuicao normal ajustada aos dados.
82
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
Definimos entao:
Defini
c
ao 19. Uma variavel aleatoria X, com funcao de densidade de probabilidade
f (x) =
(x)2
1
e 22 ,
2
< x < ;
Normal; Mdia=0
Normal
0,14
0,4
Varincia
1
4
0,3
0,10
Densidade
Densidade
Mdia Varincia
5
9
10
16
0,12
0,2
0,08
0,06
0,04
0,1
0,02
0,0
0,00
-5,0
-2,5
0,0
2,5
5,0
7,5
-5
10
X
15
20
25
X
1
= X + ( )
.
Usando a propriedade 3 acima, vemos que Y N (0,1). A variavel Z e conhecida como normal
padr
ao e sua funcao densidade, representada por e:
1 2
1
(z) = e 2 z ,
2
<z <
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
4.6.1
lim f (x) = 0
x+
C
alculo de probabilidade
Densidade
0,25
0,20
0,15
0,10
0,05
0,00
a
X
b
a
b
=P
Z
b
a
=P Z
P Z <
P(a X b) = P
b
a
b
a
P Z
P Z
=
84
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
Exemplo:
Suponha que X N (100; 1,2). Calcule a P(98,3 X 101,4)
Solucao:
98,3 100
X
101,4 100
P(98,3 X 101,4) = P
1,2
1,2
= P(1,55 Z 1,28)
= P(Z 1,28) P(Z 1,55)
Alguns resultados u
teis, relativos `a distribuicao normal, sao sumarizados na figura a seguir:
f(x)
:3F
:2F
:F
:+F
:+2F
:+3F
68%
95%
99,7%
A seguir apresentamos alguns exerccios para auxiliar na pratica de utilizacao da tabela da Normal
Padrao (X N (0,1)):
f(x)
P(0 Z 1) = 0,341345
P(0 Z 2,13) = 0,483414
Se P(0 Z zc ) = 0,45
entao zc = 1,64 ou 1,65
Se P(0 Z zc ) = 0,49
Zc
entao zc = 2,33
85
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
f(x)
e zc = 1,04
Zc
f(x)
P(1 Z 0,5)
= P(1 Z 0) P(0,5 Z 0)
.
= P(0 Z 1) P(0 Z 0,5)
= 0,341345 0191462 = 0,149883
Z1 Z2 0
f(x)
ZC
4
X
>
P(X > 4) = P
43
=P Z>
0,5
86
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
2. Se X N (2,9) calcule
(a) P(X 4)
Solucao:
P(X 4) = P
X
42
P(X 0) = P
X
02
= P(Z 0,6667)
= 1 P(Z 0,6667) = 1 0,748571 = 0,2514
(d) P(0 < X < 4)
Solucao:
02
42
<z<
3
3
32
42
<Z<
3
3
87
a
2 )
a = (1,64 3) + 2 = 6,92
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
3. Em uma prova, a nota media foi 74 e o desvio padrao foi 7. Se 12% da turma obteve conceito A, e
as notas possuem distribuicao normal, qual a menor nota da faixa A e a maior da B?
Solucao:
x 74
Temos que calcular o valor de x tal que P(X > x) = 0,12 que e o mesmo que P Z >
= 0,12
7
Pela tabela vemos que este valor e 1,175, assim resolvemos:
x 74
= 1,175
7
x = (1,175 7) + 74 = 82,225
4.6.2
Aproxima
c
oes das distribuico
es binomial e de Poisson pela normal
Em diversos sistemas fsicos aparecem variaveis aleatorias com distribuicao binomial com valores de
n muito altos, tornando os calculos de probabilidade extremamente difceis mesmo para calculadoras e
computadores comuns. Nestes casos e conveniente utilizar a aproximacao da distribuicao binomial pela
normal. Veja a figura abaixo: a area de cada barra e igual `a probabilidade binomial de x que pode ser
aproximada pela area sob a funcao de densidade normal:
0,16
Distribuio n p
Binomial
30 0,5
0,14
0,12
f(x)
0,10
0,08
0,06
0,04
0,02
0,00
5
10
15
X
20
25
f(x)
0,06
0,05
0,04
0,03
0,02
0,01
0,00
30
40
50
X
88
60
70
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
V (X) = np(1 p)
entao usaremos para aproximar a distribuicao desta variavel uma distribuicao normal com media
= np e variancia 2 = np(1 p).
Exemplo:
Em um canal digital de comunicacao o n
umero de bits recebidos com erro e uma variavel aleatoria
binomial com probabilidade 110 5. Se 16 milhoes de bits forem transmitidos, qual sera a probabilidade
de se ter mais de 150 erros?
Solucao:
Como X Binomial(16.000.000; 1 10 5) temos
P(X > 150) =1 P(X 150)
150
X
16.000.000
=1
(105 )x (1 105 )16.000.000x
x
x=0
Como este e um calculo difcil, usamos a aproximacao por uma normal com
p
= np = 16.000.000 105 = 160 e = 160(1 105 ).
Usando a padronizacao podemos calcular:
X 160
160(1 105 )
>p
150 160
160(1 105 )
Cabe ressaltar que a distribuicao binomial so e simetrica para p = 0,5, e portanto a aproximacao pela
`
normal sera uma boa aproximacao para valores de p proximos a 0,5 com n suficientemente grande. A
medida que n aumenta a aproximacao vai melhorando mesmo para p nao proximos de 0,5
Tambem uma variavel aleatoria de Poisson pode ser aproximada pela distribuicao normal. Assim:
Se X for uma variavel aleatoria de Poisson com E(X) = e V (X) = entao
Z=
e aproximadamente uma variavel aleatoria normal padrao para valores de suficientemente grandes.
Exemplo:
O n
umero de veculos que entram por minuto no campus da UFMG pela portaria da Av. Ant
onio
Carlos tem distribuicao de Poisson com = 10. Calcule a probabilidade aproximada de que em uma
89
NORMAL
4.6. DISTRIBUIC
AO
cpa/gsa
X 600
650 600
50
P(X 650) P
P Z
= P(Z 2,04) = 0,9793325
24,495
600
600
A probabildade exata e:
P(X 650) =
650 600
X
e
600x
x!
x=0
= 0,979346
Alguns autores sugerem no caso binomial usar a aproximacao normal se np 5 e no caso da Poisson
quando > 15. Essas sugestoes foram dadas em epocas em que os recursos computacionais eram escassos
ou limitados. Atualmente essas sugestoes nao precisam ser seguidas pois , por exemplo, quaiquer pacotes
estatsticos assim como planilhas eletronicas calculam probabilidades envolvendo a variavel aleatoria de
Poisson com > 15.
Afigura abaixo ilustra a aproximacao de uma distribuicao de Poisson com = 15 por uma normal
(15, 15). Esta aproximacao melhora `a medida que aumenta.
Distribuio Lambda
Poisson
15
0,10
f(x)
0,08
0,06
0,04
0,02
0,00
0
10
15
X
20
25
30
Exemplo:
Considere que o n
umero de bacterias em 1 cm3 de esgoto recebido por determinada estacao de tratamento tenha distribuicao Poisson com media de 700. Se analisarmos 1 cm3 qual a probabilidade de que
menos de 750 bacterias sejam encontradas?
Solucao:
A probabilidade exata e:
P(X 750) =
750 700
X
e
700x
x=0
90
x!
EXPONENCIAL
4.7. DISTRIBUIC
AO
cpa/gsa
750 700
P(X 750) = P Z
= P(Z 1,89) = 0,970621
700
O resultado exato da Poisson obtido pelo Minitab e 0,970799.
4.7
Distribuic
ao exponencial
ey (y)0
= ey
0!
Observe que Y > y se e somente se o evento nao ocorreu ate o instante y; ou seja Xy = 0.
E assim
P(Y y) = F (y) =
0
1 ey
se y 0,
se y > 0.
Uma variavel aleatoria com essa funcao de distribuicao e dita ter distribuicao exponencial com
parametro . Notacao X exp(). A funcao de densidade e dada por:
f (x) = ex
x>0
Pode-se provar que o tempo entre duas ocorrencias consecutivas tem tambem distribuicao exponencial
com o mesmo parametro .
Observacao: Alguns textos usam a representacao
1 1x
se x > 0,
e
f (x) =
0
caso contrario.
Se a variavel aleatoria X tem distribuicao exponencial com parametro entao:
E(X) =
91
V (X) =
1
2
EXPONENCIAL
4.7. DISTRIBUIC
AO
cpa/gsa
A figura abaixo mostra a densidade de uma variavel exponencial para alguns valores de
0,5
Valores de
2
0,4
f(x)
0,3
0,5
0,2
0,1
0,1
0,05
0
Exemplos:
1. Suponha que a duracao de certo equipamento eletronico tenha distribuicao exponencial (em horas)
com taxa = 0,001. Calcule:
(a) A probabilidade de o equipamento dure pelo menos 2.000 horas.
Solucao:
Se X Exp(0,001) entao
Z
0,001e0,001x dx
P(X 2000) =
2000
2000
=1
0,001e0,001x dx
2000
= 1 + e0,001x
= 1 + e2 1 = e2 = 0,1353
0
md
f (x)dx = 0,5
0
md
1
= 1.000 horas.
0,001e0,001x dx = 0,5
92
md
e0,001x 0
EXPONENCIAL
4.7. DISTRIBUIC
AO
cpa/gsa
resolvendo a equacao:
1 e0,001md = 0,5
e0,001md = 0,5
ln(e0,001md ) = ln(0,5)
0,001md = ln(2)
0,69315
md =
= 693,15 horas
0,001
2. O tempo entre acessos a determinado servidor da web (em segundos) tem distribuicao exponencial
com parametro 2.
(a) Ache a media e o desvio padrao do tempo entre acessos.
Solucao:
0,5
0,5
2e2x dx = e2x 0 = 1 e1 = 0,6321
Defini
c
ao 20. Propriedade de Falta de Mem
oria
Para uma variavel aleatoria exponencial X, e t1 e t2 > 0
P(X > t1 + t2 , X > t1 )
P(X > t1 )
P(X > t1 + t2 )
=
P(X > t1 )
e(t1 +t2 )
et1
t2
=e
= P(X > t2 )
=
93
4.8. DISTRIBUIC
OES
DE ERLANG E GAMMA
4.8
4.8.1
cpa/gsa
Distribuic
oes de Erlang e Gamma
Distribui
c
ao de Erlang
Como vimos na secao anterior a variavel aleatoria exponencial mede o tempo ate a primeira
ocorrencia de um processo de Poisson. Uma generalizacao desta distribuicao e aquela variavel aleatoria
que mede o tempo ate a r-esima ocorrencia deste evento. Definimos entao:
Defini
c
ao 21. A variavel aleatoria X, que e igual ao comprimento do intervalo de tempo ate que r
ocorrencias de um processo de Poisson com media > 0 acontecam tem uma distribui
c
ao de Erlang
com parametros e r. A funcao de densidade de probabilidade de X e:
f (x) =
r xr1 ex
,
(r 1)!
com x > 0 e r = 1, 2, . . .
A deducao dessa funcao de densidade escaa ao alcance da disciplina, o leitor interessado pode consultas, por exemplo, [8].
A media e variancia de uma variavel aleatoria de Erlang com parametros lambda e r sao:
= E(X) =
4.8.2
2 = V (X) =
r
2
Distribui
c
ao Gamma
r xr1 ex
,
(r)
94
2 = V (X) =
r
2
DE WEIBULL
4.9. DISTRIBUIC
AO
cpa/gsa
A figura abaixo mostra a funcao de densidade de uma variavel aleatoria Gama para alguns parametros
r e :
1
1
1
8,3
2
7,5 3,75
0,8
0,6
0,4
0,2
0
0
10
12
Veremos oportunamente um caso especial da distribuicao Gama, em que o parametro = 1/2 e r igual
a distribuicao Qui-quadrado, usada com frequencia na estimacao
a um dos valores 1/2, 1, 3/2, 2, . . . . E
por intervalos e testes de hipoteses, que serao estudados nos proximos captulos.
4.9
Distribuic
ao de Weibull
A distribuicao de Weibull e usada para modelar o tempo ate uma falha de muitos sistemas fsicos
diferentes. Os parametros da distribuicao sao flexveis e servem para modelar sistemas em que o n
umero
de falhas aumenta com o tempo, diminui com o tempo ou permanece constante.
Defini
c
ao 22. A variavel aleatoria X com funcao de probabilidade
f (x) =
x 1 (x/)
e
para x > 0
F (x) =
0
x
1 e( )
95
se x 0,
se x > 0.
LOGNORMAL
4.10. DISTRIBUIC
AO
cpa/gsa
A flexibilidade da distribuicao Weibull pode ser atestada pelos graficos das funcoes de densidade
mostrados na figura abaixo.
1
1,0
1,0
3,4
2,0
0,8
6,2
11,5
19,0
2
f(x)
0,6
4,5
0,4
0,2
0
0
10
12
4.10
Distribuic
ao Lognormal
Outra distribuicao que aparece com frequencia na analise de experimentos de analise de falhas, confiabilidade e analise de sobrevivencia, e a distribuicao Lognormal.
Registramos a seguir a densidade, media e variancia da variavel aleatoria com distribuicao Lognormal,
com parametros de locacao e escala respectivamente e 2 , alem de ilustrarmos com o grafico de f (x)
para alguns valores de 2 :
(ln(x))2
1
f (x) =
e 22 ,
x 2 2
0 < x < ;
E(X) = e+(
/2)
2
V (X) = e 1 e2+ .
0,6
0,5
f(x)
0,4
s
2
1,0
0,500
1,0
0,250
1,0
0,125
1,0
5,000
0,3
0,2
0,1
0
0
96
10
12
4.11. EXERCICIOS
4.11
cpa/gsa
Exerccios
1. Uma empresa de construcao dispoe de 200 operarios para trabalhar nas suas obras. De acordo
com historico da empresa, 1% destes operarios faltam ao servico. A empresa enfrentara serias
dificuldades se mais de 4 operarios faltarem ao servico em um determinado dia.
(a) Forneca uma expressao para a probabilidade de que em um dia determinado a empresa enfrente
serias dificuldades. Aproxime convenientemente esta probabilidade;
(b) Calcule a probabilidade de que em 10 dias, a empresa nao tenha serias dificuldades em pelo
menos 8 deles. Que suposicao e necessario assumir neste item?
2. As notas de uma prova de um concurso nacional se distribuem de acordo a uma normal com media
igual a 120,6 e desvio padrao igual 5,8.
(a) Qual a probabilidade de que a nota de um estudante esteja entre 112,5 e 126,5?
(b) Se 65 candidatos sao escolhidos ao acaso, aproxime a probabilidade de que pelo menos 50 deles
tenham nota entre 112,5 e 126,5;
(c) Qual sera a nota mnima aprovatoria se 25% dos candidatos serao admitidos?.
3. O tempo, em horas, que uma equipe leva para realizar um tipo de tarefa tem distribuicao exponencial
com media igual a 200 horas.
(a) Qual a probabilidade de que a proxima tarefa deste tipo seja executada em menos de 150
horas?
(b) Se 10 equipes igualmente eficientes realizam, cada uma, uma destas tarefas, qual a probabilidade de que no maximo uma equipe leve mais de 150 horas para completa-la?
4. O tempo de vida, em anos, de certo tipo de equipamento tem distribuicao de Weibull com parametro
de forma = 2,274 e parametro de escala = 4,391.
(a) Se o tempo de garantia destes aparelhos e de 18 meses, qual a probabilidade de que um
aparelho, escolhido ao acaso, atenda `a garantia?
(b) Qual deve ser o tempo de garantia se quisermos que 90% dos aparelhos atendam esta garantia?.
5. O tempo, em minutos, de utilizacao de um caixa eletronico por clientes de um certo banco, foi
modelado por uma vari
avel T com densidade Exponencial(5). Calcule:
(a) P(T < 2);
(b) P(T 5|T > 3);
(c) Um n
umero a tal que P(T a) = 0,8. Qual o valor e a interpretacao de a?
6. O peso contido em pacotes de arroz tem distribuicao normal com media igual a 5.000 gramas e
variancia igual a 1600 gramas2
97
4.11. EXERCICIOS
cpa/gsa
a-) Qual a probabilidade de que um pacote contenha peso entre 4.944 e 5.056 gramas?
b-) Se 15 pacotes sao escolhidos ao acaso, qual a probabilidade de que no maximo dois deles
contenham peso fora dos limites dados em (a)?
c-) Se 150 pacotes sao escolhidos ao acaso, aproxime a probabilidade de que no mnimo 15 desses
pacotes e no maximo 30 contenham peso fora dos limites em (a).
7. O peso de ruptura de certo tipo de barras tem distribuicao normal. Mediu-se o peso de ruptura 16
dessas barras, encontrando-se uma media de x
= 289,2 kg e uma variancia amostral S = 18,49 kg 2 .
(a) Encontre um intervalo de 90% de confianca para a media do peso de ruptura dessas barras.
(b) Teste, ao nvel = 0,01, H0 : = 300 contra H1 : 6= 300.
(c) Teste, ao nvel = 0,05, H0 : 2 = 15 contra H1 : 2 6= 15.
8. Voce fabrica vergalhoes de aco para construcao cuja resistencia `a tracao e uma variavel aleatoria
normal com media 5.000 kg/cm2 e variancia 400 kg 2 /cm4 .
(a) Qual a probabilidade da resistencia da barra ficar entre 4.974 e 5.026kg/cm2 ?
(b) Qual o valor (r) da resistencia , se 95% das barras produzidas possuem resistencia maior que
(r)?
(c) Qual o percentual de barras produzidas com resistencia menor ou igual a 5.031 kg/cm2 ?
9. Voce esta submetendo corpos de prova de concreto, cuja resistencia `a compressao e uma vari
avel
aleatoria normal com media 400 kg/cm2 e variancia 25 kg 2 /cm4 , a testes de ruptura.
(a) Qual a probabilidade da resistencia do corpo de prova ficar entre 390 e 405kg/cm2 ?
(b) Qual o valor (r) da resistencia , se 95% dos corpos de prova apresentarem resistencia maior
que (r)?
(c) Qual o percentual de corpos de prova com resistencia menor ou igual a 405,4 kg/cm2 ?
10. O tempo de vida de um certo tipo de oleo isolante tem distribuicao Exponencial com parametro
= 0,2 anos.
(a) Se o fabricante desse equipamentos deseja oferecer uma garantia de tal forma que o tempo de
vida de 80% do oleo vendido ultrapasse o tempo de garantia, qual deve ser esse tempo?
(b) Se uma partida de oleo atendeu o tempo de garantia, qual a probabilidade que ele dure por
mais um ano?
11. Um estudante de pos-graduacao esta submetendo sua dissertacao para correcao de um revisor que
cobra R$0,50 por cada erro de digitacao encontrado. Sabendo-se que o n
umero de erros por pagina
e uma variavel de Poisson com parametro = 0,5; responda:
(a) Se a tese tem 100 paginas, indique a probabilidade do custo de revisao ser no maximo R$20,00?
(b) Qual e aproximadamente a probabilidade de que o custo de revisao seja no maximo R$20,00?
98
Captulo 5
Infer
encia
5.1
Infer
encia estatstica
Nesse u
ltimo captulo abordaremos os conceitos fundamentais de Inferencia. No captulo 1 descrevemos e representamos graficamente amostras obtidas de uma popula
c
ao. Nesse captulo mostraremos
como usar a informacao obtida a partir da amostra para inferir sobre a populacao. Infelizmente, ao
fazer inferencia estamos sujeitos a erros. Uma forma de medirmos esses erros e usando ferramentas de
probabilidade, algumas das quais vistas no captulo 2.
A Inferencia Estatstica pode ser dividida em duas partes: estima
c
ao de par
ametros, apresentada
na secao 5.3 e testes de hip
oteses, que serao estudados na secao 5.4.
Imagine que um engenheiro de estruturas esteja analisando a resistencia `a compressao do concreto
usado em uma obra. Esta resistencia sofre variacoes devidas a diferencas nas materias primas, erros de
dosagem, mudancas na forma de concretagem, etc. e portanto o engenheiro esta interessado em estabelecer a resistencia media. Na pratica ele ira usar corpos de prova (amostras) para calcular um n
umero
que seja um valor razoavel para a media verdadeira. Este n
umero e chamado de estimativa.
Considere agora que dois tipos de cimento c1 e c2 possam ser usados para preparacao do concreto. O
engenheiro conjectura que o cimento c1 resulta em uma mistura com maior resistencia do que a obtida
com o cimento c2 . O teste de hip
oteses estatsticas resolve problemas deste tipo. Neste caso a
hipotese seria que a resistencia media do concreto usando o cimento c1 seria maior que a do concreto
obtido com o cimento c2 .
5.2
Amostragem aleat
oria
Suponhamos que estamos produzindo parafusos e estes parafusos devem cumprir certas especificacoes
para serem aceitos no mercado. Estas exigencias implicam em que = 10 cm e = 0,2 cm, onde e
sao respectivamente a media e o desvio padrao da variavel aleatoria X = comprimento do parafuso
que estamos produzindo. Se atendermos `as especificacoes acreditamos que 95% de nossa producao sera
aceita no mercado. Nossa primeira tarefa sera fazer uma producao piloto, retirar uma amostra de ta n e Sn . Se estes valores ficarem perto de 10 e 0,2 respectivamente, temos
manho n dela, e calcular X
indcio de que podemos comecar a produzir em grande escala. Uma segunda tarefa sera achar duas
n ,n ) e S(X
n ,n ) tais que P(L(X
n ,n ) X S(X
n ,n )) = 0,95. Dependendo dos valores
funcoes L(X
de L e S nossa linha de producao sera liberada ou tera que ser submetida a algumas calibracoes adicionais.
99
5.2. AMOSTRAGEM ALEATORIA
cpa/gsa
Suponhamos finalmente que, depois de certo tempo de producao, verificamos que mais de 5% da nossa
producao nao esta sendo aceita no mercado. Um primeiro motivo da rejeicao de nosso produto poderia
ser o fato de que a media deixou de ser 10. Se um comprador devolveu uma caixa de parafusos, porque X
encontrada naquela caixa foi menor que 10, entao poderamos acreditar que precisamos reajustar nossa
linha de producao para recuperar = 10; mas faramos isto depois de verificar mediante um teste de
hipotesesa afirmacao do nosso comprador.
Podemos agora definir:
Defini
c
ao 23. Seja X uma variavel aleatoria com funcao de densidade (f.d.p.) fX (x; ). Sejam
X1 ,X2 , . . . ,Xn observacoes independentes de X. Dizemos entao que X1 ,X2 , . . . ,Xn e uma amostra
aleat
oria de tamanho n da variavel X.
Seja X uma variavel aleatoria com funcao de densidade f (). Se X1 ,X2 , . . . ,Xn e uma amostra aleatoria
de X, estabelecemos, sem prova, que a funcao de densidade conjunta do vetor X = (X1 ,X2 , . . . ,Xn )
avaliado no ponto (x1 ,x2 , . . . ,xn ) e dada por
f (X1 ,X2 , . . . ,Xn ) = f (x1 )f (x2 ) . . . f (xn )
Se a densidade depende de um parametro , denotaremos
f (X1 ,X2 , . . . ,Xn ; ) = f (x1 ; )f (x2 ; ) . . . f (xn ; )
Exemplo:
Supondo que X N (, 2 ), isto e, X tem distribuicao normal com media e variancia 2 e seja
X1 ,X2 , . . . ,Xn uma amostra aleatoria de X; entao a densidade conjunta avaliada no ponto (x1 ,x2 , . . . ,xn )
e dada por:
1 (x1 )2
1 (x2 )2
1 (xn )2
2
2
1
1
1
2
2
2
ou
n
e
Pn
i=1 (xi
2
1
2
)2
Chamamos a atencao para a diferenca entre uma amostra (x1 ,x2 , . . . ,xn ) como definido no captulo
1 e uma amostra aleat
oria X1 ,X2 , . . . ,Xn . Para ilustrar esta diferenca, imaginemos que estamos investigando o comprimento dos parafusos citados no paragrafo anterior. Entao X1 ,X2 , . . . ,Xn sao variaveis
aleatorias independentes representando o comprimento dos parafusos antes da medicao efetiva. Depois
de fazermos as medicoes teremos X1 = x1 , X2 = x2 , . . . , Xn = xn ; resumindo, amostra e a realizacao de
uma amostra aleatoria.
A finalidade principal de se tomar uma amostra aleatoria e obter informacoes sobre os parametros
desconhecidos da populacao. Para isto usamos estatsticas.
100
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Defini
c
ao 24. Uma estatstica e qualquer funcao das observacoes em uma amostra aleatoria.
Ja vimos o conceito de estatstica anteriormente. Se X1 ,X2 , . . . ,Xn for uma amostra aleatoria
a variancia da amostra S 2 , a amplitude da amostra
de tamanho n, entao a media da amostra X,
[max(X1 ,X2 , . . . ,Xn ) min(X1 ,X2 , . . . ,Xn )] sao exemplos de estatsticas.
Uma das principais aplicacoes da estatstica e obtencao de estimativas para parametros da populacao
(tais como media, variancia, proporcao, etc.). Normalmente usa-se a letra grega para representar o
parametro que se quer estimar.
Em geral, se X for uma variavel aleatoria com distribuicao de probabilidades f (x), caracterizada por
um parametro desconhecido e se X1 ,X2 , . . . ,Xn for uma amostra aleatoria de tamanho n de X, entao
a estatstica = h(X1 ,X2 , . . . ,Xn ) e chamada de um estimador de .
Exemplo:
Suponha que vamos colher uma amostra de tamanho n, denotada por X1 ,X2 , . . . ,Xn . Suponha que
desejamos estimar a media populacional (ou seja o parametro que se quer estimar e ).
Sao estimadores possveis para :
X1 + X2
1. =
2
= X1 + X2 + + Xn
2. = X
n
Xmax + Xmin
3. =
2
4. = X1
Note que e funcao de variaveis aleatorias, sendo portanto tambem uma variavel aleatoria. Depois
de selecionarmos uma amostra aleatoria, o estimador assume um valor numerico particular para aquela
X1 + X2
amostra, chamado de estimativa. Assim se o estimador escolhido for =
, uma estimativa
2
x
+
x
1
2
.
seria =
2
5.3
5.3.1
Estimac
ao de par
ametros
Estima
c
ao pontual
Seja X uma variavel aleatoria com funcao de (densidade de) probabilidade cuja forma funcional e
conhecida, mas dependendo de um parametro que pode assumir valores num conjunto parametrico
(espaco parametrico). pode ser unidimensional ou p-dimensional. Neste caso entao nao estamos perante
uma funcao de probabilidade, mas perante a uma classe de funcoes de probabilidade. A cada valor de
corresponde um elemento da classe.
Como exemplo, pensemos na classe de Distribuicoes Normais com media e variancia 1. Para cada
valor de R teremos uma distribuicao da classe:
(x)2
1
e 2
com < x < , = ( : < < )
1 = f (x; ,1) =
101
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
!
1 x 2
2 = f (x; , 2 ) =
e 2
com < x <
Estimador
A media de uma u
nica populacao
A variancia 2 de uma u
nica populac
ao
A proporcao p de itens de uma classe de interesse em uma populacao
A diferenca das medias de duas populacoes,
1 2
A diferenca na proporcao de duas populacoes,
p1 p2
5.3.1.1
a media da amostra
= X,
2 = S 2 , a variancia da amostra
p = x/n, a proporcao na amostra, onde x e o
n
umero de itens da classe na amostra
1 X
2 , a diferenca entre as medias
1
2 = X
de duas amostras aleatorias independentes
p1
p2 , a diferenca entre duas proporcoes amostrais, calculadas a partir de duas amostras
aleatorias independentes.
Propriedades de estimadores
Gostaramos que os estimadores que vamos construir tenham algumas propriedades, que variam de
acordo com o problema em estudo. As principais propriedades sao:
1. N
ao viciado (nao viesado ou nao tendencioso): Um estimador e nao viciado para se
=
E()
e chamada de vcio do estimador.
Se o estimador for tendencioso, entao a diferenca E()
Exemplo:
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao com media e variancia 2 , ambas
e a variancia amostral S 2 sao estimadores nao viciados
finitas. Verifique se a media amostral X
2
para e respectivamente.
102
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Solucao:
=E
E(X)
1
(X1 + X2 + + Xn )
n
1
E(X1 + X2 + + Xn )
n
1
= nE(X1 )
n
=
Pn
E(S 2 ) = E
=
=
=
=
=
=
=
1
n1
2
X)
n1
n
X
2
E
(Xi X)
i=1 (Xi
i=1
n
X
1
2 2XX
i)
E
(X 2 + X
n 1 i=1 i
" n
#
n
n
X
X
X
1
2 2X
E
Xi2 +
X
Xi
n1
i=1
i=1
i=1
" n
#
n
X
X
X
1
i
2
2
2Xn
Xi + nX
E
n1
n
i=1
i=1
#
" n
X
1
2
Xi2 nX
E
n1
i=1
" n
#
X
1
2
2
)
E(Xi ) nE(X
n 1 i=1
#
" n
X
1
2
2
2
2
( + ) n( + /n)
n 1 i=1
1
(n2 + n 2 n2 2 )
n1
= 2
O pen
ultimo passo da resolucao acima advem de que:
= E(X
2 ) (E(X)
2)
V (X)
2 ) = 2 /n + 2
2 ) = V (X)
+ (E(X)
E(X
=0
lim V ar()
Isto e, `a medida que o tamanho da amostra vai aumentando, a media do estimador converge para
o parametro e a variancia do estimador converge para zero.
103
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Algumas vezes existem diversos estimadores nao viciados para determinado parametro da populacao. Por exemplo, suponha que geramos uma amostra aleatoria de tamanho n = 10 de uma
populacao normal e obtemos os dados:
x1 = 12,8; x2 = 9,4; x3 = 8,7; x4 = 11,6; x5 = 13,1; x6 = 9,8; x7 = 14,1; x8 = 8,5; x9 =
12,1; x10 = 10,3.
Podemos a partir da amostra obter:
12,8 + 9,4 + 8,7 + 11,6 + 13,1 + 9,8 + 14,1 + 8,5 + 12,1 + 10,3
= 11,04
10
10,3 + 11,6
Mediana: med =
= 10,95
2
8,7 + 9,4 + 9,8 + 10,3 + 11,6 + 12,1 + 12,8 + 13,1
Media truncada a 10%: =
= 10,98
8
Media: x
=
Podemos mostrar que a mediana e a media truncada sao estimadores nao viciados de . Como
nao existe um u
nico estimador nao viciado, nao podemos usar apenas o criterio de vcio zero para
selecionarmos o melhor estimador. Por isto usamos a propriedade:
3. Efici
encia: Dados dois estimadores 1 e 2 nao viciados para , dizemos que 1 e mais eficiente
que 2 se
V ar(1 ) < V ar(2 )
Nao existe um criterio absoluto para definir o melhor estimador. No entanto diremos que e
o melhor estimador para se ele e nao viciado e se alem disso, entre todos os estimadores nao
viciados, ele tiver variancia mnima. Neste caso o denominamos Estimador n
ao tendencioso de
vari
ancia mnima (ENTVM).
Exemplo:
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 1.
e 2 = X1 sao estimadores nao viciados para . Determine qual e o mais eficiente.
Os estimadores 1 = X
Solucao:
=V
V (1 ) = V (X)
X1 + X2 + , + Xn
n
1
V (X1 + X2 + , + Xn )
n2
1
= 2 nV (X)
n
1
=
n
=
V (2 ) = V (X1 ) = 1
DE PARAMETROS
5.3. ESTIMAC
AO
5.3.1.2
cpa/gsa
Desvio Padr
ao
5.3.1.3
Erro Quadr
atico M
edio
Eventualmente precisamos usar um estimador viciado. Nestes casos e importante medirmos o Erro
Quadratico Medio do estimador, definido como a media do quadrado da diferenca entre o estimador e o
valor real do parametro.
Defini
c
ao 26. O Erro Quadr
atico M
edio de um estimador do parametro e definido como
EQM = E( )2
5.3.2
M
etodos de estimac
ao
A definicao de nao viciado e as outras propriedades dos estimadores nao fornecem nenhuma indicacao
de como podemos obter bons estimadores pontuais. Veremos nesta secao dois metodos para isto.
5.3.2.1
M
etodo dos momentos
o metodo mais antigo e mais simples de estimacao pontual. Foi desenvolvido por Karl Pearson
E
no fim do seculo XIX. A ideia geral por tras do metodo e igualar os momentos populacionais, que sao
definidos em termos de valores esperados, com os momentos amostrais correspondentes.
Suponhamos que a distribuicao da variavel aleatoria X dependa de K parametros 1 ,2 , . . . ,k ; e
sejam:
n
1X i
x
i = 1,2, . . . ,k
Mi = E(X i )
i = 1,2, . . . ,k
mi =
n j=1 j
Igualamos agora os MI aos valores mi , comecando com com i = 1 e continuando ate que existam
equacoes suficientes para proporcionar solucoes u
nicas para 1 ,2 , . . . ,k .
105
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Exemplos:
1. Seja X uma variavel aleatoria com distribuicao normal e parametros desconhecidos (1 ; 2 ), e seja
x1 ,x2 , . . . ,xn uma amostra obtida desta distribuicao. Utilize o metodo dos momentos para obter
estimadores para estes parametros.
Solucao:
Calculamos primeiro
M2 = E(X 2 ) = (E(X))2 + V (X) = 12 + 2
Pn
Pn
x2
i=1 xi
m2 = i=1 i
m1 =
n
n
M1 = E(X) = 1
M1 = 1 = m1 = X
M2 = 1 + 2 = m2 = i=1 i
n
Pn
i=1
x2i
2
2 = 1 Pn (xi X)
X
n i=1
2. Suponha que X1 ,X2 , . . . ,Xn e uma amostra aleatoria de uma distribuicao exponencial com parametro
desconhecido . Qual o estimador para obtido pelo metodo dos momentos?
Solucao:
Calculamos
M1 = E(X) =
Igualando os dois momentos obtemos:
5.3.2.2
m1 =
1X
xi = X
n i=1
1
=
X
M
etodo de M
axima Verossimilhan
ca
Este e um dos melhores metodos para obter-se um estimador de um parametro. Para estuda-lo introduzimos:
Defini
c
ao 27. Seja x1 ,x2 , . . . ,xn uma amostra de uma variavel aleatoria X com funcao de (densidade)
de probabilidade f (x,), . Entao a fun
c
ao de verossimilhan
ca da amostra e definida por:
L(|x1 ,x2 , . . . ,xn ) = f (x1 ,)f (x2 ,) . . . f (xn ,)
106
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Quando x1 ,x2 , . . . ,xn sao conhecidos, a funcao de verossimilhanca e funcao somente do parametro
desconhecido . O estimador de maxima verossimilhanca de e o valor que maximiza a funcao de
verossimilhanca L.
Vejamos intuitivamente o significado deste estimador. Consideremos o caso de uma variavel discreta
com distribuicao binomial de parametros r e p, isto e
r x
f (x,p) =
p (1 p)rx
x = 0,1, . . . ,r
x
r
r
r
x1
rx1
x2
rx2
L(p|x1 ,x2 , . . . ,xn ) =
p (1 p)
p (1 p)
...
pxn (1 p)rxn
x1
x2
xn
P
P
r
r
r
=
...
p i xi (1 p)nr i xi
x1
x2
xn
Dizermos que L(
p|x1 ,x2 , . . . ,xn ) L(p|x1 ,x2 , . . . ,xn )
p : 0 < p < 1, e o mesmo que dizer que
p e tal que as observacoes x1 ,x2 , . . . ,xn tem mais probabilidade de vir de uma distribuicao binomial
com parametros r e p do que de uma distribuicao binomial com parametros r e p, 0 < p < 1. Isto e,
X1 = x1 , X2 = x2 , . . . Xn = xn tem probabilidade maxima quando p = p.
Para o caso de variaveis aleatorias contnuas, embora a analise seja mais complicada, pode-se chegar
1 ,x2 , . . . ,xn ) L(|x1 ,x2 , . . . ,xn )
`a mesma conclusao; isto e L(|x
.
Exemplos:
1. Seja x1 ,x2 , . . . ,xn uma amostra de uma distribuicao normal com media e variancia 1. Achar o
estimador de maxima verossimilhanca para .
Solucao:
2
2
2
1
1
1
1
1
1
L(|x1 ,x2 , . . . ,xn ) = e 2 (x1 ) e 2 (x2 ) . . . . . . e 2 (xn )
2
2
2
n
n 1 P
2
2
(xi )
1
=
e i=1
2
)
.
Para
calcularmos este mnimo fazemos:
i
i
X
X
(xi )2 = 2
(xi )
i
i
107
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
n
X
i=1
n
X
(xi
) = 0
(xi
) = 0
i=1
n
X
xi =
i=1
n
X
i=1
=x
Portanto x
e um candidato para o EMV procurado. Para confirmarmos se e ponto de maximo ou
de mnimo fazemos:
2 X
(xi )2 = 2n > 0,
2 i
P
o que significa que
=x
e um ponto de mnimo para i (xi )2 e equivalentemente um ponto
de maximo para L(|x1 ,x2 , . . . ,xn ). Em outras palavras,
=x
e o estimador de maxima verossimilhanca (EMV) para .
2. Seja x1 ,x2 , . . . ,xn uma amostra de uma variavel aleatoria com distribuicao exponencial com parametro
. Achar o Estimador de Maxima Verossimilhanca para
Solucao:
L(|x1 ,x2 , . . . ,xn ) = n e
P
i
xi
P
i
xi
] = nln
X
i
i
Igualando a zero temos:
= 1
108
xi
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
3. Seja f (x; ) = 1, com 1/2 X +1/2 e seja X1 ,X2 , . . . ,Xn uma amostra aleatoria da vari
avel
X. Achar o estimador de maxima verossimilhanca para .
Solucao:
L(|x1 ,x2 , . . . ,xn ) = 1,
Sejam Xmin = min xi
1
1
xi +
2
2
1
xmin
2
ou de forma equivalente:
1
2
xmin +
Entao
L(|x1 ,x2 , . . . ,xn ) =
para 1 i n:
1
xmax
2
xmax
se xmax
1
2
1
2
xmin + 21 ,
caso contrario
Isto significa que L(|x1 ,x2 , . . . ,xn ) e maximo para qualquer valor de no intervalo [xmax 12 ,xmin +
1
axima verossimilhanca para pode nao ser
2 ]. Este exemplo ilustra o fato de que o estimador de m
u
nico.
O metodo de maxima verossimilhanca pode ser usado em situacoes onde existem diversos parametros
desconhecidos, digamos, 1 ,2 , . . . ,n para estimarmos. Nestes casos, a funcao de verossimilhanca e uma
i}
funcao dos n parametros desconhecidos 1 ,2 , . . . ,n , e os estimadores de maxima verossimilhanca {
podem ser obtidos igualando-se as n derivadas parciais L(1 ,2 , . . . ,n )/i , (para i = 1,2, . . . ,n) a zero,
e resolvendo o sistema de equacoes resultante.
Exemplo:
Seja X uma v.a. com distribuicao normal com media e variancia 2 , ambas desconhecidas. Ache o
EMV para e para 2 , a partir da mostra x1 ,x2 , . . . ,xn .
Solucao:
A funcao de maxima verossimilhanca para uma amostra de tamanho n e
n
P
n
Y
(1/2 2 )
(xi )2
2
2
1
1
i=1
n
n
1 X
ln(2 2 ) 2
(xi )2
2
2 i=1
i=1
109
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
n
n
1 X
l(, 2 )
=
+
(xi )2 = 0
2
2 2
2 4 i=1
2 =
=x
1X
(xi x
)2
n i=1
Repare que sao os mesmos estimadores obtidos pelo metodo dos momentos.
Exemplo:
Suponha que a amostra a seguir, obtida aleatoriamente, e de uma variavel aleatoria normal com media
e variancia 2 :
x1 = 1,92; x2 = 4,04; x3 = 2,27; x4 = 3,19; x5 = 4,28; x6 = 4,57; x7 = 2,25; x8 = 2,74; x9 = 3,87;
x10 = 4,56; x11 = 4,90; x12 = 3,57; x13 = 3,52; x14 = 4,95; x15 = 3,00.
Qual a estimativa para os parametros 1 = e 2 = 2 usando os estimadores de maxima verossimilhanca?
Solucao:
= 53,63 = 3,58
1 = X
15
n
1X
2 = 13,78 = 0,92
2 =
(Xi X)
n i=1
15
5.3.3
Distribui
c
oes amostrais
Conforme salientamos na secao 5.1, em inferencia estatstica usamos informacoes contidas em amostras
aleatorias para chegarmos a conclusoes sobre parametros da populacao. Estas informacoes ou estatsticas,
sao tambem variaveis aleatorias que dependem dos resultados obtidos em cada amostra em particular.
portanto de fundamental importancia conhecermos a distribuicao das estatsticas: esta distribuic
E
ao e
chamada distribui
c
ao amostral.
Nesta secao apresentaremos diversos resultados que serao usados nas proximas secoes. Alguns destes
resultados serao provados como ilustracao, mas na maioria deles omitiremos as demonstracoes, por fugirem do alcance do nosso curso. As provas podem ser vistas em [2].
5.3.3.1
Distribui
c
ao da m
edia amostral - caso normal
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 . A
2
110
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Exemplos:
25 a media de uma amostra aleatoria de tamanho 25 de uma distribuicao normal com media
1. Seja X
25 assuma valores entre 71 e 79?
= 75 e variancia 2 = 100. Qual e a probabilidade de que X
Solucao:
25 tem distribuicao normal com media = 75 e variancia
Conforme resultado apresentado acima, X
100
igual a 25 = 4, ou seja:
25 < 79) = P
P(71 < X
75
X
79 75
71 75
<
<
2
2
2
2. Suponha que a aceitacao de um lote de 1.000 pecas ocorre apenas se o comprimento medio de 10
pecas estiver entre 9,2 e 10,8 cm. Se o comprimento das pecas tem distribuicao normal com media
10 cm e variancia 2 cm2 o que pode ser dito sobre a aceitacao do lote?
Solucao:
< 10,8) onde X : comprimento da peca e X N (10, 2).
P(lote ser aceito)=P(9,2 < X
N (10, 2/10) e portanto:
Mas X
9,2 10
10,8 10
5.3.3.2
Distribui
c
ao da diferen
ca de m
edias
Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media 1 e variancia 12
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de uma distribuicao normal com media 2 e variancia 22 . Se X e
n Ym tem distribuicao normal com media 1 2
Y sao independentes, entao a diferenca das medias X
2
2
n Ym (1 2 )
X
r
12
2
+ 2
n
m
111
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
n Ym (1 2 )
X
s
1
1
2
+
n m
Exemplo:
Suponha X1 ,X2 , . . . ,X10 uma amostra aleatoria de uma distribuicao normal com media = 10 e
variancia 2 = 9 e Y1 ,Y2 , . . . ,Y15 uma amostra aleatoria de uma distribuicao normal com media = 15 e
10 e Y15 as medias amostrais corresvariancia 2 = 9, independente da primeira distribuicao; e sejam X
10 (2 1 )
4 (2 1 )
Y15 X
4 (2 1 )
s
P(4 Y15 X10 4) = P s
s
1
1
1
1
1
1
2
2
2
+
+
+
n m
n m
n m
45
4 5
s
s
= P
1
1
1
1
9
+
9
+
10 15
10 15
= P(7,35 Z 0,81)
= P(Z 0,81) P(Z 7,35)
= [1 P(Z 0,81)] [1 P(Z 7,35)]
= (1 0,791030) (1 1) = 0,2090
5.3.3.3
Distribui
c
ao Quiquadrado
1. Seja Z uma variavel aleatoria normal padrao, isto e, uma variavel com distribuicao normal com
media 0 e variancia 1; entao Z 2 tem distribuicao quiquadrado com 1 grau de liberdade.
2. Sejam Z1 ,Z2 , . . . ,Zn variaveis aleatorias independentes e normalmente distribudas com media 0 e
variancia 1, entao a variavel Xn2 = Z12 + Z22 + + Zn2 tem distribuicao quiquadrado com n graus
de liberdade.
Como aplicacao da segunda propriedade acima, se X1 ,X2 , . . . ,Xn e uma amostra aleatoria de uma
distribuicao normal com media e variancia 2 , entao
2
2
2
X2
Xn
X1
+
+ +
2
n
X
Xi
X2 =
=
i=1
112
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
i=1
tem distribuicao quiquadrado com n 1 graus de liberdade. Dizemos que a soma perde um grau de libern
P
= 0 (pois X
= 1 Pn Xi ); entao conhecidos X1 = x1 , X2 = x2 , . . . , Xn1 = xn1
(Xi X)
dade pois
n
i=1
i=1
i=1
i=1
. Observe que a primeira e uma variavel aleatoria; a segunda e um valor da variavel aleatoria.
Para ilustrar melhor a perda de um grau de liberdade, consideremos um vetor X = (X1 ,X2 ,X3 ) que
pode assumir valores em R3 , isto e, ele tem 3 graus de liberdade, ele varia no espaco de tres dimensoes.
3 = X1 + X2 + X3 , e facil ver que X1 X
+ X2 X
+ X3 X
= 0, equivalente a uma equacao da
Se X
3
forma
aX1 + bX2 + cX3 = 0
que e a equacao de um plano em R3 , isto e, o vetor (X1 ,X2 ,X3 ) agora pode variar num espaco de 2
dimensoes; diz-se que ele perdeu um grau de liberdade.
Observemos agora a expressao:
n
X
n 2
Xi X
i=1
n
X
n )2 (n 1)Sn2
1
(Xi X
(n
1)
=
2
(n 1)
2
i=1
(n 1)Sn2
n,
e independente de X
2
n e a media
3. Seja X1 ,X2 , . . . ,Xn uma amostra de uma distribuicao normal com variancia 2 . Se X
(n 1)Sn2
desta amostra, entao
tem distribuicao qui-quadrado com n 1 graus de liberdade e e
2
independente de Xn .
Exemplo:
Suponha X1 ,X2 , . . . ,X10 uma amostra aleatoria de uma distribuicao normal com variancia 2 = 10.
Qual a probabilidade que a variancia da amostra seja menor que 16,31?
Solucao:
2
P(S10
< 16,31) = P
2
S10
(n 1)
16,31 9
<
2
10
113
DE PARAMETROS
5.3. ESTIMAC
AO
5.3.3.4
cpa/gsa
Distribui
c
ao t de Student
Seja Z uma variavel aleatoria com distribuicao normal padrao e seja V uma variavel aleatoria com
distribuicao quiquadrado com n graus de liberdade. Se V e Z sao independentes, entao a variavel
Z
T =p
V /n
tem funcao de densidade dada por:
n+1
2
fT (t) =
n (n/2)
onde () =
R
0
1
t2
1+
n
,
n+1
2
<t<
x1 ex dx e a funcao gama.
Diz-se que T tem distribuicao t de Student com n graus de liberdade. Nao e importante se decorar
a funcao de densidade, mas sim saber lidar com probabilidades referentes a ela, especialmente usando a
1
1 2
tabela 3 (no apendice). Quando n aumenta, fT (t) converge para e 2 t , que e a funcao de densidade
2
de Z, normal padrao. Isto e, quando n aumenta a distribuicao t de Student pode ser aproximada por
uma distribuicao normal padrao.
Duas aplicacoes diretas deste resultado sao:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 ,
ent
ao:
Xn
n
n(Xn )
Tn = r
=
2
Sn
(n 1)Sn
/(n 1)
2
tem distribuicao t de Student com n 1 graus de liberdade. A prova deste resultado decorre de
claro que usaremos esta distribuicao quando 2 nao e conhecida.
5.3.3.1, 5.3.3.3 e de 5.3.3.4. E
2. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media 1 e variancia
2 ; e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de outra distribuicao normal com media 2 e variancia
2 , com 2 desconhecida, independente da primeira. Entao a variavel
n Ym (1 2 )
X
s
1
1
2
+
n m
Tn+m2 = s
(n 1)S12
(m 1)S22
+
/(n + m 2)
2
2
Tn+m2 = s
n Ym (1 2 )
X
(n 1)S12 + (m 1)S22 1
1
+
n+m2
n m
114
DE PARAMETROS
5.3. ESTIMAC
AO
5.3.3.5
cpa/gsa
Distribui
c
ao F de Fisher
Agora consideremos uma variavel aleatoria U com distribuicao quiquadrado com m graus de liberdade
e uma variavel aleatoria V independente da primeira, com distribuicao quiquadrado com n graus de
liberdade. a variavel
U/m
F(m,n) =
V /n
tem uma distribuicao chamada F de Fisher com m graus de liberdade no numerador e n graus de liberdade
no denominador, e sua funcao de densidade e dada por:
m + n h m im/2
x(m/2)1
2
n
hmi hni
fF (x) =
h
,
0<x<
mx i(m+n)/2
1
+
2
2
n
Novamente, nao e importante memorizarmos a funcao de densidade; mas sim saber utilizar a tabela 4
(no apendice).
Uma aplicacao importante desta distribuicao e a seguinte:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria da distribuicao normal com media 1 e variancia 12 e
seja Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de outra distribuicao normal com media 2 e variancia
22 , independente da primeira, entao
F =
(n1)S12
/(n
12
(m1)S22
22
1)
/(m 1)
S12 22
S22 12
tem distribuicao F com n 1 e m 1 graus de liberdade. Esta variavel vai nos permitir construir
intervalos de confianca e fazer testes referentes `a razao de duas variancias.
As tabelas 4a a 4g fornecem os valores de f(m,n) tais que:
P(F(m,n) > f(m,n) ) =
1
f0,05(n,m)
U/m
1
1
f ) = P
f = P V /n f = P
f
V /n
F(n,m)
P(F(m,n)
U/m
Exemplos:
1. Achar o valor f0,95(4,5)
Solucao:
P[F(4,5) f0,95(4,5) ] = 0,95
f0,95(4,5) =
=
1
f0,05(5,4)
115
P[F(4,5)
=
1
= 0,16
6,26
1
] = 0,95
f0,05(5,4)
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
2. Considere uma variavel aleatoria com distribuicao F com 5 e 10 graus de liberdade. Determinar a
e b tais que P(a < F(5,10) < b) = 0,90.
Solucao:
claro que existe uma infinidade de valores a e b que atendem `a condicao.
E
f(x)
a1a2
b1 b2
Na figura acima (a1 ,b1 ) e (a2 ,b2 ) sao dois pares possveis. Por convencao escolhemos a e b tais que:
P(F(5,10) < a) = P(F(5,10) > b) = 0,05
O calculo do valor de b e direto da tabela 7 onde encontramos b = 3,33. Para encontrarmos o valor
de a fazemos:
P(F(5,10) < a) = 0,05
=
P(F(5,10) a) = 0,95
Como f0,95(5,10) =
5.3.4
1
f0,05(10,5)
de uma amostra aleatoria de tamanho n de uma distribuicao normal com media e variancia 2 . Em
(n 1)Sn2
5.3.3.3 (Distribuicao Quiquadrado) vimos que
tem distribuicao qui-quadrado com n 1 graus
2
2
de liberdade, se Sn e a variancia da mesma amostra. Nestes casos, independentemente do tamanho da
2
n e (n 1)Sn sao exatas.
amostra as distribuicoes para X
2
Quando a distribuicao de X nao e normal, precisamos de amostras grandes para aproximar a distri n , e esta aproximacao e dada pelo teorema estabelecido a seguir:
buicao de X
de uma vari
avel
Teorema 3. Teorema Central do Limite: seja X1 ,X2 , . . . ,Xn uma amostra aleat
oria
n )
n(
X
aleat
oria com media e vari
ancia 2 positiva e finita; ent
ao a vari
avel Zn =
tem uma
distribuica
o limite que e normal com media zero e vari
ancia um.
Nao damos prova do teorema, e sim uma ideia de seu significado. O que significa dizer que Zn tem
uma distribuicao que no limite e a normal padrao? Zn tem uma distribuicao, porem nao e nosso interesse
116
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
determina-la. O teorema diz que, para todo z R, P(Zn z) converge para P(Z z), `a medida que n
aumenta; sendo Z a normal padrao. Isto vai implicar que P(z1 Zn z2 ) converge para P(z1 Z z2 ).
Salientamos que para cada z R, {P(Zn z)}
encia de n
umeros reais e para
n=1 define uma sequ
cada par (z1 ,z2 ) de n
umeros reais {P(z1 Zn z2 )}
define
tamb
e
m
uma
sequ
e
ncia
de n
umeros reais:
n=1
o teorema nos diz que para todo z R, a primeira sequencia converge para P(Z z) e para cada par
(z1 ,z2 ) de n
umeros reais a segunda sequencia converge para P(z1 Zn z2 ).
Maiores detalhes podem ser encontrados em textos de nvel intermediario, sob o ttulo Convergencia
em Distribuicao
Exemplos:
a media de uma amostra aleatoria de tamanho 100 de uma distribuicao quiquadrado com
1. Seja X
< 51).
50 graus de liberdade. Aproximar o valor de P(49 < X
Solucao:
< 51) = P
P(49 < X
49
X
51
n<
n<
n
2
, = gl = 50 e 2 = 2gl = 100, entao
Como X X50
50
49 50
X
51 50
50
X
= P 1 <
100 < 1
10
1
= 80
2 =
1
= 6400
2
X 80
75 80
64 >
64
80
80
X 80
5
=P
>
10
10
> 75) = P
P(X
e positivo e finito. A partir dele podemos, entre outras coisas, construir intervalos de confianca para .
117
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Quando nao conhecemos 2 surge um problema, que e superado com a utilizacao de S 2 , que como vimos
e o estimador de 2 .
Pode-se provar que S 2 converge estocasticamente para 2 . A nocao de convergencia estocastica
foge do escopo deste curso, porem vai nos permitir usar a estatstica:
X
n
n(X )
r
=
2
S
S
2
5.3.5
Estima
c
ao por intervalos
Como vimos nas secoes anteriores, a Estimacao Pontual fornece como estimativa do parametro desconhecido um u
nico valor. Em muitas situacoes no entanto esta estimativa pontual de um parametro
nao fornece informacao completa necessaria para o estudo ou problema em questao. Quando se estima
determinado valor para, por exemplo, a media de uma variavel, e improvavel que a media verdadeira
da
seja exatamente igual a este valor. Assim uma questao importante aparece: quao proximo esta X
media verdadeira?
Uma das formas de resolver este problema e preestabelecer a margem maxima de erro que queremos
cometer. Define-se entao Erro de Estima
c
ao como a distancia entre o parametro e valor estimado (por
|).
exemplo |X
Outra abordagem e usar um intervalo estimado para o parametro populacional que expressasse o grau
de incerteza associado `a estimativa. Damos a este intervalo o nome de Intervalo de Confian
ca. Nos
nao teremos certeza de que o intervalo contem o valor correto do parametro populacional desconhecido.
Nos simplesmente usamos uma amostra aleatoria da populacao para calcular a estimativa pontual e o
intervalo. Entretanto o intervalo de confianca e construdo de tal forma que tenhamos alta confianca que
ele contem o parametro populacional desconhecido.
Assim dada uma amostra X1 ,X2 , . . . ,Xn de uma variavel aleatoria X com funcao de densidade de
probabilidade f (x,), com , vamos encontrar L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ), funcoes de
X1 ,X2 , . . . ,Xn tais que:
P[L(X1 ,X2 , . . . ,Xn ) u() S(X1 ,X2 , . . . ,Xn )] = 1
onde u() e uma funcao do parametro . Diremos entao que (L(X1 ,X2 , . . . ,Xn ), S(X1 ,X2 , . . . ,Xn )) e um
118
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
intervalo de confian
ca de 100(1)% para u(). (1) e chamado coeficiente de confianca do intervalo.
O metodo para resolver o problema e simples: consiste em encontrar uma variavel aleatoria que
dependa da funcao u() e cuja distribuicao seja conhecida. Ha varios casos a considerar, dos quais
discutiremos detalhadamente apenas a Distribuicao da media amostral - caso normal. Os demais casos
terao procedimentos analogos.
5.3.5.1
Intervalo de confian
ca para a m
edia de uma distribui
c
ao normal
Caso 1: 2 conhecida.
Queremos achar L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ) tais que
P[L(X1 ,X2 , . . . ,Xn ) S(X1 ,X2 , . . . ,Xn )] = 1
(neste caso u() = ).
n(X )
Sabemos que
tem distribuicao normal padrao, entao na tabela podemos encontrar a e
b que satisfacam `a equacao do intervalo de confianca. Existe uma infinidade de pares de valores a e b
satisfazendo esta condicao. [a1 ,b1 ] e [a1 ,b1 ] na figura abaixo sao dois destes pares.
f(z)
a1 a2
b1 b2
n(X )
P a
a =1
f(z)
-a
Olhando a figura acima, vemos que a = z(1 2 ) ; sendo z(1 2 ) tal que P(Z z(1 2 ) ) = 1 2 .
119
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
n(X )
P z(1 2 )
z(1 2 ) = 1
n(X )
z(1 )
z(1 2 )
z(1 2 ) z(1 2 ) X
2
n
n
z(1 ) X
+ z(1 )
X
2
2
n
n
z(1 ) X
+ z(1 ) = 1
P X
2
2
n
n
As funcoes procuradas sao portanto:
z(1 ) = X1 + + Xn z(1 )
L(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
+ z(1 ) = X1 + + Xn + z(1 )
S(X1 ,X2 , . . . ,Xn ) = X
2
2
n
n
n
Exemplos:
1. Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e 2 = 80. Se
n = 20 e x
= 81,20, encontrar um intervalo de confianca de 95% para (veja observacoes a seguir).
Solucao:
Temos que 1 = 0,95; entao z(1 2 ) = z0,975 = 1,96 e assim:
120
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
3. Sejam os dados:
79,38; 62,55; 65,13; 58,68; 70,25; 84,79; 62,43; 82,55; 72,84; 82,32
que correspondem a 10 observacoes de uma distribuicao normal com media e variancia 2 = 81.
Construa um intervalo de confianca de 90% para .
Solucao:
A partir dos dados, temos x
= 72,09. Como queremos 90% de confianca, 1 = 0,9; e assim
z(1 2 ) = z0,95 = 1,645. Podemos agora calcular os limites do intervalo:
Observacoes:
1. Observe que L(X1 ,X2 , . . . ,Xn ) e S(X1 ,X2 , . . . ,Xn ) sao variaveis aleatorias antes da amostra ser
obtida e portanto tem sentido a expressao P[L(X1 ,X2 , . . . ,Xn ) S(X1 ,X2 , . . . ,Xn )] = 1 .
No entanto depois que a amostra e obtida, teremos L(X1 ,X2 , . . . ,Xn ) = l e S(X1 ,X2 , . . . ,Xn ) = s e
ja nao tem mais sentido dizer que P[l s] = 1 pois agora, dependendo do valor de , esta
probabilidade sera 1 ou 0. Mesmo assim, por abuso de linguagem, diremos que (l, s) e um intervalo
de confianca de 100(1 )% para .
2. Assim sendo um intervalo de confianca de 95% para media nao quer dizer que existe uma probabilidade de 0,95 de que pertenca ao intervalo. A interpretacao correta e: Se pudessemos obter
um n
umero infinito de amostras aleatorias de tamanho n e construssemos intervalos de confianca
de 95% para cada uma das amostras, temos a garantia de que 95% destes intervalos conteriam o
verdadeiro valor de .
)
n(X
pois o valor de nao e conhecido. Temos por
n(Xn )
tanto que usar um estimador de 2 para resolver o problema. Sabemos de 5.3.3.4 que Tn1 =
S
tem distribuicao t de Student com n 1 graus de liberdade.
Neste caso, nao podemos usar a estatstica
121
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Tambem foi visto que a funcao de densidade de Tn1 e simetrica em torno do zero, entao procuramos
na tabela o valor de T(n1,1 2 ) tal que:
n
X
n t(n1,1 2 ) = 1
P t(n1,1 2 )
S
e da temos:
S
S
=1
P Xn t(n1,1 2 ) Xn + t(n1,1 2 )
n
n
78,45
= 81,20 2,093
20
p
= 81,20 2,093 3,92
= 81,20 4,15 = 77,05
S(x1 , . . . ,x20 ) = 81,20 + 4,15 = 85,35
Portanto o intervalo e (77,05; 85,35).
5. No exemplo 3, suponhamos que nao conhecemos a variancia. Usando a amostra no entanto achamos
S 2 = 93,89. Calcule um intervalo de confianca de 90%.
Solucao:
t(9;0,95) S
L(x1 , . . . ,x10 ) = X
n
93,89
= 72,09 1,833
10
p
= 72,09 1,833 9,389
= 72,09 5,62 = 66,47
S(x1 , . . . ,x10 ) = 72,09 + 5,62 = 77,71
Portanto o intervalo e (66,47; 77,71).
122
DE PARAMETROS
5.3. ESTIMAC
AO
5.3.5.2
cpa/gsa
Intervalo de confian
ca para o par
ametro p da distribui
c
ao binomial
Vamos construir intervalos de confianca para o parametro p de distribuicao binomial com n conhecido.
X np
Se X b(n, p), o Teorema Central do Limite afirma que para n grande, p
tem distribuicao
np(1 p)
aproximadamente normal com media zero e variancia um. Entao:
#
"
X np
P z(1 2 ) p
z(1 2 ) 1
np(1 p)
que pode ser reescrito por:
X
n
P z(1 2 ) q
ou ainda
"
X
P
z(1 2 )
n
p(1p)
n
z(1 2 ) 1
p(1 p)
X
p
+ z(1 2 )
n
n
#
p(1 p)
1
n
Como os limites do intervalo dependem de p, substituimos por seu estimador dado por
X
L(X) =
n
X
S(X) =
n
v
uX
u (1
t
z(1 2 ) n
n
v
uX
u (1
t
+ z(1 2 ) n
n
X
e assim:
n
X
)
n
X
)
n
X1 + + Xn
X
=
=X
N
n
e a media de uma amostra aleatoria de tamanho n de uma distribuicao binomial com parametros 1 e p.
Exemplo:
Seja X uma variavel aleatoria com distribuicao binomial de parametros 300 e p. Foi tomada uma
observacao e achou-se X = 75. Encontrar um intervalo de confianca de 90% para p.
123
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Solucao:
v
ux
u (1 x )
t
x
n
L(x) = z(1 2 ) n
n
n
v
u 75
75
u
(1
)
t
75
300
=
1,645 300
300
300
= 0,25 0,04 = 0,21
v
ux
u (1 x )
t
x
n
S(x) = + z(1 2 ) n
n
n
= 0,25 + 0,04 = 0,29
5.3.5.3
Intervalo de confian
ca para diferen
ca de duas m
edias - Caso normal
Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel X com distribuicao normal
com media 1 e variancia 12 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m de uma variavel Y
com distribuicao normal com media 2 e variancia 22 ; sendo as duas variaveis aleatorias independentes.
Nesta subsecao veremos como encontrar um intervalo de confianca para 2 1 , ou seja, encontrar
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) e S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) tais que:
P[L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) 2 1 S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym )] = 1
124
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
r
z(1/2)
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
r
+ z(1/2)
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
12
2
+ 2
n
m
12
2
+ 2
n
m
Exemplo:
Suponha que estamos testando a resistencia `a tracao de 10 barras de aco produzidas pelo fabricante
1 e 15 barras produzidas pelo fabricante 2. A partir de experiencias anteriores sabemos que o fabricante
1 produz barras de aco cuja resistencia `a tracao tem variancia de 900 kgf 2 /cm4 , enquanto para o fabricante 2 este valor e 625 kgf 2 /cm4 . As amostras nos forneceram resistencias medias de 5.000 kgf /cm2
e 4.800 kgf /cm2 respectivamente para os fabricantes 1 e 2. Construa um intervalo de confianca de 90%
para a diferenca entre as medias (2 1 ).
Solucao:
r
2 X
1 z(1/2)
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = X
r
2 X
1 + z(1/2)
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = X
2
12
+ 2 = 4.800 5000 1,645
n
m
900 625
+
10
15
12
2
+ 2 = 4.800 5000 + 1,645
n
m
900 625
+
10
15
Sp
1
2)
r
+ t(n+m2,
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
onde:
Sp
1
2)
1
1
+
n m
1
1
+
n m
s
Sp =
e alem disso:
(n 1)S12 + (m 1)S22
n+m2
h
e tal que P Tn+m2 t(n+m2,
2
e S12 e S22 s
ao as variancias amostrais correspondentes. Como 12 = 22 = 2 nao e conhecida usamos o
estimador Sp2 .
t(n+m2,
1
2)
125
1
2)
=1
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Exemplos:
= 31,24;
1. No exemplo da producao de barras de aco e da calibragem da maquina, suponha que X
S1 = 1,57; n = 10; Y = 26,69; S2 = 1,42; n = 15. Construa um intervalo de confianca de 95% para
2 1 .
Solucao:
r
Sp
s
1
1
+
=
n m
9(1,57)2 + 14(1,42)2 1
1
+
= 0,604
10 + 15 2
10 15
t(n+m2,
1
2)
= t23;0,975 = 2,069
entao:
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 26,69 31,24 (0,604)(2,069) = 2,80
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 26,69 31,24 + 1,25 = 0,30
portanto o intervalo procurado e (2,80; 0,30)
2. Uma linha de producao produz barras de aco cujo comprimento X e uma variavel aleatoria que
pelas caractersticas do processo de producao pode-se supor normalmente distribuda com media
1 e variancia 2 desconhecida. A linha de producao foi submetida a uma nova calibracao para
aumentar a media, porem conservando a variancia igual a 2 . Duas amostras, antes e depois da
calibracao foram obtidas e calculou-se x
= 3,82 m; S12 = 0,08 m2 ; y = 4,08 m; S22 = 0,10 m2 . Se
os tamanhos amostrais foram 15 e 20 respectivamente, encontre um intervalo de confianca de 95%
para 2 1 .
Solucao:
r
Sp
s
1
1
+
=
n m
14(0,08) + 19(0,10) 1
1
+
= 0,103
15 + 20 2
15 20
t(n+m2,
1
2)
= t33;0,975 = 2,03
entao:
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 4,08 3,82 (0,103)(2,03) = 0,26 0,21 = 0,05
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = 0,26 + 0,21 = 0,47
portanto o intervalo procurado e (0,05; 0,47)
Caso 3: As variancias sao desconhecidas e diferentes.
Para construir o intervalo de confianca para 2 1 no caso em que 12 e 22 sao desconhecidas ainda
usamos a mesma variavel aleatoria Tn+m2 definida em 5.3.3.4 mas agora os extremos do intervalo sao:
126
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
r
t(n+m2,
L(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
1
2)
r
+ t(n+m2,
S(X1 ,X2 , . . . ,Xn ; Y1 ,Y2 , . . . ,Ym ) = Y X
5.3.5.4
1
2)
S12
S2
+ 2
n
m
S12
S2
+ 2
n
m
Intervalo de confian
ca para vari
ancia de uma distribui
c
ao normal
Caso 1: desconhecida.
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma distribuicao normal com media e variancia 2 ,
(n 1)S 2
tem distribuicao quiquadrado com n 1
com e 2 desconhecidas. Sabemos de 5.3.3.3 que
2
graus de liberdade. Entao da tabela teremos que:
P
2
onde X(n1,
2)
2
e X(n1,
1
2)
2
X(n1,
2)
(n 1)S 2
2
X(n1,
2
1
2)
2
2
P[Xn1
X(n1,
2)
]=
2
2
P[Xn1
X(n1,
]
1
2)
=1
(n 1)S 2
2
X(n1,
1 )
2
(n 1)
2
X(n1,
n
X
(xi x
)2
1
2 ) i=1
n1
(n 1)S 2
2
X(n1,
)
2
n
(n 1) X (xi x
)2
= 2
X(n1, ) i=1 n 1
2
Caso 2: conhecida.
Quando e conhecida o procedimento para construcao do intervalo de confianca e o mesmo, so que
2
n
P
xi
usamos
que tambem tem distribuicao quiquadrado, mas com n graus de liberdade.
i=1
127
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
Exemplo:
Uma amostra aleatoria de tamanho 15 de uma distribuicao normal com media e variancia 2 foi
obtida e calculou-se x
= 3,20; S 2 = 4,24. Determinar um intervalo de confianca de 90% para 2 .
Solucao:
L(X1 , . . . ,X15 ) =
(n 1)S 2
2
X(n1,
1 )
2
14 4,24
= 2
X(14; 0,95)
=
S(X1 , . . . ,X15 ) =
=
59,36
= 2,51
23,68
14 4,24
2
X(14;
0,05)
59,36
= 9,04
6,57
5.3.5.5
Intervalo de confian
ca para raz
ao de vari
ancias - Caso normal
Sejam X uma variavel aleatoria com distribuicao normal com media 1 e variancia 12 ; Y uma variavel
aleatoria com distribuicao normal com media 2 e variancia 22 independente de X.
Sejam X1 ,X2 , . . . ,Xn e Y1 ,Y2 , . . . ,Ym amostras aleatorias das respectivas distribuicoes. Nesta subsecao
2
iremos construir um intervalo de confianca para 22 .
1
De 5.3.3.5 sabemos que
F =
S12 22
S22 12
m1)
e F1 2 ,(n1,
m1)
tais que
i
m1)
F F1 2 ,(n1,
128
m1)
=1
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
m1)
1
F1 2 ,(m1,
1
F1 2 ,(m1,
n1)
S22
2
n1) S1
Os limites do intervalo de confianca para o caso em que as medias 1 e 2 sao conhecidas podem ser
obtidos com as modificacoes adequadas usando o mesmo modelo.
Exemplo:
Imagine que tenhamos as duas amostras de uma distribuicao normal de tamanhos 10 e 5 e que as
variancias amostrais sejam respectivamente s21 = 20,0 e s22 = 35,6. Qual seria o intervalo de confianca
com = 0,05 para 22 /12 ?
Solucao:
1
35,6
F0,975(4, 9) 20,0
1 35,6
=
4,72 20,0
= 0,38
4)
35,6
20,0
35,6
20,0
= 15,84
= 8,90
5.3.5.6
Intervalo de confian
ca para a m
edia - distribui
c
ao n
ao normal
Todos os casos discutidos ate aqui envolveram distribuicoes normais. Vamos considerar agora um caso
em que nao temos distribuicao normal e no qual usaremos o Teorema Central do Limite.
Seja X1 ,X2 , . . . ,Xn uma amostra aleatoria de uma variavel X com funcao de densidade
de proba
n(Xn )
bilidade f (x,), . Se a variancia de X e positiva e finita, sabemos que Zn =
tem
distribuicao aproximadamente normal com media zero e variancia um. Entao, na tabela da normal padrao
achamos z(1 2 ) tal que:
Xn
n z(1 2 ) = 1
P z(1 2 )
e obtemos um intervalo (aproximado) com coeficiente de confianca 100(1 )%, cujos extremos sao:
129
DE PARAMETROS
5.3. ESTIMAC
AO
cpa/gsa
z(1 )
L(X1 ,X2 , . . . ,Xn ) = X
2
n
zn1
Xn
n
n(Xn )
=s
=
S
(n 1)S 2
2
(n 1)
Como ja vimos na secao 5.3.4, sabemos que a distribuicao de zn1 ainda e aproximadamente normal
padrao e neste caso o nosso intervalo aproximado tem os extremos:
z(1 ) S
L(X1 ,X2 , . . . ,Xn ) = X
2
n
+ z(1 ) S
S(X1 ,X2 , . . . ,Xn ) = X
2
n
Observe que f (x,) neste caso e uma funcao de densidade de probabilidade qualquer. A u
nica exigencia
que fazemos, alem de n ser grande,e que a variancia seja finita e positiva.
Exemplos:
1. Observou-se o tempo de vida de 65 lampadas produzidas pela fabrica A. Se x
= 321 dias e S = 18,4
dias, construa um intervalo de confianca de 95% para , a vida media das lampadas produzidas
pela fabrica A.
Solucao:
130
n(Xn )
:
S
5.4. TESTE DE HIPOTESES
cpa/gsa
2. Suponha que no exemplo anterior a variancia e conhecida e igual a 400. Construa o novo intervalo
de confianca de 95% para
Solucao:
400
L(x1 , . . . ,x65 ) = 321 1,96
65
= 321 1,96(2,4807)
= 321 4,86 = 316,14
S(x1 , . . . ,x65 ) = 321 + 4,86
= 325,86
5.4
5.4.1
Teste de Hip
oteses
Introduc
ao
Na secao anterior aprendemos a construir intervalos de confianca para parametros que estimamos a
partir de amostras. Como veremos a seguir esta e uma ferramenta fundamental no estudo de um dos
topicos mais importantes no dia a dia dos engenheiros: o teste de hipoteses. Apresentamos a seguir alguns
conceitos basicos.
Defini
c
ao 28. Hip
otese Estatstica - Uma hipotese estatstica e uma afirmacao sobre uma populacao.
A afirmacao pode ser referente `a distribuicao ou aos parametros que caracterizam a distribuicao.
Exemplos:
1. X tem distribuicao normal.
2. E(X) = = 100.
3. V (X) = 2 = 200.
Introduzimos os conceitos basicos sobre testes de hipotese atraves do seguinte exemplo:
Suponha que uma empresa produza vigotas premoldadas de concreto de comprimento X. De acordo
com o padrao de producao da empresa, X tem distribuicao normal com media = 120 cm e desvio
padrao = 0,5 cm.
Um cliente dessa empresa formula uma reclamacao alegando que as vigotas estao sendo produzidas
com comprimento menor e reinvindica a devolucao do dinheiro pago pela compra feita no u
ltimo mes.
Neste problema, a hipotese do fabricante e que = 120 cm. e a hipotese do cliente e que < 120
cm. Assim o fabricante precisa tomar uma decisao com respeito `a reclamacao do comprador. O que
muito
normalmente se faz e colher uma amostra aleatoria de tamanho n e observar a media amostral. E
natural, neste exemplo, decidir em favor do cliente se a media amostral for pequena e menor que 120.
n < 120 c para alguma constante positiva c.
Ou seja a reclamacao do cliente sera atendida se X
131
5.4. TESTE DE HIPOTESES
cpa/gsa
120
120-c
Regio Crtica
H0 e verdadeira
Erro tipo I
Decisao correta
H0 e falsa
Decisao correta
Erro tipo II
No exemplo de testar H0 : = 120 contra H1 : < 120, dissemos que podemos decidir em favor do
n < 120 c. Resta encontrar o valor da constante c. Para encontrar tal valor precisamos da
cliente se X
ancia: o nvel de significancia de um teste, representado por , e
Defini
c
ao 29. Nvel de signific
a probabilidade de cometer erro tipo I. O valor de e fixado de acordo `a seriedade do erro tipo I.
Geralmente = 0,01; 0,05; 0,1.
Entao
= P(cometer erro tipo I) = P(rejeitar H0 |H0 e verdadeira)
n < 120 c| = 120). Como sabemos que sob H0 , X
n N (120; 0,52 ) podemos
No exemplo, = P(X
n
escrever
n
n
n < 120 c| = 120) = P
(Xn 120) < [(120 c) 120]
| = 120
P(X
0,5
0,5
n
| = 120
= P Z < [(120 c) 120]
0,5
n
| = 120
= P Z < c
0,5
132
5.4. TESTE DE HIPOTESES
cpa/gsa
tomada? Desde que o valor observado de X e menor que 119,84; rejeitamos H0 ao nvel de = 0,05;
ou seja a reclamacao do cliente e procedente. Dissemos neste caso que ao nvel de = 0,05 a media e
significantemente menor que 120.
Uma outra forma de conduzir o teste e calcular o p-valor amostral que no exemplo e definido como
a probabilidade de que a media amostral seja menor que aquele valor realmente observado. No exemplo
25 = 119,7.
observa-se X
25 < 119,7| = 120)
p-valor amostral = P(X
5
5
(X25 120) <
(119,7 120)| = 120]
= P[
0,5
0,5
= P(Z < 3) = 0,001350
A decisao a ser tomada e rejeitar H0 para todo valor de maior ou igual ao p-valor amostral. Neste
caso rejeitamos H0 para todo valor de maior ou igual a 0,001350.
A vantagem de conduzirmos um teste usando o p-valor amostral e que este valor informa para nos
uma forte ou uma fraca evidencia contra a hipotese nula. Quanto menor e o p-valor amostral mais forte
sera a evidencia que temos para rejeitar a hipotese nula.
25 = 119,8. O p-valor
Suponha por exemplo que uma segunda amostra foi escolhida e observou-se X
neste u
ltimo caso e:
25 < 119,8| = 120)
p-valor amostral = P(X
5
5
= P[
(X25 120) <
(119,8 120)| = 120]
0,5
0,5
= P(Z < 2) = 0,018309
133
5.4. TESTE DE HIPOTESES
cpa/gsa
= 0,05
XA
X B 119,84
120
Ve-se portanto que em ambas as amostras temos evidencias para rejeitar H0 mas esta evidencia e
mais forte no caso da primeira amostra.
Veremos a seguir a probabilidade do erro tipo II. A probabilidade desse erro sera representada por
. Lembremos que a probabilidade de erro tipo II e a probabilidade de nao rejeitar H0 quando ela
e falsa. O espaco parametrico sob a hipotese alternativa, no exemplo, e representado pelo conjunto
= { R : < 120}. Precisamos avaliar a probabilidade de erro tipo II para cada valor de neste
conjunto.
Se o verdadeiro valor da media e igual a para algum valor de > 0 entao
(120 ) = P(nao rejeitar h0 | = 120 )
25 119,84| = 120 )
= P(X
Se o verdadeiro valor da media e = 120 entao
n
5
X25 (120 ) =
X25 (120 )
0,5
tem distribuicao normal padrao. Entao:
5
5
(120 ) = P
(X25 (120 ))
(119,84 (120 ))| = 120
0,5
0,5
= P[Z 10(0,16 + )]
= P(Z 1,6 + 10)
= 1 P(Z < 1,6 + 10)
Assim, no exemplo, se a media verdadeira fosse 119,75 entao = 120119,75 = 0,25 e a probabilidade
de erro tipo II seria:
(120 ) = 1 P(Z < 1,6 + 10) (119,75) = 1 P(Z < 0,9) = 1 0,815940 = 0,18406
Define-se o poder de um teste, avaliado em = 0 como a probabilidade de rejeitar H0
quando o verdadeiro valor da media e igual a = 0 . Representa-se o poder por K. Isto e
K(0 ) = 1 (0 ).
No exemplo, K(120 ) = 1 (120 ).
A seguir apresentamos as probabilidades de erro tipo II e os correspondentes valores do poder do teste
para alguns valores de no exemplo:
0,10
0,20
0,30
0,40
()
0,725747
0,344578
0,080757
0,008198
134
K()
0,274253
0,655422
0,919243
0,991802
5.4. TESTE DE HIPOTESES
cpa/gsa
Valor da funo
K(d)
b(d)
d
Ate aqui introduzimos, atraves de um exemplo, os conceitos basicos de testes de hipoteses. A partir
de agora generalizaremos estes conceitos para diferentes situacoes.
5.4.2
Testes sobre a m
edia de uma populac
ao com distribuic
ao normal
5.4.2.1
Vari
ancia conhecida
H1 : < 0
Teste 2: H0 : = 0
H1 : > 0
Teste 3: H0 : = 0
H1 : 6= 0
Os testes 1 e 2 sao chamados testes unilaterais e o teste 3 e chamado bilateral. Naturalmente nos
n de uma amostra aleatoria de tamanho n. Teremos respectivamente:
testes sera usada X
Ao nvel , no teste 1, H0 sera rejeitada se
n > 0 + z
X
ou Xn > 0 + z 2
Xn < 0 z 2
n
n
ou de forma equivalente se
n 0 | > z
|X
2
135
5.4. TESTE DE HIPOTESES
cpa/gsa
Exemplos:
1. Uma montadora de veculos anuncia que seu carro popular de 1.000 c.c. tem uma eficiencia
energetica media de 16 km/litro de gasolina rodando em estrada asfaltada. O editor do caderno
de veculos do jornal local afirma que a eficiencia energetica do carro e menor do que a anunciada
pela montadora, e para provar conduz um teste com 25 carros do tipo anunciado. Supondo que a
eficiencia energetica tem distribuicao normal com variancia de 11(km/l)2 responda:
(a) Formule um teste apropriado para o editor do jornal, e construa a regiao crtica com nvel de
significancia = 0,05.
= 15,6 km/l qual seria a sua conclusao? Qual
(b) Se o valor obtido pelo jornalista no teste foi X
o p-valor para a media obtida pelo editor? E qual seria se a media obtida fosse 14,8 km/litro?
(c) Se a eficiencia energetica media real destes carros fosse 15,4 km/l, qual seria a probabilidade
de erro tipo II e qual o poder do teste?
Solucao:
(a) A hipotese nula do teste seria H0 : = 16 km/l, e como o editor esta interessado em confirmar
que a eficiencia energetica e menor,
a hipotese alternativa seria H1 : < 16 km/l. H0 sera
11
< 16 1,645 = 16 1,09 = 14,91
C = (X1 , . . . ,X25 ) : X
25
< 14,91.
Ou seja, a hipotese nula sera rejeitada para os valores de X
(b) Como a media observada 15,6 e maior que 14,9 nao podemos rejeitar a hipotese nula (H0 :
= 16 km/l), e portanto nao ha evidencias para apoiar a afirmacao do jornalista de que a
eficiencia energetica e menor que 16,0 km/l.
Sabemos que o p-valor amostral pode ser obtido por
25 < 15,6| = 16)
p-valor = P(X
n
n
= P(
(X25 ) <
(15,6 | = 16)
25
= P(Z < (15,6 16| = 16)
11
= P(Z < 0,6030) = 0,2743
25 = 15,6 esta fora
Como este valor e maior que o nvel de significancia = 0,05 vemos que X
da regiao crtica, e confirmando o teste feito em (a) nao rejeitamos H0 .
= 14,8 o p-valor amostral seria obtido por:
Ja se a media amostral fosse X
25 < 14,8| = 16)
p-valor = P(X
n
= P(Z <
(14,8 | = 16)
25
= P(Z < (14,8 16| = 16)
11
= P(Z < 1,81) = 0,0351
Nesse caso o p-valor e menor que o nvel de significancia e portanto rejeitaramos H0 . Se a
= 14,8 poderamos apoiar a afirmacao do jornalista de que a eficiencia
media amostral fosse X
energetica e menor que a anunciada pela montadora.
136
5.4. TESTE DE HIPOTESES
cpa/gsa
(c) Para calcularmos a probabilidade de cometer erro tipo II se a verdadeira media fosse 15,4
lembremos que:
25 > 14,91|X
25 = 15,4)
(15,40) = P(X
n
= P[Z >
(14,91 15,4)]
5
= P[Z > (14,91 15,4)]
11
= P(Z > 0,7387) = 0,7704
A probabilidade de cometer erro tipo II se a media for 15,4 e 0,7704 e portanto o poder do
teste e 0,2296.
2. Um engenheiro esta na fase de concretagem de diversos pilares em uma obra e encomenda concreto
pronto com resistencia media de 900kgf /cm2 . Uma empresa concorrente do fornecedor habitual se
dispoe a entregar por um preco mais barato um concreto pronto que alega fornecer uma resistencia
maior que o usado atualmente. O engenheiro solicita entao da E.E.U.F.M.G. um laudo tecnico
de teste de compressao em 36 corpos de prova fabricados com o concreto desta segunda empresa,
obtendo uma resistencia media de 930kgf /cm2 . Supondo que a resistencia `a compressao do concreto
tem distribuicao normal com variancia 5.625(kgf /cm2 )2 , e utilizando em nvel de significancia de
= 0,01 responda:
(a) O engenheiro deve trocar de fornecedor?
(b) Qual o p-valor amostral do concreto do segundo fornecedor?
(c) Qual o poder do teste se a media real do concreto do segundo fornecedor for 950kgf /cm2 ?
Solucao:
(a) Para avaliarmos a conveniencia da troca de fornecedor estabelecemos o teste H0 : = 900
contra H1 : > 900. A regiao crtica sera:
!
)
(
5.625
n
n
= P (X36 ) > (930 )| = 900
2
2
#
"
36
(930 900)| = 900
=P Z>
5.625
= P(Z > 2,4) = 0,0082
esta na regiao
Como este valor e menor que o nvel de significancia = 0,01 vemos que X
crtica, e confirmando o teste feito em (a) rejeitamos H0 .
137
5.4. TESTE DE HIPOTESES
cpa/gsa
(c) Para calcularmos o poder do teste, vejamos a probabilidade de cometer erro tipo II se a
verdadeira media fosse 950:
36 < 929,25| = 950)
(950) = P(X
n
n
=P
(X36 ) <
(929,25 )
2
2
"
#
6
36
=P
(X36 950) <
(929,25 950)
75
5.625
6
(929,25 950)
=P Z<
75
= P(Z < 1,66) = 0,0485
E portanto o poder do teste e K(950) = 1 0,4085 = 0,9515.
3. Como analista do controle de qualidade de uma fabrica de lampadas voce sabe que o tempo de
vida do produto tem distribuicao normal com variancia igual a 14.400 horas2 e que sua linha de
producao esta ajustada para que as lampadas possuam uma vida media de 1.600 horas.
(a) Construa um teste de hipotese bilateral para a duracao media da lampada, construindo a
regiao crtica para = 0,10.
100 = 1.615
(b) Qual sua conclusao se um lote de 100 lampadas da producao de um dia forneceu X
horas como duracao media da lampada? Qual o p-valor amostral para esta amostra?
(c) Se a media real fosse 1.620 horas qual seria o poder do teste?
Solucao:
(a) A hipotese nula e H0 = 1.600 e a hipotese alternativa e H1 6= 1.600. Rejeitamos a hipotese
nula se:
Xn < 0 z 2
ou
Xn > 0 + z 2
n
n
Como o valor de = 0,10, entao z 2 = 1,645 e assim a regiao crtica e
C=
120
10
120
10
< 1.580,26 ou X
> 1.619,74
C = (X1 , . . . ,X100 ) : X
100 = 1.615 nao esta na regiao crtica nao rejeitamos H0 , ou seja
(b) Como a media amostral X
nao ha evidencias amostrais para rejeitarmos a afirmacao de que a linha de producao produz
lampadas com duracao media de 1.600 horas.
No teste bilateral H0 : = 0 versus H1 : 6= 0 o p-valor amostral e calculado da seguinte
forma:
<x
obs < 0 , p-valor = 2P(X
obs | = 0 )
i. Se x
>x
ii. Se x
obs > 0 , p-valor = 2P(X
obs | = 0 )
138
5.4. TESTE DE HIPOTESES
cpa/gsa
n
n
= 2P
(X100 ) >
(1.615 1.600)| = 1.600)
2
2
100
= 2P Z >
15 = P(Z > 1,25) = 0,2113
14.400
O p-valor e maior que = 0,10 confirmando entao que nao rejeitamos a hipotese nula.
(c) Para calcularmos o poder do teste, temos que calcular a probabilidade de cometer erro tipo II
se a verdadeira media fosse 1.620. Lembremos que a probabilidade de cometer erro tipo II e a
devera
probabilidade de nao rejeitarmos H0 quando ela e falsa. Para nao rejeitarmos H0 , X
cair na regiao de aceitacao, ou seja:
(1.620) = P(Nao rejeitar H0 | = 1.620)
100 < 1.619,74| = 1.620)
= P(1.580,26 < X
n
n
n
=P
(1.580,26 ) <
(X100 ) <
(1.619,74 )| = 1.620
2
2
2
"
#
100
100
=P
(1.580,26 1.620) < Z <
(1.619,74 1.620)
14.400
14.400
= P(3,31 < Z < 0,02)
= P(Z < 0,02) P(Z < 3,31) = 0,492022 0,000466 = 0,491556
Logo o poder do teste e K = 1 0,491556 = 0,508444
5.4.2.2
Vari
ancia desconhecida
S2 =
X
1
2
(Xi X)
(n 1) i=1
n < 0 t(n1;) S
X
n
Teste 2: H0 : = 0
Xn > 0 + t(n1;)
n
Teste 3: H0 : = 0
H1 : 6= 0 , rejeitamos H0 , ao nvel , se
n(Xn )
S
tem distri-
5.4. TESTE DE HIPOTESES
cpa/gsa
Para recordar, t(n1;) e tal que P(Tn1 > t(n1;) ) = . E t(n1; 2 ) e definido analogamente.
Exemplo
1. Num teste de resistencia de cordas (7 cm. de diametro) para uma amostra de tamanho n = 16,
16 = 4.482kg e S16 = 115kg.
foram obtidos os seguintes resultados para a tensao de ruptura: X
Suponha que a tensao de ruptura e uma variavel com distribuicao normal. Se o fabricante alega
que a resistencia media e = 4.500 e voce e responsavel pela seguranca de quem ira utilizar a
corda:
(a) Defina um teste apropriado e construa a regiao crtica com = 0,01.
(b) Qual a conclusao para os valores amostrais apresentados? Qual o p-valor amostral?
(c) Qual a probabilidade de se cometer erro tipo II se a media real fosse 4.475kg?
Solucao
(a) A hipotese nula e H0 : = 4.500 e a hipotese alternativa e H1 : < 4.500. Rejeitamos a
hipotese nula se:
n < 0 t(n1;) S
X
n
A regiao crtica e:
115
n
n
=P
(X16 ) <
(4.482 4.500)| = 4.500)
S
S
16
= P T15 <
(18) = P(T15 < 0,63) 0,27
115
Como esperado pelo resultado de (a) o p-valor amostral e maior que o nvel de significancia
dado = 0,01, confirmando que nao rejeitamios H0 .
(c) Para calcularmos a probabilidade de erro tipo II
(4.475) = P(Nao rejeitar H0 | = 4.475)
16 > 4.425,19| = 4.475)
= P(X
n
n
=P
(X16 ) >
(4.425,19 )
S
S
"
#
16
= P T15 <
(4.425,19 4.475)
115
= P(T15 < 1,732)
= P(T15 > 1,732) 0,052
140
5.4. TESTE DE HIPOTESES
5.4.3
cpa/gsa
Testes sobre a m
edia, caso n
ao normal
C = (X1 , . . . Xn ) : Xn < 0 z
se e conhecido ou
n
n < 0 z S
C = (X1 , . . . Xn ) : X
se e desconhecido.
n
Observe que a regiao crtica usa o quantil da distribuicao normal padrao, ou seja, a regiao crtica
e similar `a regiao crtica no caso normal com variancia conhecida. A diferenca esta que neste caso
a regiao crtica e aproximada. Para usar esta aproximacao precisamos de amostras grandes. Quao
grande precisa ser esta amostra, depende da distribuicao dos dados. Um histograma pode nos auxiliar na avaliacao do tamanho amostral. Se o histograma e simetrico em torno de algum ponto,
precisamos de amostras relativamente pequenas (n = 30 pode ser suficiente), mas se o histograma
e assimetrico precisamos de tamanhos amostrais maiores.
Teste 2: H0 : = 0
H1 : > 0
Teste 3: H0 : = 0
H1 : 6= 0
As regioes crticas para os testes 2 e 3 sao obtidas de forma analoga ao teste 1, sendo importante
reforcar que as regioes sao aproximadas.
5.4.3.1
Imaginemos uma eleicao para presidente em que o candidato A deseja fazer inferencia sobre a proporcao de eleitores que apoiam sua candidatura. Assuma que existem dezenas de milhoes de eleitores e
que o candidato A escolhe uma amostra aleatoria de tamanho 3.500 e conta entre eles o n
umero de eleitores que apoiam sua candidatura. Podemos considerar o n
umero 3.500 muito pequeno quando comparado
`as dezenas de milhoes de eleitores que apoiam o candidato A. Sendo assim, se definirmos:
n(Xn )
n(
p p)
Zn =
=p
p(1 p)
141
5.4. TESTE DE HIPOTESES
cpa/gsa
Exemplos:
1. (continuacao) O candidato A afirma que p0 = 0,30. Se dos 3.500 eleitores entrevistados, 738 apoiam
sua candidatura, teste a hipotese nula com = 0,05.
Solucao:
A hipotese nula neste caso e H0 : p = 0,30 e a hipotese alternativa H1 : p < 0,30. Ao nvel de
= 0,05, H0 sera rejeitada se
r
p < p0 z
p0 (1 p0 )
= 0,30 z0,05
n
0,30(0,70)
= 0,30 1,642(0,007746) = 0,2873
3.500
Como o valor observado p = 738/3500 = 0,2109 e menor que 0,2873, rejeitamos a hipotese nula; isto
e, ha evidencias para rejeitar a afirmacao de que a proporcao de eleitores que apoiam o candidato
A seja 0,30.
2. Uma linha de producao em grande escala produz 8% de itens defeituosos. A empresa dona da linha,
visando reduzir a proporcao de defeituosos faz investimentos de grande porte na linha de producao
e antes de religa-la definitivamente produz para teste 800 itens dos quais 52 resultaram defeituosos.
Para avaliar o efeito dos investimentos, formule um teste apropriado e obtenha conclusoes ao nvel
= 0,05.
Solucao:
A hipotese nula neste caso e H0 : p = 0,08. Espera-se que, para justificar os investimentos, a
proporcao de itens defeituosos tenha diminudo, isto e H1 : p < 0,08. Ao nvel de = 0,05, H0 sera
rejeitada se
r
p < p0 z
p0 (1 p0 )
= 0,08 z0,05
n
0,08(0,92)
= 0,08 1,642(0,009592) = 0,06422
800
Como o valor observado p = 52/800 = 0,065 nao rejeitamos a hipotese nula, isto e, nao ha evidencias
para rejeitar a afirmacao de que a proporcao de defeituosos na linha apos os investimentos seja igual
a 0,08. Assim sendo os investimentos nao surtiram efeito.
142
5.4. TESTE DE HIPOTESES
5.4.4
cpa/gsa
Considere uma amostra aleatoria X1 ,X2 , . . . ,Xn de uma variavel aleatoria X com distribuicao normal
com vari
ancia 2 . Abordamos nesta secao o problema de testes sobre variancia:
Teste 1: H0 : 2 = 02
H1 : 2 < 02
Teste 2: H0 : 2 = 02
H1 : 2 > 02
Teste 3: H0 : 2 = 02
H1 : 2 6= 02
(n 1)S 2
tem distribuicao qui-quadrado com n 1 graus de liberdade.
2
No teste 1, H0 sera rejeitada se a variancia amostral for menor que um valor c, ou seja a regiao crtica
do teste e da forma {(x1 ,x2 , . . . ,xn ) : S 2 < c}. O valor de c e encontrado a partir do valor de :
(n 1)S 2
(n 1)c 2
2
= P(S 2 < c| 2 = 02 ) = P
<
|
=
0
02
02
(n 1)c
2
assim
= P Xn1 <
02
(n 1)c
2
>
ou de forma equivalente
1 = P Xn1
02
2
Da tabela da distribuicao qui-quadrado encontramos o valor X(1;n1)
tal que
2
2
P(Xn1
> X(1;n1)
)=1
De e tem-se que
02
(n 1)c
2
= X(1;n1)
e portanto c =
X2
.
2
0
n 1 (1;n1)
02
X2
n 1 (1;n1)
Exemplo:
As notas de uma disciplina ajustam uma distribuicao normal. Historicamente a variancia e igual a 36.
Um novo metodo de ensino esta sendo proposto para tornar a turma mais homogenea no aprendizado.
20 alunos sao matriculados em uma disciplina em que e usado o novo metodo e observou-se que o valor
amostral de S 2 foi igual a 32. Formule um teste apropriado e avalie se o novo metodo atingiu o objetivo
(use = 0,10).
Solucao:
A hipotese nula e H0 : 2 = 36. Como espera-se que o metodo tenha surtido resultado temos a
hipotese alternativa H1 : 2 < 36. H0 ser
a rejeitada se
S2 <
36 2
02
X2
=
X
= 1,8947 11,65 = 22,07
n 1 (1;n1)
19 (0,9;19)
143
5.4. TESTE DE HIPOTESES
cpa/gsa
Nao podemos portanto rejeitar H0 , o que sugere que o novo metodo nao surtiu efeito.
Procedendo analogamente como feito no teste 1, conclui-se que no teste 2 H0 sera rejeitada, ao nvel
se
02
S2 >
X2
n 1 (;n1)
E no teste 3 H0 sera rejeitada, ao nvel se
S2 <
02
X2
n 1 (1 2 ;n1)
ou
S2 >
02
X 2
n 1 ( 2 ;n1)
Exemplo:
Para melhorar o processo de fabricac
ao de detergente de sua empresa, o dono adquiriu uma nova
maquina de enchimento de garrafas plasticas. O fabricante desta maquina garantia que com sua utilizacao, a variancia do volume de detergente em cada garrafa seria 8,75 ml2 . Apos sua intalacao, o
empresario retirou uma amostra aleatoria de 20 garrafas. O volume de cada garrafa nesta amostra resultou em uma variancia de 13,4 ml2 . Se o volume de enchimento tem distribuicao normal, ha evidencias de
que a maquina de enchimento esta atendendo `a performance de variabilidade informada pelo fabricante,
com = 0,05?
Solucao:
As hipoteses a serem testadas sao H0 : 2 = 8,75 ml2 contra H1 : 2 6= 8,75 ml2 e a regiao crtica
sera:
02
02
2
2
2
C : (X1 , . . . , X20 ) : S 2 <
X(1
ou
S
>
X
2 ;n1)
n1
n 1 ( 2 ;n1)
Na tabela da quiquadrado temos:
2
2
X(1
2
X(2 ;n1) = X(0,025;19)
= 32,85
2
8,75
8,75
C : (X1 , . . . , X20 ) : S 2 <
8,91 ou S 2 >
32,85 = (X1 , . . . , X20 ) : S 2 < 4,10 ou S 2 > 15,12
19
19
Como a variancia amostral (S 2 = 13,4) esta fora da regiao crtica mao rejeitamos H0 , ou seja, nao ha
evidencias significativas de que a variancia seja diferente de 8,75 ml2 .
144
5.4. TESTE DE HIPOTESES
cpa/gsa
5.4.5
5.4.5.1
Vari
ancias conhecidas
Sejam X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com distribuicao normal com media 1 e variancia 12 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m de uma
variavel aleatoria Y com distribuicao normal com media 2 e variancia 22 ; X e Y independentes.
Como ja vimos a estatstica:
Z=
n Ym (1 2 )
X
r
12
2
+ 2
n
m
H1 : 1 2 < 0
Teste 2: H0 : 1 2 = 0
H1 : 1 2 > 0
Teste 3: H0 : 1 2 = 0
H1 : 1 2 6= 0
usamos a estatstica Z e:
No teste 1: Ao nvel , rejeita-se H0 se
r
Y < z
X
12
2
+ 2
n
m
12
2
+ 2
n
m
2
2
1
1
Y < z
Y > z
X
+
ou X
+
2
2
n
m
n
m
Exemplo:
Um empresa produz postes de ferro para padrao de energia eletrica, pintados com tinta prateada
especial. Um fabricante de produtos qumicos esta anunciando um catalisador especial que, misturado `a
tinta usada pelo fabricante dos padroes reduz o tempo de secagem. Sabe-se que o tempo de secagem e
uma vari
avel aleatoria com distribuicao normal com desvio padrao de 8 minutos e que este desvio padrao
nao deve se alterar pela adicao do novo produto qumico. Dez postes sao pintados com a tinta usual e
dez com a tinta misturada ao novo produto, simultaneamente. Os tempos medios de secagem das duas
= 121 minutos e Y = 112 minutos. Quais as conclusoes que o fabricante de postes pode
amostras foram X
145
5.4. TESTE DE HIPOTESES
cpa/gsa
tirar sobre a eficiencia do catalisador, com um nvel de significancia de = 0,05? Qual o p-valor amostral?
Solucao:
As hipoteses a serem testadas sao H0 : X Y = 0 e H0 : X Y > 0, e a regiao crtica
correspondente e:
(
r
!)
12
22
Y > 1,645
(X1 , . . . , X10 ; Y1 , . . . , Y10 ) : X
82
82
+
10 10
)
= 5,89
Y > 9|X Y = 0
p-valor =P X
Y (X Y )
X
9 (X Y )
r
> r
|X Y = 0
p-valor =P
12
12
2
2
+ 2
+ 2
n
m
n
m
p-valor =P
Z > r
5.4.5.2
9
2
8
8
+
10 10
Vari
ancias desconhecidas mas iguais
Tomemos agora X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com
distribuicao normal com media 1 e variancia 2 e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma variavel aleatoria Y com distribuicao normal com media 2 e variancia 2 ; X e Y independentes
e variancias desconhecidas, mas iguais.
Nesse caso temos a estatstica:
T =
n Ym (1 2 )
X
r
1
1
+
Sp
n m
s
Sp =
(n 1)S12 + (m 1)S22
n+m2
146
5.4. TESTE DE HIPOTESES
cpa/gsa
H1 : 1 2 < 0
Teste 2: H0 : 1 2 = 0
H1 : 1 2 > 0
Teste 3: H0 : 1 2 = 0
H1 : 1 2 6= 0
usamos a estatstica T e:
No teste 1: Ao nvel , rejeita-se H0 se
r
Y < t(n+m2;) Sp
X
1
1
+
n m
1
1
+
n m
1
1
+
n m
ou
r
Y > t(m+n2; )
X
2
r
= 1,714 3,73
1
1
+
n m
1
1
+
15 10
!
= 2,61
147
5.4. TESTE DE HIPOTESES
cpa/gsa
Y = 24,2 23,9 = 0,3 esta fora da regiao crtica, nao rejeitamos H0 , ou seja, ha evidencias
Como X
para apoiar a afirmacao de que as populacoes possuem a mesma media.
Para calcularmos o p-valor amostral fazemos:
Y > 0,3|X Y = 0)
p-valor =P(X
0,3
0,3
0,42
p-valor =P t23 >
1,5228
5.4.5.3
Vari
ancias desconhecidas e diferentes
Se tivermos X1 ,X2 , . . . ,Xn uma amostra aleatoria de tamanho n de uma variavel aleatoria X com
2
distribuicao normal com media 1 e variancia X
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma variavel aleatoria Y com distribuicao normal com media 2 e variancia Y2 ; X e Y independentes
e variancias desconhecidas e diferentes, para testarmos:
Teste 1: H0 : 1 2 = 0
H1 : 1 2 < 0
Teste 2: H0 : 1 2 = 0
H1 : 1 2 > 0
Teste 3: H0 : 1 2 = 0
H1 : 1 2 6= 0
teremos agora:
Teste 1: Ao nvel , rejeita-se H0 se
r
Y < t(;)
X
2
SX
S2
+ Y
n
m
2
SX
S2
+ Y
n
m
X Y < t(; 2 )
+
ou X Y > t(; 2 )
+
n
m
n
m
onde , o n
umero de graus de liberdade da estatstica T nesse caso e calculado por:
2
2
SY2
SX
+
n
m
=
2
2 2
2
2
SY /m
SX /n
+
n+1
m+1
148
5.4. TESTE DE HIPOTESES
5.4.6
cpa/gsa
Suponha que X1 ,X2 , . . . ,Xn seja uma amostra aleatoria de tamanho n de uma populacao com dis2
tribuicao normal com media X e variancia X
e Y1 ,Y2 , . . . ,Ym uma amostra aleatoria de tamanho m
de uma populacao com distribuicao normal com media Y e variancia Y2 . Se as duas populacoes sao
independentes e quisermos comparar as variancias das duas populacoes com os testes:
2
2
X
X
2
2
2
<
= Y2
=
1
contra
H
:
<
1
Teste 1: H0 : X
1
Y
X
Y2
Y2
2
X
X
2
2
2
Teste 2: H0 : X
= Y2
=
1
contra
H
:
>
>
1
1
X
Y
Y2
Y2
2
2
X
X
2
2
2
2
Teste 3: H0 : X = Y
=1
contra
H1 : X 6= Y
6= 1
Y2
Y2
Lembremos que a estatstica
S12 22
S22 12
tem distribuicao F de Fisher com n 1 e m 1 graus de liberdade. Assim podemos escrever que as
regioes crticas de cada um dos tres testes, a um nvel de significancia sao:
Teste 1:
C:
S2
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
< f(n1;m1;1)
SY2
2
1
SX
C : (X1 , . . . , Xn ; Y1 , . . . , Ym ) : 2 <
SY
f(m1;n1;)
Teste 2:
S2
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
> f(n1;m1;)
SY2
C:
Teste 3:
C:
ou
S2
1
(X1 , . . . , Xn ; Y1 , . . . , Ym ) : X
<
SY2
f(m1;n1; 2 )
C:
(X1 , . . . , Xn ; Y1 , . . . , Ym ) :
2
SX
> f(n1;m1; 2 )
SY2
Exemplo:
Duas ind
ustrias qumicas produzem uma materia prima cuja concentracao de um elemento em particular e muito importante. A media da concentracao deste elemento nos produtos dos dois fabricantes
e a mesma, mas suspeita-se que a variabilidade possa diferir entre os dois produtos. Sao colhidas duas
amostras, uma de cada fabricante, com o seguinte resultado:
1. Amostra do fabricante X: n = 10 e SX = 4,7 gr/l
2. Amostra do fabricante Y : n = 16 e SX = 5,8 gr/l
149
5.5. EXERCICIOS
cpa/gsa
Ha evidencias para concluirmos que a variancia da concentracao do elemento em estudo seja diferente
para os dois fabricantes (use = 0,05)?
Solucao:
2
2
X
X
=
1
contra
H
:
6= 1. Neste caso sabemos que a regiao crtica sera:
1
Y2
Y2
(
)
2
2
SX
1
SX
C : (X1 , . . . , X10 ; Y1 , . . . , Y16 ) : 2 <
ou 2 > f(n1;m1; 2 )
SY
f(m1;n1; 2 )
SY
2
2
1
SX
SX
C : (X1 , . . . , X10 ; Y1 , . . . , Y16 ) : 2 <
= 0,265 ou 2 > 3,12
SY
3,77
SY
Como
2
4,72
22,09
SX
=
=
= 0,6564
SY2
5,82
33,64
esta fora da regiao crtica, nao rejeitamos H0 ou seja, nao ha evidencias para rejeitar a afirmacao que a
variancia das duas populacoes sejam iguais.
Observa
c
ao Final: Vimos no item 5.4.5 que existem tres opcoes diferentes para testarmos diferenca
de medias de duas amostras de populacoes normais:
2
e Y2 conhecidas;
X
2
X
e Y2 desconhecidas mas iguais
2
X
e Y2 conhecidas e diferentes.
Se nao tivermos nenhuma informacao sobre as variancias, devemos inicialmete testar a igualdade das
2
mesmas, conforme visto no item 5.4.6 e a sim, apos rejeitarmos ou nao a hipotese H0 : X
= Y2 ,
escolhemos adequadamente o teste para diferenca de medias.
5.5
Exerccios
1. O peso de ruptura de certo tipo de barras tem distribuicao normal. Este peso foi medido para
18 destas barras. A media obtida foi 137,1 kg e a variancia amostral S 2 igual a 4,62kg 2 (desvio
padrao= 2,15 kg). Encontre um intervalo de 95% de confianca para a media de ruptura destas
barras.
2. Uma variavel aleatoria tem distribuicao normal com media desconhecida e variancia= 9. Deseja-se
testar, ao nvel = 0,05, a hipotese H0 : = 80 contra a alternativa H1 : 6= 80 . Defina a regiao
crtica deste teste, a partir de uma amostra aleatoria de tamanho 16. Se o valor observado de foi
x
16 = 82,6, qual a decisao que voce tomaria?
150
5.5. EXERCICIOS
cpa/gsa
3. Uma empresa produz barras de aco de 120 cm. O padrao de qualidade exige que as barras produzidas
tenham distribuicao normal com desvio padrao = 0,5 cm (Variancia=0,25 cm2 ). A secao de
controle de qualidade da empresa testa, a partir de amostra retirada aleatoriamente da procucao
no incio de cada semana, esta hipotese. No incio da primeira semana de julho obteve os dados
registrados a seguir:
121,2 119,6 120,9 119,8 121,6 120,0 120,2 118,9 119,9 119,7
120,0 120,4 121,0 119,4 120,3 119,7 120,4 120,6 120,4
Supondo que a hipotese de normalidade nao seja rejeitada, teste ao nvel de significancia = 0,05,
a hipotese especificada pelo padrao de qualidade, ou seja:
(a) Testar H0 : = 120 contra H1 : > 120;
(b) testar H0 : = 120 contra H1 :6= 120;
(c) assuma que a variancia populacional e 2 = 0,25 e encontre o p-valor amostral no teste do
item (b).
4. Uma variavel aleatoria tem distribuicao normal com media desconhecida e variancia=9. Deseja-se
testar, ao nvel = 0,01, H0 : = 100 contra H1 : 6= 100.
(a) Defina a regiao crtica para este teste a partir de uma amostra aleatoria de tamanho 20;
20 = 104,6; qual a decisao que voce tomaria? Calcule o p-valor
(b) Se o valor observado de foi x
amostral;
(c) Calcule o poder do teste se o verdadeiro valor da media e 103.
5. Uma empresa produz barras de aco que de acordo a especificacoes do mercado precisam ter media
igual a 100 e desvio padrao igual a 1. Foi medido o comprimento de 15 barras e obteve-se:
99,9 101,2 99,4 101,2 102,1 101,2 99,8 99,5 102,0 103,5 100,1 103,8 101,6 100,7 99,3
Feito o teste de normalidade, esta hipotese nao foi rejeitada.
(a) Teste a hipotese H0 : = 100 contra H1 : 6= 120 ao nvel = 0,10;
(b) Teste a hipoteseH0 : 2 = 1 contra 2 6= 1 ao nvel = 0,10;
(c) Calcule o p-valor amostral do teste descrito em (a) e calcule o poder do teste se o verdadeiro
valor da media for igual a 101.
(d) Construa um intervalo de confianca de 90% para a media.
6. Voce e proprietario de uma empresa que produz vergalhoes de aco para construcao civil. Utililiza o
aco grau AO01 cuja resistencia nominal `a tracao tem distribuicao normal com media 50 kgf /mm2
e desvio padrao 2,5 kgf /mm2 . Um cliente tradicional de sua empresa alega que seu aco esta fornecendo uma resistencia `a tracao inferior `a nominal. Suponha que voce tem que julgar a reclamacao
de seu cliente.
(a) Formule um teste apropriado e defina a regiao crtica ao nvel de = 0,01; usando uma amostra
de tamanho 25.
151
5.5. EXERCICIOS
cpa/gsa
1
3,6
4,4
2
2,5
3,3
3
2,2
2,8
4
3,4
4,4
5
3,3
3,6
6
2,6
3,7
7
2,0
2,1
8
3,9
4,6
9
3,9
5,1
10
3,4
4,6
11
4,4
3,6
12
3,7
4,6
13
2,9
2,7
14
5,9
5,6
15
4,2
3,9
8. Voce e responsavel pelo envazamento de latas de refrigerante de uma fabrica e semanalmente inspeciona a linha de producao para saber se ela esta bem ajustada. A amostra da u
ltima semana
forneceu os seguintes volumes ( em ml.):
299
309
302
298
302
291
296
302
306
303
301
303
9. O diametro de rodas ferroviarias produzidas por duas forjas esta sendo investigado. Amostras
aleatorias de tamanhos n = 9 e m = 16 respectivamente das forjas X e Y , foram obtidas e apurouse o seguinte resultado
Forja X =
x
= 670mm
2
SX
= 49mm2
Forja Y =
y = 665mm
SY2 = 36mm2
(a) Existe alguma evidencia para apoiar a afirmacao de que as rodas da forja Y possuem diametro
menor que as rodas da forja X? Suponha que as variancias sao iguais e use = 0,10.
(b) Encontre o p-valor para a estatstica calculada em a.
5.5. EXERCICIOS
cpa/gsa
12. A chapa que tenta reconstruir o DA do Icex afirma contar com apoio de 80% dos estudantes do
Instituto. Um enquete e realizada com 100 estudantes escolhidos aleatoriamente, e 72 afirmaram
apoiar a chapa. Se p e a proporcao dos alunos que apoiam a chapa:
(a) Defina; ao nvel de significancia = 0,01; a regiao crtica para testar H0 : p = 0,8 contra
H1 : p < 0,8.
(b) Construa um intervalo de confianca de 95% de confianca para a real proporcao de pessoas que
apoiam a chapa com base na amostra da enquete.
153
Captulo 6
Bibliografia
154
Refer
encias Bibliogr
aficas
ao do n
umero
otimo de classes em um histograma. Relatorios
[1] Atuncar, G. S. e Amorim, F. G. Estimac
de Projetos em Estatstica, Depto de Estatstica UFMG, Belo Horizonte. 2003
[2] Casella, George & Berger, Roger L Statistical Inference, 2nd Edition Duxbury, Thompson Learning.
2002.
[3] Hogg, R & Craig, A Introduction to Mathematical Statistics, 5th Edition. Prentice Hall. 1994.
[4] Karlin, S & Taylor, H A first course in stochastic process, Academic Press. 1975.
[5] Kolmogorov, A. N., Foundations of the theory of probability, Grundbegriffe der Wahrscheinlichkeitsrechnung. 1933.
[6] Magalhaes Marcos Nascimento, Noc
oes de Probabilidade e Estatstica, Marcos Nascimento Magalhaes, Antonio Carlos Pedros de Lima. 6a ed. Editora Universidade de Sao Paulo. 2008.
[7] Montgomery D. C. e Runger G. C., Estatstica aplicada e probabilidade para engenheiros; traducao
Veronica Calado. LTC Livros Tecnicos e Cientficos Editora S.A. 2008.
[8] Ross, Sheldon, A First course in probability, 5th Edition. Prentice Hall, Inc. 1998.
155
Captulo 7
Ap
endice
156
cpa/gsa
0,00
0,500000
0,539828
0,579260
0,617911
0,655422
0,691462
0,725747
0,758036
0,788145
0,815940
0,841345
0,864334
0,884930
0,903200
0,919243
0,933193
0,945201
0,955435
0,964070
0,971283
0,977250
0,982136
0,986097
0,989276
0,991802
0,993790
0,995339
0,996533
0,997445
0,998134
0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952
0,01
0,503989
0,543795
0,583166
0,621720
0,659097
0,694974
0,729069
0,761148
0,791030
0,818589
0,843752
0,866500
0,886861
0,904902
0,920730
0,934478
0,946301
0,956367
0,964852
0,971933
0,977784
0,982571
0,986447
0,989556
0,992024
0,993963
0,995473
0,996636
0,997523
0,998193
0,998694
0,999065
0,999336
0,999534
0,999675
0,999776
0,999847
0,999896
0,999931
0,999954
0,02
0,507978
0,547758
0,587064
0,625516
0,662757
0,698468
0,732371
0,764238
0,793892
0,821214
0,846136
0,868643
0,888768
0,906582
0,922196
0,935745
0,947384
0,957284
0,965620
0,972571
0,978308
0,982997
0,986791
0,989830
0,992240
0,994132
0,995604
0,996736
0,997599
0,998250
0,998736
0,999096
0,999359
0,999550
0,999687
0,999784
0,999853
0,999900
0,999933
0,999956
0,03
0,511966
0,551717
0,590954
0,629300
0,666402
0,701944
0,735653
0,767305
0,796731
0,823814
0,848495
0,870762
0,890651
0,908241
0,923641
0,936992
0,948449
0,958185
0,966375
0,973197
0,978822
0,983414
0,987126
0,990097
0,992451
0,994297
0,995731
0,996833
0,997673
0,998305
0,998777
0,999126
0,999381
0,999566
0,999698
0,999792
0,999858
0,999904
0,999936
0,999958
0,04
0,515953
0,555670
0,594835
0,633072
0,670031
0,705401
0,738914
0,770350
0,799546
0,826391
0,850830
0,872857
0,892512
0,909877
0,925066
0,938220
0,949497
0,959070
0,967116
0,973810
0,979325
0,983823
0,987455
0,990358
0,992656
0,994457
0,995855
0,996928
0,997744
0,998359
0,998817
0,999155
0,999402
0,999581
0,999709
0,999800
0,999864
0,999908
0,999938
0,999959
157
0,05
0,519939
0,559618
0,598706
0,636831
0,673645
0,708840
0,742154
0,773373
0,802337
0,828944
0,853141
0,874928
0,894350
0,911492
0,926471
0,939429
0,950529
0,959941
0,967843
0,974412
0,979818
0,984222
0,987776
0,990613
0,992857
0,994614
0,995975
0,997020
0,997814
0,998411
0,998856
0,999184
0,999423
0,999596
0,999720
0,999807
0,999869
0,999912
0,999941
0,999961
0,06
0,523922
0,563559
0,602568
0,640576
0,677242
0,712260
0,745373
0,776373
0,805105
0,831472
0,855428
0,876976
0,896165
0,913085
0,927855
0,940620
0,951543
0,960796
0,968557
0,975002
0,980301
0,984614
0,988089
0,990863
0,993053
0,994766
0,996093
0,997110
0,997882
0,998462
0,998893
0,999211
0,999443
0,999610
0,999730
0,999815
0,999874
0,999915
0,999943
0,999963
0,07
0,527903
0,567495
0,606420
0,644309
0,680822
0,715661
0,748571
0,779350
0,807850
0,833977
0,857690
0,879000
0,897958
0,914657
0,929219
0,941792
0,952540
0,961636
0,969258
0,975581
0,980774
0,984997
0,988396
0,991106
0,993244
0,994915
0,996207
0,997197
0,997948
0,998511
0,998930
0,999238
0,999462
0,999624
0,999740
0,999822
0,999879
0,999918
0,999946
0,999964
0,08
0,531881
0,571424
0,610261
0,648027
0,684386
0,719043
0,751748
0,782305
0,810570
0,836457
0,859929
0,881000
0,899727
0,916207
0,930563
0,942947
0,953521
0,962462
0,969946
0,976148
0,981237
0,985371
0,988696
0,991344
0,993431
0,995060
0,996319
0,997282
0,998012
0,998559
0,998965
0,999264
0,999481
0,999638
0,999749
0,999828
0,999883
0,999922
0,999948
0,999966
0,09
0,535856
0,575345
0,614092
0,651732
0,687933
0,722405
0,754903
0,785236
0,813267
0,838913
0,862143
0,882977
0,901475
0,917736
0,931888
0,944083
0,954486
0,963273
0,970621
0,976705
0,981691
0,985738
0,988989
0,991576
0,993613
0,995201
0,996427
0,997365
0,998074
0,998605
0,998999
0,999289
0,999499
0,999651
0,999758
0,999835
0,999888
0,999925
0,999950
0,999967
GL
9,89
10,52
11,16
11,81
12,46
13,12
13,79
20,71
27,99
35,53
43,28
51,17
25
26
27
28
29
30
40
50
60
70
80
5,14
16
24
4,60
15
9,26
4,07
14
23
3,57
13
8,64
3,07
12
22
2,60
11
8,03
2,16
10
21
1,73
7,43
1,34
20
0,99
6,84
0,68
19
0,41
6,26
0,21
18
0,07
5,70
0,01
17
0,00
0,995
158
53,54
45,44
37,48
29,71
22,16
14,95
14,26
13,56
12,88
12,20
11,52
10,86
10,20
9,54
8,90
8,26
7,63
7,01
6,41
5,81
5,23
4,66
4,11
3,57
3,05
2,56
2,09
1,65
1,24
0,87
0,55
0,30
0,11
0,02
0,00
0,990
57,15
48,76
40,48
32,36
24,43
16,79
16,05
15,31
14,57
13,84
13,12
12,40
11,69
10,98
10,28
9,59
8,91
8,23
7,56
6,91
6,26
5,63
5,01
4,40
3,82
3,25
2,70
2,18
1,69
1,24
0,83
0,48
0,22
0,05
0,00
0,975
57,96
49,50
41,15
32,95
24,94
17,21
16,45
15,70
14,96
14,22
13,48
12,75
12,03
11,31
10,60
9,90
9,20
8,51
7,83
7,16
6,50
5,86
5,22
4,60
4,00
3,41
2,85
2,31
1,80
1,33
0,90
0,54
0,25
0,06
0,00
0,970
60,39
51,74
43,19
34,76
26,51
18,49
17,71
16,93
16,15
15,38
14,61
13,85
13,09
12,34
11,59
10,85
10,12
9,39
8,67
7,96
7,26
6,57
5,89
5,23
4,57
3,94
3,33
2,73
2,17
1,64
1,15
0,71
0,35
0,10
0,00
0,950
64,28
55,33
46,46
37,69
29,05
20,60
19,77
18,94
18,11
17,29
16,47
15,66
14,85
14,04
13,24
12,44
11,65
10,86
10,09
9,31
8,55
7,79
7,04
6,30
5,58
4,87
4,17
3,49
2,83
2,20
1,61
1,06
0,58
0,21
0,02
0,900
69,21
59,90
50,64
41,45
32,34
23,36
22,48
21,59
20,70
19,82
18,94
18,06
17,19
16,31
15,44
14,58
13,72
12,86
12,00
11,15
10,31
9,47
8,63
7,81
6,99
6,18
5,38
4,59
3,82
3,07
2,34
1,65
1,01
0,45
0,06
0,800
72,92
63,35
53,81
44,31
34,87
25,51
24,58
23,65
22,72
21,79
20,87
19,94
19,02
18,10
17,18
16,27
15,35
14,44
13,53
12,62
11,72
10,82
9,93
9,03
8,15
7,27
6,39
5,53
4,67
3,83
3,00
2,19
1,42
0,71
0,15
0,700
76,19
66,40
56,62
46,86
37,13
27,44
26,48
25,51
24,54
23,58
22,62
21,65
20,69
19,73
18,77
17,81
16,85
15,89
14,94
13,98
13,03
12,08
11,13
10,18
9,24
8,30
7,36
6,42
5,49
4,57
3,66
2,75
1,87
1,02
0,27
0,600
79,33
69,33
59,33
49,33
39,34
29,34
28,34
27,34
26,34
25,34
24,34
23,34
22,34
21,34
20,34
19,34
18,34
17,34
16,34
15,34
14,34
13,34
12,34
11,34
10,34
9,34
8,34
7,34
6,35
5,35
4,35
3,36
2,37
1,39
0,45
0,500
82,57
72,36
62,13
51,89
41,62
31,32
30,28
29,25
28,21
27,18
26,14
25,11
24,07
23,03
21,99
20,95
19,91
18,87
17,82
16,78
15,73
14,69
13,64
12,58
11,53
10,47
9,41
8,35
7,28
6,21
5,13
4,04
2,95
1,83
0,71
0,400
86,12
75,69
65,23
54,72
44,16
33,53
32,46
31,39
30,32
29,25
28,17
27,10
26,02
24,94
23,86
22,77
21,69
20,60
19,51
18,42
17,32
16,22
15,12
14,01
12,90
11,78
10,66
9,52
8,38
7,23
6,06
4,88
3,66
2,41
1,07
0,300
88,13
77,58
66,98
56,33
45,62
34,80
33,71
32,62
31,53
30,43
29,34
28,24
27,14
26,04
24,93
23,83
22,72
21,60
20,49
19,37
18,25
17,12
15,98
14,85
13,70
12,55
11,39
10,22
9,04
7,84
6,63
5,39
4,11
2,77
1,32
0,250
90,41
79,71
68,97
58,16
47,27
36,25
35,14
34,03
32,91
31,79
30,68
29,55
28,43
27,30
26,17
25,04
23,90
22,76
21,61
20,47
19,31
18,15
16,98
15,81
14,63
13,44
12,24
11,03
9,80
8,56
7,29
5,99
4,64
3,22
1,64
0,200
93,11
82,26
71,34
60,35
49,24
37,99
36,85
35,71
34,57
33,43
32,28
31,13
29,98
28,82
27,66
26,50
25,33
24,16
22,98
21,79
20,60
19,41
18,20
16,99
15,77
14,53
13,29
12,03
10,75
9,45
8,12
6,74
5,32
3,79
2,07
0,150
96,58
85,53
74,40
63,17
51,81
40,26
39,09
37,92
36,74
35,56
34,38
33,20
32,01
30,81
29,62
28,41
27,20
25,99
24,77
23,54
22,31
21,06
19,81
18,55
17,28
15,99
14,68
13,36
12,02
10,64
9,24
7,78
6,25
4,61
2,71
0,100
101,88
90,53
79,08
67,50
55,76
43,77
42,56
41,34
40,11
38,89
37,65
36,42
35,17
33,92
32,67
31,41
30,14
28,87
27,59
26,30
25,00
23,68
22,36
21,03
19,68
18,31
16,92
15,51
14,07
12,59
11,07
9,49
7,81
5,99
3,84
0,050
106,63
95,02
83,30
71,42
59,34
46,98
45,72
44,46
43,19
41,92
40,65
39,36
38,08
36,78
35,48
34,17
32,85
31,53
30,19
28,85
27,49
26,12
24,74
23,34
21,92
20,48
19,02
17,53
16,01
14,45
12,83
11,14
9,35
7,38
5,02
0,025
112,33
100,43
88,38
76,15
63,69
50,89
49,59
48,28
46,96
45,64
44,31
42,98
41,64
40,29
38,93
37,57
36,19
34,81
33,41
32,00
30,58
29,14
27,69
26,22
24,73
23,21
21,67
20,09
18,48
16,81
15,09
13,28
11,34
9,21
6,63
0,010
116,32
104,21
91,95
79,49
66,77
53,67
52,34
50,99
49,65
48,29
46,93
45,56
44,18
42,80
41,40
40,00
38,58
37,16
35,72
34,27
32,80
31,32
29,82
28,30
26,76
25,19
23,59
21,95
20,28
18,55
16,75
14,86
12,84
10,60
7,88
0,005
Tabela 2
Qui-quadrado
cpa/gsa
159
0,051
0,45
0,126
0,050
0,050
120
100000
0,126
0,050
0,050
50
60
0,127
0,126
0,126
0,126
0,051
0,050
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,128
0,128
0,128
0,128
0,128
0,128
0,129
0,129
0,129
0,130
0,130
0,131
0,132
0,134
0,137
0,142
0,158
30
0,051
0,051
28
29
0,051
0,051
26
27
0,051
0,051
24
25
0,051
0,051
22
23
0,051
0,051
20
21
0,051
0,051
18
19
0,051
16
17
0,051
0,051
14
15
0,051
0,051
12
13
0,051
0,051
10
11
0,052
0,052
0,052
0,052
0,053
0,054
0,053
0,057
0,48
0,063
40
GL
0,40
0,253
0,254
0,254
0,255
0,255
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,257
0,257
0,257
0,257
0,257
0,258
0,258
0,258
0,259
0,259
0,260
0,260
0,261
0,262
0,263
0,265
0,267
0,271
0,277
0,289
0,325
0,35
0,385
0,386
0,387
0,388
0,388
0,389
0,389
0,389
0,389
0,390
0,390
0,390
0,390
0,390
0,391
0,391
0,391
0,392
0,392
0,392
0,393
0,393
0,394
0,395
0,396
0,397
0,398
0,399
0,402
0,404
0,408
0,414
0,424
0,445
0,510
0,30
0,524
0,526
0,527
0,528
0,529
0,530
0,530
0,530
0,531
0,531
0,531
0,531
0,532
0,532
0,532
0,533
0,533
0,534
0,534
0,535
0,536
0,537
0,538
0,539
0,540
0,542
0,543
0,546
0,549
0,553
0,559
0,569
0,584
0,617
0,727
0,25
0,674
0,677
0,679
0,679
0,681
0,683
0,683
0,683
0,684
0,684
0,684
0,685
0,685
0,686
0,686
0,687
0,688
0,688
0,689
0,690
0,691
0,692
0,694
0,695
0,697
0,700
0,703
0,706
0,711
0,718
0,727
0,741
0,765
0,816
1,000
0,20
0,842
0,845
0,848
0,849
0,851
0,854
0,854
0,855
0,855
0,856
0,856
0,857
0,858
0,858
0,859
0,860
0,861
0,862
0,863
0,865
0,866
0,868
0,870
0,873
0,876
0,879
0,883
0,889
0,896
0,906
0,920
0,941
0,978
1,061
1,376
0,15
1,036
1,041
1,045
1,047
1,050
1,055
1,055
1,056
1,057
1,058
1,058
1,059
1,060
1,061
1,063
1,064
1,066
1,067
1,069
1,071
1,074
1,076
1,079
1,083
1,088
1,093
1,100
1,108
1,119
1,134
1,156
1,190
1,250
1,386
1,963
0,10
1,282
1,289
1,296
1,299
1,303
1,310
1,311
1,313
1,314
1,315
1,316
1,318
1,319
1,321
1,323
1,325
1,328
1,330
1,333
1,337
1,341
1,345
1,350
1,356
1,363
1,372
1,383
1,397
1,415
1,440
1,476
1,533
1,638
1,886
3,078
0,08
1,405
1,414
1,423
1,426
1,432
1,441
1,442
1,443
1,445
1,446
1,448
1,450
1,452
1,454
1,457
1,459
1,462
1,466
1,469
1,474
1,478
1,484
1,490
1,498
1,507
1,518
1,532
1,549
1,572
1,603
1,649
1,723
1,859
2,189
3,895
0,06
1,555
1,566
1,577
1,582
1,589
1,600
1,602
1,604
1,606
1,608
1,610
1,612
1,615
1,618
1,621
1,624
1,628
1,632
1,637
1,642
1,649
1,656
1,664
1,674
1,686
1,700
1,718
1,740
1,770
1,812
1,873
1,971
2,156
2,620
5,242
0,05
1,645
1,658
1,671
1,676
1,684
1,697
1,699
1,701
1,703
1,706
1,708
1,711
1,714
1,717
1,721
1,725
1,729
1,734
1,740
1,746
1,753
1,761
1,771
1,782
1,796
1,812
1,833
1,860
1,895
1,943
2,015
2,132
2,353
2,920
6,314
0,04
1,751
1,766
1,781
1,787
1,796
1,812
1,814
1,817
1,819
1,822
1,825
1,828
1,832
1,835
1,840
1,844
1,850
1,855
1,862
1,869
1,878
1,887
1,899
1,912
1,928
1,948
1,973
2,004
2,046
2,104
2,191
2,333
2,605
3,320
7,916
0,03
1,881
1,899
1,917
1,924
1,936
1,955
1,957
1,960
1,963
1,967
1,970
1,974
1,978
1,983
1,988
1,994
2,000
2,007
2,015
2,024
2,034
2,046
2,060
2,076
2,096
2,120
2,150
2,189
2,241
2,313
2,422
2,601
2,951
3,896
10,579
0,025
1,960
1,980
2,000
2,009
2,021
2,042
2,045
2,048
2,052
2,056
2,060
2,064
2,069
2,074
2,080
2,086
2,093
2,101
2,110
2,120
2,131
2,145
2,160
2,179
2,201
2,228
2,262
2,306
2,365
2,447
2,571
2,776
3,182
4,303
12,706
0,01
2,326
2,358
2,390
2,403
2,423
2,457
2,462
2,467
2,473
2,479
2,485
2,492
2,500
2,508
2,518
2,528
2,539
2,552
2,567
2,583
2,602
2,624
2,650
2,681
2,718
2,764
2,821
2,896
2,998
3,143
3,365
3,747
4,541
6,965
31,821
0,005
2,576
2,617
2,660
2,678
2,704
2,750
2,756
2,763
2,771
2,779
2,787
2,797
2,807
2,819
2,831
2,845
2,861
2,878
2,898
2,921
2,947
2,977
3,012
3,055
3,106
3,169
3,250
3,355
3,499
3,707
4,032
4,604
5,841
9,925
63,656
0,0025
2,807
2,860
2,915
2,937
2,971
3,030
3,038
3,047
3,057
3,067
3,078
3,091
3,104
3,119
3,135
3,153
3,174
3,197
3,222
3,252
3,286
3,326
3,372
3,428
3,497
3,581
3,690
3,833
4,029
4,317
4,773
5,598
7,453
14,089
127,32
0,001
3,090
3,160
3,232
3,261
3,307
3,385
3,396
3,408
3,421
3,435
3,450
3,467
3,485
3,505
3,527
3,552
3,579
3,610
3,646
3,686
3,733
3,787
3,852
3,930
4,025
4,144
4,297
4,501
4,785
5,208
5,894
7,173
10,214
22,328
318,29
0,0005
3,291
3,373
3,460
3,496
3,551
3,646
3,660
3,674
3,689
3,707
3,725
3,745
3,768
3,792
3,819
3,850
3,883
3,922
3,965
4,015
4,073
4,140
4,221
4,318
4,437
4,587
4,781
5,041
5,408
5,959
6,869
8,610
12,924
31,600
636,58
Tabela 3
T de Student
cpa/gsa
160
8,53
4,79
6,85
6,64
120
100000
4,98
7,17
7,08
50
60
5,39
4,61
5,06
5,18
7,56
7,31
5,42
5,45
5,49
5,53
5,57
5,61
5,66
5,72
5,78
5,85
5,93
6,01
6,11
6,23
6,36
6,51
6,70
6,93
7,21
7,56
8,02
8,65
9,55
10,92
13,27
18,00
30,82
99,00
4999
30
7,64
7,60
28
29
7,72
7,68
26
27
7,82
7,77
24
25
7,95
7,88
22
23
8,10
8,02
20
21
8,29
8,18
18
19
8,40
16
17
8,86
8,68
14
15
9,33
9,07
9,65
12
10,04
10
11
13
11,26
10,56
12,25
13,75
21,20
16,26
98,50
34,12
4052
GL 1
40
GL 2
3,78
3,95
4,13
4,20
4,31
4,51
4,54
4,57
4,60
4,64
4,68
4,72
4,76
4,82
4,87
4,94
5,01
5,09
5,19
5,29
5,42
5,56
5,74
5,95
6,22
6,55
6,99
7,59
8,45
9,78
12,06
16,69
29,46
99,16
5404
3,32
3,48
3,65
3,72
3,83
4,02
4,04
4,07
4,11
4,14
4,18
4,22
4,26
4,31
4,37
4,43
4,50
4,58
4,67
4,77
4,89
5,04
5,21
5,41
5,67
5,99
6,42
7,01
7,85
9,15
11,39
15,98
28,71
99,25
5624
3,02
3,17
3,34
3,41
3,51
3,70
3,73
3,75
3,78
3,82
3,85
3,90
3,94
3,99
4,04
4,10
4,17
4,25
4,34
4,44
4,56
4,69
4,86
5,06
5,32
5,64
6,06
6,63
7,46
8,75
10,97
15,52
28,24
99,30
5764
2,80
2,96
3,12
3,19
3,29
3,47
3,50
3,53
3,56
3,59
3,63
3,67
3,71
3,76
3,81
3,87
3,94
4,01
4,10
4,20
4,32
4,46
4,62
4,82
5,07
5,39
5,80
6,37
7,19
8,47
10,67
15,21
27,91
99,33
5859
2,64
2,79
2,95
3,02
3,12
3,30
3,33
3,36
3,39
3,42
3,46
3,50
3,54
3,59
3,64
3,70
3,77
3,84
3,93
4,03
4,14
4,28
4,44
4,64
4,89
5,20
5,61
6,18
6,99
8,26
10,46
14,98
27,67
99,36
5928
2,51
2,66
2,82
2,89
2,99
3,17
3,20
3,23
3,26
3,29
3,32
3,36
3,41
3,45
3,51
3,56
3,63
3,71
3,79
3,89
4,00
4,14
4,30
4,50
4,74
5,06
5,47
6,03
6,84
8,10
10,29
14,80
27,49
99,38
5981
2,41
2,56
2,72
2,78
2,89
3,07
3,09
3,12
3,15
3,18
3,22
3,26
3,30
3,35
3,40
3,46
3,52
3,60
3,68
3,78
3,89
4,03
4,19
4,39
4,63
4,94
5,35
5,91
6,72
7,98
10,16
14,66
27,34
99,39
6022
10
2,32
2,47
2,63
2,70
2,80
2,98
3,00
3,03
3,06
3,09
3,13
3,17
3,21
3,26
3,31
3,37
3,43
3,51
3,59
3,69
3,80
3,94
4,10
4,30
4,54
4,85
5,26
5,81
6,62
7,87
10,05
14,55
27,23
99,40
6056
12
2,18
2,34
2,50
2,56
2,66
2,84
2,87
2,90
2,93
2,96
2,99
3,03
3,07
3,12
3,17
3,23
3,30
3,37
3,46
3,55
3,67
3,80
3,96
4,16
4,40
4,71
5,11
5,67
6,47
7,72
9,89
14,37
27,05
99,42
6107
14
2,08
2,23
2,39
2,46
2,56
2,74
2,77
2,79
2,82
2,86
2,89
2,93
2,97
3,02
3,07
3,13
3,19
3,27
3,35
3,45
3,56
3,70
3,86
4,05
4,29
4,60
5,01
5,56
6,36
7,60
9,77
14,25
26,92
99,43
6143
15
2,04
2,19
2,35
2,42
2,52
2,70
2,73
2,75
2,78
2,81
2,85
2,89
2,93
2,98
3,03
3,09
3,15
3,23
3,31
3,41
3,52
3,66
3,82
4,01
4,25
4,56
4,96
5,52
6,31
7,56
9,72
14,20
26,87
99,43
6157
16
2,00
2,15
2,31
2,38
2,48
2,66
2,69
2,72
2,75
2,78
2,81
2,85
2,89
2,94
2,99
3,05
3,12
3,19
3,27
3,37
3,49
3,62
3,78
3,97
4,21
4,52
4,92
5,48
6,28
7,52
9,68
14,15
26,83
99,44
6170
18
1,93
2,09
2,25
2,32
2,42
2,60
2,63
2,65
2,68
2,72
2,75
2,79
2,83
2,88
2,93
2,99
3,05
3,13
3,21
3,31
3,42
3,56
3,72
3,91
4,15
4,46
4,86
5,41
6,21
7,45
9,61
14,08
26,75
99,44
6191
20
1,88
2,03
2,20
2,27
2,37
2,55
2,57
2,60
2,63
2,66
2,70
2,74
2,78
2,83
2,88
2,94
3,00
3,08
3,16
3,26
3,37
3,51
3,66
3,86
4,10
4,41
4,81
5,36
6,16
7,40
9,55
14,02
26,69
99,45
6209
30
1,70
1,86
2,03
2,10
2,20
2,39
2,41
2,44
2,47
2,50
2,54
2,58
2,62
2,67
2,72
2,78
2,84
2,92
3,00
3,10
3,21
3,35
3,51
3,70
3,94
4,25
4,65
5,20
5,99
7,23
9,38
13,84
26,50
99,47
6260
40
1,59
1,76
1,94
2,01
2,11
2,30
2,33
2,35
2,38
2,42
2,45
2,49
2,54
2,58
2,64
2,69
2,76
2,84
2,92
3,02
3,13
3,27
3,43
3,62
3,86
4,17
4,57
5,12
5,91
7,14
9,29
13,75
26,41
99,48
6286
60
1,47
1,66
1,84
1,91
2,02
2,21
2,23
2,26
2,29
2,33
2,36
2,40
2,45
2,50
2,55
2,61
2,67
2,75
2,83
2,93
3,05
3,18
3,34
3,54
3,78
4,08
4,48
5,03
5,82
7,06
9,20
13,65
26,32
99,48
6313
120
1,32
1,53
1,73
1,80
1,92
2,11
2,14
2,17
2,20
2,23
2,27
2,31
2,35
2,40
2,46
2,52
2,58
2,66
2,75
2,84
2,96
3,09
3,25
3,45
3,69
4,00
4,40
4,95
5,74
6,97
9,11
13,56
26,22
99,49
6340
1,01
1,38
1,60
1,68
1,80
2,01
2,03
2,06
2,10
2,13
2,17
2,21
2,26
2,31
2,36
2,42
2,49
2,57
2,65
2,75
2,87
3,00
3,17
3,36
3,60
3,91
4,31
4,86
5,65
6,88
9,02
13,46
26,13
99,50
6366
1000000
a = 0,01
Tabela 4a
F de Fisher
cpa/gsa
161
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,34
5,29
5,15
5,02
25
26
27
28
29
30
40
50
60
120
100000
5,72
24
6,12
16
5,75
6,20
15
23
6,30
14
5,79
6,41
13
22
6,55
12
5,83
6,72
11
21
6,94
5,87
7,21
10
20
7,57
5,92
8,07
19
8,81
5,98
10,01
18
5,71
12,22
6,04
6,06
17,44
3,69
3,80
3,93
3,97
4,05
4,18
4,20
4,22
4,24
4,27
4,29
4,32
4,35
4,38
4,42
4,46
4,51
4,56
4,62
4,69
4,77
4,86
4,97
5,10
5,26
5,46
6,54
7,26
8,43
10,65
16,04
39,00
38,51
799,48
647,79
GL 1
17
GL 2
3,12
3,23
3,34
3,39
3,46
3,59
3,61
3,63
3,65
3,67
3,69
3,72
3,75
3,78
3,82
3,86
3,90
3,95
4,01
4,08
4,15
4,24
4,35
4,47
4,63
4,83
5,08
5,42
5,89
6,60
7,76
9,98
15,44
39,17
864,15
2,79
2,89
3,01
3,05
3,13
3,25
3,27
3,29
3,31
3,33
3,35
3,38
3,41
3,44
3,48
3,51
3,56
3,61
3,66
3,73
3,80
3,89
4,00
4,12
4,28
4,47
4,72
5,05
5,52
6,23
7,39
9,60
15,10
39,25
899,60
2,57
2,67
2,79
2,83
2,90
3,03
3,04
3,06
3,08
3,10
3,13
3,15
3,18
3,22
3,25
3,29
3,33
3,38
3,44
3,50
3,58
3,66
3,77
3,89
4,04
4,24
4,48
4,82
5,29
5,99
7,15
9,36
14,88
39,30
921,83
2,41
2,52
2,63
2,67
2,74
2,87
2,88
2,90
2,92
2,94
2,97
2,99
3,02
3,05
3,09
3,13
3,17
3,22
3,28
3,34
3,41
3,50
3,60
3,73
3,88
4,07
4,32
4,65
5,12
5,82
6,98
9,20
14,73
39,33
937,11
2,29
2,39
2,51
2,55
2,62
2,75
2,76
2,78
2,80
2,82
2,85
2,87
2,90
2,93
2,97
3,01
3,05
3,10
3,16
3,22
3,29
3,38
3,48
3,61
3,76
3,95
4,20
4,53
4,99
5,70
6,85
9,07
14,62
39,36
948,20
2,19
2,30
2,41
2,46
2,53
2,65
2,67
2,69
2,71
2,73
2,75
2,78
2,81
2,84
2,87
2,91
2,96
3,01
3,06
3,12
3,20
3,29
3,39
3,51
3,66
3,85
4,10
4,43
4,90
5,60
6,76
8,98
14,54
39,37
956,64
2,11
2,22
2,33
2,38
2,45
2,57
2,59
2,61
2,63
2,65
2,68
2,70
2,73
2,76
2,80
2,84
2,88
2,93
2,98
3,05
3,12
3,21
3,31
3,44
3,59
3,78
4,03
4,36
4,82
5,52
6,68
8,90
14,47
39,39
963,28
10
2,05
2,16
2,27
2,32
2,39
2,51
2,53
2,55
2,57
2,59
2,61
2,64
2,67
2,70
2,73
2,77
2,82
2,87
2,92
2,99
3,06
3,15
3,25
3,37
3,53
3,72
3,96
4,30
4,76
5,46
6,62
8,84
14,42
39,40
968,63
11
1,99
2,10
2,22
2,26
2,33
2,46
2,48
2,49
2,51
2,54
2,56
2,59
2,62
2,65
2,68
2,72
2,76
2,81
2,87
2,93
3,01
3,09
3,20
3,32
3,47
3,66
3,91
4,24
4,71
5,41
6,57
8,79
14,37
39,41
973,03
12
1,94
2,05
2,17
2,22
2,29
2,41
2,43
2,45
2,47
2,49
2,51
2,54
2,57
2,60
2,64
2,68
2,72
2,77
2,82
2,89
2,96
3,05
3,15
3,28
3,43
3,62
3,87
4,20
4,67
5,37
6,52
8,75
14,34
39,41
976,72
13
1,90
2,01
2,13
2,18
2,25
2,37
2,39
2,41
2,43
2,45
2,48
2,50
2,53
2,56
2,60
2,64
2,68
2,73
2,79
2,85
2,92
3,01
3,12
3,24
3,39
3,58
3,83
4,16
4,63
5,33
6,49
8,72
14,30
39,42
979,84
15
1,83
1,94
2,06
2,11
2,18
2,31
2,32
2,34
2,36
2,39
2,41
2,44
2,47
2,50
2,53
2,57
2,62
2,67
2,72
2,79
2,86
2,95
3,05
3,18
3,33
3,52
3,77
4,10
4,57
5,27
6,43
8,66
14,25
39,43
984,87
20
1,71
1,82
1,94
1,99
2,07
2,20
2,21
2,23
2,25
2,28
2,30
2,33
2,36
2,39
2,42
2,46
2,51
2,56
2,62
2,68
2,76
2,84
2,95
3,07
3,23
3,42
3,67
4,00
4,47
5,17
6,33
8,56
14,17
39,45
993,08
24
30
40
60
120
1000000
1,64
1,76
1,88
1,93
2,01
2,14
2,15
2,17
2,19
2,22
2,24
2,27
2,30
2,33
2,37
2,41
2,45
2,50
2,56
2,63
2,70
2,79
2,89
3,02
3,17
3,37
3,61
3,95
4,41
5,12
6,28
8,51
14,12
39,46
1,57
1,69
1,82
1,87
1,94
2,07
2,09
2,11
2,13
2,16
2,18
2,21
2,24
2,27
2,31
2,35
2,39
2,44
2,50
2,57
2,64
2,73
2,84
2,96
3,12
3,31
3,56
3,89
4,36
5,07
6,23
8,46
14,08
39,46
1,48
1,61
1,74
1,80
1,88
2,01
2,03
2,05
2,07
2,09
2,12
2,15
2,18
2,21
2,25
2,29
2,33
2,38
2,44
2,51
2,59
2,67
2,78
2,91
3,06
3,26
3,51
3,84
4,31
5,01
6,18
8,41
14,04
39,47
1,39
1,53
1,67
1,72
1,80
1,94
1,96
1,98
2,00
2,03
2,05
2,08
2,11
2,14
2,18
2,22
2,27
2,32
2,38
2,45
2,52
2,61
2,72
2,85
3,00
3,20
3,45
3,78
4,25
4,96
6,12
8,36
13,99
39,48
1,27
1,43
1,58
1,64
1,72
1,87
1,89
1,91
1,93
1,95
1,98
2,01
2,04
2,08
2,11
2,16
2,20
2,26
2,32
2,38
2,46
2,55
2,66
2,79
2,94
3,14
3,39
3,73
4,20
4,90
6,07
8,31
13,95
39,49
1,01
1,31
1,48
1,55
1,64
1,79
1,81
1,83
1,85
1,88
1,91
1,94
1,97
2,00
2,04
2,09
2,13
2,19
2,25
2,32
2,40
2,49
2,60
2,72
2,88
3,08
3,33
3,67
4,14
4,85
6,02
8,26
13,90
39,50
a = 0,025
Tabela 4b
F de Fisher
cpa/gsa
162
4,49
4,30
3,44
3,47
3,49
3,52
3,55
3,59
3,63
3,68
3,74
3,81
3,89
3,98
4,10
4,26
4,46
4,74
5,14
5,79
6,94
9,55
19,00
199,50
3,05
3,07
3,10
3,13
3,16
3,20
3,24
3,29
3,34
3,41
3,49
3,59
3,71
3,86
4,07
4,35
4,76
5,41
6,59
9,28
19,16
215,71
2,82
2,84
2,87
2,90
2,93
2,96
3,01
3,06
3,11
3,18
3,26
3,36
3,48
3,63
3,84
4,12
4,53
5,19
6,39
9,12
19,25
224,58
2,66
2,68
2,71
2,74
2,77
2,81
2,85
2,90
2,96
3,03
3,11
3,20
3,33
3,48
3,69
3,97
4,39
5,05
6,26
9,01
19,30
230,16
2,55
2,57
2,60
2,63
2,66
2,70
2,74
2,79
2,85
2,92
3,00
3,09
3,22
3,37
3,58
3,87
4,28
4,95
6,16
8,94
19,33
233,99
2,46
2,49
2,51
2,54
2,58
2,61
2,66
2,71
2,76
2,83
2,91
3,01
3,14
3,29
3,50
3,79
4,21
4,88
6,09
8,89
19,35
236,77
2,40
2,42
2,45
2,48
2,51
2,55
2,59
2,64
2,70
2,77
2,85
2,95
3,07
3,23
3,44
3,73
4,15
4,82
6,04
8,85
19,37
238,88
2,34
2,37
2,39
2,42
2,46
2,49
2,54
2,59
2,65
2,71
2,80
2,90
3,02
3,18
3,39
3,68
4,10
4,77
6,00
8,81
19,38
240,54
10
2,30
2,32
2,35
2,38
2,41
2,45
2,49
2,54
2,60
2,67
2,75
2,85
2,98
3,14
3,35
3,64
4,06
4,74
5,96
8,79
19,40
241,88
11
2,26
2,28
2,31
2,34
2,37
2,41
2,46
2,51
2,57
2,63
2,72
2,82
2,94
3,10
3,31
3,60
4,03
4,70
5,94
8,76
19,40
242,98
12
2,23
2,25
2,28
2,31
2,34
2,38
2,42
2,48
2,53
2,60
2,69
2,79
2,91
3,07
3,28
3,57
4,00
4,68
5,91
8,74
19,41
243,90
13
2,20
2,22
2,25
2,28
2,31
2,35
2,40
2,45
2,51
2,58
2,66
2,76
2,89
3,05
3,26
3,55
3,98
4,66
5,89
8,73
19,42
244,69
15
2,15
2,18
2,20
2,23
2,27
2,31
2,35
2,40
2,46
2,53
2,62
2,72
2,85
3,01
3,22
3,51
3,94
4,62
5,86
8,70
19,43
245,95
20
2,07
2,10
2,12
2,16
2,19
2,23
2,28
2,33
2,39
2,46
2,54
2,65
2,77
2,94
3,15
3,44
3,87
4,56
5,80
8,66
19,45
248,02
24
2,03
2,05
2,08
2,11
2,15
2,19
2,24
2,29
2,35
2,42
2,51
2,61
2,74
2,90
3,12
3,41
3,84
4,53
5,77
8,64
19,45
249,05
30
1,98
2,01
2,04
2,07
2,11
2,15
2,19
2,25
2,31
2,38
2,47
2,57
2,70
2,86
3,08
3,38
3,81
4,50
5,75
8,62
19,46
250,10
40
1,94
1,96
1,99
2,03
2,06
2,10
2,15
2,20
2,27
2,34
2,43
2,53
2,66
2,83
3,04
3,34
3,77
4,46
5,72
8,59
19,47
251,14
60
1,89
1,92
1,95
1,98
2,02
2,06
2,11
2,16
2,22
2,30
2,38
2,49
2,62
2,79
3,01
3,30
3,74
4,43
5,69
8,57
19,48
252,20
120
1,84
1,87
1,90
1,93
1,97
2,01
2,06
2,11
2,18
2,25
2,34
2,45
2,58
2,75
2,97
3,27
3,70
4,40
5,66
8,55
19,49
253,25
1,78
1,81
1,84
1,88
1,92
1,96
2,01
2,07
2,13
2,21
2,30
2,40
2,54
2,71
2,93
3,23
3,67
4,37
5,63
8,53
19,50
254,32
1000000
3,39
3,84
100000
3,15
4,00
3,92
60
3,18
4,08
4,03
40
50
3,33
3,00
3,07
3,23
3,32
4,18
4,17
29
3,34
3,35
3,37
30
4,21
4,20
27
28
4,24
4,23
25
26
2,60
2,68
2,76
2,79
2,84
2,92
2,93
2,95
2,96
2,98
2,99
2,37
2,45
2,53
2,56
2,61
2,69
2,70
2,71
2,73
2,74
2,76
2,21
2,29
2,37
2,40
2,45
2,53
2,55
2,56
2,57
2,59
2,60
2,10
2,18
2,25
2,29
2,34
2,42
2,43
2,45
2,46
2,47
2,49
2,01
2,09
2,17
2,20
2,25
2,33
2,35
2,36
2,37
2,39
2,40
1,94
2,02
2,10
2,13
2,18
2,27
2,28
2,29
2,31
2,32
2,34
1,88
1,96
2,04
2,07
2,12
2,21
2,22
2,24
2,25
2,27
2,28
1,83
1,91
1,99
2,03
2,08
2,16
2,18
2,19
2,20
2,22
2,24
1,79
1,87
1,95
1,99
2,04
2,13
2,14
2,15
2,17
2,18
2,20
1,75
1,83
1,92
1,95
2,00
2,09
2,10
2,12
2,13
2,15
2,16
1,72
1,80
1,89
1,92
1,97
2,06
2,08
2,09
2,10
2,12
2,14
1,67
1,75
1,84
1,87
1,92
2,01
2,03
2,04
2,06
2,07
2,09
1,57
1,66
1,75
1,78
1,84
1,93
1,94
1,96
1,97
1,99
2,01
1,52
1,61
1,70
1,74
1,79
1,89
1,90
1,91
1,93
1,95
1,96
1,46
1,55
1,65
1,69
1,74
1,84
1,85
1,87
1,88
1,90
1,92
1,39
1,50
1,59
1,63
1,69
1,79
1,81
1,82
1,84
1,85
1,87
1,32
1,43
1,53
1,58
1,64
1,74
1,75
1,77
1,79
1,80
1,82
1,22
1,35
1,47
1,51
1,58
1,68
1,70
1,71
1,73
1,75
1,77
1,01
1,25
1,39
1,44
1,51
1,62
1,64
1,65
1,67
1,69
1,71
4,28
3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,32
2,27
2,24
2,20
2,18
2,13
2,05
2,01
1,96
1,91
1,86
1,81
1,76
24 4,25968 3,40283 3,00879 2,77629 2,62065 2,50819 2,42263 2,35508 2,30024 2,25474 2,21631 2,18338 2,15482 2,10768 2,02666 1,98376 1,93896 1,89196 1,84236 1,78964 1,73306
22
23
4,35
4,32
20
21
4,41
4,38
18
19
4,45
16
17
4,60
4,54
14
15
4,75
4,67
12
13
4,96
4,84
10
11
5,32
5,12
5,59
6,61
5,99
7,71
10,13
18,51
161,45
GL 1
120
GL 2
a = 0,05
Tabela 4c
F de Fisher
cpa/gsa
163
2,86
2,71
100000
2,39
2,79
2,75
60
2,41
2,84
2,81
40
50
2,50
2,30
2,35
2,44
2,49
2,89
2,88
29
2,50
2,51
2,52
2,53
2,54
2,55
2,56
2,57
2,59
2,61
2,62
2,64
2,67
2,70
2,73
2,76
2,81
3,26
30
2,90
2,89
27
28
2,92
2,91
25
26
2,94
2,93
23
24
2,96
2,95
21
22
2,99
2,97
19
20
3,03
3,01
17
3,07
3,05
15
16
18
3,14
3,10
13
14
3,23
3,18
11
3,01
2,92
3,36
3,29
10
12
3,11
3,59
3,46
3,78
3,46
4,06
3,78
4,32
5,46
9,00
49,50
5,54
4,54
8,53
39,86
GL 1
120
GL 2
2,08
2,13
2,18
2,20
2,23
2,28
2,28
2,29
2,30
2,31
2,32
2,33
2,34
2,35
2,36
2,38
2,40
2,42
2,44
2,46
2,49
2,52
2,56
2,61
2,66
2,73
2,81
2,92
3,07
3,29
3,62
4,19
5,39
9,16
53,59
1,94
1,99
2,04
2,06
2,09
2,14
2,15
2,16
2,17
2,17
2,18
2,19
2,21
2,22
2,23
2,25
2,27
2,29
2,31
2,33
2,36
2,39
2,43
2,48
2,54
2,61
2,69
2,81
2,96
3,18
3,52
4,11
5,34
9,24
55,83
1,85
1,90
1,95
1,97
2,00
2,05
2,06
2,06
2,07
2,08
2,09
2,10
2,11
2,13
2,14
2,16
2,18
2,20
2,22
2,24
2,27
2,31
2,35
2,39
2,45
2,52
2,61
2,73
2,88
3,11
3,45
4,05
5,31
9,29
57,24
1,77
1,82
1,87
1,90
1,93
1,98
1,99
2,00
2,00
2,01
2,02
2,04
2,05
2,06
2,08
2,09
2,11
2,13
2,15
2,18
2,21
2,24
2,28
2,33
2,39
2,46
2,55
2,67
2,83
3,05
3,40
4,01
5,28
9,33
58,20
1,72
1,77
1,82
1,84
1,87
1,93
1,93
1,94
1,95
1,96
1,97
1,98
1,99
2,01
2,02
2,04
2,06
2,08
2,10
2,13
2,16
2,19
2,23
2,28
2,34
2,41
2,51
2,62
2,78
3,01
3,37
3,98
5,27
9,35
58,91
1,67
1,72
1,77
1,80
1,83
1,88
1,89
1,90
1,91
1,92
1,93
1,94
1,95
1,97
1,98
2,00
2,02
2,04
2,06
2,09
2,12
2,15
2,20
2,24
2,30
2,38
2,47
2,59
2,75
2,98
3,34
3,95
5,25
9,37
59,44
1,63
1,68
1,74
1,76
1,79
1,85
1,86
1,87
1,87
1,88
1,89
1,91
1,92
1,93
1,95
1,96
1,98
2,00
2,03
2,06
2,09
2,12
2,16
2,21
2,27
2,35
2,44
2,56
2,72
2,96
3,32
3,94
5,24
9,38
59,86
10
1,60
1,65
1,71
1,73
1,76
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,92
1,94
1,96
1,98
2,00
2,03
2,06
2,10
2,14
2,19
2,25
2,32
2,42
2,54
2,70
2,94
3,30
3,92
5,23
9,39
60,19
11
1,57
1,63
1,68
1,70
1,74
1,79
1,80
1,81
1,82
1,83
1,84
1,85
1,87
1,88
1,90
1,91
1,93
1,95
1,98
2,01
2,04
2,07
2,12
2,17
2,23
2,30
2,40
2,52
2,68
2,92
3,28
3,91
5,22
9,40
60,47
12
1,55
1,60
1,66
1,68
1,71
1,77
1,78
1,79
1,80
1,81
1,82
1,83
1,84
1,86
1,87
1,89
1,91
1,93
1,96
1,99
2,02
2,05
2,10
2,15
2,21
2,28
2,38
2,50
2,67
2,90
3,27
3,90
5,22
9,41
60,71
13
1,52
1,58
1,64
1,66
1,70
1,75
1,76
1,77
1,78
1,79
1,80
1,81
1,83
1,84
1,86
1,87
1,89
1,92
1,94
1,97
2,00
2,04
2,08
2,13
2,19
2,27
2,36
2,49
2,65
2,89
3,26
3,89
5,21
9,41
60,90
15
1,49
1,55
1,60
1,63
1,66
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,80
1,81
1,83
1,84
1,86
1,89
1,91
1,94
1,97
2,01
2,05
2,10
2,17
2,24
2,34
2,46
2,63
2,87
3,24
3,87
5,20
9,42
61,22
20
1,42
1,48
1,54
1,57
1,61
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,76
1,78
1,79
1,81
1,84
1,86
1,89
1,92
1,96
2,01
2,06
2,12
2,20
2,30
2,42
2,59
2,84
3,21
3,84
5,18
9,44
61,74
24
1,38
1,45
1,51
1,54
1,57
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,72
1,73
1,75
1,77
1,79
1,81
1,84
1,87
1,90
1,94
1,98
2,04
2,10
2,18
2,28
2,40
2,58
2,82
3,19
3,83
5,18
9,45
62,00
30
1,34
1,41
1,48
1,50
1,54
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,69
1,70
1,72
1,74
1,76
1,78
1,81
1,84
1,87
1,91
1,96
2,01
2,08
2,16
2,25
2,38
2,56
2,80
3,17
3,82
5,17
9,46
62,26
40
1,30
1,37
1,44
1,46
1,51
1,57
1,58
1,59
1,60
1,61
1,63
1,64
1,66
1,67
1,69
1,71
1,73
1,75
1,78
1,81
1,85
1,89
1,93
1,99
2,05
2,13
2,23
2,36
2,54
2,78
3,16
3,80
5,16
9,47
62,53
60
1,24
1,32
1,40
1,42
1,47
1,54
1,55
1,56
1,57
1,58
1,59
1,61
1,62
1,64
1,66
1,68
1,70
1,72
1,75
1,78
1,82
1,86
1,90
1,96
2,03
2,11
2,21
2,34
2,51
2,76
3,14
3,79
5,15
9,47
62,79
120
1,17
1,26
1,35
1,38
1,42
1,50
1,51
1,52
1,53
1,54
1,56
1,57
1,59
1,60
1,62
1,64
1,67
1,69
1,72
1,75
1,79
1,83
1,88
1,93
2,00
2,08
2,18
2,32
2,49
2,74
3,12
3,78
5,14
9,48
63,06
1,01
1,19
1,29
1,33
1,38
1,46
1,47
1,48
1,49
1,50
1,52
1,53
1,55
1,57
1,59
1,61
1,63
1,66
1,69
1,72
1,76
1,80
1,85
1,90
1,97
2,06
2,16
2,29
2,47
2,72
3,11
3,76
5,13
9,49
63,33
1000000
a = 0,10
Tabela 4d
F de Fisher
cpa/gsa