Escolar Documentos
Profissional Documentos
Cultura Documentos
SETOR DE CIENCIAS
EXATAS
DEPARTAMENTO DE ESTATISTICA
CE003
ESTATISTICA II
(Notas de Aula)
DEPARTAMENTO DE ESTATISTICA
UFPR
Sum
ario
1 Conceitos B
asicos e T
ecnicas de Estatstica Descritiva
1.1
1.2
Introduc
ao
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1
1.1.2
Populac
ao e amostra . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3
Vari
aveis e suas classificacoes . . . . . . . . . . . . . . . . . . . . . .
1.2.1
Tabelas de freq
uencias . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2
Medidas-resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.3
Gr
aficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
33
2.1
Introduc
ao
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2
Definic
ao cl
assica de probabilidade . . . . . . . . . . . . . . . . . . . 34
2.2.2
Aproximac
ao da Probabilidade pela frequencia relativa . . . . . . . . 35
2.2.3
Propriedades de probabilidades . . . . . . . . . . . . . . . . . . . . . 35
2.2.4
Teorema da soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.5
Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2.6
Teorema do produto . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.7
2.2.8
Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Vari
aveis Aleat
orias
40
3.1
Introduc
ao
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2
Vari
avel Aleatoria Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3
Vari
avel Aleatoria Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.4
Esperanca Matematica
3.5
Vari
ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6
Principais Distribuic
oes de Probabilidades . . . . . . . . . . . . . . . . . . . 42
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.6.1
Distribuic
ao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.2
Distribuic
ao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.3
Distribuic
ao de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 44
i
SUMARIO
ii
3.6.4
Distribuic
ao Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6.5
Distribuic
ao Normal Padr
ao . . . . . . . . . . . . . . . . . . . . . . . 45
3.6.6
4 Infer
encia Estatstica - Teoria da Estima
c
ao
48
4.1
Introduc
ao
4.2
4.3
Distribuic
oes Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.3.2
Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
. . . . . . . . . . . . . . . . . . . . . . . 53
Distribuic
ao amostral de X
4.3.3
4.4
Estimac
ao da Media Populacional () . . . . . . . . . . . . . . . . . . . . . 57
4.5
Estimac
ao de em Amostras Pequenas . . . . . . . . . . . . . . . . . . . . 60
4.6
Estimac
ao da Diferenca entre Duas Medias Populacionais ( 1 e 2 ) . . . . 61
4.7
Estimac
ao de 1 2 em Amostras Pequenas . . . . . . . . . . . . . . . . . 62
4.8
4.9
Estimac
ao de uma Proporcao Populacional (p) . . . . . . . . . . . . . . . . 64
4.8.1
4.8.2
Determinac
ao do Tamanho da Amostra (n) . . . . . . . . . . . . . . . . . . 66
5 Testes de Hip
oteses
70
5.1
Introduc
ao
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2
5.2.2
Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.2.3
5.2.4
Regi
ao crtica (RC) e regra de decis
ao (RD) . . . . . . . . . . . . . . 73
5.2.5
5.3
Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.4
5.4.2
5.4.3
5.4.4
5.4.5
. . . . . . . . . . . . 85
. . . . . . . . . . . . . . . . . . . 93
5.5
5.6
5.7
Testes n
ao Parametricos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.7.1
Teste de aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.7.2
SUMARIO
iii
6 Correla
c
ao e Regress
ao Linear
6.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Coeficiente de Correlacao de Pearson . . . . . . . . . . . .
6.2.1 Teste de significancia para . . . . . . . . . . . . .
6.3 Regress
ao Linear Simples . . . . . . . . . . . . . . . . . .
6.3.1 Estimac
ao dos par
ametros por MQO . . . . . . . .
6.3.2 Adequac
ao do modelo de regressao linear ajustado
6.3.3 Interpretac
ao dos par
ametros do modelo . . . . . .
7 An
alise de Vari
ancia
7.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . .
7.2 Conceitos Basicos sobre Experimentacao . . . . .
7.2.1 Tratamento . . . . . . . . . . . . . . . . .
7.2.2 Unidade experimental ou parcela . . . . .
7.2.3 Repetic
ao . . . . . . . . . . . . . . . . . .
7.2.4 Vari
avel resposta ou vari
avel dependente .
7.2.5 Delineamento experimental (Design) . . .
7.2.6 Modelo e an
alise de vari
ancia . . . . . . .
7.2.7 Delineamento experimental . . . . . . . .
7.3 Analise de Vari
ancia . . . . . . . . . . . . . . . .
7.4 Teste de Tukey para Comparacao de Medias . . .
7.5 Teste de Kruskal-Wallis . . . . . . . . . . . . . .
8 Controle Estatstico de Qualidade
8.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . .
8.1.1 Gr
aficos de controle . . . . . . . . . . . .
8.1.2 Construc
ao do gr
afico . . . . . . . . . . .
8.1.3 Analise do padrao de gr
aficos de controle
8.2 Gr
aficos de Controle para Vari
aveis . . . . . . . .
8.2.1 Gr
aficos de controle para x
eR . . . . . .
8.2.2 Gr
aficos de controle para x
es . . . . . .
8.2.3 Exemplos . . . . . . . . . . . . . . . . . .
Tabelas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
. 103
. 103
. 105
. 105
. 107
. 108
. 110
.
.
.
.
.
.
.
.
.
.
.
.
112
. 112
. 112
. 112
. 113
. 113
. 114
. 114
. 115
. 116
. 116
. 118
. 120
.
.
.
.
.
.
.
.
122
. 122
. 122
. 123
. 124
. 127
. 128
. 129
. 131
136
Lista de Tabelas
1.1
1.2
1.3
Freq
uencias de estado civil em uma amostra de 385 indivduos. . . . . . . . 10
1.4
Tabela de freq
uencias para a vari
avel Idade. . . . . . . . . . . . . . . . . . . 11
1.5
Tabela de freq
uencias para a vari
avel horas semanais de atividade fsica . . 12
1.6
Tabela de freq
uencias para a vari
avel Peso . . . . . . . . . . . . . . . . . . . 12
1.7
1.8
1.9
. . . . . . . 17
4.1
Populac
ao de alunos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2
4.3
Distribuic
ao amostral da idade media. . . . . . . . . . . . . . . . . . . . . . 53
5.1
5.2
5.3
Distribuic
ao de probabilidades das possveis amostras. . . . . . . . . . . . . 75
5.4
5.5
5.6
5.7
n e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
iv
. 74
LISTA DE TABELAS
5.8
5.9
5.10
5.11
5.12
5.13
5.14
5.15
6.1
Tempo de reac
ao ao estmulo em funcao da idade. . . . . . . . . . . . . . . 106
7.1
7.2
7.3
7.4
Tabela da an
alise de vari
ancia. . . . . . . . . . . . . . . . . . .
Crescimento de explantes de morangos em gramas. . . . . . . .
Analise de vari
ancia do exemplo 7.1. . . . . . . . . . . . . . . .
Consumo de energia eletrica de tres motores durante uma hora.
8.1
8.2
1
2
3
4
6
7
8
9
10
.
.
.
.
.
.
.
.
. .
.
. .
. .
. .
. .
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
92
94
97
98
99
100
100
102
116
117
118
121
Lista de Figuras
1.1
Gr
afico de setores para a intencao de votos nos partidos A,B,C e D. . . . . 22
1.2
Gr
afico de barras para o n
umero de filhos por famlia. . . . . . . . . . . . . 24
1.3
1.4
Desenho esquem
atico do box-plot com base no resumo de 5 n
umeros. . . . . 26
1.5
Box-plot do n
umero de laranjas nas 20 caixas. . . . . . . . . . . . . . . . . . 27
1.6
Desenho esquem
atico do box-plot com base nos quartis e criterio para valores atpicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.7
1.8
Variac
ao mensal na Taxa Selic no perodo de 1995 a 2005. . . . . . . . . . . 31
1.9
Gr
afico sequencial das vendas ao longo dos meses. . . . . . . . . . . . . . . 32
3.1
Densidade Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1
4.2
. . . . . . . . . . . . . . . . . . . . . . 30
45
nhos de amostra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3
Densidades de T e Z.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4
Densidade de Z e o quantil z. . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5
5.1
Area
hachurada relativa ao P-Valor do teste . . . . . . . . . . . . . . . . . . . .
5.2
Probabilidade de n
ao rejeitar H0 quando ela e falsa. . . . . . . . . . . . . . 84
5.3
87
5.4
88
5.5
5.6
Gr
afico da distribuicao 2 .
6.1
6.2
6.3
Analise gr
afica dos resduos associados ao modelo ajustado. . . . . . . . . . . . . 109
6.4
6.5
80
. . . . . . . . . . . . . . . . . . . . . . . . . . . 101
vi
. . . . . . . . . . . . . . . . . . . 107
LISTA DE FIGURAS
8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
132
133
133
135
Captulo 1
Conceitos B
asicos e T
ecnicas de
Estatstica Descritiva
1.1
Introdu
c
ao
Correa da Rosa, J. M.
Em um r
apido levantamento e possvel encontrar varias definicoes para Estatstica,
das quais citaremos algumas interessantes.
Ciencia que utiliza metodos rgidos para lidar com incertezas.
Ciencia que procura estabelecer os limites da incerteza.
Ciencia que coleta, classifica e avalia numericamente fatos que servir
ao de
base para inferencia.
Ciencia da Incerteza.
Outras definic
oes de conte
udo metaforico s
ao:
...e a arte de torturar os dados ate que eles confessem a verdade.
...nada mais e do que o bom senso expresso em n
umeros.
Embora todas as definicoes apresentadas contenham elementos importantes, a Estatstica a ser apresentada neste material estar
a mais relacionada a definicao a seguir:
1.1. Introduc
ao
1.1.1
Gr
aficos
O objetivo da representacao gr
afica e dirigir a
atencao do analista para alguns aspectos de um
conjunto de dados.
Um gr
afico vale mais que mil palavras.
Alguns exemplos de gr
aficos s
ao: diagrama de
barras, diagrama em setores, histograma, boxplot, ramo-e-folhas, diagrama de dispers
ao, gr
afico sequencial.
Resumos numericos
Por meio de medidas ou resumos numericos podemos levantar importantes informacoes sobre o
conjunto de dados tais como: a tendencia central, variabilidade, simetria, valores extremos,
valores discrepantes, etc.
Correa da Rosa, J. M.
Teste de Hipoteses
1.1. Introduc
ao
1.1.2
Populac
ao e amostra
Tempo
Regi
ao
Exemplo 1.5. Estudo da obesidade em alunos do segundo grau por intermedio da medida
do ndice de massa corp
orea.
Sem a definic
ao dos 3 elementos, conforme os exemplos acima, torna-se difcil proceder a coleta de dados. Quando um estudo estatstico levanta informacoes de todas as
Correa da Rosa, J. M.
Tempo
Regi
ao
regi
ao metropolitana de Curitiba
unidades da populac
ao, este chama-se Censo. Ha casos em que o levantamento censit
ario
e inviavel, como por exemplo em testes destrutivos. Mesmo quando e possvel realizar o
Censo, o custo representa quase sempre um entrave. Nestes casos, a sada e estudar apenas
parte da populac
ao para inferir sobre o todo e o levantamento e dito ser por amostragem.
O processo de amostragem pode ser probabilstico (aleatorio) ou n
ao-probabilstico
(n
ao-aleat
orio). Os metodos de inferencia estatstica s
ao aplic
aveis no primeiro caso pois
a amostragem probabilstica garante a representatividade da amostra. Como nem sempre
as unidades da amostra podem ser obtidas por meio de selecao probabilstica, existem
alternativas como a amostragem de conveniencia e amostragem por quotas.
Quando a amostragem e probabilstica e necessaria a existencia de um cadastro que
contenha a relac
ao de todas as unidades na populacao.
T
ecnicas de amostragem
A Teoria de Amostragem e um ramo da estatstica que estuda metodos para levantar amostras que sejam representativas da populacao. O princpio b
asico desta teoria e
ter o m
aximo de precisao na avaliacao das quantidades de interesse com o mnimo tamanho de amostra. Nem sempre e possvel ponderar estas duas questoes de forma a obter
amostras representativas. Sendo assim, diferentes metodos de selecao de amostras foram
desenvolvidos para situac
oes especficas. Apresentamos e discutimos alguns deles.
Amostragem Aleatoria Simples: Consiste em selecionar aleatoriamente uma amostra
de tamanho n em uma populacao formada por N indivduos. A grande vantagem
desta tecnica e atribuir igual probabilidade de selecao a todas as possveis amostras.
Entretanto, para este tipo de amostragem, e crucial a existencia de um cadastro com
a relac
ao de todas as unidades populacionais. Isto e inviavel em muitas situac
oes.
Esta amostragem pode ser feita com reposicao, o que garante a probabilidade 1/N
de um elemento da populacao participar da amostra. Por outro lado, nessa situac
ao
um elemento pode aparecer m
ultiplas vezes. Quando a amostragem e feita sem reposic
ao, a probabilidade de um elemento ser includo na amostra se modifica durante
o processo de selec
ao, pois a populacao e seq
uencialmente reduzida de 1 elemento.
Amostragem Aleatoria Estratificada: Este tipo de amostragem busca a formac
ao
de h estratos homogeneos em relacao `a caracterstica estudada e, posteriormente,
amostragem aleat
oria simples ou amostragem sistematica dentro de cada estrato. A
amostragem estratificada e vantajosa quando h
a o conhecimento previo de grupos
1.1. Introduc
ao
Correa da Rosa, J. M.
amostrais s
ao includas por algum tipo de conveniencia, em geral ausencia de tempo
e recursos materiais para o levantamento dos dados. Embora n
ao sejam feitas inferencias em amostras de conveniencia, estas podem ser importantes para levantar
hip
oteses e formular modelos.
Exemplo 1.6. Uma firma de contabilidade tem N = 50 clientes comerciantes. Seu propriet
ario pretende entrevistar uma amostra de 10 clientes para levantar possibilidades de
melhora no atendimento. Escolha uma amostra aleatoria simples de tamanho n = 10.
Primeiro passo: atribuir a cada cliente um n
umero entre 1 e 50.
Segundo passo: recorrer `a tabela de n
umeros aleatorios para selecionar aleatoriamente 10 n
umeros de 1 a 50. Os clientes identificados pelos n
umeros selecionados
compor
ao a amostra.
Exemplo 1.7. Uma escola tem um arquivo com 5000 fichas de alunos e ser
a selecionada,
sistematicamente, uma amostra de 1000 alunos. Neste caso, a fracao de amostragem e
n
igual a
= 1000/5000 que representa k = 5 elementos na populacao para cada elemento
N
selecionado na amostra. Na amostragem sistematica somente o ponto de partida e sorteado
dentre as 5 primeiras fichas do arquivo. Admitamos que foi sorteado o n
umero 2, ent
ao a
amostra e formada pelas fichas 2, 7, 12, 17, . . . , 4992, 4997.
1.1.3
Vari
aveis e suas classificac
oes
ordenaveis, a vari
avel e dita ser ordinal, caso contr
ario ela e classificada como nominal. E
importante ressaltar que esta ordenacao nos nveis (categorias) da vari
avel e natural tal
como ocorre com a vari
avel classe social. Nesta situacao, Classe A > Classe B > Classe C
> Classe D. Como ja foi comentado, o tipo de vari
avel determina o tipo de an
alise e, para
vari
aveis qualitativas ordinais, um resumo numerico, uma tecnica gr
afica ou uma tabela
de freq
uencia deve incorporar a ideia de ordenacao.
Vari
aveis qualitativas (atributos)
Ordinais (ex: classe social, cargo na empresa e classificacao de um filme.)
Nominais (ex: sexo, bairro, cor de pele e canal de TV preferido.)
alem das classificac
oes mencionadas, vamos destacar uma outra situacao em que a
caracterstica de interesse e investigada ao longo do tempo (espaco) constituindo o que
chamamos de uma serie temporal. A an
alise de uma vari
avel que e medida ao longo do
tempo deve considerar aspectos especficos como tendencia e sazonalidade. Ao resumir
estas vari
aveis, quando h
a a presenca de tendencia o valor medio modifica-se ao longo do
tempo, enquanto a sazonalidade pode explicar variacoes peri
odicas, como o aumento de
venda de televisores nos meses de novembro e dezembro.
S
erie temporal
Conjunto de observac
oes ordenadas no tempo (ndice mensal de inflacao, temperatura m
axima di
aria, cotac
ao di
aria do d
olar e n
umero de nascimentos di
arios.).
1.2
T
ecnicas de estatstica descritiva
A principal func
ao da Estatstica Descritiva e resumir as informacoes contidas em um
conjunto de dados por meio de tabelas, gr
aficos e medidas caractersticas (resumos numericos). A descric
ao dos dados deve ser objetiva, ter precisao de significado e simplicidade
no c
alculo para que outras pessoas possam compreender e, eventualmente, reproduzir os
resultados. Recorremos novamente aqui `a met
afora da fotografia pois realizar uma an
alise
Correa da Rosa, J. M.
descritiva e como tirar uma foto da realidade, caso a lente esteja desfocada, o resultado
n
ao ser
a claro.
As tecnicas de estatstica descritiva s
ao aplicadas a observacoes de uma ou mais
vari
aveis, tomadas nas unidades de interesse. Quando apenas uma vari
avel e resumida, a
descric
ao e univariada, caso duas vari
aveis sejam resumidas conjuntamente, a descric
ao e
bivariada. Ao conjunto de observacoes de uma vari
avel chamaremos de dados brutos, lista
ou rol.
1.2.1
Tabelas de frequ
encias
As tabelas de freq
uencias simples s
ao adequadas para resumir observacoes de uma
vari
avel qualitativa ou quantitativa discreta, desde que esta apresente um conjunto pequeno de diferentes valores.
Utilizamos os dados presentes em Magalhaes & Lima (2004), referentes a um question
ario aplicado a moradores de comunidades de baixa renda em S
ao paulo, para construir
a Tabela 1.3 que resume as observacoes da vari
avel estado civil.
Tabela 1.3: Freq
uencias de estado civil em uma amostra de 385 indivduos.
Estado Civil
Freq
uencia Absoluta
Freq
uencia Relativa Percentual
Solteiro
Casado
Divorciado
Vi
uvo
Outro
165
166
10
12
32
42,86%
43,12%
2,6%
3,12%
8,31%
Total
385
100%
A vari
avel estado civil e qualitativa nominal e no levantamento feito nos 385 indivduos apareceram respostas que foram agrupadas em 5 nveis (categorias) para esta vari
avel:
Solteiro, Casado, Divorciado, Vi
uvo e Outro. A construcao da tabela de freq
uencia simples, neste caso, resume os dados brutos pela contagem de vezes(freq
uencia absoluta) que
uma determinada categoria foi observada.
A partir da Tabela 1.3, podemos rapidamente tirar conclusoes a respeito dos dados
como a constatac
ao de que neste grupo de indivduos, a quantidade de solteiros(165) e
casados(166) e praticamente a mesma e h
a uma parcela muito pequena de divorciados(10).
11
Estes coment
arios, embora simples, tornam-se mais claros quando analisamos a coluna das
freq
uencias relativas.
ni : freq
uencia do valor i
n: freq
uencia total
fi =
ni
n:
freq
uencia relativa (
util quando comparamos grupos de tamanhos diferentes)
fi 100: freq
uencia relativa percentual
Para vari
aveis cujos valores possuem ordenacao natural faz sentido incluirmos tambem uma coluna contendo freq
uencias acumuladas f ac. Sua construcao ajuda a estabelecer
pontos de corte, chamados de separatrizes ou quantis, a partir dos quais est
a concentrada
uma determinada freq
uencia de valores da vari
avel.
A Tabela 1.4 exibe as freq
uencias das idades em uma amostra de 50 estudantes que
preencheram um question
ario sobre h
abitos de lazer (ver Magalhaes & Lima(2004)).
Tabela 1.4: Tabela de freq
uencias para a vari
avel Idade.
Idade
ni
fi
f ac
17
18
19
20
21
22
23
24
25
9
22
7
4
3
0
2
1
2
0,18
0,44
0,14
0,08
0,06
0
0,04
0,02
0,04
0,18
0,62
0,76
0,84
0,90
0,90
0,94
0,96
1,00
total
n=50
Tabelas de frequ
encias em faixas de valores
Correa da Rosa, J. M.
Veja o exemplo na Tabela 1.5 que traz dados sobre as horas semanais de atividades
fsicas dos 50 estudantes que participaram do levantamento sobre h
abitos de lazer.
Tabela 1.5: Tabela de freq
uencias para a vari
avel horas semanais de atividade fsica
horas semanais de atividade fsica
ni
fi
fac
0 | 2
2 | 4
4 | 6
6 | 8
8 | 10
10 | 12
11
14
12
8
3
2
0,22
0,28
0,24
0,16
0,06
0,04
0,22
0,5
0,74
0,90
0,96
1,00
50
total
ni
fi
f ac
| 50,0
| 60,0
|70,0
| 80,0
|90,0
|100,0
8
22
8
6
5
1
0,16
0,44
0,16
0,12
0,10
0,02
0,16
0,60
0,76
0,88
0,98
1,00
100
40,0
50,0
60,0
70,0
80,0
90,0
total
13
Para a decepc
ao de muitos, n
ao h
a uma resposta definitiva a esta pergunta e existem
varias sugestoes na literatura para se chegar a este n
umero. Esta questao ser
a discutida
posteriormente ao falarmos de uma tecnica gr
afica chamada de histograma, mas o bom
senso indica que o n
umero de intervalos deve estar entre 5 e 10 neste tipo de descric
ao.
1.2.2
Medidas-resumo
Tend
encia central
As medidas de tendencia central indicam, em geral, um valor central em torno do
qual os dados est
ao distribudos. Este valor no Exemplo 1.8 e igual a 10 e corresponde a
media aritmetica. As principais medidas de tendencia central na Estatstica s
ao: media,
mediana e moda. Alem destas, outras medidas s
ao utilizadas com fins especficos tais
como: media geometrica, media harmonica, media ponderada e trimedia.
Sejam as observac
oes obtidas a partir da vari
avel X, em uma populacao ou em uma
amostra:
1
Alguns autores classificam as medidas de tendencia central e separatrizes como medidas de posic
ao.
Correa da Rosa, J. M.
x1 , x2 , . . . , xn
e considere a seguinte notac
ao para os dados ordenados:
x(1) , x(2) , . . . , x(n)
.
em que x(1) e o menor valor(mnimo) no conjunto de dados e x(n) e o maior valor(m
aximo).
Com base nesta notac
ao, apresentamos a seguir os conceitos de media, mediana e
moda.
M
edia (Aritm
etica)
A media aritmetica tambem e conhecida como ponto de equilbrio e centro de gravidade, denominac
oes surgidas da Fsica. Ela indica o valor em torno do qual h
a um
equilbrio na distribuic
ao dos dados. O seu calculo e feito conforme:
x
obs =
Pn
i=1 xi
(xi x
obs ) =
n
X
i=1
xi n
xobs =
n
X
i=1
xi
n
X
xi = 0.
i=1
15
x1 = 1; x2 = 1; x3 = 0; x4 = 0; x5 = 0; x6 = 0; x7 = 0; x8 = 1; x9 = 0; x10 = 1.
A media calculada a partir dos dados acima e igual a :
Pn
i=1 xi
4
= 0, 4.
n
10
A interpretac
ao deste resultado e de que 40% dos entrevistados est
ao satisfeitos com
o governo.
x
obs =
se n
e par
mdobs =
x( n2 ) + x( n2 +1)
2
550
550
550
600
600
700
1750
Neste exemplo, h
a n = 8 observacoes. Portanto, a mediana ser
a obtida como:
mdobs =
x(4) + x(5)
550 + 600
=
= 575,
2
2
isto e, a media aritmetica entre a quarta (x(4) = 550) e a quinta (x(5) = 600)
observac
oes que resulta em 575. Neste caso, note que um trabalhador com renda
mediana ganha 150 reais a menos do que um trabalhador com renda media que e
igual a (
xobs = 725).
Correa da Rosa, J. M.
Nas situac
oes em que a mediana e exatamente igual a media, diz-se que os dados tem
distribuic
ao simetrica, ou seja, a probabilidade de sortear um n
umero do conjunto
de dados e este estar localizado abaixo da media (mediana) e igual a 50%. Um modo
direto de mensurar a simetria na distribuicao dos dados e calcular a diferenca entre a
mediana e a media, quanto mais pr
oximo de zero for este resultado, maior a simetria
no conjunto de dados..
Moda
A moda observada (moobs ) e simplesmente o valor mais freq
uente em um conjunto
de dados. Considere o seguijnte conjunto de dados:3; 4; 5; 7; 7; 7; 9; 9. Temos moobs = 7,
pois o valor 7 e aquele que ocorre com a maior freq
uencia.
A moda e uma medida de tendencia central que pode ser calculada para qualquer
tipo de vari
avel, seja ela quantitativa ou qualitativa. Veja o exemplo a seguir.
Exemplo 1.11. Em uma amostra de pacientes em um laborat
orio foram observados os
tipos sanguneos encontrados em 1000 exames, com os seguintes resultados mostrados na
Tabela 1.7.
Tabela 1.7: Tipos sanguneos de 1000 pacientes.
Tipo de Sangue
Freq
uencia Absoluta(ni )
O
A
B
AB
497
441
123
25
Total
1000
Para estes dados, a moda observada e o sangue do tipo O, pois este e o mais freq
uente.
Cabe ressaltar que, para esta vari
avel, apenas podemos calcular esta medida de tendencia
central.
Pode ocorrer a situac
ao em que existam duas modas, como por exemplo para o
conjunto A = {3, 4, 4, 5, 5, 6, 7, 8} . Neste caso, os valores 4 e 5 s
ao os mais freq
uentes. O
conjunto e dito ser bimodal.
Quando o conjunto possui mais do que duas modas ele e dito ser multimodal.
Outra situac
ao extrema e aquela em que a moda n
ao existe tal como ocorre para o
conjunto B = {3, 4, 5, 6, 7, 8, 9} cujas freq
uencias est
ao distribudas uniformemente entre
os diferentes valores, ou seja, nestes dados cada valor tem freq
uencia igual a 1 e o conjunto
e dito ser amodal.
17
Medidas de dispers
ao
Muito embora as medidas de tendencia central sejam utilizadas como o primeiro
resumo numerico de um conjunto de dados, a sua representatividade est
a diretamente
ligada com a variabilidade. Veja o Exemplo 1.12 a seguir.
Exemplo 1.12. Ao aplicar a mesma prova em dois grupos de 4 alunos cada, foram obtidos
os resultados:
Notas da Turma A
aluno
nota
Notas da Turma B
aluno
nota
10
10
Turma A
Turma B
Media
Mediana
Moda
5
5
5
5
n
ao existe
n
ao existe
As medidas de dispers
ao servem para quantificar a variabilidade dos valores em um
conjunto de dados. Uma medida de tendencia central para ser melhor compreendida deve
estar acompanhada de uma medida de dispers
ao.
Nesta sec
ao, ser
ao apresentadas 5 medidas de dispers
ao (ver Tabela 1.9) para vari
aveis quantitativas, sendo que 4 delas utilizam a media como referencia: desvio medio
absoluto, vari
ancia, desvio padrao e coeficiente de variacao.
Amplitude total
Esta medida e obtida a partir da diferenca entre o m
aximo(x(n) ) e o mnimo (x(1) )
em um conjunto de dados ordenados. Esta medida possui o valor 0 como limite inferior e
e altamente sensvel `
a valores extremos.
Correa da Rosa, J. M.
Notacao
Amplitude Total
Desvio absoluto medio
Vari
ancia
Desvio padrao
Coeficiente de Variacao
obs
damobs
varobs
dpobs
cvobs
n
X
|xi x
obs |
i=1
Exemplo 1.13. Em uma prova, os alunos obtiveram as seguintes notas: 5; 6; 9; 10; 10.
Obtenha o desvio medio absoluto.
dmaobs =
|5 8| + |6 8| + |9 8| + |10 8| + |10 8|
= 2.
5
19
2,50
2,45
4,15
3,30
2,86
3,45
3,48
2,33
3,70
3,15
desvios
-0,63
-0,69
1,01
0,16
-0,28
0,31
0,34
-0,81
0,56
0.01
0, 63 + 0, 69 + . . . + 0, 01
= 0, 48
10
A interpretac
ao desta medida para o Exemplo 1.14 indica que, em media, um nascido
vivo tem peso 0,48kg distante da media observada que e 3,137kg.
dmaobs =
Vari
ancia
Esta e a mais conhecida medida de variabilidade. Como ser
a visto mais adiante, em
muitas situac
oes o c
alculo de probabilidades depende exclusivamente do conhecimento da
media e vari
ancia de uma vari
avel na populacao.
O c
alculo da vari
ancia assemelha-se com o do dmaobs , pois utiliza desvios quadr
aticos em vez dos absolutos. Assim, a vari
ancia tambem e chamada de media dos desvios
quadr
aticos.
varobs =
n
X
(xi x
obs )2
i=1
varobs =
Propriedades da vari
ancia:
1. A vari
ancia de um conjunto de n
umeros iguais e sempre 0.
2. Ao multiplicar todos os valores do conjunto por uma constante, a vari
ancia fica
multiplicada por esta constante ao quadrado.
3. Ao somar uma constante a todos os valores de um conjunto, a vari
ancia n
ao se altera.
Exemplo 1.15. O conjunto de notas do Exemplo 1.13 deve ser multiplicado por 10 para
que este possa ser lancado no boletim. Deste modo, o novo conjunto e: 50, 60, 90, 100, 100
Qual a vari
ancia das notas lancadas no boletim ?
Soluca
o: Basta multiplicar a vari
ancia encontrada anteriormente por 100.
Por utilizar a media como referencia, o desvio absoluto medio e a vari
ancia tambem
s
ao afetados por valores extremos. No caso da vari
ancia o efeito e ainda maior pois os
valores est
ao elevados ao quadrado.
Correa da Rosa, J. M.
Desvio padr
ao
Embora seja uma medida importante, a vari
ancia carece de interpretacao pois e uma
medida dos valores ao quadrdado. Isto e contornado com o uso do desvio padrao que e
obtido pelo c
alculo da raiz quadrada da vari
ancia.
dpobs =
varobs
v
u n
uX (xi x
obs )2
=t
.
n
i=1
dpobs
.
x
obs
Exemplo 1.16. Um exame fsico examinou 6 indivduos cujos pesos(kg) foram:68; 70; 86;
55; 75 e 90. No mesmo exame, foram tambem tomadas medidas de altura (cm), com os seguintes valores:170; 160; 164; 164; 170 e180. Os indivduos apresentam maior variabilidade
no peso ou altura?
Como as unidades de medida s
ao diferentes, utilizaremos o coeficiente de variac
ao
como medida de comparac
ao entre os dois conjuntos.
Resumo
Peso (Kg)
Altura (cm)
media
74
168
desvio padrao
11,65
6,43
coeficiente de variacao
15,7%
3,83 %
21
1.2.3
Gr
aficos
Muitas vezes as informacoes contidas em tabelas podem ser mais facilmente entendidas se visualizadas em gr
aficos. Gracas `a proliferacao dos recursos gr
aficos, existe hoje
uma infinidade de tipos de gr
aficos que podem ser utilizados.
No entanto, a utilizac
ao de recursos visuais deve ser feita cuidadosamente; um gr
afico
desproporcional em suas medidas pode conduzir a conclusoes equivocadas
Vamos abordar tres tipos b
asicos de gr
aficos: setores ou pizza, barras e histograma.
Correa da Rosa, J. M.
Gr
afico de setores ou pizza
Este gr
afico e adequado para representar vari
aveis qualitativas. Sua construc
ao
consiste em repartir um disco em setores cujos angulos s
ao proporcionais `as freq
uencias
relativas observadas nas categorias da vari
avel.
Exemplo 1.18. Uma pesquisa de intencao de votos para os partidos A,B,C e D, realizada
com 100 eleitores resultou na Tabela 1.11.
Tabela 1.11: Intencao de votos para os partidos A,B,C e D.
Partido
Freq
uencia Absoluta
Freq
uencia Relativa
A
B
C
D
40
30
20
10
0,4
0,3
0,2
0,1
Total
100
Conforme a Figura 1.1 a maior fatia corresponde ao partido A que detem 40%
das intenc
oes de voto. Embora tal informacao esteja na Tabela 1.11, a assimilacao das
diferencas entre as intenc
oes de votos e mais r
apida no gr
afico de setores.
Intenes de Voto
partido A
partido B
partido D
partido C
Figura 1.1: Gr
afico de setores para a intencao de votos nos partidos A,B,C e D.
23
Gr
afico de barras
Este gr
afico representa a informacao de uma tabela de freq
uencias simples e, portanto, e mais adequado para vari
aveis discretas ou qualitativas ordinais. Utiliza o plano
cartesiano com os valores da vari
avel no eixo das abscissas e as freq
uencias no eixo das
ordenadas.
Para cada valor da vari
avel desenha-se uma barra com altura correspondendo `
a
sua freq
uencia. E importante notar que este gr
afico sugere uma ordenacao dos valores
da vari
avel, podendo levar a erros de interpretacao se aplicado `a vari
aveis quantitativas
nominais.
Exemplo 1.19. Um posto de sa
ude contem um cadastro das famlias regularmente atendidas em que consta o n
umero de criancas por famlia. Ao resumir esta informacao para
todas as famlias em que h
a no m
aximo 5 criancas e obtida a Tabela 1.12.
Tabela 1.12: N
umero de criancas por famlia.
N
umero de criancas
Freq
uencia Absoluta
Freq
uencia Relativa
0
1
2
3
4
5
52
38
43
22
11
6
0,302
0,221
0,25
0,128
0,064
0,035
Total
172
A representac
ao gr
afica da Tabela 1.12 e apresentada na Figura 1.2. A altura de
cada barra e diretamente proporcional ao n
umero de famlias com a quantidade de filhos
especificada no eixo das abcissas.
Histograma
O histograma e um gr
afico que possibilita o primeiro contato com a formato da
distribuic
ao dos valores observados. Precede a sua construcao a organizacao dos dados de
uma vari
avel quantitativa em faixas de valores.
Consiste em ret
angulos contguos com base nas faixas de valores da vari
avel e com
area igual `
a freq
uencia relativa da faixa. A altura de cada ret
angulo e denominada densidade de freq
uencia ou simplesmente densidade definida pelo quociente da freq
uencia
2
relativa pela amplitude da faixa .
2
Correa da Rosa, J. M.
10
20
frequncia
30
40
50
nmero de filhos
Figura 1.2: Gr
afico de barras para o n
umero de filhos por famlia.
1. Formula de Sturges
L = 1 + 3, 3 log n.
2. Raiz quadrada de n
L=
n.
25
Assim como o gr
afico de setores e o gr
afico de barras s
ao construdos a partir de
uma tabela de frequ
uencias simples, o histograma e construdo a partir de uma tabela de
freq
uencias em faixa de valores.
Exemplo 1.20. Um determinado teste mede o nvel de estresse por uma escala de valores
que varia continuamente de 0 a 13. Uma empresa aplicou o teste a 70 funcion
arios obtendo
os seguintes resultados:
Tabela 1.13: Nvel de estresse em 70 funcion
arios de uma empresa.
Nvel de estresse
Freq
uencia Absoluta (ni )
Freq
uencia Relativa (fi )
0|2
2|4
4|6
6|8
8|10
10|12
12|14
5
10
13
16
11
9
6
0,07
0,14
0,19
0,23
0,16
0,13
0,09
Total
70
A informac
oes da Tabela 1.13, com L = 7 faixas de valores para a vari
avel nvel de
estresse, s
ao diretamente transpostas para o gr
afico histograma conforme a Figura 1.3.
Freq"uncia
10
15
nvel de estresse
10
12
14
estresse
Correa da Rosa, J. M.
Box-plot
O Box-Whisker Plot, mais conhecido por box-plot, e uma ferramenta gr
afica apropriada para resumir o conjunto de observacoes de uma vari
avel contnua. Este gr
afico
revela varios aspectos dos dados, dentre eles: tendencia central, variabilidade e simetria.
O boxplot tambem possibilita visualizar valores atpicos(outliers).
70
A construc
ao do box-plot e feita com base no chamado resumo de cinco n
umeros: o
mnimo, o primeiro quartil(Q1 ), a mediana (mdobs ), o terceiro quartil (Q3 ) e o m
aximo.
Apos calcular estes cinco n
umeros em um conjunto de dados observados, eles s
ao dispostos
de acordo com a Figura 1.4.
60
Max
50
Q3
40
md
30
Q1
Min
A parte central do gr
afico e composta de uma caixa com o nvel superior dado por
Q3 e o nvel inferior por Q1 . O tamanho da caixa e uma medida de dispers
ao chamada
amplitude interquartlica (AIQ = Q3 Q1 ).
27
46
36, 50
55, 50
Mnimo (x(1) )
22
Maximo (x(20) )
69
70
Na Figura 1.5 e apresentado para esses dados o box-plot com base no resumo de 5
n
umeros.
60
Max
laranjas
50
Q3
40
md
30
Q1
Min
A representac
ao gr
afica no box-plot informa, dentre outras coisas, a variabilidade e
simetria dos dados. Na Figura 1.5, a distribuicao dos dados est
a muito pr
oxima da perfeita
simetria pois: a diferenca entre a mediana(46) e a media(46,55) e pequena e a dist
ancia
da mediana para os quartis e a mesma.
Outra possibilidade na construcao do box-plot e utilizar nas extremidades dos tracos
adjacentes `
a caixa um criterio para identificar observacoes atpicas. Este criterio e baseado
na amplitude interquartis(AIQ = Q3 Q1 ). A esquematizacao que utiliza este criterio e
apresentada na Figura 1.6.
No exemplo das laranjas, n
ao h
a valores fora destes limites e, quando isto ocorre, os
limites s
ao representados pelo mnimo e m
aximo conforme a Figura 1.4.
Correa da Rosa, J. M.
60
80
Q3+1,5AIQ
Q3
40
md
20
Q1
Q11,5AIQ
29
altura
99.00
115.00
114.00
133.00
106.00
160.00
96.00
96.00
127.00
110.00
111.00
128.00
107.00
134.00
109.00
104.00
106.00
117.00
147.00
132.00
148.00
80.00
91.00
107.00
79.00
127.00
107.00
123.00
91.00
119.00
75.00
75.00
101.00
105.00
97.00
100.00
116.00
127.00
sexo
m
m
f
m
m
m
m
m
f
f
f
f
f
f
f
f
m
m
m
m
f
f
f
f
f
m
m
m
f
m
m
m
m
f
m
f
m
m
crianca
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
altura
118.00
118.00
86.00
124.00
113.00
121.00
92.00
104.00
75.00
108.00
105.00
102.00
96.00
96.00
113.00
88.00
100.00
152.00
88.00
108.00
120.00
93.00
98.00
110.00
108.00
119.00
93.00
116.00
98.00
108.00
91.00
109.00
97.00
115.00
88.00
58.50
88.00
103.00
sexo
f
m
m
m
m
f
m
m
f
m
f
f
m
f
m
m
m
f
f
m
m
f
m
f
m
m
f
m
m
m
m
f
m
m
m
m
m
f
Correa da Rosa, J. M.
60
80
100
altura em cm
120
140
160
m
sexo
31
SELIC apresenta maior variabilidade. Por este conjunto de dados apresentar aspectos tipcos de uma serie temporal, devemos tomar extremo cuidado ao calcular resumos numericos
pois estes podem variar em funcao do perodo de tempo em que s
ao calculados.
Exemplo 1.22. Uma importante rede de lojas registra durante um ano a quantidade (em
milhares) de eletrodomesticos vendidos.
mes
vendas de
eletrodomesticos
jan
fev
mar
abr
mai
jun
jul
ago
set
out
nov
dez
25
23
17
14
11
13
10
11
20
22
A evoluc
ao das vendas ao longo do tempo e melhor entendida no gr
afico seq
uencial
apresentado na Figura 1.9. Repare que ap
os o mes de janeiro h
a uma tendencia de queda
que e revertida novamente nos u
ltimos meses do ano.
Correa da Rosa, J. M.
10
15
qtde vendida
20
25
10
12
ms
Figura 1.9: Gr
afico sequencial das vendas ao longo dos meses.
Captulo 2
Introdu
c
ao
2.2
Conceitos B
asicos de Probabilidade
34
2.2.1
Definic
ao cl
assica de probabilidade
Em fenomenos aleat
orios tais como lancamento de uma moeda, de um dado, extracao de uma carta de um baralho entre outros, temos que todos os resultados possveis tem
a mesma chance de ocorrer. Assim, por exemplo no lancamento de uma moeda a probabilidade do evento cara ou coroa ocorrer s
ao igualmente prov
aveis, ou seja, a probabilidade
atribuda a cada um e 1/2.
A probabilidade de um evento A qualquer ocorrer pode ser definida por:
P (A) =
n
umero de casos favor
aveis ao evento A
.
n
umero de casos possveis
3
= 0, 50.
6
2.2.2
35
Aproximac
ao da Probabilidade pela frequ
encia relativa
Quando n
ao se tem conhecimento sobre as probabilidades dos eventos, estas podem
ser atribudas ap
os repetidas observacoes do fenomeno aleatorio, ou seja, a proporc
ao de
vezes que um evento A qualquer ocorre pode ser estimada como segue:
P (A) =
n
umero de ocorrencias do evento A
.
n
umero de observacoes
Exemplo 2.7. Uma escola particular pretende oferecer um treinamento esportista aos
seus alunos. Dos 300 alunos entrevistados, 142 optaram pelo voleibol, 123 indicaram o
basquete e 35 indicaram o futebol. Selecionado aleatoriamente um desses alunos, qual a
probabilidade de obter alguem que prefere o voleibol?
P (V ) =
142
= 0, 47333.
300
` medida que o n
A
umero de observacoes aumenta, as aproximacoes tendem a ficar
cada vez mais pr
oximas da probabilidade efetiva.
2.2.3
Propriedades de probabilidades
uma func
E
ao P(.) que associa n
umeros reais aos elementos do espaco amostral e
satisfaz as condic
oes:
1. 0 P (A) 1, para qualquer evento A;
2. P() = 1;
3. P() = 0;
4. P(nj=1 Aj ) =
n
X
P (Aj ).
j=1
2.2.4
Teorema da soma
36
= {1, 2, 3, 4, 5, 6}.
1
P (A) =
.
6
3
P (B) =
.
6
3
.
P (C) =
6
1 3
4
P (A B) =
+ = .
6 6
6
1 3 1
3
P (A C) =
+ = .
6 6 6
6
5
1
P (A) = 1 = .
6
6
Exemplo 2.9. Um estudo realizado por uma empresa de recursos humanos mostrou que
45% dos funcion
arios de uma multinacional saram da empresa porque estavam insatisfeitos
com seus sal
arios, 28% porque consideraram que a empresa nao possibilitava o crescimento
profissional e 8% indicaram insatisfacao tanto com o sal
ario como com sua impossibilidade
de crescimento profissional. Considere o evento S: o funcion
ario sai da empresa em raz
ao
do sal
ario e o evento I: o funcion
ario sai da empresa em raz
ao da impossibilidade de
crescimento profissional. Qual e a probabilidade de um funcion
ario sair desta empresa
devido a insatisfac
ao com o sal
ario ou insatisfacao com sua impossibilidade de crescimento
profissional?
P (S I) = P (S) + P (I) P (S I)
P (S I) = 0, 45 + 0, 28 0, 08 = 0, 65.
2.2.5
Probabilidade condicional
Existem situac
oes em que a chance de um particular evento acontecer depende do
resultado de outro evento. A probabilidade condicional de A dado que ocorreu B pode ser
determinada dividindo-se a probabilidade de ocorrencia de ambos os eventos A e B pela
probabilidade do evento B; como se mostra a seguir:
P (A | B) =
P (A B)
, P (B) > 0.
P (B)
37
Exemplo 2.10. Em uma universidade foi selecionada uma amostra de 500 alunos que
cursaram a disciplina de Estatstica. Entre as questoes levantadas estava: Voce gostou da
disciplina de Estatstica? De 240 homens, 140 responderam que sim. De 260 mulheres, 200
responderam que sim. Para avaliar as probabilidades podemos organizar as informac
oes
em uma tabela. maneira:
Tabela 2.1: Gosto pela disciplina de estatstica segundo sexo.
Sexo
Gostou
Sim Nao
Homem
Mulher
140
200
100
60
240
260
Total
340
160
500
Total
P (G) =
340
= 0, 68.
500
260
= 0, 52.
500
(d) NG = Nao gostou da disciplina de Estatstica?
P (M ) =
160
= 0, 32.
500
(e) Seja uma mulher ou gostou da disciplina de Estatstica.
P (N G) =
= 0, 80.
500 500 500
(f) Seja uma mulher e gostou da disciplina de Estatstica.
P (M G) =
200
= 0, 40.
500
(g) Dado que o aluno escolhido gostou da disciplina de Estatstica. Qual a probabilidade
de que o aluno seja um homem?
P (M G) =
P (H | G) =
140
P (H G)
=
= 0, 41176.
P (G)
340
(h) Dado que o aluno escolhido e uma mulher. Qual a probabilidade de que ela n
ao gostou
da disciplina de Estatstica?
P (N G | M ) =
P (N G M )
60
=
= 0, 23077.
P (M )
260
38
2.2.6
Teorema do produto
Da definic
ao de probabilidade condicional P (A|B) = P P(AB)
(B) podemos obter o teorema do produto, que nos permite calcular a probabilidade da ocorrencia simult
anea de
dois eventos. Sejam A e B eventos de , a probabilidade de A e B ocorrerem juntos e
dada por:
P (A B) = P (A) P (B|A), com P(A) > 0
ou
P (A B) = P (B) P (A|B), com P(B) > 0.
Dois eventos A e B s
ao independentes quando a ocorrencia de um n
ao altera a
probabilidade de ocorrencia do outro. Desse modo,
P (A B) = P (A) P (B).
Exemplo 2.11. Uma empresaria sabe por experiencia, que 65% das mulheres que compram em sua loja preferem sandalias plataformas. Qual e a probabilidade de as duas
pr
oximas clientes comprarem cada uma delas, uma sandalia plataforma? Vamos admitir que o evento A a primeira cliente compra uma sandalia plataforma e o evento B a
segunda cliente compra uma sandalia plataforma. Entao,
P (A B) = (0, 65)(0, 65) = 0, 4225.
2.2.7
39
V = (V I) (V II)
P (V ) = (P (V I)) + (P (V II)
= P (I)(P (V |I)) + (P (II)P (V |II)
1 2 1 4
=
+
= 0, 48571.
2 5 2 7
Exemplo 2.13. Um estabilizador pode provir de tres fabricantes I, II e III com probabilidades de 0,25, 0,35 e 0,40, respectivamente. As probabilidades de que durante determinado
perodo de tempo, o estabilizador n
ao funcione bem s
ao, respectivamente, 0,10; 0,05 e 0,08
para cada um dos fabricantes. Qual e a probabilidade de que um estabilizador escolhido ao
acaso n
ao funcione bem durante o perodo de tempo especificado. Se denotarmos por A o
evento um estabilizador n
ao funcione bem e por C1 , C2 e C3 os eventos um estabilizador
vem do fabricante I, II e III, respectivamente. A probabilidade de que um estabilizador
escolhido ao acaso n
ao funcione bem durante o perodo de tempo especificado e:
2.2.8
Teorema de Bayes
P (Cj ) P (A|Cj )
, j = 1, 2, . . . , n.
P (C1 ) P (A|C1 ) + P (C2 ) P (A|C2 ) + + P (Cn ). P (A|Cn )
P (C1 ) P (A|C1 )
P (C1 )P (A|C1 ) + P (C2 )P (A|C2 ) + P (C3 )P (A|C3 )
(0, 25)(0, 10)
= 0, 33557.
0, 07450
Captulo 3
Vari
aveis Aleat
orias
3.1
Introdu
c
ao
3.2
Vari
avel Aleat
oria Discreta
Uma vari
avel aleat
oria que pode assumir um n
umero finito de valores ou uma quantidade enumeravel de valores, cujas probabilidades de ocorrencia s
ao conhecidas e denominada vari
avel aleat
oria discreta.
A func
ao que atribui a cada valor da vari
avel aleatoria sua probabilidade e denominada func
ao discreta de probabilidade ou funcao de probabilidade, isto e:
P (X = xi ) = p(xi ) = pi , i = 1, 2, . . .
Uma func
ao de probabilidade satisfaz as duas condicoes seguintes:
i) 0 pi 1;
P
ii)
pi = 1.
3.3. Vari
avel Aleatoria Contnua
41
faringe, 9% tiveram tres internamentos por infeccao da faringe e 1% tiveram quatro internamentos por infecc
ao da faringe. Seja X uma vari
avel aleatoria discreta que representa o
n
umero de internamentos por infeccao da faringe. Logo, a funcao de probabilidade para
X e dada na tabela a seguir:
X
0
1
2
3
4
pi 0,20 0,45 0,25 0,09 0,01
No exemplo temos: 0,20 + 0,45 + 0,25 + 0,09 + 0,01 = 1.
3.3
Vari
avel Aleat
oria Contnua
Uma vari
avel aleat
oria que pode tomar um n
umero infinito de valores, e esses valores podem ser associados a mensuracoes em uma escala contnua e as probabilidades
necessarias ao seu estudo s
ao calculadas como a area abaixo da curva da distribuic
ao, e
chamada de func
ao de densidade de probabilidade. Como exemplos de vari
aveis aleat
orias
contnuas, podemos citar: o tempo de uso de um equipamento eletr
onico; medidas do
torax, di
ametro de um cabo de vdeo, tempo de atendimento a clientes; altura, peso, etc.
Uma func
ao de densidade de probabilidade f (x) pode ser usada para descrever a
distribuic
ao de probabilidades de uma vari
avel aleatoria contnua X, se satisfaz:
i)fZ(x) 0, para todo x (, );
ii)
f (x)dx = 1.
3.4
Esperan
ca Matem
atica
i=1
E(X) = =
42
3.5
Vari
aveis Aleatorias
Vari
ancia
A vari
ancia de uma vari
avel aleatoria X e dada por:
V ar(X) = 2 = E(X)2 [E(X)]2 .
3.6
Principais Distribuic
oes de Probabilidades
A distribuic
ao de probabilidade de uma vari
avel descreve como as probabilidades
est
ao distribudas sobre os valores da vari
avel aleatoria. A seguir veremos as distribuic
oes
de probabilidade Bernoulli, Binomial e Poisson para vari
aveis aleatorias discretas e a
distribuic
ao Normal para uma vari
avel aleatoria contnua.
3.6.1
Distribuic
ao de Bernoulli
Em situac
oes em que o fenomeno aleatorio e realizado uma s
o vez e a vari
avel de
interesse assume somente dois valores, tais como: um gestor de informacao reconhece uma
determinada editora ou n
ao, um paciente sobrevive a um transplante de medula ossea ou
n
ao, um equipamento eletr
onico e classificado como bom ou defeituoso. Estas situac
oes
tem alternativas dicot
omicas, ou seja, podem ser representadas por respostas do tipo
sucesso com probabilidade p que se atribui o valor 1 ou fracasso com probabilidade q que
se atribui o valor 0. Podemos definir estes experimentos como ensaios de Bernoulli.
Uma vari
avel X tem distribuicao de Bernoulli e sua funcao discreta de probabilidade
e dada por:
P (X = x) = px q 1x , x = 0, 1.
Exemplo 3.3. Uma caixa tem 20 bolas azuis e 30 verdes. Retira-se uma bola dessa caixa.
Seja X o n
umero de bolas verdes. Determinar P (X).
20
50 = 0, 4
x
0, 6 0, 41x .
Para x = 0 temos q =
Logo, P (X = x) =
3.6.2
e para x = 1, p =
30
50
= 0, 6.
Distribuic
ao Binomial
n x nx
P (X = x) =
p q
,
x
em que
43
x = 0, 1, 2, . . . , n,
n
n!
=
x
x!(n x)!
sendo
n = n
umero de tentativas,
x = n
umero de sucessos,
p = probabilidade de sucesso,
q = probabilidade de fracasso e
P (x)= a probabilidade de se obter exatamente x sucessos em n provas.
Para uma vari
avel aleat
oria X com distribuicao binomial a media e sua vari
ancia s
ao
dadas, respectivamente, por:
= E(X) = np; e 2 = npq.
Exemplo 3.4. Uma moeda e lancada 6 vezes. Qual a probabilidade de:
a) Exatamente duas caras ocorrerem?
6
P (X = 2) =
0, 52 0, 562 = 0, 23438.
2
b) Ocorrerem pelo menos 4 caras?
P (X 4) = P (X = 4) + P (X = 5) + P (X = 6)
6
6
6
=
0, 54 0, 564 +
0, 55 0, 565 +
0, 56 0, 566
4
5
5
= 0, 23438 + 0, 09375 + 0, 01563 = 0, 34375.
c) Pelo menos 1 cara?
P (X 1) = 1 P (X = 0)
6
P (X 1) =
0, 50 0, 560
0
P (X 1) = 1 0, 01563 = 0, 98438.
Exemplo 3.5. Num muncipio, h
a uma probabilidade de 0,70 de uma empresa de materiais recicl
aveis ter seguro contra incendio; qual a probabilidade de que, dentre cinco
empresas:
a) Nenhuma tenha seguro contra incendio?
5
P (X = 0) =
0, 70 0, 350 = 0, 00243.
0
b) Exatamente quatro tenham seguro contra incendio?
5
P (X = 4) =
0, 74 0, 354 = 0, 36015.
4
44
3.6.3
Vari
aveis Aleatorias
Distribuic
ao de Poisson
Como aplicac
oes da distribuicao de Poisson podemos citar estudos de acidentes com
veculos; n
umero de mortes por derrame cerebral por ano, numa cidade, n
umero de reclamac
oes que chegam em uma operadora telefonica por hora, n
umero de clientes que chegam
numa loja durante uma hora de promocao rel
ampago e n
umero de usuarios de computador
ligados `
a Internet.
A distribuic
ao de Poisson e uma distribuicao discreta de probabilidade, aplic
avel a
ocorrencia de um evento em um intervalo especificado (tempo, dist
ancia, area, volume ou
outra unidade an
aloga). A probabilidade do evento ocorrer x vezes em um intervalo e
dada a seguir:
P (X = x) =
x e
.
x!
52 e5
= 0, 08422.
2!
b) Inferior ou igual a 2?
P (X 2) =
3.6.4
50 e5 51 e5 52 e5
+
+
= 0, 12465.
0!
1!
2!
Distribuic
ao Normal
A distribuic
ao Normal e a mais importante distribuicao de probabilidade para descrever vari
aveis aleat
orias contnuas. Isto justifica-se pelo grande n
umero de aplicac
oes
que a utilizam tais como, altura, pressao arterial, medidas de testes psicol
ogicos, tempo de
vida u
til de um dispositivo eletr
onico, temperatura corporal, dentre outras. Alem disso,
pela sua capacidade de aproximar outras distribuicoes e tambem pela grande aplicac
ao na
inferencia estatstica.
A vari
avel aleat
oria contnua X com distribuicao Normal tem funcao de densidade
de probabilidade dada por:
f (x) =
(x)2
1
e 22 , para < x <
2
em que os par
ametros e representam a media e o desvio padrao, respectivamente.
45
Usaremos a notac
ao X N (, 2 ), para indicar que a vari
avel aleatoria X tem
2
distribuic
ao Normal com par
ametros e .
Algumas caractersticas da distribuicao normal s
ao:
a curva normal tem forma de sino, e simetrica em relacao `a media, como representada
na Figura 3.1;
a media, mediana e moda s
ao valores coincidentes;
a vari
avel aleat
oria X associada a sua distribuicao varia de < x < ;
0.0
0.1
0.2
0.3
0.4
a func
ao f (x) tem ponto m
aximo em x = .
3.6.5
Distribuic
ao Normal Padr
ao
3.6.6
46
Vari
aveis Aleatorias
47
x
,
em que:
Z representa o n
umero de desvios-padrao a contar da media;
x representa um valor qualquer da vari
avel aleatoria;
= media da distribuic
ao;
= desvio padrao da distribuicao.
Exemplo 3.14. As vendas di
arias de um confeitaria no centro de uma cidade tem distribuic
ao normal, com media igual R$ 450,00 por dia e desvio padrao igual a R$ 95,00. Qual
e a probabilidade das vendas excederem R$ 700,00 em determinado dia?
= 2, 63 e utilizando a tabela da Normal padrao, encontramos a probaSendo Z = 700500
90
bilidade de 0,00426 para o valor de Z = 2, 63.
Exemplo 3.15. Suponha que entre pacientes o nvel de colesterol tenha uma distribuic
ao
aproximadamente Normal de media 105 mg por 100 ml e um desvio padrao 9 mg por
100 ml. Qual a proporc
ao de diabeticos que tem nveis entre 90 e 125 mg por 100 ml?
Como Z = 90105
= 1, 67 e Z = 125105
= 2, 22 temos a partir da tabela da Normal
9
9
padrao as seguintes probabilidades: 0,98679 para o valor de Z = 2, 22 e 0,04745 para o
valor de Z = 1, 67. Desse modo, a proporcao de diabeticos e 93,93.
Captulo 4
Infer
encia Estatstica - Teoria da
Estima
c
ao
4.1
Introdu
c
ao
Estatstica: e qualquer valor calculado a partir dos dados amostrais. Por exemplo, X
(media amostral), S (desvio-padrao amostral) e p (proporcao amostral). A estatstica
e uma vari
avel aleat
oria, por dois motivos: porque e uma quantidade incerta (antes
de obter a amostra n
ao sabemos seu valor) e porque seu valor varia de amostra
claro que, quando uma amostra e selecionada e uma estatstica
para amostra. E
e calculada, torna-se entao uma constante, ou seja, e o resultado da observac
ao de
uma vari
avel aleat
oria.
Estimador e Estimativa: uma estatstica destinada a estimar um par
ametro e cha48
4.1. Introduc
ao
49
mada estimador. Dada uma amostra, o valor assumido pelo estimador e chamado
de estimativa ou valor estimado do par
ametro. As estimativas obtidas por meio da
estatstica variam de acordo com a amostra selecionada.
Os procedimentos b
asicos de inferencia estatstica compreendem duas metodologias.
Uma e chamada de estimac
ao, na qual n
os usamos o resultado amostral para estimar o
valor desconhecido do par
ametro; a outra e conhecida como teste de hip
oteses, em que
n
os usamos o resultado amostral para avaliar se uma afirmacao sobre o par
ametro (uma
hip
otese) e sustent
avel ou n
ao. Teoria de estimacao e o assunto principal deste captulo e
teste de hip
oteses ser
a retomado no pr
oximo captulo.
Para motivac
ao, consideremos uma populacao formada por 5 alunos. Temos informac
oes sobre a idade e sexo dos alunos na Tabela 4.1.
Tabela 4.1: Populacao de alunos.
Identificac
ao
dos alunos
Idade
em anos completos
Sexo
feminino(f); masculino(m)
1
2
3
4
5
22
19
19
20
22
f
f
m
f
m
A populac
ao de alunos tem, em media, = 20, 4 anos com vari
ancia 2 = 1, 84 anos2
(desvio-padrao = 1, 36 anos, aproximadamente). Verificamos que 40% dos alunos s
ao
homens, ou seja, a proporc
ao de homens e p = 0, 40. A idade media, o desvio-padrao de
idade e a proporc
ao de homens descrevem a populacao de alunos, portanto s
ao par
ametros.
Embora tenhamos acesso a todos os dados de sexo e idade dos 5 alunos, vamos re a idade media amostral, e p por p, a proporc
correr a amostragem para estimar por X,
ao
amostral de homens.
Na Tabela 4.2 est
ao relacionadas todas as amostras possveis de tamanho dois, que
podem ser selecionadas da populacao dos 5 alunos, por amostragem aleatoria simples com
i,
reposic
ao. S
ao 52 = 25 possveis amostras. Para cada amostra i, podemos calcular X
uma estimativa para a idade media e pi , uma estimativa para a proporcao de homens.
Temos estimativas variadas para e p, e e o que ocorre quando tiramos varias amostras
de uma populac
ao. Nenhuma das estimativas coincide com o valor do par
ametro. Por
exemplo, a amostra i = 4, formada pelos alunos 1 e 4, apresenta uma superestimativa
4 = 21 anos, e subestima a proporcao de homens, p4 = 0, 0. J
para a idade media, X
a na
amostra i = 8, em que foram selecionados os alunos 2 e 3, a idade media e subestimada em
8 = 19 anos, e a proporc
X
ao de homens e superestimada em p8 = 0, 5. Nesta ilustrac
ao,
estamos medindo o erro das estimativas, pois o valor do par
ametro e conhecido, situac
ao
que n
ao acontece nos problemas reais de estimacao.
50
Inferencia Estatstica
Tabela 4.2: Todas as possveis amostras aleatorias simples com reposicao de tamanho 2,
da populac
ao de alunos.
Amostra
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Alunos
selecionados
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
e
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
Dados
amostrais
i
X
pi
22 f, 22 f
22 f, 19 f
22 f, 19 m
22 f, 20 f
22 f, 22 m
19 f, 22 f
19 f, 19 f
19 f, 19 m
19 f, 20 f
19 f, 22 m
19 m, 22 f
19 m, 19 f
19 m, 19 m
19 m, 20 f
19 m, 22 m
20 f, 22 f
20 f, 19 f
20 f, 19 m
20 f, 20 f
20 f, 22 m
22 m, 22 f
22 m, 19 f
22 m, 19 m
22 m, 20 f
22 m, 22 m
22,0
20,5
20,5
21,0
22,0
20,5
19,0
19,0
19,5
20,5
20,5
19,0
19,0
19,5
20,5
21,0
19,5
19,5
20,0
21,0
22,0
20,5
20,5
21,0
22,0
0,0
0,0
0,5
0,0
0,5
0,0
0,0
0,5
0,0
0,5
0,5
0,5
1,0
0,5
1,0
0,0
0,0
0,5
0,0
0,5
0,5
0,5
1,0
0,5
1,0
e p.
Com os resultados da Tabela 4.2 podemos calcular a media dos estimadores X
Media de X:
P15
i=1 Xi
15
Media de p:
P15
i
i=1 p
= 20, 4 =
= 0, 4 = p
15
e p coincidiram com os valores dos corresNao foi por acaso que as medias de X
pondentes par
ametros. Podemos demonstrar que a media dessas estimativas e igual ao
51
par
ametro que est
a sendo estimado.
e p, temos um outro resultado interessante. Denotando
Para as vari
ancias de X
tamanho da amostra por n, podemos mostrar tambem que
e:
a vari
ancia de X
2
,
n
e a vari
ancia de p e:
p(1 p)
.
n
Verifique este resultados com os dados da Tabela 4.2. Nas formulas para a vari
ancia
dos estimadores, n aparece no denominador, isto quer dizer que quanto maior o tamanho
da amostra, menos dispersas ser
ao as estimativas.
Quando obtemos todas as amostras de tamanho da populacao encontramos estimativas diferentes para o mesmo par
ametro, porem, em media, s
ao iguais ao par
ametro; e
tendem a ser mais homogeneas com o aumento do tamanho da amostra. Este resultado e
tao surpreendente, que torna possvel o uso de uma amostra para estimar os par
ametros
da populac
ao.
Podemos propor varios estimadores para um determinado par
ametro. Para estimar,
por exemplo, a media populacional da vari
avel X, n
os poderamos usar a media amostral
4.2
Vcio
Um estimador e n
ao viciado se sua media e igual ao par
ametro. A media amostral
e um estimador n
ao viciado da media populacional. Por outro lado, um estimador
viciado, em media, tende a subestimar ou sobrestimar o par
ametro. As vezes, pode
ser interessante usar estimadores viciados, com vcios que tendem a desaparecer
quando o tamanho da amostra aumenta.
Efici
encia
Uma segunda propriedade interessante para um estimador e ter um erro padrao
pequeno, comparado a outros estimadores. Um estimador com essa propriedade e
dito ser eficiente.
52
Inferencia Estatstica
desej
E
avel que o estimador de um par
ametro deva ser n
ao viciado e eficiente. Vimos
que a media amostral e a proporcao amostral s
ao estimadores n
ao viciados para e p,
respectivamente; e e possvel mostrar que s
ao estimadores eficientes. Por outro lado,
Pn
2
i=1 Xi X
2
=
n
e um estimador viciado de 2 e
S =
Pn
i=1
Xi X
n1
2
e n
ao viciado.
Uma boa maneira de visualizar as propriedades dos estimadores e fazer uma analogia
com o jogo de dardos. Na Figura 4.1 est
ao esquematizados o desempenho de 4 jogadores,
cada um com 8 dardos. Os dardos s
ao as amostras e os jogadores representam 4 tipos
de estimadores. O jogador da Figura 4.1a representa um bom estimador, pois os dardos
est
ao em torno do alvo (n
ao viciado) e bem concentrados (eficiente). Nas Figuras 4.1b a
4.1d os jogadores n
ao tem um desempenho tao bom. Na Figura 4.1b est
a representado
o estimador mais eficiente, comparando com os outros estimadores, mas tem vcios. J
ao
estimador caracterizado na Figura 4.1c n
ao tem vcios porem, n
ao e eficiente. O jogador
da Figura 4.1d representa o pior dos 4 estimadores: e viciado e n
ao pode ser considerado
eficiente.
rrrrrrrr
'$
'$
rrrrbrrrr
b
&%
&%
'$
'$
r
r r
r b r
r br
r
r
r
r
r
r rr
&%
&%
r
(a)
(b)
(c)
(d)
4.3. Distribuic
oes Amostrais
4.3
4.3.1
53
Distribuic
oes Amostrais
Introduc
ao
valores de X
19,0
19,5
20,0
20,5
21,0
22,0
0,16
0,16
0,04
0,32
0,16
0,16
Total
1,00
Se esta fosse a u
nica forma de obter a distribuicao amostral, o processo de inferencia
ficaria inviavel para populac
oes reais, pois e necessario obter todas as possveis amostras
de tamanho n para construir a distribuicao amostral. Felizmente, pela teoria de probabilidades podemos mostrar que se uma vari
avel X tem distribuicao Normal, a media amostral,
4.3.2
Distribuic
ao amostral de X
54
Inferencia Estatstica
/ n
tem distribuic
ao Normal Padr
ao.
0.6
0.8
0.0
0.2
0.4
X~N (5,25)
n=10
n=20
n=30
n=100
10
10
20
4.3. Distribuic
oes Amostrais
55
Se uma vari
avel aleat
oria X tem distribuicao Normal com media , entao
T =
S/ n
tem distribuic
ao t de Student com (n 1) graus de liberdade, sendo que S e o estimador
de , o desvio-padrao de X.
Na Figura 4.3 est
ao representadas as densidades das distribuicoes de Z e T .
t (gl=2)
N (0,1)
4.3.3
56
Inferencia Estatstica
distribuic
ao aproximadamente Normal com media e desvio-padrao / n. Assim,
X
/ n
tem aproximadamente distribuicao Normal Padr
ao.
Se e desconhecido, pode ser substitudo por sua estimativa S, o desvio-padrao
amostral, e mesmo assim, podemos entao dizer que
X
S/ n
tem aproximadamente distribuicao Normal Padr
ao.
Exemplo 4.1. Como ilustracao do uso de distribuicoes amostrais, consideremos uma
amostra aleat
oria de n = 100 trabalhadores imigrantes, com a informacao sobre X, sal
ario
Para tanto, usaremos o TCL, ja que n = 100. Assim, dividindo todos os termos dentro da
probabilidade por
S
1200
=
= 120,
n
100
teremos:
Pelo TCL,
200 = P
P 200 X
1, 67
X
1, 67 .
120
S/ n
200
P 200 X
= 0, 905,
4.4. Estimac
ao da Media Populacional ()
57
n
ao podemos garantir que o erro m
aximo n
ao ser
a ultrapassado, mas temos 90, 5% de
confianca que ele n
ao ser
a maior que R$200,00.
Para aumentar o nvel de confianca, e preciso aumentar n, o tamanho da amostra;
ou diminuir e, o erro m
aximo. O processo de encontrar n, fixados o nvel de confianca e
o erro m
aximo, e um problema de calculo de tamanho de amostra, apresentado na Sec
ao
4.9. O processo de encontrar e, fixados o tamanho de amostra e o nvel de confianca, e
um problema de estimac
ao. Neste tipo de problema, fazemos o calculo da probabilidade
ao contr
ario: temos o valor 0,905 e queremos encontrar 1,67. Os detalhes desse processo
inverso s
ao vistos a partir da Secao 4.4.
Ate o momento apresentamos uma estimativa do par
ametro baseado em um u
nico
valor, referido como estimativa pontual. Por exemplo, se a proporcao de mulheres com
osteoporose em uma comunidade for estimada em 45%, essa estimativa e pontual pois
se baseia em um u
nico valor numerico. Muitas vezes, entretanto, queremos considerar,
conjuntamente, o estimador e a sua variabilidade. A forma usual de incorporar esta
informac
ao e por meio do chamado intervalo de confianca.
Com uma amostra disponvel, n
os podemos usar a distribuicao amostral do estimador para formar um intervalo de confianca, isto e, um intervalo de valores que deve
conter o verdadeiro valor do par
ametro com uma probabilidade pre-determinada, referida
por nvel de confianca. Na estimacao por intervalo, acreditamos, com um certo nvel de
confianca, que o intervalo contem o valor do par
ametro. Um exemplo seria dizer que a
proporc
ao de mulheres com osteoporose est
a estimada entre 40% e 50% com um nvel de
95% de confianca.
4.4
Estima
c
ao da M
edia Populacional ()
/ n
tem distribuic
ao Normal Padr
ao.
Como representado na Figura 4.4, podemos encontrar o valor de z, pela tabela da
distribuic
ao Normal Padr
ao, tal que
P (z Z z) = 1 .
58
Inferencia Estatstica
Z~N (0,1)
Assim,
P
X
z = 1 .
z
/ n
z X
+ z
X
n
n
= 1 .
(4.1)
+ z
z ;X
X
n
n
contem o par
ametro.
O erro m
aximo da estimativa, e, tambem conhecido como margem de erro, para um
nvel de confianca (1 ), e dado por:
e = z ,
n
4.4. Estimac
ao da Media Populacional ()
59
S/ n
(4.2)
t S X
+ t S
X
n
n
= 1 .
;X + t
.
X t
n
n
Condi
c
ao 3: Para o caso em que X n
ao segue uma distribuicao Normal, vamos
supor que n seja suficientemente grande para a aplicacao do TCL. Entao:
Z=
X
,
S/ n
(4.3)
z
P z
= 1 .
S/ n
Isolando , chegamos ao intervalo:
z S ; X
+ z S
X
n
n
60
Inferencia Estatstica
Exemplo 4.2. Um centro de ortodontia deseja conhecer a estimativa do tempo medio que
um membro da equipe gasta para atender a cada paciente. Suponha que uma amostra de
38 especialistas revelou que a media foi de 45 minutos com um desvio-padrao de 6 minutos.
Determine um intervalo de 99% de confianca para o par
ametro.
Desejamos uma estimativa para o par
ametro desconhecido , o tempo medio que um
= 45 e S = 6.
membro da equipe gasta para atender um paciente. Temos que n = 38, X
Nao temos muita informac
ao sobre a distribuicao de X, o tempo gasto para atender um
paciente, ent
ao aplicaremos a Condicao 3. Para um nvel de confianca de 99%, o valor de
z e 2,58. Portanto, o intervalo aproximado de 99% de confianca para e
z S ; X
+ z S
X
n
n
6
6
45 2, 58 ; 45 + 2, 58
38
38
4.5
Estima
c
ao de em Amostras Pequenas
4.6. Estimac
ao da Diferenca entre Duas Medias Populacionais ( 1 e 2 )
61
S
e = t = 2, 08 1, 066 = 2, 217.
n
Ent
ao, temos o seguinte intervalo de 95% de confianca para o par
ametro :
t S ; X
+ t S
X
= (15 2, 217; 15 + 2, 217) = (12, 783; 17, 217).
n
n
O intervalo de 12,783 a 17,217 contem a quantia media que cada cliente gasta por lanche,
com 95% de confianca.
Pode parecer um pouco estranho que, com uma populacao distribuda normalmente,
venhamos eventualmente a utilizar a distribuicao t de Student para achar os valores associados ao nvel de confianca; mas quando n
ao e conhecido, a utilizacao de S incorpora
outra fonte de erro. Para manter o grau desejado de confianca compensamos a variabilidade adicional ampliando o intervalo de confianca por um processo que substitui o valor
z por um valor maior, t. Para ilustrar esta ideia considere para o Exemplo 4.3 um intervalo de confianca de 95%, utilizando o valor z de uma distribuicao Normal Padr
ao. Este
intervalo apresenta uma amplitude menor.
(15 2, 089; 15 + 2, 089) = (12, 911; 17, 089).
4.6
Estima
c
ao da Diferenca entre Duas M
edias Populacionais ( 1 e 2 )
Em muitas situac
oes h
a a necessidade de comparar duas populacoes diferentes.
Como exemplos, podemos ter interesse em saber: se idosos que praticam exerccios fsicos diariamente apresentam nvel de colesterol menor do que idosos, com as mesmas
condic
oes, mas que n
ao praticam exerccios fsicos diariamente; se um tipo de equipamente eletr
onico tem maior durabilidade do que outro; e assim por diante. A seguir
vamos utilizar um metodo para construir um intervalo de confianca para a diferenca entre
duas medias, com duas amostras independentes. Para tanto, uma amostra aleatoria e
selecionada independentemente de cada populacao.
Seja X a vari
avel aleat
oria a ser comparada. Suponhamos que X tenha media 1
e desvio-padrao 1 na Populacao 1 e tenha media 2 e desvio-padrao 2 na Populac
ao 2.
Suponhamos tambem que as amostras tenham tamanhos n1 e n2 para as Populacoes 1 e
2, respectivamente.
1 X
2 tem
Se n1 e n2 30, podemos estender o resultado do TCL, tanto que X
distribuic
ao aproximadamente Normal com media 1 2 e desvio-padrao
s
12 22
+ .
n1 n2
Quando os par
ametros 1 e 2 s
ao desconhecidos podem ser substitudos por S1 e
S2 , os desvios-padrao amostrais.
62
Inferencia Estatstica
s
s
2
2
2
2
1 X
2 ) z S1 + S2 ; (X
1 X
2 ) + z S1 + S2 ,
(X
n1
n2
n1
n2
em que o valor de z e encontrado na tabela da distribuicao Normal Padr
ao, conforme o
nvel de confianca do intervalo.
Exemplo 4.4. Com o objetivo de comparar dois metodos de reducao de gordura localizada
nas coxas, foram criados dois grupos, 1 e 2, cada um com 30 pessoas que apresentam as
mesmas condic
oes, recebendo um tipo de tratamento. Antes e depois de um perodo de
60 dias de utilizac
ao do aparelho foi anotado a perda em mm. Obtendo-se:
1 = 21, 3 ; S1 = 2, 6
X
e
2 = 13, 4 ; S2 = 1, 9,
X
construir o intervalo de 95% de confianca para a diferenca de medias.
A diferenca observada na amostra e
1 X
2 = 7, 9
X
e o intervalo:
r
7, 9 1, 96
!
r
2, 62
2, 62
1, 92
1, 92
= (6, 748; 9, 0527).
+
; 7, 9 + 1, 96
+
30
30
30
30
e o intervalo de confianca de 95% para a diferenca entre as reducoes medias dos dois
metodos.
Quando o zero pertence ao intervalo de confianca, h
a forte evidencia de que n
ao h
a
diferenca entre as duas medias populacionais. No Exemplo 4.4, com base no intervalo de
confianca de 95%, podemos concluir que h
a diferenca significativa entre a reducao media
de gordura das coxas entre os dois metodos utilizados, pois o valor zero n
ao pertence ao
intervalo de confianca.
4.7
Estima
c
ao de 1 2 em Amostras Pequenas
Se n1 ou n2 e menor que 30, formas alternativas devem ser usadas para os intervalos
de confianca. A teoria usada na Secao 4.5 pode ser estendida para o caso de duas amostras
independentes. Assumimos normalidade para as distribuicoes populacionais, como no caso
4.7. Estimac
ao de 1 2 em Amostras Pequenas
63
de uma amostra. Alem disso, vamos assumir aqui que 1 = 2 , isso quer dizer que as duas
populac
oes tem o mesmo desvio-padrao, digamos, . A vari
ancia populacional 2 pode
ser estimada por:
Sp2 =
1 X
2) t
(X
Sp2
s
!
1
1
1
1
1 X
2) + t S 2
+
+
,
; (X
p
n1 n2
n1 n2
Mulher
n1 = 10
X1 = 45, 33
S12 = 1, 54
n2 = 11
X2 = 43, 54
S22 = 2, 96
9 1, 54 + 10 2, 96
= 2, 29.
19
1, 79 2, 86
2, 29
s
!
1
1
1
1
= (0, 10; 3, 68).
+
+
; 1, 79 + 2, 86 2, 29
10 11
10 11
64
4.8
Inferencia Estatstica
Estima
c
ao de uma Propor
c
ao Populacional (p)
Nesta sec
ao, as vari
aveis s
ao referentes a contagens, como o n
umero de fumantes,
n
umero de unidades defeituosas em uma linha de producao, e assim por diante. Primeiramente, abordaremos a distribuicao amostral de p, em seguida a estimativa pontual do
par
ametro p, a proporc
ao populacional, e, por u
ltimo, construiremos estimativas intervalares.
Consideremos o caso em que o par
ametro a ser estimado e a proporcao p de indivduos em uma populac
ao, que apresentam uma certa caracterstica. Retira-se da populac
ao
uma amostra de tamanho n. Considerando a vari
avel Xi = 1, se o elemento i da populac
ao
Pn
pertence a categoria de interesse, e Xi = 0, se n
ao pertence a categoria, temos que i=1 Xi
ser
a o n
umero de elementos da amostra que apresentam a caracterstica em estudo.
Para uma populac
ao de N elementos podemos calcular a proporcao populacional
por:
p=
PN
i=1 Xi
Pn
i=1 Xi
Ent
ao, o c
alculo de p e p e an
alogo ao de uma media e, portanto, e possvel aplicar
o TCL para a proporc
ao amostral.
4.8.1
estimado por:
Assim,
p
p
p(1 p)/n
p(1 p)/n.
p p
p(1 p)/n
4.8. Estimac
ao de uma Proporcao Populacional (p)
4.8.2
65
z p
p p
p(1 p)/n
= 1 ,
p z
p(1 p)
p p + z
n
p(1 p)
n
= 1 .
(4.4)
1
.
4n
420
= 0, 70.
600
Inferencia Estatstica
0.00
0.05
0.10
p(1p)
0.15
0.20
0.25
66
0.0
0.2
0.4
0.6
0.8
1.0
0, 7 1, 96
!
r
0, 70 0, 30
0, 70 30
; 0, 70 + 1, 96
= (0, 663; 0, 737).
600
600
4.9
Determina
c
ao do Tamanho da Amostra (n)
Supondo que h
a condicoes para aplicacao do TCL, as formulas para o calculo de n
s
ao derivadas, fixando o erro m
aximo, e e o nvel de confianca (1 ). A determinac
ao de
n tambem depende do plano amostral adotado e do par
ametro a ser estimado.
No caso da amostragem aleatoria simples, a formula de n para a estimacao de e
encontrada isolando n em
e = z .
n
Portanto,
z 2
,
n=
e
4.9. Determinac
ao do Tamanho da Amostra (n)
67
Assim,
n=
amplitude
z 2
e
1000 50
= 237, 5.
4
1, 96 237, 5
100
2
= 21, 67 22.
p(1 p)
,
e2
68
Inferencia Estatstica
Exemplo 4.8. Lderes estudantis de uma faculdade querem conduzir uma pesquisa para
determinar a proporc
ao p de estudantes a favor de uma mudanca no hor
ario de aulas.
Como e impossvel entrevistar todos os 2000 estudantes em um tempo razo
avel, decide-se
fazer uma amostragem aleat
oria simples dos estudantes:
a) Determinar o tamanho de amostra (n
umero de estudantes a serem entrevistados)
necessario para estimar p com um erro m
aximo de 0,05 e nvel de confianca de 95%.
Assumir que n
ao h
a nenhuma informacao a priori disponvel para estimar p.
Temos que e = 0, 05 e que z = 1, 96. Como n
ao h
a informacao a priori sobre p, segue
que
p(1 p)
0, 25
n = z2
= 1, 962
= 384, 16 385.
2
e
0, 052
Para estimar o proporc
ao de estudantes favor
aveis a mudanca de hor
ario, com um
erro m
aximo de 0,05 a 95% de confianca, e necessaria uma amostra de 385 estudantes.
b) Os lderes estudantis tambem querem estimar a proporcao de p de estudantes que
sentem que a representacao estudantil atende adequadamente as suas necessidades.
Com um erro m
aximo de 7% e nvel de confianca de 95%, determinar o tamanho de
amostra para estimar p. Utilizar a informacao de uma pesquisa similar conduzida a
alguns anos, quando 60% dos estudantes acreditavam que estavam bem representados.
0, 60(1 0, 60)
p(1 p)
= 1, 962
= 188, 16 189.
n = z2
2
e
0, 072
Para estimar o proporc
ao de estudantes que se consideram bem representados, e
necessaria uma amostra de 189 estudantes; considerando um erro m
aximo de 0,07 a
95% de confianca.
c) Qual o tamanho de amostra adequado para atingir ambos os objetivos da pesquisa?
Para atingir ambos os objetivos da pesquisa, devemos considerar a maior amostra,
que e a de 385 estudantes.
Quando N (tamanho da populacao) e conhecido, o valor de n para estimar e p
pode ser corrigido (n ):
Nn
n =
.
N +n
Notamos que se N e muito maior que n, entao n e aproximadamente n.
Exemplo 4.9. Determinar o tamanho de amostra necessario para estimar o volume medio
de vendas de carros novos nacionais entre as concessionarias, fixando um nvel de confianca
conhecido que existem 200
de 99% para um erro de estimacao igual a 1 autom
ovel. E
concessionarias na regi
ao em estudo. Em uma pesquisa similar feita 5 anos antes, o
desvio-padrao amostral foi igual a 2,8. Supor que foi feita uma amostragem aleat
oria
simples.
4.9. Determinac
ao do Tamanho da Amostra (n)
69
Temos que e = 1 e para um nvel de confianca igual a 99% temos que z = 2, 58.
Usaremos a estimativa a priori para , substituindo-o na formula por 2,8. Assim,
n=
z 2
e
2, 58 2, 8
1
2
= 52, 19 53.
Com a informac
ao de que h
a N = 200, podemos corrigir o valor de n
n =
200 53
10600
Nn
=
=
= 41, 90 42.
N +n
200 + 53
253
Captulo 5
Testes de Hip
oteses
5.1
Introdu
c
ao
Os testes estatsticos s
ao regras de decis
oes, vinculadas a um fenomeno da populac
ao,
que nos possibilitam avaliar, com o auxlio de uma amostra, se determinadas hip
oteses
(suposic
oes, conjecturas, algo qualquer que um pesquisador esteja estabelecendo) podem
ser rejeitadas, ou n
ao.
No campo da Inferencia Estatstica, a busca por respostas acerca de certas caractersticas de uma populac
ao estudada e de fundamental import
ancia. Apenas com base
nessas caractersticas e que se devem estabelecer regras e tomar decis
oes sobre qualquer
hip
otese formulada no que se refere `a populacao. Dessa forma, escolhida uma vari
avel
X e colhida uma amostra aleatoria da populacao, podemos estar interessados em inferir
a respeito de alguns de seus par
ametros (media, vari
ancia e proporcao, por exemplo) e,
tambem, sobre o comportamento da vari
avel (a sua distribuicao de probabilidade). A realizac
ao de testes de hip
oteses nos fornece meios para que possamos, com determinado grau
de certeza, concluir se os valores dos par
ametros ou mesmo a distribuicao associados `
a
populac
ao considerada, podem representa-la de forma satisfatoria. Nesse contexto, temos
os Testes Parametricos, vinculados a estimacao dos valores dos par
ametros e os Testes de
Aderencia, associados `
a busca da distribuicao de X. Na verdade, como veremos nos exemplos do item 5.3, quando realizamos Testes Parametricos, esses est
ao intimamente ligados
aos Testes de Aderencia. Pois, para se obter a determinada certeza citada, e necessario
que saibamos qual a distribuicao de probabilidade que melhor se ajusta `as estimativas
observadas por intermedio das amostras.
A maior parte das ciencias se utiliza da tecnica Estatstica denominada Teste de
Hipoteses. Podemos citar algumas suposicoes: o dado de certo cassino e honesto; a
propaganda de um produto vinculada na televisao surtiu o efeito desejado; uma rac
ao
desenvolvida para certo animal proporcionou um ganho maior de peso do que aquela ja
utilizada h
a anos; vale a pena trocar as m
aquinas desta ind
ustria; qual medicamento e
mais eficaz no tratamento de certa doenca; a metodologia empregada na educacao infantil
est
a associada ao aprendizado; o candidato A est
a com uma intencao de votos superior ao
70
71
seu advers
ario; o n
umero de acidentes por dia na BR-116 segue uma distribuicao de Poisson; o tempo de vida de uma marca de lampada pode ser representado pela distribuic
ao
Exponencial. E assim, poderamos citar in
umeras suposicoes dentro de todas as areas do
conhecimento. Vejamos, agora, algumas terminologias e conceitos adotados na area dos
Testes de Hipoteses Parametricos.
5.2
5.2.1
Hip
oteses estatsticas param
etricas
As hip
oteses parametricas s
ao suposicoes sobre os valores dos par
ametros de certa
populac
ao.
Tipos de hip
oteses
1. Hipotese de Nulidade (Nula): e a hip
otese que est
a sendo testada. Colhida uma
amostra a fim de inferirmos a respeito do valor parametrico (), obtemos a estimativa
por intermedio de uma Estimador. Da, por meio do C
do par
ametro ()
alculo
de Probabilidades, cujos resultados s
ao obtidos em funcao da Hipotese Nula (H0 ),
tomamos a decis
ao de rejeitar, ou n
ao, H0 . Nessa decis
ao, e verificada se a diferenca
e
observada entre o valor suposto na Hipotese Nula e a estimativa do par
ametro, ,
significativa, ou n
ao. Veja que quanto menor a diferenca, maior ser
a a probabilidade
n
de n
ao rejeitarmos H0 . Assim, dizemos que ( )
ao foi significativa, concluindo-se
que tal diferenca ocorreu por acaso. Caso contr
ario, devemos rejeitar H0 e concluir
que a diferenca foi suficientemente grande para n
ao ter, provavelmente, ocorrido ao
acaso. Vejamos o exemplo: Ser
a que a altura media ( = ) dos alunos da UFPR e
de 1,71 m? Resumidamente, a Hipotese Nula poderia ser descrita desta forma:
H0 : = 1, 71 m
Para respondermos a essa questao, deveramos colher uma amostra de tamanho n e
obs ), funcao da amostra, e, posteriormente
obtermos a estimativa da media ( = X
verificarmos a diferenca entre e x
obs . Caso H0 fosse rejeitada, concluiramos que
a diferenca observada foi significativa e que n
ao se deveu ao acaso. Logo, a media
verdadeira () assume um outro valor, desde que diferente de 1,71 m. E, conseq
uentemente, esses possveis valores pertenceriam `a Hipotese Alternativa.
2. Hipotese Alternativa (Ha ou H1 ): e uma hip
otese que, necessariamente, difere de
H0 . Assim, nesse contexto, teramos: H1 : 6= 1, 71 m ou H1 : < 1, 71 m ou
H1 : > 1, 71 m.
72
Testes de Hipoteses
5.2.2
Camarinha Filho, J. A.
Testes
S
ao regras de decis
ao acerca da rejeicao ou n
ao rejeicao de uma determinada Hipotese
Nula.
Tipos de testes
Dependendo do interesse da pesquisa, podemos estabelecer testes especficos conforme o objetivo do pesquisador. Por exemplo:
1. Teste Bilateral (Bicaudal): H0 : = 1, 71 m vs H1 : 6= 1, 71 m.
Note que o objetivo desse teste e decidir se a media populacional n
ao difere de
1, 71 m, n
ao importando se ser
a maior ou menor do que 1,71 m.
2. Teste Unilateral `
a Direita: H0 : p = 0, 30 vs H1 : p > 0, 30.
Esse teste tem por finalidade verificar se, por exemplo, a proporcao verdadeira n
ao
s
o difere de 0,30, mas, tambem, necessariamente, se p e maior do que 0,30. Objetivamente, poderamos citar uma pesquisa que visa verificar se um determinado
candidato a Reitor, conseguiu aumentar sua intencao de votos ap
os a realizac
ao de
um debate com seu advers
ario realizado pela televisao.
3. Teste Unilateral `
a Esquerda H0 : 2 = 5 vs H1 : 2 < 5.
Nesse contexto, visamos estabelecer uma Regra de Decisao para verificarmos se a
variabilidade e menor do que 5. Pois, por exemplo, se for menor do que 5, n
ao seria
recomendado investirmos num melhoramento genetico.
5.2.3
H0 e Verdadeira
H0 e Falsa
Rejeitar H0
Erro Tipo I
Decisao Correta
Nao Rejeitar H0
Decisao Correta
Erro tipo II
73
5.2.4
Regi
ao crtica (RC) e regra de decis
ao (RD)
5.2.5
74
Testes de Hipoteses
Camarinha Filho, J. A.
5.3
Exemplos
Ser
ao vistos dois exemplos com a finalidade de explicar, detalhadamente, as ideias
sobre os Testes de Hipoteses. S
ao eles:
Exemplo 5.1. Imagine que seu amigo Jose lhe diga o seguinte: Possuo em meu bolso do
palet
o 16 bolas de gude, sendo que 10 s
ao brancas (B), 4 s
ao verdes (V) e 2 s
ao amarelas
(A). Voce acreditaria nessa afirmacao? Quais seriam os meios que voce disporia para
verificar a verdade? Formalmente, poderamos estabelecer, primeiramente, as seguintes
hip
oteses: H0 : Jose n
ao est
a mentindo versus H1 : Jose est
a mentindo, bem como fixar
um valor para , por exemplo 0,10. E, posteriormente, criar algumas alternativas para
uma tomada de decis
ao. A primeira delas seria, simplesmente, esvaziar o bolso do Jose e,
conseq
uentemente, tomar uma decis
ao. Como, nessa situacao, foram observadas todas as
bolas, a sua decis
ao ser
a absolutamente correta. Ou seja, n
ao restara d
uvida (incerteza)
em relac
ao `
a afirmac
ao de Jose, caso decidssemos rejeitar H0 . Porem, em Estatstica, nem
sempre isso e possvel, ou por inacessibilidade de toda populacao, ou pela impossibilidade
desse procedimento ou, ainda, por tal procedimento ser inviavel, ou seja, n
ao possuir
um sentido pr
atico. Como exemplo, podemos citar a verificacao do tempo de vida de
certa marca de l
ampada. Obviamente, n
ao faria o menor sentido amostrarmos todas as
lampadas de uma linha de producao, pois assim n
ao restaria nenhuma delas para a venda.
E o resultado desse procedimento seria desastroso.
Nesse contexto, uma segunda alternativa nos levaria `a coleta de uma amostra de
tamanho n e observaramos o resultado e, assim, tomaramos uma decis
ao. Portanto, voce
poderia, por exemplo, retirar 2 bolas (n = 2) do bolso do Jose, sem reposicao. Imaginemos,
conforme a Tabela 5.2, algumas ocorrencias, implicacoes e possveis decis
oes:
Tabela 5.2: Algumas ocorrencias, implicacoes e decis
oes ap
os a retirada da amostra.
I
II
III
Ocorrencia
1 Bola Branca e 1 Bola Preta
2 Bolas Brancas
2 Bolas Amarelas
Implicacao
Afirmacao Falsa
Afirmacao Possvel
Afirmacao Possvel
Decisao
Jose mentiu
Jose, provavelmente, n
ao mentiu
Jose, provavelmente, mentiu
5.3. Exemplos
75
P (AA) =
2
2
16
2
1/120
6/120
8/120
20/120
40/120
45/120
1
120
76
Testes de Hipoteses
Camarinha Filho, J. A.
= 0, 10
= 0, 05
= 0, 01
AA
Rejeitar H0
Rejeitar H0
Rejeitar H0
AB
Nao Rejeitar H0
Nao Rejeitar H0
Nao Rejeitar H0
AV
Rejeitar H0
Nao Rejeitar H0
Nao Rejeitar H0
BB
Nao Rejeitar H0
Nao Rejeitar H0
Nao Rejeitar H0
BV
Nao Rejeitar H0
Nao Rejeitar H0
Nao Rejeitar H0
VV
Rejeitar H0
Rejeitar H0
Nao Rejeitar H0
Pela an
alise da Tabela 5.4 podemos tirar algumas conclusoes:
` medida que diminumos o Nvel de Significancia do Teste, torna-se mais difcil
1. A
obvio que isso ocorra, pois com menor, a amostra
rejeitar a Hipotese Nula. E
coletada ter
a uma chance cada vez menor de ser considerada rara;
5.3. Exemplos
77
Probabilidade
1/14400
40/14400
16/14400
...
1800/14400
720/14400
2025/14400
3600/14400
...
36/14400
640/14400
1600/14400
= 0, 10
Rejeitar H0
Rejeitar H0
Rejeitar H0
...
N
ao Rejeitar H0
Rejeitar H0
N
ao Rejeitar H0
N
ao Rejeitar H0
...
Rejeitar H0
Rejeitar H0
N
ao Rejeitar H0
Decisao
= 0, 05
Rejeitar H0
Rejeitar H0
Rejeitar H0
...
N
ao Rejeitar H0
Rejeitar H0
N
ao Rejeitar H0
N
ao Rejeitar H0
...
Rejeitar H0
Rejeitar H0
N
ao Rejeitar H0
= 0, 01
Rejeitar H0
Rejeitar H0
Rejeitar H0
...
N
ao Rejeitar H0
N
ao Rejeitar H0
N
ao Rejeitar H0
N
ao Rejeitar H0
...
Rejeitar H0
N
ao Rejeitar H0
N
ao Rejeitar H0
78
Testes de Hipoteses
Camarinha Filho, J. A.
5.3. Exemplos
79
Feitas as reflex
oes, podemos enunciar o Exemplo 5.2: Sabemos que a vari
avel (X)
altura dos alunos da Universidade A, local A, segue uma distribuicao normal com altura
media de 171 cm e desvio padrao de 9 cm. Se recebermos, de uma origem desconhecida,
local B, uma amostra de 27 alunos, poderamos decidir se essa amostra foi retirada da
Universidade A ou se o local B possui a mesma media do local A?
Admitamos que a populacao cuja amostra (n=27) foi retirada seja bem representada
por uma distribuic
ao normal com desvio padrao igual ao da Universidade A ( = 9cm).
A N (171, 92 /27).
Sabemos da Teoria da Estimacao que se XA N (171, 92 ), entao, X
Assim, o comportamento das estimativas das medias das possveis amostras da Univer A N (171, 3). Supondo que x
sidade A fica bem caracterizada: X
B = 167 cm, essa
estimativa pode ser vista como rara ou n
ao? Como poderamos, com base na estimativa
da media da amostra B, obter uma Regra de Decisao para concluirmos sobre a origem
dessa amostra. Enfim, qual conclusao deveramos tomar? A solucao e simples. Assim
como no Exemplo 5.1, basta verificar se seria plausvel coletarmos do Local A uma amostra de 27 alunos cuja estimativa da altura media fosse de 167 cm. Porem, diferentemente
do Exemplo 5.1, a vari
avel X desse exemplo e contnua. Portanto, sendo a probabilidade
pontual igual a zero, devemos obter uma probabilidade intervalar. Assim, poderamos
calcular a probabilidade da estimativa da media ser menor ou igual a 167 cm sob H0 , ou
seja, supondo que = 171 cm, P (
xB 167| = 171). Assim, estaramos contemplando
no c
alculo dessa probabilidade valores iguais a 167 cm, mas, tambem, valores com medias
inferiores a 167 cm. Dessa forma, comparando-se com a Regra de Decisao adotada, podemos concluir se essas estimativas s
ao raras. Com o auxlio da transformacao da vari
avel
X na Normal Padronizada, Z N (0, 1), calcularamos a probabilidade dessa forma:
X
P (
xB 167| = 171) = P Z
/ n
167 171
= P Z
9/ 27
= P (Z 2, 31) = 0, 0105.
Graficamente, teramos (Figura 5.1):
Com base nessa probabilidade, chamada de Nvel Descritivo (P-valor) do Teste,
podemos tomar uma decis
ao da seguinte forma: se acharmos que essa probabilidade e
baixa, concluiramos que:
a amostra deve ser rara;
deveramos rejeitar a Hipotese Nula de que os 27 alunos pertencem `a Universidade
A;
A deve ser superior a B ;
a diferenca observada (A x
B ) = 4 cm, provavelmente, foi significativa;
80
Testes de Hipoteses
Camarinha Filho, J. A.
Sob Ho
PValor = 0.0105
167
Estimativas da Mdia
a diferenca observada n
ao deve ter ocorrido por acaso;
se refizessemos o experimento in
umeras vezes, esperaramos que na maioria delas as
estimativas vindas das possveis amostras (n=27) do local B, nos fornecesse valores
inferiores a 171cm, indicando, portanto, uma tendencia.
Formalmente, poderamos realizar o teste segundo as etapas do item 5.2.5. Assim,
1. Estabelecer as Hipoteses Nula e Alternativa;
(
H0 : = 171 cm
H1 : < 171 cm
2. Identificar a Distribuic
ao Amostral associada ao Estimador e obter a Estimativa do
Par
ametro;
A N (171, 3)
X
x
B = 167 cm
e zcalculado=
/ n
= 2, 31
5.3. Exemplos
81
4. Construir a Regi
ao Crtica com base na Hipotese Alternativa e no valor de ;
zte
orico = 1, 6449
ou
x
crtico = 168, 2 cm
Regra de decis
ao: Se a Estimativa do Par
ametro pertencer a` Regi
ao Crtica, rejeitamos a Hipotese Nula. Caso contr
ario, n
ao. Ou seja, se zcalculado < zteorico , ou se
x
B < M 168, 2, rejeitamos H0 .
5. Conclusao: Como Zcalculado = 2, 31 < ZTeorico = 1, 6449 ou x
B = 167 cm <
168, 2 cm. Decidimos por rejeitar H0 .
A obtenc
ao do P-valor, essencial para a tomada de decis
ao, est
a intimamente ligado
ao comportamento da distribuicao das estimativas obtidas com o auxlio das possveis
amostras coletadas da populacao. Esse comportamento pode ser descrito pela func
ao de
densidade de probabilidade (f.d.p) associada `a distribuicao amostral dessas estimativas.
Porem, essa f.d.p. s
o poder
a ser perfeitamente caracterizada sob a referencia da Hipotese
Nula. Ent
ao, os valores parametricos que a caracterizam est
ao contidos em H0 . Dessa
forma, dependendo dos valores parametricos supostos em H0 , obteremos P-valores distintos
e, em conseq
uencia, poderemos tomar decis
oes diferentes. Para ilustrar tal fato, tomemos
o Exemplo 5.2 como referencia e imaginemos algumas situacoes em que , 0 e n s
ao
modificados. As Decis
oes e as Regras de Decisao, em funcao de x
obs = 167, podem ser
vistas na Tabela 5.6:
Tabela 5.6: Algumas tomadas de decis
ao e regras de decis
ao conforme a hip
otese nula, o
nvel de significancia e a distribuicao de probabilidade.
Situa
ca
o
Exemplo 5.2
( = 171; = 9)
I
= 170
=9
II
= 170
= 10
III
= 170
=6
IV
= 168
=2
V
= 173
= 12
VI
= 172
= 12
P-valor
0,0105
Decis
ao(
xobs = 167)
= 0, 01
= 0, 05
= 0, 10
NR
R
R
Regra de decis
ao para rejeitar H0
= 0, 01
= 0, 05
= 0, 10
< 166, 97
< 168, 2
< 168, 8
Se X
Se X
Se X
0,0416
NR
< 166
Se X
< 167, 2
Se X
< 167, 8
Se X
0,06
NR
NR
< 165, 5
Se X
< 166, 8
Se X
< 167, 5
Se X
0,0047
< 168, 7
Se X
< 169, 1
Se X
< 169, 3
Se X
0,0047
< 167, 1
Se X
< 167, 4
Se X
< 167, 5
Se X
0,0047
< 167, 6
Se X
< 169, 2
Se X
< 170, 0
Se X
0,1056
NR
NR
NR
< 162, 7
Se X
< 165, 4
Se X
< 166, 87
Se X
82
Testes de Hipoteses
Camarinha Filho, J. A.
5.3. Exemplos
83
n
ao poderamos afirmar que = 170. Porem, deveramos afirmar que provavelmente
n
ao e menor do que 170 cm.
s
ao distintas. Assim, deveramos verificar que, tanto no intervalo 167 < XIII < 168, 7, 1
IV < 167, 1, h
quanto no intervalo 167 < X
a o mesmo n
umero de possveis amostras (n =
III
27). Ou seja, P (167 < XIII < 168, 7) = P (167 < XIV < 167, 1) = 0, 053, pois X
Finalmente, na Situac
ao VI, tem-se um tamanho de amostra tres vezes menor do que
nas situac
oes anteriores e, tambem, o maior desvio padrao dentre todas as situacoes. Note
que, mesmo para uma media suposta de 172 cm, encontramos um P-valor que resulta em
rejeic
ao para todos os nveis de significancia adotados na Tabela 5.6. Comparativamente,
ve-se que a diferenca observada na Situacao IV e de 1 cm e na Situacao VI e de 5 cm.
Porem, a primeira diferenca foi significativa, enquanto a segunda, n
ao.
Com vimos, h
a uma probabilidade de n
ao rejeitar H0 quando ela e falsa, ou seja,
tomamos a decis
ao de que = 0 quando, na verdade, n
ao e. Obtem-se essa probabilidade
calculando-se =P(N
ao Rejeitar H0 |H0 e Falsa). Veja que se n
ao rejeitamos H0 , decidimos
que = 0 , portanto ser
a calculado em funcao de = 0 , ou seja, em funcao de
2
84
Testes de Hipoteses
Camarinha Filho, J. A.
obs > X
= P (X
crtico | = 169)
= P [Z >
x
169
]
/ n
= P [Z >
168, 2 169
] = 0, 678
9/ 27
sob H0 : * =
sob H0 : = 171
realidade
suposio
Xcrit
171
85
e .
= 0, 01 = 0, 05 = 0, 10
Situac
ao
I
= 169; = 9; n = 27
II
III
IV
VI
1 ( )
0,121
0,322
0,454
= 169; = 9; n = 200
0,793
0,933
= 169; = 2; n = 27
0,998
0,9998
0,969
=1
= 172; = 9; n = 27
0,002
0,0013
0,032
= 166; = 9; n = 27
0,712
0,893
0,946
= 169; = 9; n = 9
0,048
0,164
0,269
5.4
5.4.1
86
Testes de Hipoteses
Camarinha Filho, J. A.
Porem, `
a medida que n cresce, os testes tendem a ser equivalentes, pois os valores
de Z e t se aproximam. Dessa forma, os P-valores estar
ao bastante pr
oximos, para n > 30,
e, conseq
uentemente, a decis
ao em relacao `a H0 ser
a praticamente a mesma.
Exemplo 5.3. Uma m
aquina enche pacotes de cafe de uma marca X deve complet
a-los,
em media, com no mnimo 500 g. Se coletassemos de uma amostra aleatoria de tamanho
16, a fim de verificarmos se a m
aquina se encontra regulada, e obtivessemos uma media
igual a 495 g e desvio padrao de 5 g, seria plausvel concluirmos que a media e menor do
que 500 g, ou seja, a m
aquina se encontraria regulada?
Os dados observados s
ao: 498,8; 503,1; 497,6; 491,6; 499,3; 491,3; 499.8; 492.1; 498.1;
493.2; 487.2; 489.8; 495.8; 498.2; 498.8; 485.7
Soluc
ao: Devemos proceder ao Teste Parametrico, segundo as etapas descritas no
item 5.2.5. Assim:
1. Estabelecer as Hipoteses Nula e Alternativa;
H0 : = 500g vs H1 : < 500g
2. Identificar a Distribuic
ao Amostral associada ao Estimador e obter a Estimativa do
Par
ametro; Distribuic
ao Amostral: t de Student com 15 g.l.. Pois, n < 30 e 2
desconhecida;
obs = 495g e s = 5g
Estimativas: X
3. Fixar um valor para o Nvel de Significancia () e obter a estatstica de teste do
Par
ametro por meio da Estatstica do Teste;
Nvel de Significancia: = 0, 01
Estatstica de teste:
tcalculado =
obs 0
X
495 500
=
= 4, 0
s/ n
5/ 16
-2,602 em X
crtico , assim:
2, 602 =
X
500
crtico
x
crtico = 496, 75.
5/ 16
87
RegiNco de nNco
rejeiNgNco de H0
Estimativas da Mdia
para Xobs fossem, na sua grande maioria inferiores a 500 g, indicando, portanto,
uma tendencia;
conforme a probabilidade (P-Valor), cujo valor est
a associado `a ocorrencia de
estimativas da media menores do que 495 g, que Xobs = 495 g, sob H0 , e raro
(veja a Figura 5.5);
Conseq
uentemente, de acordo com essas conclusoes, seria plausvel admitirmos
que deve ser menor do que 500 g, indicando que a m
aquina, provavelmente,
esteja desregulada.
88
Testes de Hipoteses
Camarinha Filho, J. A.
RegiNco de nNco
rejeiNgNco de H0
Estimativas da Mdia
PValor = 0.0006
495
Sob H0
Estimativas da Mdia
Figura 5.5: Probabilidade associada `a ocorrencia de estimativas da media menores do que 495 g.
5.4.2
89
2
2
Note, ent
ao, que antes de compararmos as duas medias, e fundamental que facamos
primeiramente um teste para a verificacao da homocedasticidade (H0 : 12 = 22 ). Assim,
poderemos efetuar o teste adequado para testar H0 : 1 2 = D. Dessa forma, as etapas
do Teste para compararmos as duas vari
ancias, fica:
1. Estabelecer as Hipoteses Nula e Alternativa;
H0 : 12 = 22 vs H1 : 12 6= 22
2. Distribuic
ao Amostral: F de Snedecor, que sob H0 , e dada por: F(a,b,) , sendo a e b
os n
umeros de graus de liberdade do numerador e denominador, respectivamente;
Estimativas:s21 e s22 ;
3. Nvel de Significancia: = 0
m
ax(s21 ,s22)
Estatstica: Fcalculado =
. Note que, embora H1 : 12 6= 22 , como o numemn(s21 ,s22)
rador ser
a maior do que o denominador, Fcalculado ser
a maior do que 1. Logo, o teste
adotado ser
a o unilateral `a direita;
4. Regi
ao Crtica (RC): valores de F > Fcrtico = Ftabelado = F(a,b,0 ) pertencerao `
a
RC;
5. Concluir o Teste: Se Fcalculado pertencer `a Regi
ao Crtica, rejeitamos a Hipotese
Nula. Caso contr
ario, n
ao.
Feitas as observac
oes, vejamos os testes 5.4.3, 5.4.4 e 5.4.5.
90
Testes de Hipoteses
5.4.3
Camarinha Filho, J. A.
As amostras ser
ao consideradas independentes (ou n
ao correlacionadas, ou n
ao pareadas, ou n
ao emparelhadas) se a ocorrencia de um valor especifico retirado da populac
ao 1,
n
ao interferir, ou mesmo n
ao estiver correlacionado com a observacao colhida da populac
ao
2. Nesse contexto, observe os casos seguintes:
Caso 1) Qual das duas racoes A e B proporcionaria um maior ganho de peso medio,
em 20 dias, numa determinada raca de animal?
Note que os animais que receber
ao a Racao A s
ao diferentes daqueles que receber
ao
a Rac
ao B. Veja, tambem, que o ganho de peso de um certo animal que recebeu a rac
ao A
n
ao interferir
a no ganho de peso de qualquer outro animal em que administramos a rac
ao
B. Alem disso, podemos ter tamanhos de amostra diferentes para as duas racoes. Logo,
as amostras podem ser consideradas independentes.
Caso 2) Ser
a que uma determinada racao A atinge um ganho de peso medio igual a
0 , em 20 dias, numa determinada raca de animal?
Observe que nesse caso, para sabermos se houve, de fato, um ganho de peso desejado,
precisaramos observar os pesos dos n animais da amostra antes da racao ser administrada
e ap
os os 20 dias considerados. Assim, h
a uma amostra inicial, associada ao incio do
tratamento com a rac
ao, e uma amostra associada ao termino do tratamento com a rac
ao
A. E, com base, nos pesos iniciais e finais desses n animais, podemos estabelecer o ganho de
peso individual, e conseq
uentemente, o ganho de peso medio por intermedio da diferenca
observada entre os pesos. Portanto, s
o obteremos o ganho de peso medio se tivermos as
duas informac
oes obtidas de um mesmo animal. Logo, fica evidente que essas informac
oes
s
ao dependentes. Ou seja, s
ao pareadas.
Exemplo 5.4. Vamos utilizar o Caso 1, com as seguintes informacoes: A Racao A foi
administrada em 8 animais (nA ) e observou-se uma media de 3,12 kg (
xA ) e um desvio
2
padrao de 0, 15 kg (sA ). J
a na Racao B, obtivemos x
B = 3, 05 kg e sB = 0, 11 kg para
nB = 10. Vejamos, portanto, se a racoes diferem em relacao ao ganho de peso. Esse
problema pode ser resolvido por meio de um teste parametrico. Porem, qual metodologia
devemos utilizar? As referentes aos testes 5.4.3, 5.4.4 e 5.4.5? Como ja discutido, as
amostras s
ao independentes. Portanto, devemos, antes de proceder ao teste, verificar se .
Assim, as etapas do teste ficam:
Os dados utilizados s
ao:
Rac
ao A: 3,40; 2,99; 3,21; 3,07; 3,01; 3,27; 3,23; 3,02.
Rac
ao B: 2,82; 3,16; 2,98; 3,04; 3,15; 3,20; 3,00; 3,01; 3,08; 3,06.
2 = 2 vs H : 2 > 2
1. As Hipoteses: H0 : A
0
B
A
B
2. Distribuic
ao Amostral: Sob H0 , F(a,b,) = Ftabelado = F (7, 9, 0 ).
Estimativas: s2A = 0, 152 e s2B = 0, 112
3. Nvel de Significancia: = 0 = 0, 05 (por exemplo)
Estatstica: Fcalculado =
0,152
0,112
91
= 1.8595.
4. Regi
ao Crtica (RC): valores de
s2A
s2B
Regra de Decis
ao (RD):se Fcalculado > Ftabelado = 3, 293, rejeita-se H0 .
2 = 2 .
5. Concluir o Teste: Como Fcalculado n
ao pertence `a RC, n
ao se rejeita H0 : A
B
Logo, h
a homocedasticidade e o teste 5.4.3 dever
a ser o escolhido.
tcalculado =
(
xA x
B ) (A B )
3, 12 3, 05
q
q
,
=
1
sc n1A + n1B
0, 1290 18 + 10
Como as vari
ancias n
ao diferem, calculamos uma vari
ancia comum dada por:
s2c =
92
Testes de Hipoteses
Camarinha Filho, J. A.
5.4.4
101,2
102,0
100,8
102,3
101,6
Concreto 2
100,0
102,8
101,5
99,0
102,0
(v1 + v2 )2
2
[v12 /(n1 + 1)] + [v22 /(n2 + 1)]
Assim, = 5, 79 = 5g.l.
Portanto, ttabelado = 2, 015
v1 =
s21
n1
e v2 =
s22
n2
93
3. Nvel de Significancia: = 0, 05
Estatstica de teste:
tcalculado =
101, 6 101, 1
(
x1 x
) (1 2 )
q2 2
q
=
s1
s22
2,368
0,362
5 + 5
n1 + n2
5.4.5
d D0
sd / n
em que:
d e a media da amostra da diferencas;
D0 e o valor suposto para a media das diferencas;
sd e o desvio padrao da amostra das diferencas;
n e o tamanho da amostra pareada.
Vejamos um exemplo:
Exemplo 5.6. Um novo medicamento est
a sendo pesquisado com intuito de diminuir a
pressao sist
olica em indivduos hipertensos. Dez pacientes voluntarios submeteram-se ao
94
Testes de Hipoteses
Camarinha Filho, J. A.
179
200
161
170
181
190
202
220
195
165
Apos
160
180
161
180
165
170
196
216
170
160
Diferenca (di )
-19
-20
10
-16
-20
-8
-4
-25
-5
3. Nvel de Significancia: = 0, 01
Estatstica de teste:
tcalculado =
10, 7 0
11, 066/ 10
5.5
95
o n
umero de sucessos ocorridos (k). Assim, podemos obter a proporcao (porcentagem)
estimada de sucessos (
p = nk ) e concluir a respeito do valor suposto p0 .
De acordo com o item 2.5, vejamos um exemplo.
Exemplo 5.7. Um Candidato A a Reitor da UFPR afirma que 57% (p0 ) dos professores
ir
ao votar nele na pr
oxima eleicao. O Candidato B, desconfiado desse percentual, resolveu
encomendar uma pesquisa de intencao de votos para verificar a autenticidade dessa afirmac
ao. Apos a coleta de uma amostra aleatoria de 200 professores (n), constatou-se que
98 (k) tinham a intenc
ao de votar no Candidato A. Segundo a pesquisa, qual a conclusao
deveramos tomar, ao nvel de 0,05 de probabilidade, em relacao `a afirmacao do Candidato
A?
As Etapas:
1. As Hipoteses: H0 : p = p0 = 0, 57 vs H1 : p < 0, 57.
Optamos por H1 : p < 0, 57, pois o Candidato B desconfiou da afirmacao do Candidato A;
2. Distribuic
ao Amostral: a Estatstica p segue uma distribuicao aproximadamente
normal, isto e,
p N (p;
p(1 p)
)
n
k
n
98
200
= 0, 49 ;
3. Nvel de Significancia: = 0, 05
Estatstica de teste: zcalculado =
q pp0
p0 (1p)
n
96
Testes de Hipoteses
5.6
Camarinha Filho, J. A.
pR (1 pR ) pC (1 pC )
+
).
nR
nC
kR
nR
171
180
= 0, 95 e pC =
kC
nC
171
190
= 0, 90
3. Nvel de Significancia: = 0, 01
Estatstica de teste:
Em que, p =
(
pR pC ) (pR pC )
N (0, 1)
Zcalculado = q
p(1 p)( n1R + n1C )
nR pR +nC pC
nR +nC
kR +kC
nR +nC .
1
+
0, 9243(1 0, 9243)( 180
1
190 )
5.7. Testes n
ao Parametricos
97
4. Regi
ao Crtica (RC):
RC = Z |Z > 2, 33 = {(
pR pC ) | > (
pR pC ) > 0, 064};
Regra de Decis
ao: Se Zcalculado > 2, 33, ou se (
pR pC ) > 0, 064, rejeitamos H0 .
5. Concluir o Teste: Como (
pR pC ) = 0, 05 < 0, 064, podemos concluir que, provavelmente, o an
uncio feito pelos engenheiros n
ao procede.
5.7
5.7.1
Testes n
ao Param
etricos
Teste de ader
encia
...
Freq. Observada
O1
O2
O3
...
Ok
Freq. Esperada ei
e1
e2
e3
...
ek
Karl Pearson propos a seguinte formula para medir as possveis discrepancias entre
proporc
oes observadas e esperadas:
Q2 =
k
X
(oi ei )2
i=1
ei
em que,
k e o n
umero de classes (categorias) consideradas;
oi e a freq
uencia observada;
ei e a freq
uencia esperada.
98
Testes de Hipoteses
Camarinha Filho, J. A.
k
X
(oi ei )2
i=1
ei
2q
Domingo
S
abado
Sexta
Quinta
Quarta
Terca
Segunda
N
umero de acidentes
30
18
26
13
17
Soluc
ao: As etapas para realizacao do teste s
ao:
1. Hipoteses a serem testadas:
H0 : O n
umero de acidentes n
ao muda conforme o dia da semana;
H1 : Pelo menos um dos dias tem n
umero diferente dos demais.
Note que, se pi representa a probabilidade de ocorrencia de acidentes no i-esimo dia
da semana, ent
ao,
H0 : pi = 1/7 para todo i = 1, . . . , 7;
H1 : pi 6= 1/7 para pelo menos um valor de k.
2. Distribuic
ao Amostral: Qui-quadrado com k 1 g.l.
Portanto: 2 = 14, 449, para = 0, 05.
Estimativa: Total de acidentes na semana: n = 119.
5.7. Testes n
ao Parametricos
99
Domingo
30
17
13
S
abado
18
17
1
Sexta
26
17
9
Quinta
13
17
-4
Quarta
7
17
-10
Terca
8
17
-9
Segunda
17
17
0
Estatstica de teste: .
Q2 =
k
X
(oi ei )2
i=1
ei
Assim,
Q2 =
(o7 e7 )2
(o1 e1 )2 (o2 e2 )2
+
+ ... +
e1
e2
e7
Q2 =
(13)2
(1)2
(0)2
+
+ ... +
= 26, 35
17
17
17
5.7.2
100
Testes de Hipoteses
Camarinha Filho, J. A.
N
umero de filhos
0
+ de dois
Total
menos de 2000
15
27
50
43
135
2000 a 5000
13
10
40
5000 ou mais
25
30
12
75
Total
48
70
71
61
250
B2
A1
n11
n12
A2
n21
n22
Ar
nr1
nr2
Total
n.1
n.2
Bs
Total
n1s
n1.
n2s
n2.
nrs
n.s
n..
nr.
H0 : A e B s
ao vari
aveis independentes
H1 : As vari
aveis A e B n
ao s
ao independentes.
e j = 1, 2, . . . , s
Logo, o n
umero esperado de observacoes com as caractersticas (Ai e Bj ) entre as
n.. observac
oes, sob a hip
otese de independencia, e dado por:
Eij = n.. pij = n.. pi. p.j = n..
ni. n.j
n.. n..
ni. n.j
n..
5.7. Testes n
ao Parametricos
101
A dist
ancia entre os valores observados e os valores esperados sob a suposic
ao de
independencia pode ser obtido pela Estatstica do teste de independencia dada por:
2 =
r
s X
X
(Oij Eij )2
Eij
i=1 j=1
s X
r
X
(Oij Eij )2
2q .
Eij
i=1 j=1
A Regra de decis
ao pode ter como base o nvel descritivo P, neste caso,
P = P (2q 2obs )
ao apresentada para
em que 2obs e o valor calculado, a partir dos dados, usando a express
2
. Graficamente, teramos (Figura 5.6):
2
obs
Figura 5.6: Gr
afico da distribuicao 2 .
Se, para fixado, obtivermos P , rejeitaremos a hip
otese H0 de independencia.
Vejamos, ent
ao, a decis
ao que deveramos tomar para o exemplo do estudo da dependencia entre renda e o n
umero de filhos. As hip
oteses ficariam:
102
Testes de Hipoteses
Camarinha Filho, J. A.
H0 : O n
umero de filhos e a renda s
ao independentes;
H1 : Existe dependencia entre o n
umero de filhos e a renda.
O c
alculo dos valores esperados sob H0 (independencia), fica:
N
umero esperado de famlias sem filhos e renda menor que R$ 2000:
48 135
= 25, 92
250
Feito todos os c
alculos, podemos construir a tabela de valores observados e esperados
(entre parenteses). Assim,
E11 =
Tabela 5.15: N
umero esperado para n
umero de filhos e renda.
Renda (R$)
N
umero de filhos
0
+ de dois
Total
menos de 2000
15 (25,92)
27 (37,80)
50 (38,34)
43 (32,94)
135
2000 a 5000
8 (14,40)
13 (21,00)
9 (21,30)
10 (18,30)
40
5000 ou mais
25 (7,68)
30 (11,20)
12 (11,36)
8 (9,76)
75
Total
48
70
71
61
250
2obs =
=
=
=
O n
umero de graus de liberdade ser
a determinado por: q = (r1)(s1) = 23 = 6.
Sendo que:
Categorias de renda: r = 3;
Categorias de n de filhos: s = 4.
Portanto,2 26 e, supondo = 0, 05, P (26 36, 62) = 0, 0000021
Como P = 0, 000 < = 0, 05, rejeitamos a independencia entre n
umero de filhos e
renda familiar.
Captulo 6
Correlac
ao e Regress
ao Linear
6.1
Introdu
c
ao
6.2
Coeficiente de Correla
c
ao de Pearson
Cov(X, Y )
E(XY ) E(X)E(Y )
=
.
X Y
X Y
(6.1)
104
Giolo, S. R.
calculado por:
q P
r =
q P
Pn
)(yi y)
i=1 (xi x
n
2 Pn
)
i=1 (xi x
i=1 (yi
Pn
xy
i=1 xi yi n
n
2
i=1 xi
n
x2
Pn
2
i=1 yi
y)2
n
y2
sendo x
e y as medias amostrais dos xi s e yi s, respectivamente.
Os gr
aficos de dispers
ao apresentados na Figura 6.1 ilustram algumas situacoes com
diferentes coeficientes de correlacao. No gr
afico (a) desta figura, podemos notar a ausencia
de associac
ao entre X e Y . J
a nos gr
aficos (b) e (c), podemos notar forte relacao linear
entre X e Y , pois os valores dos coeficientes de correlacao de Pearson est
ao muito pr
oximos
de 1 e 1, respectivamente. Na situacao ilustrada no gr
afico (b), `a medida que os valores
de uma vari
avel crescem, os da outra tambem crescem, e isto ocorre de forma linear. J
a na
situac
ao ilustrada no gr
afico (c), `a medida que os valores de uma vari
avel crescem, os da
outra decrescem, tambem de forma linear. Na situacao mostrada no gr
afico (d) podemos
observar a ausencia de relac
ao linear entre X e Y . Neste caso, h
a a presenca de uma
relac
ao quadr
atica, ou seja, n
ao-linear entre elas.
(b) r = 0,99
20
40
10
60
15
80
20
(a) r = 0,13
10
12
14
16
10
12
(c) r = 0,98
(d) r = 0,01
14
16
20
0
40
80 60 40 20
10
x
12
14
16
10
15
20
6.3. Regress
ao Linear Simples
105
na ausencia de relac
ao entre elas. Outro tipo de relacao pode estar presente, como, por
exemplo, a n
ao-linear.
6.2.1
Teste de signific
ancia para
Na pr
atica, desejamos testar se a associacao linear entre X e Y e estatisticamente
diferente de zero, bem como concluir a respeito desta associacao n
ao somente para a
amostra em estudo, mas tambem para a populacao da qual a referida amostra foi extrada.
Para tanto, uma estatstica de teste bastante simples utilizada para testar as hip
oteses:
(
e dada por:
H0 : = 0
H1 : 6= 0 (ou H1 : > 0 ou H1 : < 0)
r
n2
1 r2
a qual, sob H0 , tem distribuicao t-Student com (n 2) graus de liberdade, sendo n o
tamanho amostral e r o coeficiente de correlacao linear entre X e Y . Calculado o valor
dessa estatstica, comparamos o mesmo com o valor tabelado, que e obtido a partir da
Tabela t-Student a um nvel de significancia pre-estabelecido. Se o valor calculado for
maior que o tabelado, podemos rejeitar a hip
otese nula ao nvel de significancia considerado. Rejeic
ao da hip
otese nula indica que a correlacao linear observada na amostra e
estatisticamente diferente de zero e que essa correlacao pode ser inferida para a populac
ao
da qual a mesma foi retirada.
T =r
Exemplo 6.1. Para uma amostra de tamanho n = 80, em que a relacao entre duas vari
aveis quantitativas e de interesse, foi obtido para o coeficiente de correlacao de Pearson
o valor r = 0,78. Para testar se a correlacao linear indicada por este coeficiente e estatisticamente diferente de zero, foi utilizado o teste de significancia apresentado nesta sec
ao.
Com base nos resultados obtidos, isto e, tcal = 11, 0 e ttab = 1,99 ao nvel de 5% de signific
ancia (teste bilateral), podemos rejeitar a hip
otese nula e, conseq
uentemente, concluir
que a correlac
ao e estatisticamente diferente de zero, bem como que a mesma pode ser
inferida para a populac
ao da qual a amostra foi extrada.
Uma vez constatada a existencia de relacao linear entre duas vari
aveis, e de usual
interesse descrever essa relac
ao por meio de uma equacao linear. Na secao a seguir, discutimos esse assunto em detalhes.
6.3
Regress
ao Linear Simples
Se uma relac
ao linear e valida para sumarizar a dependencia observada entre duas
vari
aveis quantitativas, ent
ao a equacao que descreve esta relacao e dada por:
Y = 0 + 1 X.
(6.2)
106
Giolo, S. R.
Os valores observados n
ao se encontram, contudo, exatamente sobre esta linha reta,
ou seja, existe uma diferenca entre o valor observado e o valor fornecido pela equac
ao.
Esta diferenca e denominada erro e e representada por . Este erro e assumido ser um
erro estatstico, isto e, uma vari
avel aleatoria que quantifica a falha do modelo em ajustarse aos dados exatamente. Tal erro pode ser devido ao efeito, dentre outros, de vari
aveis
n
ao consideradas e de erros de medicao. Incorporando esse erro `a equacao (6.2) temos:
Y = 0 + 1 X + ,
(6.3)
(6.4)
A vari
avel X em (6.3), denominada vari
avel regressora ou independente, e considerada uma vari
avel controlada pelo analista dos dados e medida com erro desprezvel.
J
a Y , denominada vari
avel resposta ou dependente, e considerada uma vari
avel aleat
oria,
V (Y | X = x) = V (0 + 1 x + ) = 2 .
96
92
98
104
116
20
20
25
25
30
109
100
118
108
127
106
100
110
101
106
112
105
113
112
117
30
30
35
35
40
20
20
25
25
30
35
35
40
40
40
A partir da representacao gr
afica desses dados mostrada na Figura 6.2, e possvel
visualizar uma relac
ao linear positiva entre a idade e o tempo de reacao. O coeficiente
6.3. Regress
ao Linear Simples
107
tempo de reao
95
de correlac
ao de Pearson para esses dados resultou em r = 0,768, bem como seu respectivo teste de significancia em tcalc = 5,09, que comparado ao valor tabelado ttab,5% =
2,1, fornece evidencias de relacao linear entre essas duas vari
aveis. Podemos, entao, usar
um modelo de regressao linear simples para descrever essa relacao. Para isso, e necessario estimar, com base na amostra observada, os par
ametros desconhecidos 0 e 1 deste
modelo. O metodo de estimacao denominado Mnimos Quadrados Ordinarios (MQO) e
freq
uentemente utilizado em regressao linear para esta finalidade e e apresentado a seguir.
20
25
30
35
40
idade
6.3.1
Estimac
ao dos par
ametros por MQO
n
X
i=1
2i =
n
X
(yi 0 1 xi )2 ,
(6.5)
i=1
n
X
yi xi n
yx
i=1
b1 =
,
n
X
2
2
xi n
x
i=1
(6.6)
\
e o modelo de regressao linear simples ajustado, em que E(Y
| x), denotado tambem Yb
por simplicidade, e o valor medio predito de Y para qualquer valor X = x que esteja na
108
Giolo, S. R.
variac
ao observada de X. No exemplo 6.2, a variacao de X se encontra entre 20 e 40 anos
e as estimativas dos par
ametros resultaram em b0 = 80,5 e b1 = 0,9.
Os desvios ei = yi ybi (i = 1 n) s
ao denominados resduos e s
ao considerados
uma amostra aleat
oria dos erros. Por este fato, uma an
alise gr
afica dos resduos e, em
geral, realizada para verificar as suposicoes assumidas para os erros i .
6.3.2
Adequac
ao do modelo de regress
ao linear ajustado
g.l.
Soma de Quadrados
n
X
(b
yi y)2
SQReg =
Quadrado Medio
QMReg =
SQReg
(p1)
np
SQRes =
QMRes =
SQRes
(np)
n1
SQT otal =
p1
i=1
n
X
(yi ybi )2
i=1
n
X
i=1
(yi y)2
p = n
umero de par
ametros do modelo e n = tamanho amostral.
QMReg
,
QMRes
6.3. Regress
ao Linear Simples
109
g.l.
1
18
19
Soma de Quadrados
SQReg = 810
SQRes = 563
SQT otal = 1373
Quadrado Medio
QMReg = 810
QMRes = 31, 28
F
25,897
Quanto `
as suposic
oes, devemos verificar se os erros encontram-se aleatoriamente
distribudos em torno de zero, bem como se a vari
ancia dos mesmos e constante e se
s
ao independentes. A suposicao de independencia est
a intimamente relacionada `a forma
como os dados foram coletados. Se o experimento foi conduzido de forma a garantir que as
informac
oes observadas em uma unidade amostral n
ao tenham sido influenciadas pelas das
outras unidades, ent
ao esta suposicao e razo
avel. Por outro lado, o gr
afico dos resduos,
ei , versus os valores preditos pelo modelo, ybi , bem como o gr
afico dos resduos versus os
valores xi , nos auxiliam a verificar se a media dos erros e zero e se a vari
ancia e constante.
Para os dados do exemplo 6.2, a Figura 6.3 mostra ambos os gr
aficos.
5
0
resduos
0
5
resduos
10
(b)
10
(a)
10
preditos
15
20
20
25
30
35
40
preditos
110
Giolo, S. R.
QQplot apresentado na Figura 6.4. A partir desta figura, notamos que a suposic
ao de
normalidade dos erros, e conseq
uentemente da vari
avel resposta Y , e razo
avel para os
dados desse exemplo.
5
0
5
Quantis amostrais
10
Normal QQ Plot
Quantis tericos
6.3.3
Interpretac
ao dos par
ametros do modelo
111
125
6.3. Regress
ao Linear Simples
115
110
105
95
100
tempo de reao
120
20
25
30
35
40
idade
media, 103 segundos. Estimativas para qualquer outra idade entre 20 e 40 anos podem
ser obtidas de forma an
aloga.
As estimativas pontuais, yb, obtidas por meio do modelo de regressao linear simples
ajustado, claramente n
ao refletem a variacao que certamente ocorre entre pessoas de uma
mesma idade. Uma estimativa intervalar do tempo esperado de reacao seria, desse modo,
conveniente e recomendavel. Este intervalo para uma idade X = x, a um nvel de confianca
de (1 )%, pode ser obtido por:
yb t/2,n2
p
vd
ar(b
y)
)
c2
vd
ar(b
y) =
+ Pn
)2
n
i=1 (xi x
em que:
c2 =
Pn
ybi )2
.
(n 2)
i=1 (yi
Captulo 7
An
alise de Vari
ancia
7.1
Introdu
c
ao
A Analise de Vari
ancia (ANOVA) e um procedimento utilizado para comparar tres
ou mais tratamentos. Existem muitas variacoes da ANOVA devido aos diferentes tipos
de experimentos que podem ser realizados. Nesse curso ser
a estudado apenas a an
alise de
vari
ancia com um fator.
Inicialmente, s
ao apresentados alguns conceitos utilizados em planejamento de experimentos e na an
alise de vari
ancia.
7.2
7.2.1
Conceitos B
asicos sobre Experimenta
c
ao
Tratamento
113
Os tratamentos s
ao chamados de vari
aveis independentes. Quando, em um experimento, estamos interessados em estudar apenas um tipo de vari
avel independente, dizemos
que possumos apenas um fator. Em um experimento, um fator pode ter varias categoriais
que s
ao chamadas de nveis.
Exemplo: Um laborat
orio deseja estudar o efeito da composicao de pecas de metal
sobre a dilatac
ao.
Neste exemplo, a composicao das pecas e o fator (vari
avel independente). Os diferentes tipos de composic
ao s
ao os nveis do fator. A dilatacao das pecas, medida em
milmetros, por exemplo, e a vari
avel resposta (vari
avel dependente).
Em um experimento podem existir mais de um fator e mais de uma vari
avel resposta.
Toda e qualquer vari
avel que possa interferir na vari
avel resposta ou dependente
deve ser mantida constante. Quando isso n
ao e possvel, existem tecnicas (estrategias)
que podem ser utilizadas para reduzir ou eliminar essa interferencia.
7.2.2
a
Unidade experimental ou parcela e onde e feita a aplicacao do tratamento. E
unidade experimental que fornece os dados para serem avaliados. Como exemplos de
unidades experimentais ou parcelas pode-se citar: um motor, uma peca do motor, uma
placa de Petri com meio de cultura, uma porcao de algum alimento.
As unidades experimentais podem ser formadas por grupos ou indivduos. Por exemplo, quando trabalha-se com cobaias, pode-se ter apenas uma cobaia como unidade experimental, ou seja, apenas um animal fornecer
a a resposta do tratamento, ou ainda, pode-se
ter um grupo de cobaias em uma gaiola fornecendo as informacoes. O uso de grupos
ou indivduos como unidades experimentais depende do fen
omeno que se est
a estudando,
da forma como o experimento e conduzido e dos recursos disponveis. De modo geral, a
escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental.
7.2.3
Repetic
ao
Repetica
o e o n
umero de vezes que um tratamento aparece no experimento.
O n
umero de repetic
oes, em um experimento, vai depender tambem dos recursos
disponveis, do tipo de experimento (delineamento) e, tambem, da variabilidade do experimento ou da vari
avel resposta. Existem varias metodologias para estimar o n
umero
satisfat
orio de repetic
oes em um experimento. Mas, em funcao das possveis limitac
oes
acima, a definic
ao do n
umero de repeticoes, muitas vezes, torna-se uma tarefa difcil. A
experiencia do pesquisador sobre o fenomeno em estudo deve ser levada em consideracao. Alem disso, as metodologias empregadas, para esse calculo, pressup
oem que uma
estimativa do erro experimental e conhecida. Nem sempre essa informacao est
a disponvel
114
Analise de Vari
ancia
Anjos, A. dos
antes da realizac
ao de um experimento e, como cada experimento e uma nova hist
oria, em
func
ao de caractersticas intrnsecas de cada fenomeno, esse calculo pode ser em vao.
7.2.4
Vari
avel resposta ou vari
avel dependente
Uma vari
avel e qualquer caracterstica que apresenta variacao, por exemplo, a altura
de pessoas, o peso de animais, o comprimento de uma peca, o n
umero de microrganismos
em um litro de leite etc.
Quando o valor de uma vari
avel n
ao pode ser determinado antes da realizac
ao de
um experimento, tem-se ent
ao uma vari
avel aleat
oria.
As vari
aveis que assumem valores enumeraveis, s
ao denominadas vari
aveis aleat
orias
discretas. Por exemplo, o n
umero de sementes germinadas, o n
umero de microrganismos
em um litro de leite.
As vari
aveis que assumem valores em um intervalo, s
ao denominadas vari
aveis aleatorias contnuas. Por exemplo, o peso de animais, o teor de umidade em um alimento, o
conte
udo de
oleo em uma semente.
Em um experimento, podem ser medidas muitas vari
aveis, mas deve-se considerar
somente aquelas que possam contribuir para a explicacao da hip
otese formulada.
7.2.5
7.2.6
115
Modelo e an
alise de vari
ancia
Em um experimento completamente casualizado, cada observacao Yij pode ser decomposta conforme o modelo a seguir:
Yij = + i + ij
i = 1, . . . , I e j = 1, . . . , J
(7.1)
em que:
Yij e a observac
ao do i-esimo tratamento na j-esima unidade experimental ou parcela;
e o efeito constante (media geral);
i e o efeito do i-esimo tratamento;
ij e o erro associado ao i-esimo tratamento na j-esima unidade experimental ou parcela
IID
assumido como: ij N (0, 2 ). Aqui, IID significa que os erros devem ser independentes
e identicamente distribudos.
Em um experimento, existe o interesse em testar se h
a diferencas entre as medias
dos tratamentos, o que equivale a testar as hip
oteses:
(
em que:
H 0 : 1 = 2
H1 : i 6= i
= = I
para pelo menos um par (i,i ), com i 6= i
i = + i
i = 1, 2, . . . , I.
H 0 : 1 = 2 = = I = 0
H1 : i 6= 0 para pelo menos um i .
J
I P
P
i=1 j=1
SQTrat =
I
P
i=1
2
yi.
(
2
yij
C, em que C =
J
I P
P
i=1 j=1
IJ
yij )2
C,
116
Analise de Vari
ancia
Anjos, A. dos
Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela
da an
alise de vari
ancia, como apresentado na Tabela 7.1.
Para testar a hip
otese H0 , utiliza-se o teste F apresentado na tabela da Analise
de Vari
ancia (Tabela 7.1). Convem lembrar que esse teste e valido se os pressupostos
assumidos para os erros do modelo estiverem satisfeitos.
Tabela 7.1: Tabela da an
alise de vari
ancia.
Causas de
Variacao
Tratamentos
Resduo
Total
Graus de
Liberdade
I-1
I(J-1)
IJ-1
Soma de
Quadrados
SQTrat
SQRes
SQTotal
Quadrados
Medios
QMTrat
QMRes
F calculado
QMTrat/QMRes
7.2.7
Delineamento experimental
7.3
An
alise de Vari
ancia
Exemplo 7.1. Considere o seguinte experimento que foi conduzido, considerando um delineamento inteiramente casualizado. Foram comparados 4 tratamentos (tipos de cultivo:
117
Agar
(A), C
assia (C), Guar (G), Leucena (L)). Mediu-se o crescimento, em gramas, de
explantes de morango (Tabela 7.2).
Tabela 7.2: Crescimento de explantes de morangos em gramas.
Trat.
A
G
L
C
Total
I
0.1958
0.3627
0.1621
0.2841
II
0.1301
0.4841
0.1150
0.3099
III
0.1806
0.4119
0.2011
0.2922
Repetico
es
IV
V
0.1545
0.1252
0.4457
0.4755
0.2123
0.1475
0.1505
0.2345
Total
VI
0.1882
0.5174
0.1922
0.1652
VII
0.2211
0.4173
0.1802
0.1379
VIII
0.1734
0.4001
0.2248
0.1960
1,3689
3,5147
1,4352
1,7703
8,0891
em que ij N (0, 2 )
yij = + i + ij
i = 1, 2, . . . , 4 tratamentos;
j = 1, 2, . . . , 8 repetic
oes;
yij e o peso em gramas correspondente ao i-esimo tratamento na j-esima unidade experimental;
i e o efeito do i-esimo tratamento;
ij e o erro experimental associado ao i-esimo tratamento e a j-esima repeticao.
As hip
oteses testadas neste experimento s
ao:
H 0 : 1 = 2 = 3 = 4
H1 : i 6= i
com i 6= i .
C
alculos para a An
alise de Vari
ancia
Tem-se que:
J
I P
P
i=1 j=1
J
I P
P
i=1 j=1
As somas de quadrados s
ao obtidas da seguinte forma:
1. SQTotal=
J
I P
P
i=1 j=1
(
2
yij
J
I P
P
i=1 j=1
IJ
yij )2
= 2, 4952
(8,0891)2
32
= 0, 4504
118
Analise de Vari
ancia
(
J
I P
P
yij )2
J
I P
P
yij )2
i=1 j=1
Obs: A express
ao
IJ
da soma de quadrados.
2. SQTrat=
I
P
i=1
2
yi.
i=1 j=1
IJ
Anjos, A. dos
(8,0891)2
32
= 0, 3828.
Tratamentos
Resduo
4-1=3
4(8-1)=28
0,3828
0,0676
Total
48-1=31
0,4504
0,1276
0,002414
52,8583
Conclusao da an
alise de vari
ancia: de acordo com o teste F, foram encontradas evidencias de diferencas significativas, ao nvel de 1% de probabilidade, entre os tratamentos,
com relac
ao ao crescimento. Rejeitamos, portanto, a hipotese de nulidade H0 . Deve existir, pelo menos, um contraste significativo entre as medias de tratamentos, com relac
ao ao
crescimento medio.
O procedimento seguinte, quando de interesse do pesquisador, e o de comparar as
medias de tratamentos utilizando algum teste de comparacao de medias ou contrastes para
identificar qual ou quais tratamentos e ou s
ao diferente(s).
7.4
119
Apos concluirmos que existe diferenca significativa entre tratamentos, por meio do
teste F, podemos estar interessados em avaliar a magnitude destas diferencas utilizando
um teste de comparac
oes m
ultiplas. Ser
a utilizado o teste de Tukey.
O teste de Tukey permite testar qualquer contraste, sempre, entre duas medias de
tratamentos, ou seja, n
ao permite comparar grupos entre si.
O teste baseia-se na Diferenca Mnima Significativa (DMS) . A estatstica do teste
e dada da seguinte forma:
=q
QM Res
,
r
(7.2)
em que q e a amplitude total studentizada, tabelada (tabela 7), QMRes e o quadrado medio
do resduo, e r e o n
umero de repeticoes. O valor de q depende do n
umero de tratamentos
e do n
umero de graus de liberdade do resduo. Tambem, em um teste de comparac
oes
de medias, deve-se determinar um nvel de significancia para o teste. Normalmente,
utiliza-se o nvel de 5% ou 1% de significancia.
Como o teste de Tukey e, de certa forma, independente do teste F, e possvel que,
mesmo sendo significativo o valor de Fcalculado, n
ao se encontrem diferencas significativas
entre contrastes de medias.
Aplicando o teste de Tukey `as medias dos tratamentos do exemplo 7.1, temos:
r
(5%) = 3, 85
0, 00242
= 0, 06696.
8
sendo
q=3,85 e = 0, 05
Se o contraste for maior do que , entao as medias diferem ao nvel de significancia.
Utilizar-se-
a o metodo de letras para exemplificar o uso do teste, mas existem outras
maneiras de representac
ao como, por exemplo, o uso de tabelas ou barras.
Inicialmente, ordenamos as medias de forma crescente ou decrescente, para facilitar
as comparac
oes. Colocamos uma letra do alfabeto na primeira media (normalmente a
letra a) e, em seguida, comparamos a diferenca com as medias seguintes. Se a diferenca
for superior ao valor de (5%) = 0, 06696, a diferenca entre duas medias ser
a considerada
significativa. Sendo representada pela presenca de letras diferentes. O resultado final e o
seguinte:
G
C
L
A
0,4393
0,2213
0,1794
0,1711
a
b
b
b
120
7.5
Analise de Vari
ancia
Anjos, A. dos
Teste de Kruskal-Wallis
A an
alise de vari
ancia exige que os erros ij tenham distribuicao Normal e deve haver
homocedasticidade entre os tratamentos (vari
ancias homogeneas). Estes pressupostos nem
sempre s
ao satisfeitos em um experimento ou conjunto de dados.
Como uma alternativa para a an
alise de vari
ancia parametrica para um delineamento
completamente casualizado, k 3 tratamentos, existe o teste n
ao parametrico de KruskalWallis. Este teste pode ser utilizado para testar a hip
otese H0 : 1 = 2 = = k . No
lugar das medidas, utiliza-se os postos e n
ao h
a suposicoes com relacao a Normalidade e
Homocedasticidade.
Uma exigencia do teste de Kruskal-Wallis e que a vari
avel em estudo seja contnua.
Outra e que as observac
oes devem ser independentes. A analise consiste em obter o posto
de cada uma das observac
oes. Adota-se que o menor valor recebe (ranking ou posto) 1,
o segundo 2 e assim por diante, ate que todas as observacoes tenham sido consideradas.
Quando ocorrerem empates, atribui-se o valor medio entre as observacoes, ou seja, atribuise a media das ordens que seriam atribudas a elas se n
ao ocorresse o empate. Se, por
exemplo, as duas menores observacoes forem iguais h
a um empate. Neste caso, cada uma
recebe o posto 1,5 que e a media dos valores 1 e 2.
Para testar a hip
otese nula, utilizamos a estatstica de teste:
k
H=
X (Rj)2
12
3(N + 1)
N (N + 1)
nj
j=1
em que:
N = n
umero total de observacoes;
k = n
umero de tratamentos;
nj = n
umero de observac
oes no j-esimo tratamento;
Rj = soma dos postos do j-esimo tratamento.
Rejeitamos H0 se H 2 com k 1 graus de liberdade ao nvel de significancia.
Se ocorrerem empates, a estatstica de teste H deve ser corrigida com a seguinte
express
ao:
P 3
(ti ti )
C =1
,
N3 N
em que ti e o n
umero de observacoes empatadas no i-esimo grupo.
Assim, temos a estatstica corrigida:
H
C
Para testar H0 , procedemos exatamente como se n
ao houvesse empates.
H1 =
121
Tabela 7.4: Consumo de energia eletrica de tres motores durante uma hora.
Motor 1
Motor 2 Motor 3
H=
2212 (13)
2025 (9)
1989 (8)
2232 (14)
2027 (10)
2195 (12)
2031 (11)
1876 (7)
1750 (2)
1060 (1)
1770
1800
1852
1769
(4)
(5)
(6)
(3)
R1 = 54
R1 = 33
R1 = 18
2
332 182
54
12
+
+
3(15) = 5, 4
14(15) 5
5
4
Captulo 8
Introdu
c
ao
A an
alise e interpretac
ao de dados, voltados para a melhoria da qualidade de produtos ou servicos, e chamada de controle estatstico de qualidade ou controle estatstico de processos (CEP).
No controle estatstico de qualidade existem varios metodos que podem ser utilizados para monitorar um processo: desde a estatstica descritiva ou um simples gr
afico de
dispers
ao, ate metodos mais especficos como gr
aficos de controle e ndices de capacidade.
Neste texto, abordaremos apenas alguns tipos de gr
aficos de controle.
8.1.1
Gr
aficos de controle
Basicamente, um gr
afico de controle consiste no acompanhamento de um processo
ao longo do tempo. Um linha media e inserida no gr
afico acompanhada de uma linha
superior e uma linha inferior, chamadas de limite superior e limite inferior de controle,
respectivamente. Esses limites s
ao construdos segundo criterios estatsticos. Na Figura
8.1 e mostrado um exemplo de gr
afico de controle.
Diz-se que um processo est
a sob controle ou est
avel quando a variacao observada e
devida somente a causas de variacao naturais do processo, ou seja, o gr
afico mostra apenas
flutuac
oes aleat
orias. Caso contr
ario, o processo e dito fora de controle.
O objetivo principal de um gr
afico de controle e identificar se a variacao existente
e uma func
ao de causas naturais de variacao do processo ou de causas especiais. No caso
de causas especiais, e necessario intervir no processo para reduzir a variabilidade.
Os gr
aficos de controle s
ao elaborados em funcao do tipo de vari
avel e da caracterstica da amostra. Por exemplo, para atributos ou vari
aveis do tipo contagem e para
vari
aveis contnuas s
ao elaborados gr
aficos para cada tipo de vari
avel. Tambem, dependendo do tamanho da amostra (n), metodologias especficas devem ser utilizadas.
122
8.1. Introduc
ao
123
varivel
Limite superior
Mdia
Limite inferior
tempo
8.1.2
Construc
ao do gr
afico
No eixo horizontal s
ao inseridos os n
umeros das amostras de tamanho n (em geral
constante), observadas no processo. No eixo vertical e inserida a unidade de medida da
vari
avel que est
a sendo estudada ou controlada. As amostras s
ao chamadas tambem de
subgrupos.
No gr
afico, s
ao representadas as medias de cada amostra que ir
ao refletir o comportamento de variac
ao do processo.
A linha central, dependendo das informacoes disponveis, representa, em geral, a
media do processo. A linha central ou o valor medio x
e obtido pela media das medias
amostrais e pode, tambem, ser denotada por x. Se existem informacoes anteriores sobre
o processo, pode-se utilizar um valor de referencia. Por u
ltimo, se for conhecida, a media
da populac
ao, deve ser utilizada.
As duas linhas que definem os limites de controle: LSC - limite superior de controle
e LIC - limite inferior de controle, s
ao utilizadas, entre outras, para decidir quando o
processo est
a sob controle ou n
ao.
Nao se deve confundir limites de controle com limites de especificacao. Os limites
uma questao tecnica, definida
de especificac
ao s
ao definidos pela natureza do produto. E
pelo projeto do produto. Os limites de controle s
ao sempre menores do que os limites
de especificac
ao. Os limites de controle, por outro lado, podem ser definidos de duas
maneiras:
1. Utilizando a distribuic
ao da vari
avel X que mede o desempenho do processo. Nesse
caso, podemos encontrar limites de controle de tal forma que,
P (LIC X LSC) 1
124
Anjos, A. dos
sendo um n
umero arbitrario e fixo, normalmente pequeno ( = 0, 01). Esse limite
e chamado de limite probabilstico. Esperamos que, por ser pequeno, um valor
alem dos limites inferior e superior devam ocorrer raramente se o processo estiver
sob controle. Nesse caso, um ponto fora dos limites indicar
a que o processo est
a fora
de controle e que uma ou mais causas de variacao especiais est
ao atuando sobre o
processo.
2. Outra maneira e definir os limites de controle por meio de m
ultiplos do desvio padrao
da vari
avel X:
LSC = x + kx
LIC = x kx ,
em que x e a media de X, x e o desvio padrao de X e k e uma constante positiva.
Em geral, costuma-se utilizar k = 3.
Se X tiver uma distribuicao Normal, a probabilidade de um ponto cair fora dos
limites e aproximadamente 0,003.
O tamanho da amostra e o tipo de vari
avel influenciam na construcao dos limites
de controle.
importante que os limites sejam definidos para um processo que esteja sob controle.
E
Ou seja, como os limites dependem da variabilidade do processo (), se o processo n
ao
estiver sob controle, ou seja, quando a variacao observada e devida somente a causas de
variac
ao naturais do processo, os limites podem n
ao refletir o verdadeiro comportamento
do processo.
Limites de aviso ou de alerta
Podemos utilizar, alem dos limites superior e inferior, limites de aviso. Quando um
ponto ultrapassa os limites de 3, acoes corretivas devem ser utilizadas. No entanto, um
limite menor, por exemplo, 2 pode ser utilizado como um limite de advertencia (Figura
8.2).
Quando um ponto atinge os limites de aviso, podemos, por exemplo, coletar amostras
com um n maior e/ou amostras com maior freq
uencia, para obter informacoes sobre o
processo mais rapidamente.
Limites de aviso aumentam a sensibilidade do gr
afico de controle. Por outro lado,
esses mesmos limites podem gerar alarmes falsos ou falsos positivos. Por isso, eles devem
ser utilizados com cautela, pois podem, inclusive, aumentar custos sem necessidade.
8.1.3
An
alise do padr
ao de gr
aficos de controle
8.1. Introduc
ao
125
Limite superior
varivel
Mdia
Limite inferior
tempo
variavel
Limite superior
Limite inferior
tempo
126
Anjos, A. dos
variavel
Limite superior
Limite inferior
tempo
de vari
avel, entre outas.
Algumas regras podem ser (Montgomery, 1991):
1. um ou mais pontos fora dos limites de controle;
2. dois de tres pontos consecutivos alem dos limites de 2 (mas ainda dentro dos limites
de controle);
3. quatro de cinco pontos consecutivos alem do limite de 1;
4. oito pontos consecutivos acima ou abaixo da linha central;
5. seis pontos em uma linha crescente ou decrescente;
6. quinze pontos em linha, acima ou abaixo da media;
7. quatorze pontos alternados para cima e para baixo;
8. oito pontos em linha em ambos os lados da linha central e nenhum em ate 1;
9. um padrao incomum ou n
ao aleatorio;
10. um ou mais pontos pr
oximos dos limites de controle.
Em resumo, um gr
afico de controle ajuda a:
monitorar e reduzir a variabilidade;
monitorar um processo ao longo do tempo;
detectar rapidamente pontos fora de controle e tendencias;
realizar correc
oes, diminuindo o n
umero de produtos defeituosos.
8.2. Gr
aficos de Controle para Vari
aveis
8.2
127
Gr
aficos de Controle para Vari
aveis
Introdu
c
ao
Quando trabalhamos com vari
aveis do tipo comprimento, largura, di
ametro, ou seja,
vari
aveis que possuem uma escala contnua, s
ao utilizados gr
aficos de controle para vari
aveis, que ser
ao apresentados nessa secao.
No caso de vari
aveis, existem tres gr
aficos usuais: x
, R e s.
O gr
afico x
e utilizado para monitorar a media do processo, enquanto os gr
aficos R
e s s
ao utilizados para monitorar a variabilidade do processo.
Nos gr
aficos da Figura 8.5, a seguir, pode-se perceber a import
ancia de se monitorar
a media e a vari
ancia de um processo.
LIE
LSE
0
(a)
LIE
LSE
0
1 > 0
(b)
LIE
LSE
1 > 0
(c)
Figura 8.5: Efeito da media e desvio padrao em relacao aos limites de especificacao (LIE= limite
inferior de especificacao e LSE= limite superior de especificacao).
128
Anjos, A. dos
8.2.1
Gr
aficos de controle para x e R
x1 + x2 + . . . + xn
n
sendo x
normalmente distribudo com media e desvio padrao x =
.
n
ao intervalo z/2 n e 1 .
Como visto antes, z/2 e geralmente substitudo por 3, que significa um limite de 3
sigmas.
x
1 + x
2 + . . . + x
m
m
8.2. Gr
aficos de Controle para Vari
aveis
129
+ A2 R
LSC = x
Linha central = x
A2 R.
LIC = x
A2 e uma constante tabelada para diferentes tamanhos de n. Essa constante e determinada em func
ao da amplitude de variacao e do desvio padrao das amostras, considerando
uma distribuic
ao Normal (demonstracao omitida).
Coment
arios sobre o gr
afico R
Embora o gr
afico R tenha sido elaborado inicialmente para facilitar a obtenc
ao
dos limites de controle, ele e simples de ser construdo e interpretado e isso e um ponto
importante.
Para amostras com n pequeno (4, 5, 6) a informacao fornecida pela amplitude n
ao
e muito diferente daquela fornecida pelo desvio padrao.
O gr
afico R e sensvel a dados discrepantes (outliers). Por isso, e importante analisar
a origem de um outlier antes de tirar conclusoes sobre o gr
afico R. Claro que um processo
que contem outliers deve ter problemas.
8.2.2
Gr
aficos de controle para x e s
x
)2
.
n1
Mas, o desvio padrao amostral de s n
ao e um estimador n
ao viesado de . Considerando um distribuic
ao Normal, s estima c4 . Aqui, c4 e uma constante que varia em
p
func
ao do tamanho amostral n. Ainda, o desvio padrao de s e dado por 1 c24 .
2
s =
i=1 (xi
130
Anjos, A. dos
LSC = c4 + 3
LIC = c4 3
1 c24
1 c24 .
LSC = B6
Linha central = c4
LIC = B5 .
Valores de B5 e B6 s
ao tabelados para varios tamanhos de n.
Se o valor de n
ao e fornecido, ele pode ser estimado de dados anteriores. Considerando que se tenham m amostras, cada uma com tamanho n, e seja si o desvio padrao
da i-esima amostra, a media dos desvios-padrao e:
m
1 X
s =
si .
m
i=1
s
c4
e um estimador n
ao viesado de . Logo, podemos reescrever os
A estatstica
par
ametros do gr
afico de controle s:
LSC = s + 3
s
c4
1 c24
s
c4
1 c24
Linha central = s
LIC = s 3
Definindo B3 e B4 como constantes tal que:
q
3
1 c24
c4
q
3
1 c24 ,
B4 = 1 +
c4
B3 = 1
8.2. Gr
aficos de Controle para Vari
aveis
131
LSC = B4 s
Linha central = s
LIC = B3 s.
Observe, ainda, que, B4 = B6 /c4 e B3 = B5 /c4 .
Gr
afico x
Utilizando
gr
afico x
como:
s
c4
+
LSC = x
3
s
c4 n
Linha central = x
LIC = x
3
s
c4 n
+ A3 s
LSC = x
Linha central = x
A3 s
LIC = x
8.2.3
Exemplos
Exemplo 8.1. Considere um conjunto de dados sobre espessura de uma peca de metal
medida em milmetros (Tabela 8.1). Nesse exemplo, 20 amostras de tamanho n=5 foram
obtidas. Um gr
afico de controle para a media para esses dados e apresentado na Figura
8.6
Podemos observar no gr
afico da Figura 8.6 que n
ao h
a pontos localizados alem dos
limites de controle inferior e superior. Portanto, considerando as regras sugeridas na Sec
ao
8.1.3 podemos dizer que o processo est
a sob controle.
Alem disso, para os dados da Tabela 8.1, os gr
aficos de controle R e s s
ao apresentados nas Figuras 8.7 e 8.8, respectivamente. Nesses gr
aficos, podemos observar que n
ao h
a
pontos fora dos limites de controle. Seguindo as regras sugeridas na p
agina 8.1.3, tambem
n
ao h
a suspeitas de que o processo esteja fora de controle.
132
Anjos, A. dos
4
9.96
9.86
10.10
9.99
10.00
10.04
9.99
9.96
9.85
10.01
9.93
9.81
10.11
10.11
9.93
10.02
10.03
9.85
9.81
9.92
5
9.92
10.03
10.00
10.08
9.99
10.07
9.99
9.97
9.96
10.01
9.94
10.06
9.91
10.03
9.96
10.09
10.14
9.90
9.94
9.95
10.10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
10.03
10.02
10.06
10.04
9.99
9.98
9.92
9.96
9.89
10.02
10.03
10.10
10.01
10.04
9.95
9.97
10.02
10.04
10.12
9.92
Medidas
3
10.09
9.97
10.01
10.12
9.97
9.94
9.96
10.03
9.97
10.06
9.95
9.87
9.94
10.00
10.23
9.93
10.07
9.96
9.88
9.99
10.00
9.90
9.95
espessura (mm)
10.05
UCL
LCL
10
11
12
13
14
15
16
17
18
19
20
amostras
Figura 8.6: Grafico de controle para media - sem problemas (Tabela 8.1).
8.2. Gr
aficos de Controle para Vari
aveis
133
0.2
0.0
0.1
espessura (mm)
0.3
UCL
LCL
10
11
12
13
14
15
16
17
18
19
20
amostras
UCL
0.00
0.05
espessura (mm)
0.10
0.15
LCL
10
11
12
13
14
15
16
17
18
19
20
amostras
Figura 8.8: Grafico de controle para o desvio padrao - dados da Tabela 8.1.
134
Anjos, A. dos
Exemplo 8.2. Consideremos agora, outro conjunto de dados sobre espessura de uma
peca de metal, avaliados em outro momento (Tabela 8.2). Nessa situacao, observe que um
dos pontos amostrais ultrapassa o limite superior de controle (Figura 8.9). Em princpio,
nesse momento deveria ser realizada uma intervencao no processo para descobrir a causa
do problema.
1
10, 18
9.92
10, 03
10.04
10, 07
10, 01
9.93
9, 96
10, 10
9, 97
9, 98
10.04
10, 01
10.09
10.03
9.89
10.03
9.98
10.13
9.95
2
9, 90
10.06
10.22
9, 93
10, 06
10, 06
10.06
10, 08
9.94
10.11
10.00
9, 87
10.01
10.06
9.93
9.93
10.00
9.97
9.95
10.09
Medidas
3
9, 94
9.99
10.18
9.98
10, 10
10, 05
10.01
9, 91
9.98
10.05
10, 03
10, 03
10, 04
10.09
9.95
9.96
10.00
9.98
10.05
9.88
4
9.97
10, 01
10.03
10, 40
9, 89
9, 92
9.99
9.99
9.90
10.01
10, 14
10, 01
10.06
10.10
9.93
10.00
9.97
9.86
10.02
9.96
5
9.92
10.18
10.15
10.08
10, 10
9, 98
9.97
10, 03
9.97
10.07
10, 06
9, 93
10, 03
10.06
9.87
10.19
9.94
10.05
10.07
9.99
8.2. Gr
aficos de Controle para Vari
aveis
135
9.95
10.00
espessura (mm)
10.05
10.10
UCL
LCL
10
11
12
13
14
15
16
17
18
19
20
amostras
Figura 8.9: Grafico de controle para media - com problemas (Tabela 8.2).
TABELAS
136
Tabelas
137
Parte inteira
e primeira
decimal de zc
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
1
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
2
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
3
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
4
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
5
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
6
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
7
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
8
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
9
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000
138
Z
0,0
-0,1
-0,2
-0,3
-0,4
-0,5
-0,6
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
-1,7
-1,8
-1,9
-2,0
-2,1
-2,2
-2,3
-2,4
-2,5
-2,6
-2,7
-2,8
-2,9
-3,0
-3,1
-3,2
-3,3
-3,4
-3,5
-3,6
-3,7
-3,8
-3,9
Tabelas
Tabela 2: Distribuic
ao Normal padrao com valores de P [ Z Zc ].
0
0.5000
0.4602
0.4207
0.3821
0.3446
0.3085
0.2743
0.2420
0.2119
0.1841
0.1587
0.1357
0.1151
0.0968
0.0808
0.0668
0.0548
0.0446
0.0359
0.0287
0.0228
0.0179
0.0139
0.0107
0.0082
0.0062
0.0047
0.0035
0.0026
0.0019
0.0013
0.0010
0.0007
0.0005
0.0003
0.0002
0.0002
0.0001
0.0001
0.0000
1
0.4960
0.4562
0.4168
0.3783
0.3409
0.3050
0.2709
0.2389
0.2090
0.1814
0.1562
0.1335
0.1131
0.0951
0.0793
0.0655
0.0537
0.0436
0.0351
0.0281
0.0222
0.0174
0.0136
0.0104
0.0080
0.0060
0.0045
0.0034
0.0025
0.0018
0.0013
0.0009
0.0007
0.0005
0.0003
0.0002
0.0002
0.0001
0.0001
0.0000
2
0.4920
0.4522
0.4129
0.3745
0.3372
0.3015
0.2676
0.2358
0.2061
0.1788
0.1539
0.1314
0.1112
0.0934
0.0778
0.0643
0.0526
0.0427
0.0344
0.0274
0.0217
0.0170
0.0132
0.0102
0.0078
0.0059
0.0044
0.0033
0.0024
0.0018
0.0013
0.0009
0.0006
0.0005
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
3
0.4880
0.4483
0.4090
0.3707
0.3336
0.2981
0.2643
0.2327
0.2033
0.1762
0.1515
0.1292
0.1093
0.0918
0.0764
0.0630
0.0516
0.0418
0.0336
0.0268
0.0212
0.0166
0.0129
0.0099
0.0075
0.0057
0.0043
0.0032
0.0023
0.0017
0.0012
0.0009
0.0006
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
4
0.4840
0.4443
0.4052
0.3669
0.3300
0.2946
0.2611
0.2296
0.2005
0.1736
0.1492
0.1271
0.1075
0.0901
0.0749
0.0618
0.0505
0.0409
0.0329
0.0262
0.0207
0.0162
0.0125
0.0096
0.0073
0.0055
0.0041
0.0031
0.0023
0.0016
0.0012
0.0008
0.0006
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
5
0.4801
0.4404
0.4013
0.3632
0.3264
0.2912
0.2578
0.2266
0.1977
0.1711
0.1469
0.1251
0.1056
0.0885
0.0735
0.0606
0.0495
0.0401
0.0322
0.0256
0.0202
0.0158
0.0122
0.0094
0.0071
0.0054
0.0040
0.0030
0.0022
0.0016
0.0011
0.0008
0.0006
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
6
0.4761
0.4364
0.3974
0.3594
0.3228
0.2877
0.2546
0.2236
0.1949
0.1685
0.1446
0.1230
0.1038
0.0869
0.0721
0.0594
0.0485
0.0392
0.0314
0.0250
0.0197
0.0154
0.0119
0.0091
0.0069
0.0052
0.0039
0.0029
0.0021
0.0015
0.0011
0.0008
0.0006
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
7
0.4721
0.4325
0.3936
0.3557
0.3192
0.2843
0.2514
0.2206
0.1922
0.1660
0.1423
0.1210
0.1020
0.0853
0.0708
0.0582
0.0475
0.0384
0.0307
0.0244
0.0192
0.0150
0.0116
0.0089
0.0068
0.0051
0.0038
0.0028
0.0021
0.0015
0.0011
0.0008
0.0005
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
8
0.4681
0.4286
0.3897
0.3520
0.3156
0.2810
0.2483
0.2177
0.1894
0.1635
0.1401
0.1190
0.1003
0.0838
0.0694
0.0571
0.0465
0.0375
0.0301
0.0239
0.0188
0.0146
0.0113
0.0087
0.0066
0.0049
0.0037
0.0027
0.0020
0.0014
0.0010
0.0007
0.0005
0.0004
0.0003
0.0002
0.0001
0.0001
0.0001
0.0000
9
0.4641
0.4247
0.3859
0.3483
0.3121
0.2776
0.2451
0.2148
0.1867
0.1611
0.1379
0.1170
0.0985
0.0823
0.0681
0.0559
0.0455
0.0367
0.0294
0.0233
0.0183
0.0143
0.0110
0.0084
0.0064
0.0048
0.0036
0.0026
0.0019
0.0014
0.0010
0.0007
0.0005
0.0003
0.0002
0.0002
0.0001
0.0001
0.0001
0.0000
Tabelas
139
Tabela 3: Distribuic
ao Normal padrao com valores de P [ Z Zc ] (continuac
ao).
Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
1
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
2
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
3
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
4
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
5
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
6
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
7
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
8
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
9
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
0.9999
1.0000
140
2
199,5
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,15
3,07
3,00
3
215,7
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,76
2,68
2,60
4
224,6
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,53
2,45
2,37
5
230,2
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,37
2,29
2,21
6
234,0
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,25
2,18
2,10
7
236,8
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,17
2,09
2,01
8
238,9
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,10
2,02
1,94
9
240,5
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,04
1,96
1,88
10
241,9
19,40
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
1,99
1,91
1,83
11
243,0
19,40
8,76
5,94
4,70
4,03
3,60
3,31
3,10
2,94
2,82
2,72
2,63
2,57
2,51
2,46
2,41
2,37
2,34
2,31
2,28
2,26
2,24
2,22
2,20
2,18
2,17
2,15
2,14
2,13
2,04
1,95
1,87
1,79
12
243,9
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,92
1,83
1,75
13
244,7
19,42
8,73
5,89
4,66
3,98
3,55
3,26
3,05
2,89
2,76
2,66
2,58
2,51
2,45
2,40
2,35
2,31
2,28
2,25
2,22
2,20
2,18
2,15
2,14
2,12
2,10
2,09
2,08
2,06
1,97
1,89
1,80
1,72
14
245,4
19,42
8,71
5,87
4,64
3,96
3,53
3,24
3,03
2,86
2,74
2,64
2,55
2,48
2,42
2,37
2,33
2,29
2,26
2,22
2,20
2,17
2,15
2,13
2,11
2,09
2,08
2,06
2,05
2,04
1,95
1,86
1,78
1,69
15
245,9
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,84
1,75
1,67
16
246,5
19,43
8,69
5,84
4,60
3,92
3,49
3,20
2,99
2,83
2,70
2,60
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,16
2,13
2,11
2,09
2,07
2,05
2,04
2,02
2,01
1,99
1,90
1,82
1,73
1,64
20
248,0
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,75
1,66
1,57
24
249,1
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,70
1,61
1,52
30
250,1
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,65
1,55
1,46
40
251,1
19,47
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,59
1,50
1,39
60
252,2
19,48
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,53
1,43
1,32
120
253,3
19,49
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,71
1,70
1,68
1,58
1,47
1,35
1,22
254,3
19,50
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,39
1,25
1,01
Tabelas
n2\n1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
Tabelas
2
4999,3
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
4,98
4,79
4,61
3
5403,5
99,16
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,19
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,13
3,95
3,78
4
5624,3
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,65
3,48
3,32
5
5764,0
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,34
3,17
3,02
6
5859,0
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,12
2,96
2,80
7
5928,3
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
2,95
2,79
2,64
8
5981,0
99,38
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,82
2,66
2,51
9
6022,4
99,39
27,34
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,72
2,56
2,41
10
6055,9
99,40
27,23
14,55
10,05
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,63
2,47
2,32
11
6083,4
99,41
27,13
14,45
9,96
7,79
6,54
5,73
5,18
4,77
4,46
4,22
4,02
3,86
3,73
3,62
3,52
3,43
3,36
3,29
3,24
3,18
3,14
3,09
3,06
3,02
2,99
2,96
2,93
2,91
2,73
2,56
2,40
2,25
12
6106,7
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,50
2,34
2,18
13
6125,8
99,42
26,98
14,31
9,82
7,66
6,41
5,61
5,05
4,65
4,34
4,10
3,91
3,75
3,61
3,50
3,40
3,32
3,24
3,18
3,12
3,07
3,02
2,98
2,94
2,90
2,87
2,84
2,81
2,79
2,61
2,44
2,28
2,13
14
6143,0
99,43
26,92
14,25
9,77
7,60
6,36
5,56
5,01
4,60
4,29
4,05
3,86
3,70
3,56
3,45
3,35
3,27
3,19
3,13
3,07
3,02
2,97
2,93
2,89
2,86
2,82
2,79
2,77
2,74
2,56
2,39
2,23
2,08
15
6157,0
99,43
26,87
14,20
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,35
2,19
2,04
16
6170,0
99,44
26,83
14,15
9,68
7,52
6,28
5,48
4,92
4,52
4,21
3,97
3,78
3,62
3,49
3,37
3,27
3,19
3,12
3,05
2,99
2,94
2,89
2,85
2,81
2,78
2,75
2,72
2,69
2,66
2,48
2,31
2,15
2,00
20
6208,7
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,20
2,03
1,88
24
6234,3
99,46
26,60
13,93
9,47
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,12
1,95
1,79
30
6260,4
99,47
26,50
13,84
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,03
1,86
1,70
40
6286,4
99,48
26,41
13,75
9,29
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
1,94
1,76
1,59
60
6313,0
99,48
26,32
13,65
9,20
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,84
1,66
1,47
120
6339,5
99,49
26,22
13,56
9,11
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,73
1,53
1,32
6365,6
99,50
26,13
13,46
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,60
1,38
1,01
141
n2\n1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
142
Tabelas
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,67
1,66
1,65
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04
2,02
2,00
1,98
1,96
31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,52
2,51
2,50
2,49
2,49
2,48
2,47
2,47
2,46
2,46
2,42
2,39
2,36
2,33
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,66
2,62
2,58
636,58
31,60
12,92
8,61
6,87
5,96
5,41
5,04
4,78
4,59
4,44
4,32
4,22
4,14
4,07
4,01
3,97
3,92
3,88
3,85
3,82
3,79
3,77
3,75
3,73
3,71
3,69
3,67
3,66
3,65
3,55
3,46
3,37
3,30
Tabelas
Tabela 7: Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nvel de 5% de probabilidade.
I=n
umero de tratamentos, GLRES= n
umero de graus de liberdade do resduo.
GLRES\I
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
2
17,97
6,09
4,50
3,93
3,64
3,46
3,34
3,26
3,20
3,15
3,11
3,08
3,06
3,03
3,01
3,00
2,98
2,97
2,96
2,95
2,92
2,89
2,86
2,83
2,80
2,77
3
26,98
8,33
5,91
5,04
4,60
4,34
4,17
4,04
3,95
3,88
3,82
3,77
3,74
3,70
3,67
3,65
3,63
3,61
3,59
3,58
3,53
3,49
3,44
3,40
3,36
3,31
4
32,82
9,80
6,83
5,76
5,22
4,90
4,68
4,53
4,42
4,33
4,26
4,20
4,15
4,11
4,08
4,05
4,02
4,00
3,98
3,96
3,90
3,85
3,79
3,74
3,69
3,63
5
37,08
10,88
7,50
6,29
5,67
5,31
5,06
4,89
4,76
4,65
4,57
4,51
4,45
4,41
4,37
4,33
4,30
4,28
4,25
4,23
4,17
4,10
4,04
3,98
3,92
3,86
6
40,41
11,74
8,04
6,71
6,03
5,63
5,36
5,17
5,02
4,91
4,82
4,75
4,69
4,64
4,60
4,56
4,52
4,50
4,47
4,45
4,37
4,30
4,23
4,16
4,10
4,03
7
43,40
12,44
8,48
7,05
6,33
5,90
5,61
5,40
5,24
5,12
5,03
4,95
4,89
4,83
4,78
4,74
4,71
4,67
4,65
4,62
4,54
4,46
4,39
4,31
4,24
4,17
8
45,40
13,03
8,85
7,35
6,58
6,12
5,82
5,60
5,43
5,31
5,20
5,12
5,05
4,99
4,94
4,90
4,86
4,82
4,79
4,77
4,68
4,60
4,52
4,44
4,36
4,29
9
47,36
13,54
9,18
7,60
6,80
6,32
6,00
5,77
5,60
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,64
4,55
4,47
4,39
10
49,07
13,99
9,46
7,83
7,00
6,49
6,16
5,92
5,74
5,60
5,49
5,40
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,82
4,74
4,65
4,56
4,47
11
50,59
14,39
9,72
8,03
7,17
6,65
6,30
6,05
5,87
5,72
5,61
5,51
5,43
5,36
5,31
5,26
5,21
5,17
5,14
5,11
5,01
4,92
4,82
4,73
4,64
4,55
12
51,96
14,75
9,95
8,21
7,32
6,79
6,43
6,18
5,98
5,83
5,71
5,62
5,53
5,46
5,40
5,35
5,31
5,27
5,23
5,20
5,10
5,00
4,90
4,81
4,71
4,62
13
53,20
15,08
10,15
8,37
7,47
6,92
6,55
6,29
6,09
5,94
5,81
5,71
5,63
5,55
5,49
5,44
5,39
5,35
5,32
5,28
5,18
5,08
4,98
4,88
4,78
4,69
14
54,33
15,33
10,35
8,53
7,60
7,03
6,66
6,39
6,19
6,03
5,90
5,80
5,71
5,64
5,57
5,52
5,47
5,43
5,39
5,36
5,25
5,15
5,04
4,94
4,84
4,74
15
55,36
15,65
10,53
8,66
7,72
7,14
6,76
6,48
6,28
6,11
5,98
5,88
5,79
5,71
5,65
5,59
5,54
5,50
5,46
5,43
5,32
5,21
5,11
5,00
4,90
4,80
16
56,32
15,91
10,69
8,79
7,83
7,24
6,85
6,57
6,36
6,19
6,06
5,95
5,86
5,79
5,72
5,66
5,61
5,57
5,53
5,49
5,38
5,27
5,16
5,06
4,95
4,85
17
57,22
16,14
10,84
8,91
7,93
7,34
6,94
6,65
6,44
6,27
6,13
6,02
5,93
5,85
5,79
5,73
5,68
5,63
5,59
5,55
5,44
5,33
5,22
5,11
5,00
4,89
18
58,04
16,37
10,98
9,03
8,03
7,43
7,02
6,73
6,51
6,34
6,20
6,09
6,00
5,92
5,85
5,79
5,73
5,69
5,65
5,61
5,49
5,38
5,27
5,15
5,04
4,93
19
58,83
16,57
11,11
9,13
8,12
7,51
7,10
6,80
6,58
6,41
6,27
6,15
6,06
5,97
5,90
5,84
5,79
5,74
5,70
5,66
5,55
5,43
5,31
5,20
5,09
4,97
20
59,56
16,77
11,24
9,23
8,21
7,59
7,17
6,87
6,64
6,47
6,33
6,21
6,11
6,03
5,96
5,90
5,84
5,79
5,75
5,71
5,59
5,48
5,36
5,24
5,13
5,01
143
144
Tabelas
Tabela 8: Distribuic
ao de Qui-quadrado.Valor crtico de 2 tal que P (2k > 20 ) = .
GL 0,995 0,975
0,05
0,025
0,01
0,005
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
0,00
0,01
0,07
0,21
0,41
0,68
0,99
1,34
1,73
2,16
2,60
3,07
3,57
4,07
4,60
5,14
5,70
6,26
6,84
7,43
8,03
8,64
9,26
9,89
10,52
11,16
11,81
12,46
13,12
13,79
20,71
27,99
35,53
43,28
51,17
59,20
67,33
0,00
0,05
0,22
0,48
0,83
1,24
1,69
2,18
2,70
3,25
3,82
4,40
5,01
5,63
6,26
6,91
7,56
8,23
8,91
9,59
10,28
10,98
11,69
12,40
13,12
13,84
14,57
15,31
16,05
16,79
24,43
32,36
40,48
48,76
57,15
65,65
74,22
3,84
5,99
7,81
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,88
113,15
124,34
5,02
7,38
9,35
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,63
118,14
129,56
6,63
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,43
112,33
124,12
135,81
7,88
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
Tabelas
145
n
d2
A2
D3
D4
1,693
1,023
0
2,574
2,059
0,729
0
2,282
2,326
0,577
0
2,115
2,534
0,483
0
2,004
2,704
0,419
0,076
1,924
2,847
0,373
0,136
1,864
2,970
0,337
0,184
1,816
10
3,078
0,308
0,223
1,777
146
Tabelas
Tabela 10: Tabela de n
umeros aleatorios.
5831
1431
0498
4925
3593
2626
9704
2853
7697
2218
4756
1290
2402
6421
0118
0099
7192
4003
1180
9595
9763
0693
1277
6956
2608
4081
1498
2372
7666
9964
1963
0274
4805
0887
4045
2471
8983
4587
1073
3788
0329
2648
6264
9312
4626
2129
5038
4956
7262
5170
4168
6591
4057
0203
7779
1320
4845
4461
4144
8902
8640
4874
1390
3486
0425
1298
9695
9066
4696
2457
6552
5121
4774
2775
9329
9471
4046
3462
2647
8821
0852
6009
2746
4898
5475
5119
6260
6327
7236
7337
3101
2711
4777
1302
4268
2013
0792
3924
1070
1221
5373
1947
7911
6165
4664
1923
0222
0037
9335
5535
2388
4000
6172
1086
2552
5508
3755
6247
4188
9928
5232
5881
4593
8988
6237
1976
8292
1470
9471
5393
3719
5709
1128
9006
1226
0600
2456
9362
9038
3585
8640
7370
4724
1096
4035
8793
1762
6866
5872
8982
7386
9907
3871
8134
6202
9743
7458
2611
4037
1329
6621
4941
9508
4079
7333
6740
5436
3955
2129
8781
8916
9463
7857
2886
0458
9986
7369
2012
7179
5227
4400
4945
6309
1770
8369
0264
4185
2769
6732
3763
4682
5101
5428
8048
6563
5044
7775
9149
6774
3203
7116
3589
9651
4891
0745
0240
1073
7862
7552
3546
5409
8298
1681
4945
8034
9234
5522
4353
3418
7204
1667
9374
9449
7190
4898
7637
5214
6566
6958
3488
6998
1856
5210
0494
4539
2168
4028
8868
7871
9239
0360
1160
7811
1366
7198
3338
8247
7558
2739
6426
8095
9937
3830
0725
2753
6569
3786
6483
6160
7616
8491
3444
7533
2278
9299
1453
6438
7790
3728
2868
4394
3027
7012
4664
3756
0741
1126
2212
8422
8139
3983
1538
4025
5109
9363
2411
1408
3346
1354
1637
3293
8902
4499
6059
8925
5854
9764
6343
7496
4263
7151
0849
6506
6916
7209
8914
4186
4360
9928
3694
9895
7137
4897
3972
0069
4826
4321
0833
0818
9219
7532
8150
3768
1854
6877
2178
8880
4410
3750
2447
3248
0628
3949
5433
8456
7700