Livro Curso Basico de Estatistica - Prof. Marcelo de Paula - V6

UNIVERSIDADE FEDERAL DO OESTE DA BAHIA
CENTRO DAS CIÊNCIAS EXATAS E DAS TECNOLOGIAS
CURSO BÁSICO DE ESTATÍSTICA

Prof. Dr. Marcelo de Paula
Sexta Versão - Junho de 2021

Resumo
Neste material didático apresentamos um curso básico de estatı́stica com o objetivo de atender aos cursos de
graduação da Universidade Federal do Oeste da Bahia, em particular aos cursos do Centro das Ciências Exatas e
das Tecnologias (CCET), do Centro das Humanidades (CEHU) e do Centro das Ciências Biológicas e da Saúde
(CCBS). Ao longo de todo o texto abordarmos os principais tópicos em estatı́stica descritiva, inferência estatı́stica
via técnicas de estimação de parâmetros e via testes de hipótese. Também abordamos de maneira introdutória os
modelos de regressão. Além de proporcionar um primeiro contato com a Estatı́stica, este material didático tem
como pretensão dar um suporte necessário e suficiente para o prosseguimento e aprofundamento nos principais
tópicos em Estatı́stica.
Na primeira parte deste material didático, fazemos um breve relato histórico do desenvolvimento da Ciência
Estatı́stica. Explanamos a natureza das variáveis e, em seguida, abordamos o operador matemático somatório e
sua extrema importância para o desenvolvimento do estudo da análise estatı́stica quantitativa. Diversos exemplos
e exercı́cios com o somatório são apresentados a fim de ilustrar suas propriedades e operações.
Na segunda parte apresentamos as medidas de tendência central e as medidas de dispersão para a realização
das análises descritivas dos dados. Adicionalmente apresentamos também todo o tratamento descritivo para dados
agrupados em classes. A apresentação tabular e gráfica é usualmente adotada para o tratamento descritivo dos
dados.
Na terceira parte apresentamos a teoria das probabilidades com ênfase nas variáveis aleatórias e nos modelos
probabilı́sticos. Modelos são descrições aproximadas da realidade cujo objetivo é substituir, de maneira simplificada
e objetiva, um problema real. Podemos afirmar que um modelo é uma tentativa de representar as caracterı́sticas
mais importantes de um problema para a tomada de decisões. Dessa maneira, os modelos demandam um nı́vel
adicional de abstração por ser descrições aproximadas de modelos. Por meio do formalismo matemático tentamos
substituir nosso modelo do problema real por um modelo matemático, necessário para o prosseguimento dos es-
tudos em amostragem e inferência estatı́stica via técnicas de estimação de parâmetros populacionais. Os modelos
probabilı́sticos estudados neste material são: modelo de Bernoulli, modelo Binomial, modelo de Poisson e o modelo
Normal (também denominado de modelo Gaussiano).
Na quarta parte deste material didático trabalhamos a inferência estatı́stica cujo intuito é tecer afirmações a
respeito de uma população (também denominada de conjunto universo) por meio de parte dela, isto é, por meio
um conjunto representativo de valores denominada amostra. Diferentemente da estatı́stica descritiva, que pode
ser vista como a simples apresentação dos dados cujo poder de decisão do analista é bem limitado, a inferência
estatı́stica generaliza as decisões obtidas na amostra para a população aumentando consideravelmente o poder de
decisão do analista. A possibilidade de erro é inerente ao processo de inferência, ou seja, sempre que estudamos
uma população a partir de uma amostra, existe a possibilidade de cometermos algum tipo de erro de conclusão.
O principal papel da Inferência Estatı́stica é fornecer métodos que permitam quantificar esse erro provável. A
partir do processo de amostragem probabilı́stica e das técnicas clássicas de estimação pontual e intervalar dos
parâmetros populacionais, pretende-se possibilitar ao estudante uma compreensão teórica e prática dos principais
procedimentos de estimação afim de subsidiar os principais testes estatı́sticos paramétricos.
Na quinta parte apresentamos a teoria dos testes de hipóteses. Frequentemente é necessário tomar decisões
a respeito das populações, baseado nas informações da(s) amostra(s). Para se tomar decisões é apropriado a
formulação de hipóteses, que podem ser verdadeiras ou não. A tomada de decisão será então baseada no teste
desta hipótese. Um teste de hipótese é um método de inferência estatı́stica usando dados de um estudo cientı́fico.
É um procedimento estatı́stico baseado na análise de uma amostra, através da teoria de probabilidades, usado para
avaliar determinados parâmetros que são desconhecidos numa população. Embora a teoria dos testes de hipótese
e a teoria dos intervalos de confiança sejam deveras semelhantes em seu objetivo principal de inferir, é necessário
salientar a distinção conceitual por meio da definição de hipótese. A teoria dos testes de hipóteses tem uma grande
importância em diversas áreas do conhecimento, pois uma decisão errada pode levar a grandes prejuı́zos. Nosso
intuito é demonstrar os procedimentos usuais para se testar hipóteses sobre os principais parâmetros populacionais.
Na sexta parte deste material didático abordamos um dos procedimentos estatı́sticos mais difundidos e utili-
zados nas mais diversas ciências: a modelagem por regressão. Atualmente, a análise de regressão é uma das mais
importantes técnicas estatı́sticas, sendo utilizada em aplicações de diversas áreas como engenharia, medicina, eco-
nomia, etc. Além disso, a modelagem por regressão sofreu um grande impulso desde o desenvolvimento dos modelos
lineares generalizados (MLGs), podendo ser interpretada como uma generalização do modelo de regressão linear
tradicional. Apresentamos a correlação linear entre duas variáveis quantitativas, a regressão linear simples bem
como sua abordagem matricial, demonstramos vários resultados importantes associados ao método dos mı́nimos
quadrados e abordamos o ajustamento de modelos não lineares nos parâmetros, porém linearizáveis. Introduzimos
a regressão linear múltipla bem como os modelos lineares generalizados.
Palavras-chave: Estatı́stica descritiva, modelos probabilı́sticos, teoria da amostragem, inferência estatı́stica,

técnicas de estimação, testes de hipóteses, regressão linear.
Universidade Federal do Oeste da Bahia
Centro das Ciências Exatas e das Tecnologias Prof. Dr. Marcelo de Paula
Sumário
I Introdução e Conceitos Básicos 8

1 Introdução 9
1.1 Um breve relato histórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Alguns conceitos básicos em estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Algumas aplicações da estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Natureza das variáveis e representações gráficas 12

2.1 Variáveis qualitativas nominais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Variáveis qualitativas ordinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Variáveis quantitativas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Variáveis quantitativas contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Somatório 22
3.1 Propriedades do Somatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Operações com o Somatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Exercı́cios propostos sobre somatório 27
II Estatı́stica Descritiva 28
5 Medidas de Tendência Central ou Posição Central 29
5.1 Média aritmética ou simplesmente média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.4 Diferenças entre média, moda e mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.5 Propriedades da média aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.6 Exemplo de aplicação em saúde pública . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6 Medidas de Dispersão 37
6.1 Amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.2 Desvio médio absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.4 Desvio padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
6.5 Coeficiente de variação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.6 Propriedades da variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.7 Exemplo de aplicação na indústria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
7 Análise descritiva para dados agrupados em classes 43

7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.2 Ilustração com dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.3 Apresentação tabular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7.4 Distribuições de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
7.5 Frequência absoluta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
7.6 Medidas de posição ou tendência central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.7 Frequência acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.8 Frequência acumulada relativa percentual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.9 Média para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.10 Mediana para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.11 Moda bruta para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.12 Moda de Czuber para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.13 Medidas de dispersão para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.14 Variância para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.15 Desvio padrão para dados agrupados em classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.16 Coeficiente de variação para dados agrupado em classes . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.17 Medidas separatrizes ou quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.17.1 Tercil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.17.2 Quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.17.3 Decil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.17.4 Percentil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.18 Medidas de assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.18.1 Primeiro coeficiente de assimetria de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.18.2 Segundo coeficiente de assimetria de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.18.3 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
7.18.4 Coeficiente de assimetria via método dos momentos . . . . . . . . . . . . . . . . . . . . . . . 61
7.19 Medidas de curtose ou achatamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.19.1 Coeficiente percentı́lico de curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.20 Coeficiente de curtose via métodos dos momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
8 Exercı́cios propostos sobre estatı́stica descritiva 64
III Probabilidade e Variáveis Aleatórias 71

9 Introdução à teoria das probabilidades 72
9.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.2 Operações básicas com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.3 Propriedades básicas com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
10 Probabilidades 78
10.1 Partição do espaço amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
10.2 Teorema da probabilidade total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
10.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
11 Variáveis aleatórias discretas 82

11.1 Exemplo de variável aleatória discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
11.2 Função distribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
11.3 Esperança matemática de uma Variável aleatória discreta . . . . . . . . . . . . . . . . . . . . . . . . 84
11.4 Variância de uma variável aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
11.5 Propriedades da esperança matemática e da variância . . . . . . . . . . . . . . . . . . . . . . . . . . 85
11.5.1 Propriedades da esperança de uma variável aleatória . . . . . . . . . . . . . . . . . . . . . . . 85
11.5.2 Propriedades da variância de uma variável aleatória . . . . . . . . . . . . . . . . . . . . . . . 86
11.6 Covariância: variância da soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
11.6.1 Exemplo numérico para motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
11.6.2 Propriedades da covariância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
11.6.3 Matriz de variâncias e covariâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
11.7 Exemplo de aplicação em jogos de azar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
11.8 Exemplo de aplicação em empresas seguradoras de veı́culos . . . . . . . . . . . . . . . . . . . . . . . 98
11.9 Exemplo de aplicação na área comercial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
11.10Exemplo de aplicação em apostas e premiações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
11.11Distribuição uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
12 Variáveis aleatórias contı́nuas 106

12.1 Definição e conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
12.2 Função distribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
12.3 Mediana de uma variável aleatória contı́nua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
12.4 Moda de uma variável aleatória contı́nua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
12.5 Esperança matemática e variância de uma variável aleatória contı́nua . . . . . . . . . . . . . . . . . . 107
12.6 Exemplo de aplicação genérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
12.7 Exemplo de aplicação na engenharia de tráfego rodoviário . . . . . . . . . . . . . . . . . . . . . . . . 110
12.8 Exemplo de aplicação na engenharia industrial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
13 Modelo ou Distribuição de Bernoulli 116
14 Modelo ou Distribuição Binomial 118

14.1 Exemplo de aplicação na área genética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
14.2 Exemplo de aplicação na exploração de petróleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
15 Distribuição ou modelo de Poisson 121

15.1 Exemplo de aplicação em doenças raras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
15.2 Exemplo de aplicação: abalos sı́smicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
16 Distribuição da soma de distribuições de Poisson 127

16.1 Exemplo de aplicação no tráfego urbano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
16.2 Exemplo de aplicação em modelagem de acidentes em rodovias . . . . . . . . . . . . . . . . . . . . . 129
17 Distribuição Normal 130

17.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
17.2 O modelo normal e suas propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
17.3 Distribuição normal padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
17.4 Exemplo de aplicação: vazão de rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
18 Combinação Linear de Distribuições Normais 146

18.1 Distribuição da soma de distribuições normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
18.2 Exemplo de aplicação genérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
18.3 Exemplo de aplicação em carga de elevadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
19 Exercı́cios sobre probabilidade e variáveis aleatórias 150
IV Inferência Estatı́stica: Técnicas de Estimação de Parâmetros 162

20 Amostragem 163
20.1 Vantagens da amostragem em relação ao censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
20.2 Alguns conceitos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
20.3 Amostragem não-probabilı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
20.4 Amostragem probabilı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
20.5 Numero de amostras: população finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
20.6 Erro padrão da média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
20.7 Fator de correção para populações finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
20.8 Exemplo genérico de aplicação em população finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
21 Estimação pontual de parâmetros 171

21.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
21.2 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
21.3 Exemplo 1: a média amostral como estimador da média populacional . . . . . . . . . . . . . . . . . . 172
21.4 Exemplo 2: vários estimadores não viciados para o mesmo parâmetro populacional . . . . . . . . . . 173
22 Estimação intervalar da média populacional considerando variância populacional conhecida 175

22.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
22.2 Distribuição da média amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
22.3 Construção do intervalo de confiança para a média populacional com variância populacional σ 2
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
22.4 Exemplo 1. Aplicações na indústria de eletrônicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
22.5 Exemplo 2. Aplicações na indústria metalúrgica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
22.6 Confiança versus precisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
22.7 Empate técnico entre intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
23 Estimação intervalar da média populacional considerando variância populacional desconhecida188

23.1 Determinação do tamanho da amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
23.2 Exemplo 1: Aplicações em estudos ambientais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
23.3 Exemplo 2: Aplicações em pesquisas antropométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
23.4 Exemplo 3: Aplicações em estudos de comparação de rendimento acadêmico. . . . . . . . . . . . . . 194
23.5 Fluxograma sı́ntese da estimação da média populacional µ . . . . . . . . . . . . . . . . . . . . . . . . 195
24 Estimação intervalar da proporção populacional 196

24.1 Distribuição da proporção amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
24.2 Exemplo 1: Aplicações em pesquisas de mercado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
24.3 Exemplo 2: Aplicações em biologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
24.4 Exemplo 3: Aplicações em empresas seguradoras de veı́culos . . . . . . . . . . . . . . . . . . . . . . . 200
24.5 Exemplo 4: Aplicações em pesquisa eleitoral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
24.6 Determinação do tamanho da amostra para o caso da proporção populacional . . . . . . . . . . . . . 202
24.7 Porque adota-se o valor numérico 0, 25? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
24.8 Exemplo 5: Procedimento estatı́stico adotado em pesquisas de intenção de voto . . . . . . . . . . . . 204
25 Estimação intervalar da variância populacional 206
26 Estimação da diferença de duas médias populacionais assumindo variâncias conhecidas 207
27 Estimação da diferença de duas médias populacionais assumindo variâncias desconhecidas 209
28 Estimação intervalar da diferença de duas proporções populacionais 210

28.1 Exemplo 1: Aplicações em seguro de veı́culos automotivos . . . . . . . . . . . . . . . . . . . . . . . . 212
28.2 Exemplo 2: Aplicações em pesquisa de mercado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
29 Exercı́cios sobre inferência estatı́stica via técnicas de estimação 213
V Inferência Estatı́stica: Testes de hipótese 221

30 Conceitos básicos em testes de hipóteses 222
30.1 Elementos básicos de um teste de hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
30.2 Tipo de erros associados a um teste de hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
30.3 Tipo de testes de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
31 Testes de hipótese para a média populacional assumindo variância conhecida 225

31.1 Construção do teste e formulação da hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
32 Testes de hipótese para a média populacional assumindo variância desconhecida 226

32.2 Exemplo 1: Aplicações na indústria de pneus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
32.3 Exemplo 2: Aplicações em pesquisas antropométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
32.4 Exemplo 3: Aplicações em estudos de rendimento acadêmico . . . . . . . . . . . . . . . . . . . . . . 229
33 Testes de hipótese para a proporção populacional 230

33.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
33.3 Exemplo 1: Aplicações em pesquisas de satisfação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
33.4 Exemplo 2: Aplicações em biologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
33.5 Exemplo 3: Aplicações em empresas seguradoras de veı́culos . . . . . . . . . . . . . . . . . . . . . . . 233
34 Testes de hipótese para a variância populacional 234

35 Testes de hipótese para a diferença de duas médias populacionais assumindo variâncias co-
nhecidas 237
35.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
36 Testes de hipótese para a diferença de duas médias populacionais assumindo variâncias des-
conhecidas 239
36.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
36.3 Exemplo 1: Aplicações em estudos ambientais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
36.4 Exemplo 2: Aplicações em estudos de comparação de rendimento acadêmico. . . . . . . . . . . . . . 242
36.5 Exemplo 3: Aplicações no comércio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
37 Testes de hipótese para dados pareados 244

37.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
37.2 Construção do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
37.3 Exemplo 1: Aplicações em dieta de emagrecimento humano . . . . . . . . . . . . . . . . . . . . . . . 245
37.4 Exemplo 2: Aplicações em dieta de engorda de frangos . . . . . . . . . . . . . . . . . . . . . . . . . . 246
37.5 Exemplo 3: Aplicações em dieta de cães . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
38 Testes de hipótese para a diferença de duas proporções populacionais 248

38.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
38.2 Construção e formulação do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
38.3 Exemplo 1. Aplicação genérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
39 Testes de hipóteses para duas variâncias populacionais 251

39.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
39.2 Distribuição da estatı́stica F-Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
40 Análise de variância 253

40.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
40.2 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
40.3 Fontes de variabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
40.4 Formulação da hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
40.5 Distribuição da estatı́stica F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
40.6 Exemplo de aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
40.7 Exercı́cio proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
41 Exercı́cios sobre testes de hipóteses e análise de variância 261
VI Regressão Linear 268

42 Correlação 269
42.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
42.2 Um breve relato histórico sobre correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
42.3 Tipos de correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
42.4 Coeficiente de Correlação Linear de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
43 Regressão Linear Simples 273

43.1 Modelo Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273
43.2 Exemplo de aplicação na engenharia agronômica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
43.3 Resı́duos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
43.4 Abordagem matricial do modelo linear simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
43.5 Obtenção dos estimadores via método dos mı́nimos quadrados . . . . . . . . . . . . . . . . . . . . . . 279
44 Ajustamento de modelos linearizáveis 282

44.1 Modelo exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
44.2 Modelo potência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
44.3 Quadro resumo dos modelos ajustados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
44.4 Exemplo de aplicação em empresas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
44.5 Exemplo de aplicação em engenharia florestal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
45 Regressão Linear Múltipla 299

45.1 Estimação de β pelo método dos mı́nimos quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
46 Exercı́cios sobre regressão linear simples 301
Curso Básico de Estatı́stica 7

Parte I
Introdução e Conceitos Básicos

1 Introdução
A estatı́stica descritiva é um ramo da Ciência Estatı́stica que aplica inúmeras técnicas para descrever e
sumarizar um conjunto de dados, seja amostra ou população. Esta diferencia-se da estatı́stica inferencial, pois seu
objetivo é coletar, organizar, resumir, analisar e interpretar os dados sem que haja um aprendizado ou conclusões
indutivas sobre a população. Este fato faz da estatı́stica descritiva independente dos outros ramos. A apresentação
tabular e gráfica é usualmente adotada para o tratamento descritivo dos dados.
Neste material didático fazemos um breve relato histórico do desenvolvimento da Ciência Estatı́stica, em
seguida abordamos o operador somatório e sua extrema importância para o desenvolvimento deste estudo, apre-
sentamos as medidas de tendência central e as medidas de dispersão. Além de propiciar um primeiro contato com
a Estatı́stica, esta primeira parte deste material didático tem como pretensão dar um suporte básico e necessário
para o prosseguimento dos estudos em Inferência Estatı́stica.
1.1 Um breve relato histórico
A estatı́stica é um ramo do conhecimento humano (área da matemática) que surgiu da necessidade de mani-
pulação dos dados coletados, e da necessidade de extrair informações de interesse dos mesmos. A palavra estatı́stica
deriva da expressão status, em latim, e significa o estudo do estado, em virtude das coletas de dados na antiguidade
terem se constituı́do essencialmente de levantamentos promovidos pelo Estado. Particularmente na Roma antiga,
tais levantamentos buscavam o registro de todos os indivı́duos de alguma camada social da sociedade, bem como o
inventário de suas propriedades, com a finalidade de determinar como e quem deveria ser taxado e convocado ao
serviço militar.
Esses levantamentos extensivos eram chamados censos, sendo promovidos por um magistrado chamado censor,
cargo esse criado em 443 A.C. Posteriormente, o cargo passou a compreender outras funções, como a supervisão
moral dos cidadãos (daı́ decorrendo, igualmente, palavra censura).
Com o desenvolvimento do conceito de método cientı́fico a partir do século XVI, a estatı́stica viria a desempe-
nhar um papel fundamental na ciência, por possibilitar um tratamento formal de dados experimentais. Foi pensada
pelos ingleses, no século XVI, como uma ciência polı́tica, destinada a descrever caracterı́sticas de um estado ou
paı́s, tais como população, área, riqueza e recursos naturais, envolvendo compilações de dados e gráficos.
Em 1662, John Graunt1 publicou informes estatı́sticos sobre nascimentos e mortes. A partir daı́ deu-se inı́cio
ao desenvolvimento da probabilidade e estatı́stica, sobretudo a partir do século XVII, com o estudo das grandes
epidemias que assolavam o mundo, dando ensejo ao desenvolvimento da demografia. Em cada século seguinte mais
e mais áreas foram se incorporando ao conjunto das que faziam uso da estatı́stica.
O conceito de probabilidade, gradualmente desenvolvido a partir do século seguinte, fez surgir a noção de que
as informações obtidas em amostras poderiam ser generalizadas para a totalidade de uma população.
Assim, o alto custo despendido na realização de censos poderia agora ser reduzido em muito, promovendo
uma verdadeira “explosão” quanto ao uso de técnicas estatı́sticas nas décadas seguintes.
A partir de 1925, com os trabalhos de R.A. Fisher2 , a estatı́stica iniciou-se como método cientı́fico, então, o
trabalho do estatı́stico passou a ser o de ajudar a planejar experimentos, interpretar e analisar os dados experimen-
tais e apresentar os resultados de maneira a facilitar a tomada de decisões razoáveis, embora os trabalhos pioneiros
de Gauss no fim do século anterior e dos trabalhos de Gosset3 de 1908, publicados com o pseudônimo de Student,
foram de extrema importância.
Em 1936, o sociólogo americano George Gallup4 inaugurou a prática da pesquisa de intenção de voto pela
qual uma amostra representativa da população (considerando diferentes nı́veis de escolaridade, renda, idade) era
entrevistada. A prática ganhou enorme popularidade a partir daquele ano, uma vez que as projeções da pesquisa
foram confirmadas nas urnas.
Na última década, com a grande revolução da informática, houve um avanço significativo das áreas de proba-
bilidade e estatı́stica, com o desenvolvimento de softwares mais poderosos, deixando à disposição do pesquisador
muitas ferramentas alternativas ao seu trabalho.
1 John Graunt, nascido em 24 de abril de 1620 em Londres, e falecido em 18 de abril de 1674 na mesma cidade. Foi um cientista e
demógrafo britânico, precursor na construção de Tábuas de Mortalidade. Esta obra continha um rudimento de tábua de vida, obtida
por meio de dados sobre enterros em Londres.
2 Sir Ronald Aylmer Fisher, membro da Royal Society (FRS), nascido em 17 de fevereiro de 1890 na cidade de Londres, e falecido
em 29 de julho de 1962 na cidade de Adelaide, Austrália. Foi um estatı́stico, biólogo evolutivo e geneticista inglês.
3 William Sealy Gosset, nascido em 13 de Junho de 1876 e falecido em 16 de Outubro de 1937. Foi um quı́mico e matemático inglês,
mais conhecido pelo pseudónimo Student e pelo seu trabalho na distribuição t-Student.
4 George Horace Gallup, nascido em 18 de novembro de 1901 e falecido em 26 de julho de 1984. Foi um estatı́stico estado-unidense,
inventor do sistema de Pesquisa Gallup de sucesso, um método de pesquisa de amostras estatı́sticas de medição da opinião pública.

1.2 Alguns conceitos básicos em estatı́stica
Para darmos inı́cio aos estudos e nos aprofundarmos nos conteúdos dos próximos Capı́tulos deste livro, é
necessário abordarmos alguns conceitos básicos em estatı́stica, conforme a seguir.
Ciência Estatı́stica: Ciência voltada à coleta, organização, resumo, análise e interpretação dos dados.
População: Corresponde ao conjunto de todos os indivı́duos de um sistema ou conjunto que queremos

descrever, também denominado de conjunto universo. É sempre um conjunto de elementos com caracterı́sticas
em comum.
Indivı́duo: É um elemento qualquer da população.
Censo: Atividade de inspeção de todos os elementos de uma população, em relação a uma ou mais variáveis
descritoras.
Parâmetro: É uma medida numérica qualquer calculada para descrever uma determinada caracterı́stica de
toda uma população. O parâmetro é sempre populacional.
Amostra: Subconjunto ou parte da população, cujos elementos são avaliados utilizando uma ou mais
variáveis descritoras. O processo de generalização da informação contida na amostra para a totalidade de
uma população é chamada de inferência estatı́stica.
Amostragem: Processo de obtenção de amostra(s).
Estatı́sticas: são medidas numéricas quaisquer calculadas para descrever caracterı́sticas de uma amostra.
Estatı́stica descritiva: Parte da Ciência Estatı́stica que tem como objetivo descrever populações ou amos-
tras. Em geral se refere à maneira de apresentar um conjunto de dados resumindo as suas informações em
algumas medidas descritivas. Tal resumo pode ser representado em tabelas e gráficos.
Inferência estatı́stica: É a parte da Ciência Estatı́stica que baseia-se na teoria das probabilidades para
estabelecer conclusões sobre todo uma população, quando se observou apenas uma parte (amostra) desta
população. Em outras palavras, é a extrapolação dos dados observados segundo certos critérios.
A Figura 1 apresenta o esquema estatı́stico simplificado entre população e amostra.
Figura 1: Esquema estatı́stico simplificado entre população e amostra

É necessário destacar que a Estatı́stica é uma Ciência por si só. No entanto, trata-se de uma ferramenta para
os pesquisadores das outras áreas do saber. Neste contexto, para que ela seja bem utilizada é necessário conhecer
os seus fundamentos básicos, bem como e os seus princı́pios e raciocı́nios.
Além disso, é fundamental que os pesquisadores de todas as áreas tenham a possibilidade de desenvolver um
espı́rito crı́tico acerca de sua pesquisa empreendida.
1.3 Algumas aplicações da estatı́stica
As mais diversas áreas aplicam diretamente o uso da estatı́stica, dentre elas destacamos:
Demografia: A Demografia é uma área da ciência geográfica que estuda a dinâmica populacional humana
e seu objeto de estudo engloba as dimensões, estrutura e distribuição das diversas populações humanas. Tais
distribuições não são estáticas, variando devido à natalidade, mortalidade, migrações e envelhecimento. Em linhas
gerais é responsável pelo estudo sobre fenômenos populacionais, sociais e ambientais, estudo sobre o crescimento
ou decrescimento populacional. A análise demográfica centra-se também nas caracterı́sticas de toda uma sociedade
ou um grupo especı́fico, definido por critérios como a Educação, a nacionalidade, religião e etnia.
Ecologia: A Ecologia é a ciência que estuda o meio ambiente e os seres vivos que vivem nele, ou seja, é o
estudo cientı́fico da distribuição e abundância dos seres vivos e das interações que determinam a sua distribuição.
Tais interações podem ser entre seres vivos e/ou com o meio ambiente. Dentre várias técnicas estatı́sticas adotadas
pela ecologia destacamos a estimação de tamanho populacional e o estudo da dinâmica de populações.
Economia: É a ciência que consiste na análise da produção, distribuição e consumo de bens e serviços. A
economia utiliza um conjunto de ferramentas estatı́sticas, denominado econometria, com o objetivo de entender a
relação entre variáveis econômicas por meio da aplicação de um modelo matemático. Outro exemplo é o estudo
sobre a evolução ou previsão da inflação ou rendimento da bolsa de valores ao longo do tempo, por meio de modelos
de previsão para séries temporais.
Indústria: Para garantir a qualidade total dos produtos e serviços, as indústrias adotam o Controle Es-
tatı́stico de Processos (CEP), que é uma ferramenta do chamado Sistema da Qualidade Total, utilizada nos
processos produtivos (e de serviços) com objetivo de fornecer informações para um diagnóstico mais eficaz na
prevenção e detecção de defeitos/problemas nos processos avaliados e, consequentemente, auxilia no aumento da
produtividade/resultados da empresa, evitando desperdı́cios de matéria-prima, insumos e produtos.
Engenharia: A teoria da confiabilidade de sistemas é amplamente adotada nas engenharias, pois trata-se do
estudo confiabilidade de sistemas durante o seu ciclo de vida que, por meio da abordagem estatı́stica, é modelado
por uma distribuição de probabilidade de falhas, tempo de parada, custos associados em manutenção e perda de
produção, por exemplo. A teoria da confiabilidade também estuda o tempo de garantia de um produto.
Medicina: A estatı́stica está presente no estudo do tempo de vida de pacientes com uma determinada
doença, na comparação da eficácia de tratamentos distintos, ou ainda no protocolo de estudos e utilização de um
novo medicamento na população.
Meteorologia: A meteorologia é uma das ciências que estudam a atmosfera terrestre, que tem como foco
o estudo dos processos atmosféricos e a previsão do tempo. Estuda os fenômenos que ocorrem na atmosfera e
as interações entre seus estados dinâmicos, fı́sico e quı́mico, com a superfı́cie terrestre subjacente. As primeiras
previsões numéricas do tempo tornaram-se possı́veis com o desenvolvimento de modelos matemático-meteorológicos
no inı́cio do século XX. A invenção do computador e da Internet tornou mais rápido e mais eficaz o processamento
e o intercâmbio de dados meteorológicos, proporcionando assim um maior entendimento dos eventos meteorológicos
e suas variáveis e, conseqüentemente, tornou possı́vel uma maior precisão na previsão de temperaturas e chuvas.
Polı́tica: A pesquisa de intenção de votos num perı́odo de eleição é uma das mais usadas técnicas estatı́sticas
na polı́tica. Por meio da amostragem de eleitores realiza-se a pesquisa que irá ser utilizada para encontrar uma
estimativa percentual de votos para cada um dos candidatos. Além disso, é possı́vel monitorar a popularidade de
um determinado candidato.

2 Natureza das variáveis e representações gráficas
Variáveis são caracterı́sticas da população, comuns a todos os indivı́duos, mas que variam de um indivı́duo
para outro ou no mesmo indivı́duo ao longo do tempo. Em estatı́stica, as variáveis podem ser classificadas em dois
grandes grupos:
Variáveis qualitativas (ou também denominadas de variáveis categóricas): São variáveis cujos dados
são obtidos por meio de classificação em categorias. Não faz sentido mensurá-las, ou seja, atribuir valores
numéricos no indivı́duo. Nesse grupo há dois subgrupos denominados de nominais e ordinais.
Variáveis quantitativas (ou também denominadas de variáveis numéricas): São variáveis cujos dados
são obtidos por meio de mensurações (contagem ou medição). Nesse grupo há dois subgrupos denominados
de discretas e contı́nuas.
2.1 Variáveis qualitativas nominais
As variáveis qualitativas nominais são variáveis em que atribuem-se um nome, qualidade ou categoria. Alguns
exemplos são:
Cor de olho dos indivı́duos de uma comunidade;
Sabor dos alimentos produzidos por uma indústria alimentı́cia;
Sexo biológico dos estudantes de uma grande Universidade;
Etnia dos turistas que visitam anualmente a cidade de Nova Iorque;
Grupo sanguı́neo de doadores de um grande banco de sangue;
Espécie de animais do Cerrado Baiano;
Estações do ano no Hemisfério Norte;
Religião dos moradores do municı́pio de São Paulo;
Estado civil dos indivı́duos adultos que usam o sistema público de saúde;
Naturalidade dos pacientes atendidos em um grande hospital estadual, etc.
A fim de ilustrar uma representação gráfica das variáveis qualitativas nominais, considere os dados dos
estudantes de graduação da UFOB apresentados na Tabela (1), no que diz respeito a variável qualitativa nominal
“sexo biológico”.
Tabela 1: Sexo biológico dos estudantes de graduação da UFOB (Base de Dados SIGAA em 16 de Julho de 2019).
Números absolutos Números Percentuais
Centro Multidisciplinar Masculino Feminino Total Masculino Feminino Total
CCBS 293 608 901 32,5% 67,5% 100%
CCET 571 384 955 59,8% 40,2% 100%
CEHU 321 525 846 37,9% 62,1% 100%
BARRA 177 231 408 43,4% 56,6% 100%
LAPA 231 94 325 71,1% 28,9% 100%
LEM 80 128 208 38,5% 61,5% 100%
SAMAVI 82 170 252 32,5% 67,5% 100%
UFOB 1755 2140 3895 45,06% 54,94% 100%
Fonte: “Perfil dos Estudantes de Graduação da UFOB - Um Retrato dos 3895 Estudantes
Ativos no SIGAA” - Relatório elaborado pela Coordenadoria de Estatı́stica, CEST/PROGRAF
Base de Dados SIGAA em 16 de Julho de 2019.

A partir dos dados expressos na Tabela (1), apresentamos a representação gráfica da variável qualitativa
nominal “sexo biológico”, conforme a Figura (2).
Figura 2: Sexo biológico dos estudantes de graduação ingressantes na UFOB entre 2014 e 2019.
Considere agora os dados dos estudantes de graduação da UFOB apresentados na Tabela (2), no que diz
respeito a variável qualitativa nominal “modalidade do curso”, por ano de entrada.
Tabela 2: Modalidade do curso dos estudantes de graduação da UFOB, por cada ano entrada.
(Base de Dados SIGAA em 16 de Julho de 2019)
Quantitativo absoluto Quantitativo percentual
Ano de Entrada Bacharelado Licenciatura Total Bacharelado Licenciatura Total
2014 394 28 422 93, 4% 6, 6% 100, 0%
2015 736 132 868 84, 8% 15, 2% 100, 0%
2016 818 131 949 86, 2% 13, 8% 100, 0%
2017 863 126 989 87, 3% 12, 7% 100, 0%
2018 909 118 1027 88, 5% 11, 5% 100, 0%
2019 901 134 1035 87, 1% 12, 9% 100, 0%
nominal “modalidade do curso”, conforme a Figura (3).
Figura 3: Modalidade do curso de graduação dos estudantes ingressantes na UFOB entre 2014 e 2019.

Como terceiro exemplo, considere os dados dos estudantes de graduação da UFOB apresentados na Tabela
(3), no que diz respeito a variável qualitativa nominal “naturalidade dos estudantes”, por ano de entrada.
Tabela 3: Naturalidade dos estudantes de graduação da UFOB, por ano de entrada.

Naturalidade Ano de Ingresso
dos Estudantes 2014 2015 2016 2017 2018 2019
AC 0 1 0 0 0 0
AL 0 1 4 2 0 1
AM 1 0 0 1 1 2
AP 0 0 1 0 0 0
BA 367 752 758 792 836 867
CE 3 1 5 6 7 4
DF 7 20 29 45 34 19
ES 0 5 14 1 2 5
GO 12 16 19 23 30 24
MA 0 0 2 2 5 1
MG 11 26 33 26 16 21
MS 1 2 1 1 2 0
MT 1 0 0 3 1 3
PA 0 0 1 1 1 1
PB 0 2 2 0 3 1
PR 1 0 1 6 10 6
PE 3 3 5 15 9 9
PI 3 7 3 8 10 8
RJ 2 3 6 5 7 1
RN 2 0 2 1 1 0
RO 0 0 1 0 0 0
RS 1 1 0 4 5 1
SC 0 0 3 0 3 0
SP 4 26 50 42 37 52
SE 3 1 4 2 2 4
TO 0 1 4 0 2 4
Angola 0 0 0 0 1 0
Benin 0 0 0 0 2 0
Cabo Verde 0 0 1 0 0 0
Gana 0 0 0 0 0 1
Guiné Bissau 0 0 0 1 0 0
Peru 0 0 0 1 0 0
São Tomé e Prı́ncipe 0 0 0 1 0 0
TOTAL 422 868 949 989 1027 1035
nominal “modalidade do curso” por meio da divisão em duas categorias: “natural da Bahia” e “natural de outro
Estado”, conforme ilustrado na Figura (4).

Figura 4: Naturalidade dos estudantes de graduação ingressantes na UFOB entre 2014 e 2019.
2.2 Variáveis qualitativas ordinais
As variáveis qualitativas ordinais são variáveis nominais em que atribuem-se uma ordem. Alguns exemplos
são:
Gravidade de uma doença (estado inicial, intermediário, avançado ou terminal);
Infração de trânsito (leve, moderada, grave ou gravı́ssima);
Classificação em um concurso público (primeiro lugar, quinto lugar, etc);
Nı́vel socioeconômico (classes A, B, C, etc), etc.
Opinião sobre um determinado produto ou serviço: ruim, regular, bom ou ótimo.
Nı́vel de vulnerabilidade socioeconômica: baixı́ssima, baixa, moderada, alta ou altı́ssima, etc
Para darmos um exemplo gráfico, apresentamos na Figura (5) a escala de classificação do Índice de Vulnera-
bilidade Socioeconômica (IVS) dos estudantes de graduação da UFOB.
Figura 5: Escala de classificação do Índice de Vulnerabilidade Socioeconômica (IVS) dos estudantes de graduação
da UFOB.
Podemos perceber, a partir da Figura (5), que a variável qualitativa ordinal “Índice de Vulnerabilidade
Socioeconômica (IVS)” é composta por seis nomes (atributos) ordenados: baixı́ssima, baixa, mediana, moderada,
alta e altı́ssima.

2.3 Variáveis quantitativas discretas
As variáveis quantitativas discretas são aquelas resultantes, em geral, de dados contagem. Alguns exemplos
são:
Número de filhos por famı́lia em uma determinada região brasileira;

Número semestral de matrı́culas em componentes curriculares em uma determinada Universidade;
Número diário de acidentes em um determinado trecho de uma rodovia;
Número de estudantes jubilados anualmente em uma universidade;
Número diário de ovos depositados por uma espécie de tartaruga marinha, etc.
Para ilustrarmos a representação gráfica de alguns exemplos de variáveis quantitativas discretas, a Tabela (4)
apresenta a distribuição do número de turmas/componentes e do número de matrı́culas em componentes curriculares
para cada Centro, e para a UFOB, durante o perı́odo compreendido entre o semestre letivo 2016.1 ao semestre
letivo 2018.2.
Tabela 4: Número de turmas/componentes e número de matrı́culas em componentes por Centro.
Semestre Letivo 2018.1 Semestre Letivo 2018.2

Nº de Nº de Nº Médio de Nº de Nº de Nº Médio de
Turmas/ Matriculas em Estudantes por Turmas/ Matriculas em Estudantes por
CENTRO Compon. Componentes Turma/Compon. Compon. Componentes Turma/Compon.
CCBS 278 6387 (30,0%) 23,0 266 5700 (29,6%) 21,4
CCET 257 4899 (23,0%) 19,1 227 4084 (21,2%) 18,0
CEHU 201 3600 (16,9%) 17,9 201 3701 (19,2%) 18,4
BARRA 121 2514 (11,8%) 20,8 130 2462 (12,8%) 18,9
LAPA 89 1558 (7,3%) 17,5 83 1368 (7,1%) 16,5
LEM 71 1138 (5,3%) 16,0 70 884 (4,6%) 12,6
SAMAVI 62 1224 (5,7%) 19,7 52 1044 (5,4%) 20,1
UFOB 1079 21320 (100%) 19,8 1029 19243 (100%) 18,7
CCBS 227 4677 (27,2%) 20,6 251 4594 (30,0%) 18,3
CCET 206 4186 (24,4%) 20,3 203 3589 (23,4%) 17,7
CEHU 176 2531 (14,7%) 14,4 169 2368 (15,4%) 14,0
BARRA 104 2054 (12,0%) 19,8 96 1774 (11,6%) 18,5
LAPA 71 1702 (9,9%) 24,0 66 1206 (7,9%) 18,3
LEM 70 908 (5,3%) 13,0 65 807 (5,3%) 12,4
SAMAVI 55 1117 (6,5%) 20,3 56 992 (6,5%) 17,7
UFOB 909 17175 (100%) 18,9 906 15330 (100%) 16,9
CCBS 151 2102 (16,9%) 13,9 171 2335 (20,7%) 13,7
CCET 194 3376 (27,1%) 17,4 171 3042 (26,9%) 17,8
CEHU 130 2608 (20,9%) 20,1 136 2301 (20,4%) 16,9
BARRA 70 1450 (11,6%) 20,7 78 1332 (11,8%) 17,1
LAPA 45 1047 (8,4%) 23,3 45 780 (6,9%) 17,3
LEM 46 784 (6,3%) 17,0 46 611 (5,4%) 13,3
SAMAVI 47 1090 (8,8%) 23,2 44 901 (8,0%) 20,5
UFOB 683 12457 (100%) 18,2 691 11302 (100%) 16,4
Fonte: Relatório Geral de Desempenho Acadêmico dos Estudantes de Graduação da UFOB elaborado pela
Coordenadoria de Estatı́stica, CEST/PROGRAF - Base de Dados do SIGAA - 2016.1 a 2018.2.

A partir dos dados expressos na Tabela (4), apresentamos a representação gráfica das variáveis quantitativas
discretas “Número de matrı́culas em componentes curriculares” e “Número de turmas/componentes ofertadas pela
UFOB” durante seis semestres letivos consecutivos, conforme ilustradas nas Figuras (6) e (7).
Figura 6: Número de matrı́culas em componentes curriculares ofertados pela UFOB durante seis semestres.
Figura 7: Número de turmas/componentes ofertadas pela UFOB durante seis semestres.
Um outro exemplo de variável quantitativa discreta é apresentado na Tabela (5) em que temos o número de
vagas ofertadas pela UFOB e o número de candidatos inscritos pelo SISU entre os anos de 2014 e 2018.
Tabela 5: Quantitativo de vagas ofertadas e número de candidatos inscritos pelo SISU.

Ano Vagas Ofertadas Inscritos no SISU
2014 474 24150
2015 884 16954
2016 924 16455
2017 996 19014
2018 996 16304

A partir dos dados expressos na Tabela (5), apresentamos a representação gráfica das variáveis quantitati-
vas discretas “Número de vagas ofertadas pela UFOB” e “Número de candidatos inscritos pelo SISU”, conforme
ilustrado na Figura (8).
Figura 8: Número de vagas ofertadas e número de candidatos inscritos pelo SISU entre 2014 e 2018.
2.4 Variáveis quantitativas contı́nuas
As variáveis quantitativas contı́nuas são aquelas variáveis resultantes de medições. Alguns exemplos são:
Altura e peso dos estudantes do ensino médio da cidade de Barreiras-BA;
Idade dos consumidores de uma grande rede atacadista;
Renda per capita das famı́lias moradoras de um determinado bairro;
Salário dos funcionários em uma empresa prestadora de serviços;
Índice de massa corporal dos frequentadores de uma academia de ginástica;
Vazão de um rio em um determinado ponto;
Temperatura diária de um municı́pio brasileiro;
Tempo de gestação de uma espécie de mamı́fero;
Pressão arterial sistólica e diastólica dos pacientes de um hospital;
Tempo de espera para o atendimento ao cliente em uma empresa;
Volume diário de chuva em uma região brasileira durante a época chuvosa;
Área total degradada em uma grande área de proteção permanente, etc.

Para ilustrarmos a representação gráfica de um exemplo de variável quantitativa contı́nua, a Tabela (6)
apresenta a distribuição de frequências da idade dos 3895 estudantes de graduação regularmente matriculados na
UFOB (Base de dados SIGAA: 16/07/2019).
Tabela 6: Distribuição do número de estudantes da UFOB quanto a idade.
Faixa Número de Frequência Relativa Frequência Relativa

Etária Estudantes Percentual Acumulada Percentual
Até 17 anos 29 0,74% 0,74%
18 ou 19 anos 664 17,05% 17,79%
20 ou 21 anos 1043 26,78% 44,57%
22 ou 23 anos 850 21,82% 66,39%
24 ou 25 anos 507 13,02% 79,41%
26 ou 27 anos 220 5,65% 85,06%
28 ou 29 anos 155 3,98% 89,04%
30 ou 31 anos 106 2,72% 91,76%
32 ou 33 anos 80 2,05% 93,81%
34 ou 35 anos 63 1,62% 95,43%
36 ou 37 anos 58 1,49% 96,92%
38 ou 39 anos 28 0,72% 97,64%
40 ou 41 anos 29 0,74% 98,38%
42 ou 43 anos 15 0,39% 98,77%
44 ou 45 anos 13 0,33% 99,10%
46 ou 47 anos 12 0,31% 99,41%
48 ou 49 anos 7 0,18% 99,59%
50 ou 51 anos 3 0,08% 99,67%
52 ou 53 anos 4 0,10% 99,77%
54 ou 55 anos 2 0,05% 99,82%
56 ou 57 anos 3 0,08% 99,90%
58 ou 59 anos 2 0,05% 99,95%
60 anos ou mais 2 0,05% 100,00%
Total UFOB 3895 100,0%
Fonte: Relatório Perfil dos Estudantes de Graduação da UFOB elaborado pela
Coordenadoria de Estatı́stica, CEST/PROGRAF - Base de Dados SIGAA de 16/07/2019.
A partir dos dados expressos na Tabela (6), apresentamos a representação gráfica da variável quantitativa
contı́nua “Idade dos estudantes de graduação da UFOB”, conforme ilustrado na Figura (9).

Figura 9: Distribuição de frequências da idade dos 3895 estudantes de graduação regularmente matriculados na
UFOB (Base de dados: 16/07/2019).
Considere agora os dados apresentados na Tabela (7) em que temos o rendimento acadêmico médio de cada
Centro Multidisciplinar da UFOB, considerando seis semestres letivos consecutivos.
Tabela 7: Rendimento acadêmico médio de cada Centro Multidisciplinar da UFOB.
Centro Multidisciplinar 2016.1 2016.2 2017.1 2017.2 2018.1 2018.2

CCBS 6,77 6,65 6,89 7,23 7,18 7,20
CCET 5,59 4,75 5,04 5,05 5,10 5,25
CEHU 6,22 6,15 6,42 6,52 6,83 7,10
BARRA 5,57 6,26 6,01 6,26 6,09 6,54
LAPA 4,66 4,57 4,44 4,76 4,67 5,19
LEM 5,13 4,14 4,54 4,58 4,84 5,20
SAMAVI 7,06 7,11 7,30 7,12 7,57 7,55
UFOB 5,98 5,75 5,92 6,16 6,23 6,47
Fonte: Relatório Geral de Desempenho Acadêmico dos Estudantes de Graduação
da UFOB elaborado pela Coordenadoria de Estatı́stica, CEST/PROGRAF
Base de Dados do SIGAA - 2016.1 a 2018.2.

A partir dos dados apresentados na Tabela (7), vamos ilustrar a variável quantitativa contı́nua “rendimento
acadêmico médio” graficamente em duas figuras: A Figura (10) apresenta o rendimento médio de cada Centro
Multidisciplinar da UFOB e a Figura (11) apresenta o rendimento médio geral da UFOB.
Figura 10: Série temporal do rendimento médio* em componentes curriculares considerando cada centro multidis-
ciplinar da UFOB, em seis semestres letivos seguidos.
Figura 11: Série temporal do rendimento médio* geral em componentes curriculares na UFOB, em seis semestres
letivos seguidos.
*O cálculo do rendimento médio desconsidera as matrı́culas canceladas, as matrı́culas trancadas e as reprovações

exclusivamente por faltas.

3 Somatório
Neste Capı́tulo introduzimos o conceito do operador linear somatório. Trata-se de um operador matemático
que denota a soma de n elementos de um conjunto quantitativo P de dados, ou seja, um conjunto de dados discretos
ou contı́nuos. É representado pela letra grega maiúscula (chamada de sigma).
As n observações de um conjunto quantitativo de dados referentes a uma variável qualquer são representadas
por X1 , X2 , . . . , Xn . Outra notação também muito utilizada em estatı́stica para representarmos um conjunto de
dados é Xi , i = 1, 2, . . . , n. Sua soma é representada por
n
X
Xi
i=1
Lê-se “somatório de Xi com i variando de 1 a n”. Ou seja,

n
X
Xi = X1 + X2 + · · · + Xn
i=1
Observação: quando ordenamos um conjunto quantitativo de dados (ou observações) formado por X1 , X2 , . . . , Xn ,
seja em ordem crescente ou em ordem decrescente, denotaremos por X(1) , X(2) , . . . , X(n) . Podemos notar que
n
X n
X
Xi = X(i)
i=1 i=1
Exemplo 1. Seja um conjunto de dados formado por (5, 7, 9, 11, 13). Então temos que seu somatório é dado
por
5
X
Xi = X1 + X2 + X3 + X4 + X5
|{z} |{z} |{z} |{z} |{z}
i=1 5 7 9 11 13
= 5 + 7 + 9 + 11 + 13
5
X
Xi = 45
i=1
Exemplo 2. Seja um conjunto de dados formado por (10, 20, 30, 40, 50, 60, 70, 80, 90, 100). Então temos que
seu somatório é dado por
10
X
Xi = X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9 + X10
|{z} |{z} |{z} |{z} |{z} |{z} |{z} |{z} |{z} |{z}
i=1 10 20 30 40 50 60 70 80 90 100
= 10 + 20 + 30 + 40 + 50 + 60 + 70 + 80 + 90 + 100
10
X
Xi = 550.
i=1
Exemplo 3. Seja um conjunto de dados formado por (19, 22, 14, 23, 20, 17, 26, 19). Então temos que seu
somatório é dado por
8
X
Xi = X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8
|{z} |{z} |{z} |{z} |{z} |{z} |{z} |{z}
i=1 19 22 14 23 20 17 26 19
= 19 + 22 + 14 + 23 + 20 + 17 + 26 + 19
8
X
Xi = 160
i=1

3.1 Propriedades do Somatório
Considere X1 , X2 , . . . , Xn um conjunto quantitativo de dados discretos ou contı́nuos. Seja c uma constante

real arbitrária (c ∈ R). Então as principais propriedades do somatório são:
Propriedade 1. Se o conjunto de dados é formado apenas pela constante c, então o somatório da constante
é dado por n vezes a constante c, ou seja,
Xn
c = nc. (1)
i=1
Demonstração:
n
X
c = X1 + X2 + · · · + Xn
i=1
= c + c + ··· + c
| {z }
n vezes
n
X
c = nc.
i=1
O que demonstra a expressão (1).
Propriedade 2. Se, para cada observação deste conjunto for adicionado ou subtraı́do a constante c, então
seu somatório é dado por
X n Xn
(Xi ± c) = Xi ± nc. (2)
i=1 i=1
Demonstração: Vamos demonstrar para o caso positivo, pois o caso negativo é análogo.
n
X
(Xi + c) = (X1 + c) + (X2 + c) + · · · + (Xn + c)
i=1
= X1 + X2 + · · · + Xn + c + c + · · · + c
| {z } | {z }
somatório de Xi n vezes
n
X n
X
(Xi + c) = Xi + nc.
i=1 i=1
O que demonstra a expressão (2) para o caso positivo.
Propriedade 3. Se, para cada observação deste conjunto quantitativo de dados for multiplicada uma
constante c, então seu somatório é dado por
n
X n
X
Xi c = c Xi . (3)
i=1 i=1
Demonstração:
n
X
Xi c = X1 c + X2 c + · · · + Xn c
i=1
= c (X1 + X2 + · · · + Xn )
n
X Xn
Xi c = c Xi
i=1 i=1
O que demonstra a expressão (3).

Propriedade 4. Sejam duas constantes arbitrárias a e b (a, b ∈ R). Então, pelas propriedades 1, 2 e 3,
temos
Xn X n
(a ± bXi ) = na ± b Xi . (4)
i=1 i=1
Demonstração: Vamos demonstrar para o caso positivo, pois o caso negativo é análogo. Usando as propri-
edades 1, 2 e 3, temos
n
X n
X n
X
(a + bXi ) = a+ bXi
i=1 i=1 i=1
n
X
= na + b Xi
i=1
Propriedade 5. Sejam X e Y duas variáveis quantitativas, então o somatório da soma é a soma dos
somatórios. De forma análoga, o somatório da diferença é a diferença do somatório, ou seja:
n
X n
X n
X
(Xi ± Yi ) = Xi ± Yi . (5)
i=1 i=1 i=1
Demonstração: Vamos demonstrar para o caso positivo, pois o caso negativo é análogo.
n
X
(Xi + Yi ) = (X1 + Y1 ) + (X2 + Y2 ) + · · · + (Xn + Yn )
i=1
= X1 + X2 + · · · + Xn + Y1 + Y2 + · · · + Yn
n
X Xn Xn
(Xi + Yi ) = Xi + Yi .
i=1 i=1 i=1
Observação: Esta propriedade também vale para 3 ou mais variáveis quantitativas.
Propriedade 6. Sejam X e Y duas variáveis quantitativas. Então o somatório do produto é diferente do

produto dos somatórios, isto é,
n
X n
X n
X
Xi Yi 6= Xi Yi . (6)
i=1 i=1 i=1
Em particular, se X e Y são variáveis positivas, isto é, Xi > 0 e Yi > 0, para i = 1, 2, . . . , n, então o
somatório do produto é menor que o produto dos somatórios:
n
X n
X n
X
Xi Yi < Xi Yi . (7)
i=1 i=1 i=1
Demonstração de 7: Vamos demonstrar para o caso em que X e Y são variáveis positivas. Assumindo que
Xi > 0 e Yi > 0, para i = 1, 2, . . . , n, temos que segue a desigualdade:
n
X n
X n
X
Xi Yi < Xi Yi
i=1 i=1 i=1
⇒ X1 Y1 + X2 Y2 + · · · + Xn Yn < (X1 + X2 + · · · + Xn ) (Y1 + Y2 + · · · + Yn )
| {z }
n
P
Yi
i=1
n
X n
X n
X
⇒ X1 Y1 + X2 Y2 + · · · + Xn Yn < X1 Yi + X2 Yi + · · · + Xn Yi
i=1 i=1 i=1

n
P
Como qualquer termo é menor que a soma, isto é, Yi < Yi , então segue imediatamente que
i=1
n
! n
! n
!
X X X
X1 Y1 < X1 Yi , X2 Y2 < X2 Yi , . . . , Xn Yn < Xn Yi ,
i=1 i=1 i=1
ou seja,
n
X n
X n
X
Xi Yi < Xi Yi
i=1 i=1 i=1
O que demonstra o caso particular dado na expressão (7).
3.2 Operações com o Somatório
A partir das propriedades básicas dos somatórios, podemos então realizar operações com os somatórios, isto
é, podemos simplificar expressões algébricas que envolvem o operador somatório, conforme os exemplos a seguir.
n n n
Xi2 = 30, Xi3 = 100 e n = 4, determinar
P P P
Exemplo 1. Seja Xi = 10,
i=1 i=1 i=1
n n
Xi + Xi2 + Xi3 Xi2 + 1 (Xi + 4)
P P
a. e.
i=1 i=1
n n
Xi3 − 10
P P
b. (Xi + 1) f.
i=1 i=1
n n 3 2

P 2 P Xi −2Xi −3Xi
c. (Xi − 2) g. 10
i=1 i=1
Pn
d. (Xi + 5) (Xi − 2)
i=1
Resolução do item a:
n
X n
X n
X n
X
Xi + Xi2 + Xi3 Xi2 + Xi3

= Xi +
i=1 i=1 i=1 i=1
= 10 + 30 + 100
n
X
Xi + Xi2 + Xi3

= 140
i=1
Resolução do item b:
n
X n
X n
X
(Xi + 1) = Xi + 1
i=1 i=1 i=1
= 10 + n × 1
= 10 + 4
n
X
(Xi + 1) = 14
i=1
Resolução do item c:
n
X n
X
2
Xi2 − 4Xi + 4

(Xi − 2) =
i=1 i=1
n
X n
X n
X
= Xi2 − 4 Xi + 4
i=1 i=1 i=1
= 30 − 4 × 10 + 4 × 4
= 30 − 40 + 16
n
X 2
(Xi − 2) = 6
i=1

Resolução do item d:
n
X n
X
Xi2 − 2Xi + 5Xi − 10

(Xi + 5) (Xi − 2) =
i=1 i=1
n
X n
X n
X n
X
= Xi2 − 2 Xi + 5 Xi − 10
i=1 i=1 i=1 i=1
= 30 − 2 × 10 + 5 × 10 − 4 × 10 = 30 − 20 + 50 − 40
n
X
(Xi + 5) (Xi − 2) = 20
i=1
Resolução do item e:
n
X n
X
Xi2 + 1 (Xi + 4) Xi3 + 4x2i + Xi + 4

=
i=1 i=1
n
X n
X n
X n
X
= Xi3 + 4 Xi2 + Xi + 4
i=1 i=1 i=1 i=1
= 100 + 4 × 30 + 10 + 4 × 4 = 100 + 120 + 10 + 16
n
X
Xi2 + 1 (Xi + 4)

= 246
i=1
Resolução do item f:
n
X n
X n
X
Xi3 Xi3

− 10 = − 10
i=1 i=1 i=1
= 100 − 4 × 10
= 100 − 40
n
X
Xi3 − 10

= 60.
i=1
Resolução do item g:
n
Xi3 − 2Xi2 − 3Xi
P
n
Xi3 2Xi2

X − − 3Xi i=1
=
i=1
10 10
n n n
Xi3 − 2 Xi2 − 3
P P P
Xi
i=1 i=1 i=1
=
10
100 − 2 × 30 − 3 × 10
=
10
100 − 60 − 30
=
10
10
=
10
n
Xi3 − 2Xi2 − 3Xi
X
= 1
i=1
10

4 Exercı́cios propostos sobre somatório
Exercı́cio 1. Escreva por extenso cada um dos somatórios abaixo (isto é, sem os sinais de somatório):
8 n 5
2 Yi +10
Xi4
P P P
a. b. (3Xi + 5) c. (Xi − 2)
i=1 i=1 i=1
n 7 Y ∞
Xi i λi
abXi +Yi
P P P
d. e. Zi f. i!
i=1 i=1 i=0
n n n
aXi2 + bXi + c ea+bXi +cYi +dZi
P P P
g. (aXi + b) h. i
i=1 i=1 i=1
n 10 n
ln(Xi )
Xii+1 Yii−1 i2 Xi
P P P
j. k. l. Yi !+ln(Zi )
i=1 i=1 i=1
Exercı́cio 2. Considere os seguintes somatórios:

n
X n
X n
X
Xi = 50 ; Yi = 80 ; Zi = 65.
i=1 i=1 i=1
Use as propriedades dos somatórios para calcular o valor numérico das expressões abaixo:
n n n
6Xi −3Yi Xi −Yi +Zi
P P P
a. (8Xi − 5Yi ) b. 15 c. 35
i=1 i=1 i=1
n n n
2Yi +6Zi
P P P
d. (10Xi − 5Yi − Zi ) e. 50 f. (3Xi + 8Yi − 12Zi )
i=1 i=1 i=1
Exercı́cio 3. Seja os seguintes somatórios:

5
X 5
X 5
X
Xi = 15 ; Xi2 = 55 ; Xi3 = 225.
i=1 i=1 i=1
Calcule o valor numérico das expressões abaixo aplicando corretamente as propriedades do somatório:
5 5 5
2
Xi2 + 1 (Xi + 4)
P P P
a. (Xi − 3) b. (Xi + 5) (Xi − 2) c.
i=1 i=1 i=1
5 5 3 5
Xi −2Xi2 −7Xi

Xi2 − 11 Xi2 (Xi − 4)
P P P
d. e. 10 f.
i=1 i=1 i=1
Exercı́cio 4. Considere os somatórios abaixo:

8
X 8
X 8
X 8
X
Xi = 12 ; Xi2 = 34 ; Xi3 = 108 ; Xi4 = 370.
i=1 i=1 i=1 i=1
Aplicando corretamente as propriedades do somatório, determine o valor numérico da seguinte expressão:

8
1 Xh 2 i
3Xi + 5Xi2 − Xi .
80 i=1
Exercı́cio 5. Sejam a1 , a2 , . . . , an um conjunto quantitativo de dados tal que ai > 0, para i = 1, 2, ..., n,
então mostre que:
n
! n
!2
X X
2
ai < ai , ∀a > 0.
i=1 i=1

Parte II
Estatı́stica Descritiva

5 Medidas de Tendência Central ou Posição Central
As medidas de tendência central ou posição central constituem uma forma resumida de apresentar os resulta-
dos contidos nos dados observados, pois representam um valor central, em torno do qual os dados se concentram.
As medidas de tendência central mais empregadas são a média, a moda e a mediana.
5.1 Média aritmética ou simplesmente média
Dentre as três medidas de posição, a média aritmética, ou simplesmente média é a mais usada por ser a
mais comum e compreensı́vel delas, além de ter um bom tratamento algébrico. De uma maneira informal a média
aritmética é uma medida de tendência central que nivela os dados. É calculada somando-se os valores de todas as
observações e dividindo-se essa soma pelo número de observações.
Se estivermos fazendo um censo, ou seja, se estivermos fazendo o levantamento de toda a população, então
temos a média populacional, denotada pela letra grega µ, expressa por
N
P
Xi
i=1
µ= .
N
Se estivermos num processo de amostragem, então temos a média amostral, denotada por X, expressa por
n
P
Xi
i=1
X= .
n
A média aritmética nada mais é que o nivelamento dos dados, ou seja, é um representante de todos os
indivı́duos. Em outras palavras, é como se todos os elementos do conjunto de dados tivessem o mesmo valor
numérico, conforme mostra a ilustração abaixo:

Exemplo 1 de aplicação: Foi pesada uma amostra de n = 12 pessoas adultas e os resultados foram (pesos
em quilos): 73, 68, 75, 65, 74, 90, 70, 77, 95, 84, 90, 75. Então a média amostral X dos pesos é determinada por:
n
P 12
P
Xi Xi
i=1 i=1
X = =
n 12
73 + 68 + 75 + 65 + 74 + 90 + 70 + 77 + 95 + 84 + 90 + 75
=
12
936
=
12
X = 78 quilos.
Interpretação: O peso médio dessa amostra de pessoas é de 78 quilos. Ou ainda, o peso que nivela este
conjunto de dados é de 78 quilos.
Exemplo 2 de aplicação: Foi medida a altura de 10 estudantes da UFOB e os resultados foram (altura em
cm): 158, 181, 174, 157, 164, 170, 179, 165, 168, 176. Então a média amostral X dos pesos é determinada por:
n
P 10
P
Xi Xi
i=1 i=1
X = =
n 10
158 + 181 + 174 + 157 + 164 + 170 + 179 + 165 + 168 + 176
=
10
1692
=
10
X = 169, 2 cm.
Interpretação: A altura média dessa amostra de estudantes da UFOB é de 169, 2 cm. Ou ainda, a altura que
nivela este conjunto de dados é de 169, 2 cm.
5.2 Mediana
A mediana é uma medida de tendência central que divide um conjunto quantitativo ordenado de dados em
duas partes iguais, 50% acima e 50% abaixo dela. A mediana é de importância central nas estatı́sticas robustas, já
que é a estatı́stica mais resistente, tendo um ponto de ruptura de 50%: enquanto não mais da metade dos dados
está contaminada, a mediana não vai dar um resultado arbitrariamente grande. A mediana é definida apenas em
dados unidimensionais encomendados, e é independente de qualquer distância métrica.
Em uma amostra de dados, ou uma população finita, pode não haver nenhum membro da amostra cujo valor
é idêntico à mediana (no caso de um mesmo tamanho de amostra). Se houver um tal elemento, pode haver mais
do que um de modo que a mediana pode não identificar um membro da amostra. No entanto, o valor da mediana
é determinada exclusivamente com a definição usual.
A mediana pode ser utilizada como uma medida de localização quando a distribuição é desviada , quando
os valores finais não são conhecidos, ou quando se exige reduzida importância para ser anexado a outliers, por
exemplo, uma vez que podem existir erros de medição.
Em termos de notação, alguns autores representam a mediana de uma variável quantitativa X como X̃ ou
como µ1/2 . Neste texto didático denotaremos a mediana como M e.
Caso 1. Quando o número de dados (n) for ı́mpar, a mediana é dada por:
M e = X( n+1 )
2
Caso 2. Quando o número de dados (n) for par, a mediana é dada por:
X( n ) + X( n+2 )
2 2
Me =
2

A ilustração abaixo apresenta como a mediana funciona em um conjunto de dados:
Exemplo 1 de aplicação. Em uma pesquisa sócioeconômica no municı́pio de Barreiras, foram entrevistadas

19 famı́lias. Uma das variáveis levantadas foi o número X de filhos por famı́lia e os resultados foram:
2 1 2 0 5 0 2 3 1 7 1 1 2 4 0 0 1 4 4
Para encontrarmos o número mediano de filhos por famı́lia, devemos primeiramente ordenar os dados cres-
centemente:
0 0 0 0 1 1 1 1 1 2 2 2 2 3 4 4 4 5 7
Como se trata de uma amostra com um número ı́mpar de indivı́duos, basta considerar o valor central 2. Ou
seja, o número mediano de filhos por famı́lia nesta amostra é:
M e = 2 filhos.
Interpretação: Nesta amostra, 50% das famı́lias tem mais de 2 filhos e 50% das famı́lias tem menos de 2 filhos.
Exemplo 2 de aplicação. Em uma pesquisa sobre saúde dos estudantes universitários da UFOB, foram
pesados 16 indivı́duos e os resultados foram (pesos em kg):
66 61 61 75 67 58 69 66 59 68 57 69 56 65 65 68
Para encontrarmos o peso mediano, devemos primeiramente ordenar os dados crescentemente:
56 57 58 59 61 61 65 65 66 66 67 68 68 69 69 75
Como se trata de uma amostra com um número par de indivı́duos, devemos considerar os dois valores centrais
65 e 66 e tomarmos a média dos dois, isto é
X( n ) + X( n+2 ) X( 16 ) + X( 16+2 ) X(8) + X(9)

2 2 2 2
Me = = =
2 2 2
65 + 66 131
= =
2 2
Me = 65, 5 quilos.
Interpretação: Nesta amostra, 50% dos estudantes pesam acima de 65, 5 quilos e 50% pesam abaixo de 65, 5
quilos.

5.3 Moda
A moda ou valor modal de um conjunto quantitativo de dados é uma medida de tendência central dada
pelo(s) valor(es) mais frequente(s), denotada por M o = Xf req . O termo moda foi utilizado primeiramente em 1895
por Karl Pearson, sob influência do termo moda referindo-se ao uso popular com o significado de objeto que se está
usando muito no tempo presente. A referência mais antiga conhecida do conceito da moda apresenta-se no cerco
no inverno de 428 a.C. dos peloponésios e beócios aos plateus e atenienses. Os sitiados, necessitando construir
escadas adequadas às muralhas inimigas, fizeram com que muitas pessoas contassem as fileiras de tijolos. Com tal
estratagema, ainda que houvesse um número grande de erros, um número grande de contagem seria confiável.
Ao contrário de média e da mediana, o conceito de moda também faz sentido para “dados nominais” (i.e.,
não consistindo valores numéricos no caso de média ou mesmo de valores ordenados, no caso do rendimento médio).
Por exemplo, tomando uma amostra de nomes de uma famı́lia coreana, pode-se achar que “Kim” ocorre com mais
frequência do que qualquer outro nome. Então, “Kim” seria a moda da amostra.
A ilustração abaixo apresenta como a moda funciona em um conjunto de dados:
A classificação de um conjunto de dados, quanto a moda, é:

Amodal: Quando o conjunto de dados não apresenta nenhum valor mais frequente;
Unimodal: Quando o conjunto de dados apresenta um valor mais frequente;
Bimodal: Quando o conjunto de dados apresenta dois valores mais frequentes;
Multimodal: Quando o conjunto de dados apresenta três ou mais valores mais frequentes.
Exemplo de aplicação da moda: Em uma pesquisa antropométrica, foram pesadas 4 amostras de n = 12

estudantes da UFOB. Abaixo temos o quadro com os dados observados bem como a classificação de cada uma delas
quanto aos valores modais.
Amostras de estudantes da Ufob (pesos em quilos) Moda Classificação

A 68 58 51 66 67 73 52 63 59 50 64 53 − Amodal
B 70 55 63 85 54 54 39 64 55 55 55 77 M o = 55 Unimodal
C 79 66 58 76 61 73 74 58 72 66 63 60 M o = 58 e M o = 66 Bimodal
D 66 55 58 57 68 55 59 58 65 79 68 64 M o = 55, M o = 58 e M o = 68 Multimodal
Podemos observar que a amostra A não possui nenhum peso mais frequente (amodal). A amostra B, por sua
vez, apresenta um peso mais frequente (unimodal). A amostra C apresenta dois pesos mais frequentes (bimodal)
e a amostra D apresenta três pesos mais frequentes (multimodal).

5.4 Diferenças entre média, moda e mediana
Diante do que vimos até o momento, surge a pergunta: Qual medida de tendência central devemos usar?
Elas têm a finalidade, como já comentamos no inı́cio desta aula, de sintetizar as informações de um conjunto de
dados resumindo-as em um único valor. Uma vez que o objetivo das três é semelhante, talvez você agora esteja se
perguntando: quando devo usar a média? E a moda? E a mediana?
Se estamos diante de uma situação na qual essas três medidas apresentam o mesmo valor, tal fato nos informa
que a distribuição dos dados é simétrica; quando resultam em valores diferentes, porém muito próximos, indica
que a forma dessa distribuição é aproximadamente simétrica. Nesses casos, optaremos por qualquer uma das três:
média, moda ou mediana. Nos demais casos, devemos analisar as especificidades da situação estudada e escolher
entre elas a mais adequada.
A seguir, apresentamos um quadro resumo que irá ajudá-lo a optar por uma das três, embora nada o impeça
de calcular todas elas.
Caracterı́sticas e diferenças entre as medidas de tendência central.
Média Aritmética Moda Mediana
É única Pode não ser única; É única

Pode não existir ;
É influenciada por É influenciada pelos É influenciada pela ordem

todas as observações valores mais frequentes dos valores
Seu uso é indicado quando É a única medida indicada Seu uso é indicado quando
a distribuição não apresenta para se trabalhar com há valores muito discrepantes
valores muito extremos ou variáveis qualitativas pois ela não é afetada
muito discrepantes nominais por valores extremos
Possui propriedades Muito adotada em variáveis Muito adotada em variáveis

algébricas preferı́veis sociais e econômicas sociais e econômicas
É democrática; Pode detectar discrepâncias; Pode detectar discrepâncias;

É imparcial; Pode detectar a presença Pode detectar a presença
Pode “mascarar” os dados, ou ausência de equidade na ou ausência de equidade na
pois não detecta discrepâncias; distribuição dos dados; distribuição dos dados;
Não tem equidade.
Quando obtemos um conjunto de dados em que a média, moda e mediana possuem valores numéricos próximos,
então tal conjunto de dados é considerado aproximadamente simétrico. Diversas formas gráficas para a avaliação
da natureza da distribuição dos dados podem ser utilizadas pelo pesquisador para uma inspeção empı́rica a fim
de inferir que tipo de distribuição os dados de sua pesquisa se apresentam. Uma forma de se estimar o grau de
assimetria pode ser dada pelos coeficientes de assimetria de Pearson ou pelo método dos momentos. Nesse trabalho
abordaremos tais medidas no Capı́tulo que trata dos dados agrupados em Classes.

5.5 Propriedades da média aritmética
Em geral a média aritmética é a medida de tendência central mais adotada, pois apresenta propriedades
importantes que serão úteis posteriormente em inferência estatı́stica. Apresentamos a seguir tais propriedades
considerando a média amostral X, mas que valem para a média populacional µ. Considere X a média de um
conjunto quantitativo de dados formado por X1 , X2 , ..., Xn e C uma constante arbitrária.
Propriedade 1. Considere um conjunto quantitativo de dados formado por X1 , X2 , ..., Xn tal que X1 =
C, X2 = C, ..., Xn = C e C uma constante arbitrária. Então temos que
X = C. (8)
Em outras palavras, se o conjunto de dados é formado por uma constante C, então a média deste conjunto é
a própria constante C.
Comentário: Para um melhor entendimento, imagine que uma turma de estudantes fizeram uma prova e que
todos tiraram a mesma nota 8, 0. Então a nota média também será 8, 0. Uma vez que as notas não variaram, isto
é, as notas assumiram um valor constante, então a nota média é a própria constante.
n
P
Xi
i=1
Demonstração de (8): Por definição sabemos que a média é expressa por X = n . Porém, como Xi = C
para i = 1, 2, ..., n, então temos
n
P n
P
Xi C
i=1 i=1 C + C + ... + C nC
X = = = = =C
n n n n
X = C.
Propriedade 2. Sejam Yi = Xi ± C, para i = 1, 2, . . . , n. Então a média de Y , denotada por Y , é dada por
Y = X ± C. (9)
Comentário: Imagine que uma turma de estudantes fez uma prova e cada um obteve a sua nota e, portanto,
a turma obteve uma nota média. O professor resolve dar 1 ponto a mais na nota de cada estudante. Então a nova
nota média será a nota média obtida anteriormente adicionada com 1 ponto.
Demonstração de (9): Vamos considerar o caso positivo, pois o caso negativo é análogo. Por definição a
n
P
Yi
i=1
média de Y , denotada por Y , é dada por Y = n . Como Yi = Xi + C, para i = 1, 2, . . . , n, temos que
n
P n
P n
P n
P
Yi (Xi + C) Xi + C
i=1 i=1 i=1 i=1
Y = = =
n n n
n
P
Xi
i=1 nC
= +
n n
Y = X + C.
Propriedade 3. Sejam Yi = Xi C, para i = 1, 2, . . . , n. Então a média de Y , denotada por Y , é dada por
Y = XC. (10)
Comentário: Imagine que uma turma de estudantes fez uma prova e cada um obteve a sua nota e, portanto,
a turma obteve uma nota média. Como a turma foi muito mal, o professor resolve dobrar a nota de cada um, isto
é, multiplicar cada nota por 2. Então a nota média atualizada será a nota média obtida anteriormente multiplicada
por 2.

n
P
Yi
i=1
Demonstração de (10): Por definição sabemos que a média de Y é dada por Y = n . Como Yi = Xi C
temos que
n
P n
P n
P
Yi Xi C Xi
i=1 i=1 i=1
Y = = =C = CX
n n n
Y = XC.
Propriedade 4. Considere duas constantes arbitrárias a e b. Sejam Yi = a ± bXi , para i = 1, 2, . . . , n, então,

pelas propriedades 1, 2 e 3, temos
Y = a ± bX. (11)
Comentário: Este item mostra a aplicação direta das propriedades lineares do somatório. Em diversas áreas
é muito comum a adoção de funções lineares de variáveis quantitativas.
Demonstração de (11): Vamos considerar o caso positivo, pois o caso negativo é análogo. Por definição
n
P
Yi
i=1
sabemos que a média de Y é dada por Y = n . Como Yi = a + bXi temos que
n
P
Yi
i=1
Y =
n
n
P n
P n
P n
P
(a + bXi ) a bXi b Xi
i=1 i=1 i=1 na i=1
= = + = +
n n n n n
Y = a + bX.

Propriedade 5. Considere o i-ésimo desvio dado por Xi − X , para i = 1, 2, ..., n. Então a soma de todos
os desvios em relação a média é nula, isto é,
n
X
Xi − X = 0. (12)
i=1
Comentário: Para exemplificar, considere o seu núcleo familiar. Encontre o peso X de cada um dos membros:
peso do pai, peso da mãe, peso dos irmãos, etc. Em seguida encontre o peso médio X. Encontre todas as diferenças
(Xi − X). Note que a soma de todos os desvios é igual a zero.
Demonstração de (12):
n
X n
X n
X

Xi − X = Xi − X
i=1 i=1 i=1
n
P
n
X Xi
= Xi − n i=1
i=1
n
n
X n
X
= Xi − Xi = 0
i=1 i=1
n
X
Xi − X = 0.
i=1

Propriedade 6. O somatório do quadrado de todos os desvios é sempre um valor mı́nimo. Matematicamente,

para qualquer arbitrariamente pequeno ( > 0) temos
n n
X 2 X 2
Xi − X < Xi − X ± . (13)
i=1 i=1
Comentário: Esta propriedade mostra que, para quaisquer valores diferentes da média X, seja para mais ou
para menos, então o somatório do quadrado dos desvios será maior do que seria adotando a média X.
5.6 Exemplo de aplicação em saúde pública
Em uma pesquisa sobre saúde pública realizada em uma grande Universidade, uma das variáveis estudadas
foi o peso X em quilos. Foram analisadas 5 turmas de 15 estudantes de cada. Os resultados encontram-se no
quadro abaixo:
Turma A 72 70 73 57 56 84 70 70 75 55 69 62 59 53 62
Turma B 49 87 64 94 81 66 77 65 73 62 73 58 83 71 71
Turma C 63 81 52 55 48 60 57 57 53 47 69 63 70 59 57
Turma D 90 72 79 86 113 74 65 76 69 56 52 76 69 69 55
Turma E 49 79 70 70 33 61 67 78 63 69 69 77 63 65 80
As turmas são consideradas amostras desta Universidade. Encontrar as medidas de tendência central de cada
uma destas 5 turmas e responda:
i. Quais turmas apresentaram os maiores peso médio, mediano e modal?

ii. Quais turmas apresentaram os menores pesos médio, mediano e modal?
Respostas do exercı́cio proposto
Para facilitar a obtenção das respostas, é conveniente dispor os resultados em um quadro resumo, conforme
abaixo:
Peso médio Peso mediano Peso modal Classificação

Turmas X Me Mo quanto à moda
A 65, 80 kg 69 kg 70 kg conjunto unimodal
B 71, 60 kg 71 kg 71 kg e 73 kg conjunto bimodal
C 59, 40 kg 57 kg 57 kg conjunto unimodal
D 73, 40 kg 72 kg 69 kg conjunto unimodal
E 66, 20 kg 69 kg 63 kg, 69 kg e 70 kg multimodal
Resposta do item i: A turma D apresentou o maior peso médio e o maior peso mediano. A turma B
apresentou o maior peso modal.
Resposta do item ii: A turma C apresentou o menor peso médio, mediano e modal.

6 Medidas de Dispersão
Neste Capı́tulo apresentamos as medidas de dispersão, também denominadas de medidas de variação ou

variabilidade. Para motivar o tema, observe os conjuntos de dados abaixo:
Conjuntos Dados observados Média

A 10 20 30 40 50 60 X = 35
B 5 80 10 45 X = 35
C 15 25 95 25 15 X = 35
D 35 35 35 35 35 35 X = 35
E 5 35 20 45 70 X = 35
Podemos notar que os conjuntos são bastante distintos entre si. No entanto todos eles possuem a mesma
média, X = 35. Este fato sugere que podemos ter diferentes conjuntos de dados que podem eventualmente fornecer
a mesma média. Desta maneira, é necessário o uso de medidas que meçam a variabilidade dos dados.
As medidas de dispersão, também denominadas de medidas de variação ou variabilidade, medem o grau de
variabilidade dos dados. As medidas de dispersão mais usadas são: amplitude, desvio médio absoluto, variância,
desvio padrão e coeficiente de variação.
6.1 Amplitude
A amplitude é uma medida de dispersão expressa pela diferença entre o maior e o menor valor do conjunto
quantitativo de dados, isto é,
A = Xmáximo − Xmı́nimo .
Exemplo de aplicação: Em uma pesquisa antropométrica, mediu-se a altura de 4 amostras de n = 15

estudantes da UFOB, conforme quadro abaixo:
Amostras de estudantes da Ufob (alturas em cm)

Amostra A 179 165 161 166 160 166 166 157 175 150 157 161 166 167 174
Amostra B 180 168 157 168 165 157 177 159 183 157 154 158 191 170 181
Amostra C 145 147 173 151 166 161 164 142 157 178 159 177 150 167 159
Amostra D 165 181 169 177 161 181 160 176 197 166 177 162 146 161 173
A amplitude da turma A é dada por:
A = Xmáximo − Xmı́nimo = 179 − 150 = 29 cm.
A amplitude da turma B é dada por:
A amplitude da turma C é dada por:
A amplitude da turma D é dada por:

Podemos observar que, a partir das amplitudes obtidas, a amostra D apresentou a maior variabilidade nos
dados (51 cm), enquanto que a amostra A apresentou a menor variabilidade (29 cm). Em outras palavras, podemos
afirmar que a amostra D é mais heterogênea nas alturas dos indivı́duos no que tange a amplitude, e a amostra
A é a mais homogênea. As amostras B e C possuem praticamente a mesma variabilidade, pois apresentaram
amplitudes numericamente próximas (36 cm e 37 cm).
6.2 Desvio médio absoluto
Considere um conjunto quantitativo de dados formado por X1 , X2 , ..., Xn e sua média associada X. Definimos
como desvio a diferença entre a i-ésima observação e a média do conjunto, isto é,
di = Xi − X, i = 1, 2, ..., n.
Vimos no Capı́tulo anterior que a soma dos desvios é sempre nula, isto é,
n
X n
X
di = Xi − X = 0.
i=1 i=1
Para medir a variação dos dados utilizando a definição dos desvios, o desvio médio absoluto é uma medida
de dispersão que considera a média dos módulos dos desvios. Em outras palavras, é a média dos desvios absolutos:
n
P
Xi − X
i=1
dm = .
n
Exemplo de aplicação: Considerando o quadro anterior, vamos encontrar o desvio-médio absoluto de cada
uma das quatro amostras.
Amostra A: Considerando que a altura média da amostra A vale 164, 67 cm, então o seu desvio-médio
absoluto é dado por:
n
P 15
P
Xi − X Xi − X
i=1 i=1
dm = =
n 15
|179 − 164, 67| + |165 − 164, 67| + |161 − 164, 67| + ... + |174 − 164, 67| 84
= =
15 15
dm = 5, 60 cm.
Amostra B: Considerando que a altura média da amostra B vale 168, 33 cm, então o seu desvio-médio
n
P 15
P
Xi − X Xi − X
i=1 i=1
dm = =
n 15
|180 − 168, 33| + |168 − 168, 33| + |157 − 168, 33| + ... + |181 − 168, 33| 144
= =
15 15
dm = 9, 60 cm.
Amostra C: Considerando que a altura média da amostra C vale 159, 73 cm, então o seu desvio-médio

n
P 15
P
Xi − X Xi − X
i=1 i=1
dm = =
n 15
|145 − 159, 73| + |147 − 159, 73| + |173 − 159, 73| + ... + |159 − 159, 73| 135, 75
= =
15 15
dm = 9, 05 cm.
Amostra D: Considerando que a altura média da amostra D vale 170, 13 cm, então o seu desvio-médio
n
P 15
P
Xi − X Xi − X
i=1 i=1
dm = =
n 15
|165 − 170, 13| + |181 − 170, 13| + |169 − 170, 13| + ... + |173 − 170, 13| 142, 13
= =
15 15
dm = 9, 48 cm.
6.3 Variância
A variância é uma medida de dispersão dada pela média dos quadrados dos desvios da seguinte forma:
Se estivermos fazendo um censo, ou seja, se estivermos fazendo o levantamento de toda a população, então
temos a variância populacional, denotada pela letra grega σ 2 , expressa por
N
P 2
(Xi − µ)
i=1
σ2 = .
N
Se estivermos num processo de amostragem, então temos a variância amostral, denotada por S 2 , expressa
por
n
P 2
Xi − X
i=1
S2 = .
n−1
Observação: A unidade da variância sempre será o quadrado da unidade da média. Por exemplo, se a
variável em estudo for peso com a unidade da média em kg, então a unidade da variância será kg 2 . Se a variável
for altura com a unidade da média em cm, então a unidade da variância será em cm2 .
Exemplo de aplicação: Vamos determinar a variância amostral de cada uma das quatro amostras apresen-
tadas no quadro da Seção anterior.
Amostra A: A variância amostral é dada por:
n
P 2 15
P 2
Xi − X Xi − X
i=1
S2 = = i=1
n 15 − 1
2 2 2 2
(179 − 164, 67) + (165 − 164, 67) + (161 − 164, 67) + ... + (174 − 164, 67)
=
14
793, 33
=
14
S2 = 56, 67 cm2 .

Amostra B: A variância amostral é dada por:
n
P 2 15
P 2
Xi − X Xi − X
i=1
S2 = = i=1
n 15 − 1
2 2 2 2
(180 − 168, 33) + (168 − 168, 33) + (157 − 168, 33) + ... + (181 − 168, 33)
=
14
1899, 33
=
14
S2 = 135, 67 cm2 .
Amostra C: A variância amostral é dada por:
n
P 2 15
P 2
Xi − X Xi − X
i=1
S2 = = i=1
n 15 − 1
2 2 2 2
(145 − 159, 73) + (147 − 159, 73) + (173 − 159, 73) + ... + (159 − 159, 73)
=
14
1792, 93
=
14
S2 = 128, 07 cm2 .
Amostra D: A variância amostral é dada por:
n
P 2 15
P 2
Xi − X Xi − X
i=1
S2 = = i=1
n 15 − 1
2 2 2 2
(165 − 170, 13) + (181 − 170, 13) + (169 − 170, 13) + ... + (173 − 170, 13)
=
14
2057, 73
=
14
S2 = 146, 98 cm2 .
6.4 Desvio padrão
O desvio padrão é uma medida de dispersão dada pela raiz quadrada da variância, isto é,
v
u N
uP 2
√ t i=1 (Xi − µ)
u
Desvio padrão populacional: σ = σ2 =
N
v
u n
uP 2
X −X
√ t i=1 i
u
Desvio padrão amostral: S= S2 = .
n−1
Exemplo de aplicação: Vamos encontrar o desvio-padrão amostral para cada uma das quatro amostras da
Seção anterior.
√
Amostra A: S =
p
S2 = 56, 67 cm2 = 7, 53 cm.
√
Amostra B: S =
p
S2 = 135, 67 cm2 = 11, 65 cm.

√
Amostra C: S =
p
S 2 = 128, 07 cm2 = 11, 32 cm.
√
Amostra D: S = S 2 = 146, 98 cm2 = 12, 12 cm.
p
A vantagem de se usar o desvio padrão ao invés da variância é que sua unidade de medida é a mesma da
média.
6.5 Coeficiente de variação
É uma medida de dispersão dada pelo quociente percentual entre o desvio padrão a e média, isto é,
σ
Coeficiente de variação populacional: CV = × 100%
µ
S
Coeficiente de variação amostral: CV = × 100%.
X
Exemplo de aplicação: Considerando as médias e os desvios-padrão obtidos, vamos encontrar o coeficiente

de variação amostral para cada uma das quatro amostras.
Amostra A: CV = S
X
× 100% = 7,53
164,67 × 100% = 4, 57%.
Amostra B: CV = S
X
× 100% = 11,65
168,33 × 100% = 6, 92%.
Amostra C: CV = S
X
× 100% = 11,32
159,73 × 100% = 7, 08%.
Amostra D: CV = S
X
× 100% = 12,12
170,13 × 100% = 7, 13%.
O coeficiente de variação é adotado para comparar a variabilidade entre grupos. Quanto maior o seu valor,
mais heterogêneo é o grupo, quanto menor, mais homogêneo, quando comparado aos demais grupos.
6.6 Propriedades da variância
2
Considere σX a variância de um conjunto quantitativo de dados formado por X1 , X2 , ..., Xn e C uma constante
arbitrária (C ∈ R).
Propriedade 1. Se Xi = C, para i = 1, 2, ..., n, então a variância da constante é nula, ou seja,

2
σX = 0.
Propriedade 2. Sejam Yi = Xi ± C, para i = 1, 2, ..., n. Então a variância de Y , denotada por σY2 , é a

própria variância de X, isto é,
σY2 = σX
2
.
Propriedade 3. Sejam Yi = Xi C, para i = 1, 2, ..., n. Então a variância de Y , denotada por σY2 , é dada por
σY2 = σX
2
C 2.
Propriedade 4. Considere duas constantes arbitrárias a e b. Sejam Yi = a ± bXi , para i = 1, 2, ..., n, então,
pelas propriedades 1, 2 e 3, temos
σY2 = b2 σX
2
.

6.7 Exemplo de aplicação na indústria
Uma grande fábrica de eletrodomésticos tem o interesse em estudar o tempo de montagem de um determinado
modelo de lavadoura de roupas. Para isto, selecionou-se uma equipe de funcionários para cada uma das cinco filiais
diferentes desta fábrica e verificou-se o tempo que cada um dos funcionários levou para montar a lavadoura. Os
resultados encontram-se no quadro abaixo (tempo em minutos):
Tempo (em minutos) de montagem da lavadoura realizada pelas cinco equipes.

Equipe A 15 7 14 6 14 13 22 18 10
Equipe B 9 13 17 19 17 23 18 9 15 23 16 17 14
Equipe C 19 13 17 13 11 14 8 15
Equipe D 8 21 5 9 16 10 15 13 19 18
Equipe E 33 12 24 14 28 17 6 26 15 32 4 22
a. Qual equipe apresentou o maior e o menor tempo médio?

b. Qual equipe apresentou o maior e o menor tempo mediano?
c. Qual a classificação das equipes quanto ao tempo modal?
d. Encontrar o desvio médio absoluto, a variância amostral e o desvio-padrão amostral.
e. Determinar o coeficiente de variação de cada equipe e apontar qual teve a maior e a menor variabilidade.
Respostas do exemplo de aplicação
Afim de iniciar a análise descritiva dos dados, vamos elaborar um quadro com as medidas de tendência central
e de dispersão para cada uma das cinco equipes.
X Me Mo A dm S2 S CV
A 13, 22 min 14, 0 min 14 min 16 min 3, 75 min 25, 6944 min2 5, 07 min 38, 35%
B 16, 15 min 17, 0 min 17 min 14 min 3, 22 min 18, 8077 min2 4, 34 min 26, 87%
C 13, 75 min 13, 5 min 13 min 11 min 2, 50 min 11, 6429 min2 3, 41 min 24, 80%
D 13, 40 min 14, 0 min Amodal 16 min 4, 40 min 27, 8222 min2 5, 27 min 39, 33%
E 19, 42 min 19, 5 min Amodal 29 min 8, 08 min 92, 2652 min2 9, 61 min 49, 49%
À luz dos resultados expressos no quadro acima, temos a seguinte análise:
a. A equipe E apresentou o maior tempo médio e a equipe A o menor.

b. A equipe E apresentou o maior tempo mediano e a equipe C o menor.
c. As equipes A, B e C são unimodais. As equipes D e E são amodais.
d. O desvio médio absoluto, a variância amostral e o desvio-padrão de cada equipe estão no quadro acima.
e. O coeficiente de variação de cada equipe está no quadro acima. A equipe E apresentou a maior variabilidade
nos dados enquanto que a equipe C apresentou a menor variabilidade. Esse fato sugere que a equipe E é mais
heterogênea dentre as cinco equipes, enquanto que a equipe C é mais homogênea.

7 Análise descritiva para dados agrupados em classes
7.1 Introdução
Nesse Capı́tulo apresentamos a metodologia para o agrupamento de dados quantitativos (discretos ou contı́nuos)
em k classes bem como seu tratamento estatı́stico, cuja representação mais simples é a distribuição de frequência.
A distribuição de frequência é a distribuição dos dados em classes ou categorias, onde o número de elementos
pertencentes a cada classe representa a frequência da classe. Aconselha-se a trabalhar com dados agrupados em
classes sempre quando estamos trabalhando diretamente com a população ou quando a amostra for considerada
grande. Para a análise exploratória dos dados agrupados em classes abordamos as principais medidas descritivas,
a saber:
Medidas de tendência central: média, moda bruta, moda de Czuber e mediana;
Medidas de dispersão: amplitude, variância, desvio-padrão e coeficiente de variação;
Medidas separatrizes ou quantis: tercil, quartil, decil e percentil;
Medidas de assimetria: Coeficientes de Pearson e via momentos;
Medias de curtose: Coeficiente percentı́lico e via momentos;
7.2 Ilustração com dados reais
Para ilustrar a metodologia estatı́stica usada para dados agrupados em classes, apresentamos a seguir um
estudo de caso real em que fazemos passo a passo a construção de cada uma das medidas descritivas acima
mencionadas.
Estudo de caso: Em um estudo foram realizados 270 pontos de sondagem no solo da fazenda Ponta da
Serra, Caicó - RN, em que, para cada amostra, mediu-se o teor de chumbo (unidades em ppm). Desta forma temos
uma amostra de tamanho n = 270 pontos de sondagem. Os dados estão descritos na Tabela (8).
Tabela 8: Teores de chumbo (ppm) em 270 pontos de sondagem no solo da fazendaPonta da Serra - Caicó-RN.
63 71 69 83 81 70 47 69 57 122 67 24 60 124 87
73 55 80 86 68 53 84 128 51 89 62 61 90 74 51
124 102 43 108 47 94 99 86 82 99 45 66 115 59 74
38 75 99 82 38 96 97 61 79 137 47 127 123 83 66
57 136 66 71 81 41 63 81 40 82 110 49 37 92 60
57 27 109 69 98 92 74 109 81 68 70 72 26 74 80
97 71 86 85 47 95 67 82 110 74 44 93 65 123 72
53 95 92 51 37 103 48 92 62 94 48 89 73 23 58
85 52 60 82 104 83 65 26 113 44 80 53 80 81 86
112 133 86 99 107 56 93 77 109 94 24 43 68 59 91
81 43 84 85 101 67 124 79 74 105 77 54 74 70 59
15 57 60 39 68 63 77 39 28 105 117 131 72 84 85
84 89 52 83 71 69 55 94 101 35 109 104 107 95 73
88 75 66 70 57 34 32 52 108 72 116 66 38 86 48
62 78 105 65 71 90 101 67 76 84 102 114 82 64 110
84 59 47 77 53 81 101 43 56 15 35 105 106 62 84
61 47 92 59 91 88 24 78 110 68 64 111 47 40 51
83 78 103 141 72 54 86 54 59 155 63 95 100 92 84

Os dados coletados pelo pesquisador na forma em que se encontram, como na Tabela (8), são denominados
dados brutos, ou seja, sem nenhum tratamento estatı́stico. Normalmente estes dados fornecem pouca ou nenhuma
informação ao leitor, sendo necessário uma organização afim de aumentar sua capacidade de informação.
A mais simples organização numérica é a ordenação dos dados em ordem crescente ou decrescente. Dados
apresentados dessa forma (ordenados) são chamados de ROL. A Figura (12) apresenta o ROL de dados referentes
aos teores de chumbo (em ppm) dos 270 pontos de sondagem no solo da Fazenda Ponta da Serra - Caicó-RN.
Figura 12: ROL dos dados referentes aos teores de chumbo (em ppm).
Como podemos observar na Figura (12) a simples organização dos dados (ROL) aumenta muito capacidade de
informação destes, pois, enquanto a Tabela (8) nos informava apenas que tı́nhamos 270 valores de teor de chumbo,
a Figura (12) nos apresenta o menor e o maior valor de teor de chumbo, dando uma ideia geral da variação dos
teores de chumbo (em ppm) dos pontos de sondagem do solo coletadas na Fazenda Ponta da Serra. O menor teor
de chumbo encontrado foi de 15 ppm e o maior teor de chumbo encontrado foi de 155 ppm. Portanto, houve uma
variação nas amostras de 140 ppm.
7.3 Apresentação tabular
Após esta primeira organização dos dados, ou seja, após a ordenação dos dados, podemos ainda agrupá-los em
classes de menor tamanho, afim de aumentar sua a capacidade de informação. Distribuindo os dados observados em
classes e contando o número de indivı́duos contidos em cada classe, obtemos a frequência absoluta de cada classe. A
disposição tabular dos dados agrupados em classes, juntamente com as frequências correspondentes denominamos
distribuição de frequência.
Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que delimitam
o intervalo de classe. A construção das classes pode ser feita de maneira subjetiva, como por exemplo, por meio do
conhecimento do pesquisador a respeito da caracterı́stica em estudo, ou utilizando algum critério de categorização.
Apresentamos a seguir três critérios adotados para o procedimento de categorização de variáveis quantitativas
contı́nuas ou discretas.

7.4 Distribuições de frequências
Para montar uma distribuição de frequências é necessário que primeiramente se determine o número k de
classes em que os dados serão agrupados. Por questões de ordem prática e estética alguns autores sugerem utilizar
de 5 a 20 classes. Há várias indicações do número k de classes a ser utilizado, em função do número n de dados,
dentre elas podemos destacar:
Caso 1. Quando o número de dados é n ≤ 100:

√
k= n.
Caso 2. Quando o número de dados é n > 100:
k = 5 log (n) .
Caso 3. Critério de SCOTT (1979), baseado na normalidade dos dados:
√
A3n
k= ,
3, 49S
em que:
A : é a amplitude total dos dados;
S : é o desvio-padrão amostral dos dados;
n : é o número de observações.
Em nosso exemplo temos o número de observações igual a n = 270 e, portanto, devemos usar o segundo caso,
a saber
k = 5 log (n) = 5 log (270) = 12, 16

k ∼
= 12 classes.
Após determinado o número k de classes em que os dados serão agrupados, deve-se então determinar a
amplitude h de classe que é dada pela seguinte expressão:
A
h= ,
k−1
em que
h : é a amplitude da classe ou intervalo de classe (comum a todas as classes);
A : é a amplitude total dos dados;
k : é o número de classes;
Em nosso exemplo temos:
A 140
h = = = 12, 73 ppm.
k−1 12 − 1
h ∼
= 13 ppm.
Conhecida a amplitude h de classes, determina-se então os intervalos de classe. Os limites inferior e superior
de cada classe devem ser determinados a partir do limite inferior da primeira classe (LI1 ) de modo que o menor
valor observado esteja localizado no ponto médio da primeira classe, que é dado por:
LI1 + LS1
P M1 = ,
2
sendo
P M1 : é o ponto médio da primeira classe;
LI1 : é o limite inferior da primeira classe;
LS1 : é o limite superior da primeira classe;
Assim, o limite inferior da primeira classe (LI1 ) será:
h
LI1 = Xmin − .
2
Em nosso exemplo do teor de chumbo encontrado nas amostras coletadas temos
h 13
LI1 = Xmin − = 15 − = 15 − 6, 5 = 8, 5.
2 2
LI1 = 8, 5 ppm.

Os demais limites são obtidos somando-se h ao limite anterior. Para montar a distribuição de frequência,
basta apresentar as classes obtidas na forma tabular e contar quantos indivı́duos existe cada classe. Apresentando
os dados na forma de distribuição de frequência, sintetiza-se a informação contida nos mesmos, além de facilitar sua
visualização. A apresentação dos dados em forma de distribuição de frequência facilita ainda o cálculo de várias
medidas estatı́sticas de interesse, além de permitir a apresentação gráfica dos mesmos.
A Tabela (9) apresenta a distribuição de frequências do teor de chumpo (em ppm) dos pontos de sondagem
do solo da Fazenda Ponta da Serra (dados agrupados em 12 classes).
Tabela 9: Distribuição de frequências do teor de chumpo (em ppm) dos pontos de sondagem do solo da Fazenda
Ponta da Serra.
Limite Limite Frequência absoluta

Inferior (LI) Superior (LS) fi
1a classe: 8, 5 ppm ` 21, 5 ppm 2
2a classe: 21, 5 ppm ` 34, 5 ppm 10
3a classe: 34, 5 ppm ` 47, 5 ppm 26
4a classe: 47, 5 ppm ` 60, 5 ppm 38
5a classe: 60, 5 ppm ` 73, 5 ppm 51
6a classe: 73, 5 ppm ` 86, 5 ppm 60
7a classe: 86, 5 ppm ` 99, 5 ppm 34
8a classe: 99, 5 ppm ` 112, 5 ppm 30
9a classe: 112, 5 ppm ` 125, 5 ppm 11
10a classe: 125, 5 ppm ` 138, 5 ppm 6
11a classe: 138, 5 ppm ` 151, 5 ppm 1
12a classe: 151, 5 ppm ` 164, 5 ppm
P 1
270
7.5 Frequência absoluta
A frequência absoluta (fi ) nada mais é que o número de elementos pertencentes a i-ésima classe, i = 1, 2, ..., k.
Podemos observar que a soma de todas as frequências absolutas é igual ao número de observações do conjunto de
Pk
dados, ou seja, fi = n, e n é o número total de observações. Na Tabela (9) onde apresentamos o exemplo de
i=1
distribuição de frequências, em 12 classes, do teor de chumbo encontrado nos pontos de sondagem temos:
12
X
fi = f1 + f2 + f3 + f4 + f5 + f6 + f7 + f8 + f9 + f10 + f11 + f12
i=1
12
X
fi = 2 + 10 + 26 + 38 + 51 + 60 + 34 + 30 + 11 + 6 + 1 + 1
i=1
12
X
fi = 270 = n (quantidade total de observações).
i=1

7.6 Medidas de posição ou tendência central
Ao examinar uma distribuição amostral simétrica ou pelo menos aproximadamente simétrica, nota-se que
geralmente que os dados são mais frequentes perto de um valor central e são mais raros ao afastar-se deste. A
obtenção deste valor central é de importância fundamental para a pesquisa. Abordaremos as medidas de posição
ou tendência central para o caso em que o dados estão agrupados em classes. Para isso é necessário introduzir o
conceito da Hipótese Tabular Básica (HTB).
Hipótese tabular básica: Para fins de análises matemáticas todas as observações contidas num intervalo
de classe são consideradas iguais ao ponto médio da classe. Essa hipótese é conhecida como hipótese tabular básica
(HTB). Os cálculos das medidas de posição ou de dispersão amostral usando os pontos médios das classes como
representantes de todos os seus elementos contém menor precisão do que aqueles realizados utilizando os dados
brutos ou elaborados.
No entanto, estes erros, como já constatado por muitos pesquisadores em estatı́stica, podem ser considerados
desprezı́veis e, portanto, devem ser ignorados. A vantagem de se utilizar a distribuição de frequência refere-
se à simplificação estrutural dos dados sem grandes perdas de precisão, bem como o aumento da facilidade de
cálculos devido a estas simplificações, além de fornecer uma idéia da forma da distribuição da variável por meio da
representação gráfica.
Para o cálculo das medidas de tendência central para dados agrupados em classes tais como a média, a moda
e a mediana, é necessário acrescentar algumas colunas a mais na Tabela (9) conforme mostra a Tabela (10):
Tabela 10: Dados do teor de chumpo (em ppm) agrupados em classes.
Limite Limite Frequencia absoluta

Inferior (LI) Superior (LS) fi Xi fi Xi Fi F ri %
8, 5 ` 21, 5 2 15 30 2 0, 74
21, 5 ` 34, 5 10 28 280 12 4, 44
34, 5 ` 47, 5 26 41 1066 38 14, 07
47, 5 ` 60, 5 38 54 2052 76 28, 15
60, 5 ` 73, 5 51 67 3417 127 47, 07
73, 5 ` 86, 5 60 80 4800 187 69, 26
86, 5 ` 99, 5 34 93 3162 221 81, 85
99, 5 ` 112, 5 30 106 3180 251 92, 96
112, 5 ` 125, 5 11 119 1309 262 97, 04
125, 5 ` 138, 5 6 132 792 268 99, 26
138, 5 ` 151, 5 1 145 145 269 99, 63
151, 5 ` 164, 5 P 1 158 158 270 100
270 20.391
7.7 Frequência acumulada
Muitas vezes o nosso interesse não reside na quantidade de observações que existe numa determinada classe,
mas sim em saber a quantidade de observações acima ou abaixo de um determinado ponto na distribuição. Deste
modo, a soma das frequências de todos os valores abaixo do limite superior de uma determinada classe é definida
como frequência acumulada até o ponto de interesse. Desta forma temos:
t
X
Fi = fi , t ≤ k,
i=1
em que
fi : é a frequência absoluta da i-ésima classe, i = 1, 2, ..., t, t ≤ k;

t
P
fi : é o somatório de todas as frequências absolutas até a classe t em questão (t ≤ k). Podemos observar que
i=1
t
X t−1
X
Fi − Fi−1 = fi , i = 2, 3, ..., k, ou ainda fi − fi = fi , t ≤ k.
i=1 i=1
Por exemplo, podemos observar na Tabela (10) que a frequência absoluta da segunda classe (f2 = 10) é igual
a frequência acumulada da segunda classe (F2 = 12) menos a frequência acumulada da primeira classe (F1 = 2). A
frequência absoluta da terceira classe (f3 = 26) é igual a frequência acumulada da terceira classe (F3 = 38) menos
a frequência acumulada da segunda classe (F2 = 12), e assim por diante para as demais classes.
7.8 Frequência acumulada relativa percentual
A frequência acumulada relativa percentual da i-ésima classe, i = 1, 2, ..., k, é dada por:
F ri % = F ri × 100%, t ≤ k.
Podemos observar que
t
X t−1
X
F ri % − F ri−1 % = f ri %, i = 2, 3, ..., k, ou ainda f ri % − f ri % = f ri %, t ≤ k.
i=1 i=1
7.9 Média para dados agrupados em classes
A média é a principal medida de posição, sendo utilizada principalmente quando os dados apresentam dis-
tribuição simétrica ou aproximadamente simétrica, como acontece com a maioria das situações práticas. Deve-se
diferenciar, por meio de notação apropriada a média populacional da amostral.
A população refere-se a todos os elementos de interesse do pesquisador para a qual fica praticamente impossı́vel
tomar as informações elemento a elemento. A amostra por sua vez refere-se a um subconjunto de elementos desta
população e obtida de acordo com alguns critérios, de tal forma que haja uma representatividade da população
da qual foi extraı́da, e para qual se deseja extrapolar as informações (inferências estatı́sticas). Será utilizada para
diferenciar a média da amostra e da população a seguinte notação:
Média populacional: Média amostral:

k
P k
P
fi Xi fi Xi
i=1 i=1
µ= k
P
X= k
P
fi fi
i=1 i=1
em que:
Xi : é o ponto médio da i-ésima classe, i = 1, 2, ..., k.
fi : é o frequência absoluta da i-ésima classe, i = 1, 2, ..., k.
Então no exemplo do teor de chumbo temos:
k
P
fi Xi
i=1 20.391
X= k
= = 75, 52 ppm.
P 270
fi
i=1
Interpretação: A quantidade média do teor de chumbo nos pontos de sondagem do solo na fazenda Ponta
da Serra - Caicó-RN é de 75, 52 ppm, ou ainda, o valor médio do qual os teores de chumbo se concentram é de
75, 52 ppm.

7.10 Mediana para dados agrupados em classes
No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte expressão:
 
k
1
P
2 fi − Fant 
 i=1
M e = LIM e +   × h,

 fM e 
em que
LIM e : é o limite inferior da classe que contem a mediana;
Fant : é a frequência acumulada anterior à classe que contem a mediana;
fM e : é a frequência absoluta da classe que contem a mediana;
h : é a altura (amplitude) da classe que contem a mediana;
Então no exemplo do teor de chumbo, a partir da Tabela (3), temos:
 
k
1
P
2 fi − Fant  270
2 − 127

i=1
Me = LIM e +  × h = 73, 5 + × 13
 
fM e 60

 
Me = 75, 23 ppm
Interpretação: 50% dos pontos de sondagem apresentaram um teor de chumbo abaixo de 75, 23 ppm.
Equivalentemente 50% dos pontos de sondagem apresentaram um teor de chumbo acima de 75, 23 ppm.
7.11 Moda bruta para dados agrupados em classes
Seja um conjunto de dados agrupados em k classes, então sua moda bruta é dada por:
h
M ob = LIM o + ,
2
em que
LIM O : é o limite inferior da classe modal;
h : é a amplitude da classe modal;
Então no exemplo do teor de chumbo, a partir da Tabela (10), temos que a moda bruta é dada por
h 13
M ob = LIM o + = 73, 5 + = 80
2 2
M ob = 80 ppm.
Interpretação: O valor bruto mais frequente do teor de chumbo nos pontos de sondagem do solo na fazenda
Ponta da Serra - Caicó-RN é de 80 ppm.
7.12 Moda de Czuber para dados agrupados em classes
A moda é definida para dados qualitativos ou para quantitativos discretos como sendo o valor de maior
frequência na amostra. Para dados quantitativos contı́nuos a moda é o valor de maior densidade. Portanto para
dados quantitativos contı́nuos o estimador da moda é baseado na distribuição de frequências. Esse estimador busca
encontrar o ponto de máximo do polı́gono de frequências.
O estimador da moda para dados quantitativos contı́nuos é definido a partir da distribuição de frequência
por meio de um método geométrico, a partir do histograma de frequências (Método de Czuber). Este método é
baseado na influência que as classes adjacentes exercem sobre a moda, deslocando-a no sentido da classe de maior
frequência, o qual conduz a seguinte expressão:

∆1
M o = LIM o + × h,
∆1 + ∆ 2
em que
LIM o : é o limite inferior da classe modal (classe mais frequente);
∆1 : é a diferença entre a classe modal e a classe anterior;
∆2 : é a diferença entre a classe modal e a classe posterior;
h : é a altura (amplitude) da classe modal;
Então no exemplo do teor de chumbo, a partir da Tabela (3), temos que a moda de Czuber é dada por

∆1 9
Mo = LIM o + × h = 73, 5 + × 13
∆1 + ∆ 2 9 + 26
Mo = 76, 84 ppm.
Interpretação: O valor mais frequente do teor de chumbo nos pontos de sondagem do solo na fazenda Ponta
da Serra - Caicó-RN é de 76, 84 ppm.
Observação: Quando a classe modal é a primeira classe então não há classe anterior e, portanto, ∆1 é a própria
frequência absoluta da primeira classe f1 , pois a frequência absoluta da classe anterior é zero já que ela não existe,
ou seja
∆1 = f1 − 0 = f1 .
Analogamente, quando a classe modal é a última classe então não há classe posterior e, portanto, ∆2 é a própria
frequência absoluta da última classe fk , pois a frequência absoluta da classe posterior é zero já que ela não existe,
ou seja
∆2 = fk − 0 = fk .
A Figura (13) mostra geometricamente a obtenção da Moda para dados agrupados em classes pelo método
de Czuber.
Figura 13: Moda de Czuber para os dados do teor de chumbo.
No histograma acima, marcam-se, na classe modal, os vértices A, B, C e D. Traçam-se as retas AC e

BD. No ponto de intersecção destas retas (ponto E) traça-se uma perpendicular ao eixo das classes, localizando
o ponto Mo, valor da moda. O ponto Mo divide o intervalo da classe modal (que mede h) em duas partes, cujos
comprimentos são proporcionais a ∆1 e ∆2 . Notamos pela Figura (13) que ∆1 é a diferença entre a frequência
da classe modal e da classe imediatamente anterior, e ∆2 é a diferença entre as frequências da classe modal e da
imediatamente posterior.

Por E traça-se a reta FG, paralela ao eixo das classes, obtendo assim, os segmentos EF e EG, que representam
as alturas dos triângulos ABE e CDE. Sendo LIM o o limite inferior da classe modal, LSM o o limite superior e x
a distância entre LIM o e a moda (Mo), verifica-se na Figura (13) que:
M o = LIM o + x (14)
Como os triângulos ABE e CDE são semelhantes (pois possuem dois ângulos iguais) segue que:
EF EG x h−x
= ⇔ =
AB CD ∆1 ∆2
Resolvendo a equação em função de x obtemos
x∆2 = ∆1 (h − x)
x∆2 = ∆1 h − ∆1 x
x∆2 + ∆1 x = ∆1 h
x (∆1 + ∆2 ) = ∆1 h
∆1 h
x =
∆1 + ∆ 2
Desse forma temos que
∆1
x= ×h (15)
∆1 + ∆ 2
Substituindo (15) em (14) obtemos finalmente a expressão para a Moda pelo método de Czuber
Mo = LIM o + x
∆1
Mo = LIM o + ×h
∆1 + ∆ 2
O estimador da moda pode também ser considerado como o valor médio da classe modal (moda bruta), como
é apresentado por diversos autores. A justificativa é dada pela hipótese tabular básica, que diz que todos os valores
de uma classe são iguais ao seu ponto médio.
Como neste caso a classe modal é a de maior frequência, a moda é considerada como igual a este ponto médio.
Nesse material o método geométrico anteriormente apresentado é considerado, por ser considerado mais eficiente.
Fato: Se a distribuição de frequências for perfeitamente simétrica então temos que ∆1 = ∆2 , e o valor modal
para este caso particular se resume na moda bruta, ou seja,
h
M o = LIM o + .
2
Demonstração: como ∆1 = ∆2 então segue que

∆1
Mo = LIM o + ×h
∆1 + ∆ 2
∆1
= LIM o + ×h
∆1 + ∆ 1
∆1
= LIM o + ×h
2∆1
h
Mo = LIM o +
2
É conveniente comentar que as calculadoras eletrônicas não fornecem os cálculos da mediana e da moda, o
que para grandes conjuntos de dados, seus cálculos exatos podem ser extremamente laborioso. A moda de Czuber
é mais apurada para o conjunto de dados, ou seja, é mais refinada no que diz respeito ao valor modal em relação
a moda bruta. Na prática, quando o conjunto de dados é muito grande então a moda de Czuber e a moda bruta
são bem próximas.

7.13 Medidas de dispersão para dados agrupados em classes
Para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto de dados agrupados em classes,
usaremos as medidas de dispersão já estudadas para o caso de dados não agrupados. Essas medidas nos propor-
cionarão um conhecimento mais completo do fenômeno a ser analisado, permitindo estabelecer comparações entre
fenômenos da mesma natureza e mostrando até que ponto os valores se distribuem acima ou abaixo da medida de
tendência central.
Nesse Capı́tulo apresentamos a seguir a variância e o desvio padrão. Para o cálculo das medidas de dispersão
tais como a variância e o desvio padrão é necessário acrescentar algumas colunas na Tabela (10) conforme mostra
a Tabela (11):
Limite Limite Frequencia absoluta

Inferior (LI) Superior (LS) fi Xi fi Xi Fi F ri % fi Xi2
8, 5 ` 21, 5 2 15 30 2 0, 74 450
21, 5 ` 34, 5 10 28 280 12 4, 44 7.840
34, 5 ` 47, 5 26 41 1066 38 14, 07 43.706
47, 5 ` 60, 5 38 54 2052 76 28, 15 110.808
60, 5 ` 73, 5 51 67 3417 127 47, 07 228.939
73, 5 ` 86, 5 60 80 4800 187 69, 26 384.000
86, 5 ` 99, 5 34 93 3162 221 81, 85 294.066
99, 5 ` 112, 5 30 106 3180 251 92, 96 337.080
112, 5 ` 125, 5 11 119 1309 262 97, 04 155.771
125, 5 ` 138, 5 6 132 792 268 99, 26 104.544
138, 5 ` 151, 5 1 145 145 269 99, 63 21.025
151, 5 ` 164, 5 P 1 158 158 270 100 24.964
270 20.391 1.713.193
7.14 Variância para dados agrupados em classes
Para o caso de dados agrupados em classes a variância populacional e amostral são dadas respectivamente
por:
Variância populacional: Variância amostral:

"
k
k
2 # "
k
k
2 #
2 1 1 1 1
fi Xi2 2
fi Xi2
P P P P
σ = N − N fi Xi s = n−1 − n fi Xi
i=1 i=1 i=1 i=1
em que:
Então no exemplo do teor de chumbo, a variância amostral é dada por


k k
!2 
1  X 1 X
S2 = fi Xi2 − fi Xi 
n − 1 i=1 n i=1
" #
2
1 (20.391)
= 1.713.193 −
270 − 1 270
S2 = 643, 94 ppm2 .
Observação: A unidade da variância sempre é igual ao quadrado da unidade da média.
7.15 Desvio padrão para dados agrupados em classes
Para o caso de dados agrupados em classes o desvio padrão populacional e amostral são dados respectivamente
por:
Desvio padrão populacional: Desvio padrão amostral:

√ √
v " σ= σ2 v s= S2
u
k
k
2 # u "
k
k
2 #
u u
= t N1 fi Xi2 − 1 1
fi Xi2 − 1
P P P P
N fi Xi =t n−1 n fi Xi
i=1 i=1 i=1 i=1
em que
Então no exemplo do teor de chumbo, o desvio-padrão amostral é dada por:
√ p
S = S2 = 643, 94 ppm2
S = 25, 38 ppm.
7.16 Coeficiente de variação para dados agrupado em classes
O coeficiente de variação é o quociente percentual entre o desvio padrão e a média do conjunto de dados,
sendo expresso por:
S
CV = × 100%.
X
Em nosso exemplo do teor de chumbo das amostras coletadas, temos
25, 38
CV = × 100%
75, 52
CV = 33, 61%.

7.17 Medidas separatrizes ou quantis
Medidas separatrizes ou quantis são medidas que dividem o conjunto de dados ordenados (ROL) em partes
iguais em termos de quantidade de observações. Na estatı́stica descritiva usa-se frequentemente o Tercil, Quartil,
o Decil e o Percentil.
7.17.1 Tercil
Os tercis separam um conjunto de dados ordenados (ROL) em três partes iguais. A Figura abaixo mostra
graficamente a divisão do conjunto de dados por meio de dos tercis.
T1 T2 T3
0 1/3 2/3 3/3

Assim:
T1 : é o primeiro tercil, deixa 1/3 (33, 33%) dos elementos abaixo dele;
T2 : é o segundo tercil, deixa 2/3 (66, 67%) dos elementos abaixo dele;
T3 : é o terceiro tercil, deixa 3/3 (100%) dos elementos abaixo dele;
A expressão abaixo nos fornece o valor do i-ésimo tercil (Ti ), i = 1, 2, 3, para dados agrupados em classes.
 
k
i
P
3 f i − F ant 
Ti = LITi +  i=1  × h,
 
 fTi 
em que
LITi : é o limite inferior da classe que contém o Ti , i = 1, 2, 3;
Fant : é a frequência acumulada anterior à classe que contém o Ti , i = 1, 2, 3;
fTi : é a frequência da classe que contém o Ti , i = 1, 2, 3;
h : é a altura (amplitude) da classe que contém o Ti , i = 1, 2, 3;
Cálculo do primeiro tercil (T1 ) Exemplo do teor de chumbo das amostras.
 
k
1
P
3 fi − Fant  1
× 270 − 76

T1 = LIT1 +  i=1  × h = 60, 5 + 3 × 13
 
 fT1  51
T1 = 64, 07 ppm.
Interpretação: 1/3 dos pontos de sondagem apresentaram um teor de chumbo abaixo de 64, 07 ppm ou
equivalentemente 2/3 dos pontos de sondagem apresentaram um teor de chumbo acima de 64, 07 ppm.
Cálculo do segundo tercil (T2 ): Exemplo do teor de chumbo das amostras.
 
k
2
P
3 fi − Fant  2
3 × 270 − 127

 i=1
T2 = LIT2 +   × h = 73, 5 + × 13

 fT2  60
T2 = 84, 98 ppm.
Interpretação: 2/3 dos pontos de sondagem apresentaram um teor de chumbo abaixo de 84, 98 ppm ou
equivalentemente 1/3 dos pontos de sondagem apresentaram um teor de chumbo acima de 84, 98 ppm.
Cálculo do terceiro tercil (T3 ): Exemplo do teor de chumbo das amostras.
 
k
3
P
3 fi − Fant  3
× 270 − 269

T3 = LIT3 +  i=1  × h = 151, 5 + 3 × 13
 
 fT3  1
T3 = 164, 5 ppm.

Interpretação: 3/3 (100%) dos pontos de sondagem apresentaram um teor de chumbo abaixo de 164, 5 ppm.
Observação: O último tercil sempre vai assumir um valor igual ao limite superior da última classe (LSk ).
7.17.2 Quartil
Os quartis separam um conjunto de dados ordenados (ROL) em quatro partes iguais. A Figura abaixo mostra
graficamente a divisão do conjunto de dados por meio de dos quartis.
Q1 Q2 Q3 Q4
0% 25% 50% 75% 100%

Assim temos:
Q1 : é o primeiro quartil, deixa 25% dos elementos abaixo dele;
Q2 : é o segundo quartil, deixa 50% dos elementos abaixo dele;
Q3 : é o terceiro quartil, deixa 75% dos elementos abaixo dele;
Q4 : é o quarto quartil, deixa 100% dos elementos abaixo dele;
A expressão abaixo nos fornece o valor do i-ésimo quartil (Qi ), i = 1, 2, 3, 4, para dados agrupados em classes.
 
k
i
P
4 fi − Fant 
Qi = LIQi +  i=1  × h,
 
 fQi 
em que:
LIQi : é o limite inferior da classe que contém o Qi , i = 1, 2, 3, 4;
Fant : é a frequência acumulada anterior à classe que contém o Qi , i = 1, 2, 3, 4;
fQi : é a frequência da classe que contém o Qi , i = 1, 2, 3, 4;
h : é a altura (amplitude) da classe que contém o Qi , i = 1, 2, 3, 4;
Observação: A expressão algébrica que nos fornece o cálculo do segundo quartil (Q2 ) coincide com a expressão
da mediana, pois ambas as medidas, M e e Q2 nos fornece 50% dos dados abaixo de si mesma. Portanto, quando
nos referimos ao segundo quartil da distribuição estamos nos referindo a mediana da distribuição.
Vamos determinar o Q1 , Q2 , Q3 e Q4 no exemplo do teor de chumbo.
Cálculo do primeiro quartil (Q1 ): Exemplo do teor de chumbo das amostras.
 
k
1
P
4 fi − Fant  1
4 × 270 − 38

Q1 = LIQ1 +  i=1 × h = 47, 5 + × 13
 
fQ1 38

 
Q1 = 57, 59 ppm.
Interpretação: 25% dos pontos de sondagem apresentaram um teor de chumbo abaixo de 57, 59 ppm ou
equivalentemente 75% dos pontos de sondagem apresentaram um teor de chumbo acima de 57, 59 ppm.
Cálculo do segundo quartil (Q2 ): Exemplo do teor de chumbo das amostras.
 
k
2
P
4 fi − Fant  2
× 270 − 127

Q2 = LIQ2 +  i=1  × h = 73, 5 + 4 × 13
 
 fQ2  60
Q2 = 75, 23 ppm.
Observação: Podemos notar que o valor obtido de Q2 é o mesmo valor obtido da mediana M e.
Cálculo do terceiro quartil (Q3 ): Exemplo do teor de chumbo das amostras.
 
k
3
P
4 fi − Fant  3
× 270 − 187

Q3 = LIQ3 +  i=1  × h = 86, 5 + 4 × 13
 
 fQ3  34
Q3 = 92, 43 ppm.

Cálculo do quarto quartil (Q4 ): Exemplo do teor de chumbo das amostras.
 
k
4
P
4 fi − Fant  4
4 × 270 − 269

Q4 = LIQ4 +  i=1 × h = 151, 5 + × 13
 
fQ4 1

 
Q4 = 164, 5 ppm.
Interpretação: 100% dos pontos de sondagem apresentaram um teor de chumbo abaixo de 164, 5 ppm.
Observação: O último quartil sempre vai assumir um valor igual ao limite superior da última classe (LSk ).
7.17.3 Decil
São valores que dividem uma série de dados ordenados em dez partes iguais. A Figura abaixo mostra
graficamente a divisão do conjunto de dados por meio de dos decis.
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
em que
D1 : é o primeiro decil, deixa 10% dos elementos abaixo dele;
D2 : é o segundo decil, deixa 20% dos elementos abaixo dele;
D3 : é o terceiro decil, deixa 30% dos elementos abaixo dele;
.. .. .. .. ..
. . . . .
D10 : é o décimo decil, deixa 100% dos elementos abaixo dele;
O i-ésimo decil, i = 1, 2, ...., 10, de um conjunto de observações organizadas na forma de uma distribuição de
frequências é expresso por:
 n 
i
P
× f i − Fant
 10 i=1 
Di = LIDi +  ×h
 fDi 
em que
LIDi : é o limite inferior da classe que contém o Di ;
Fant : é a frequência acumulada anterior à classe que contém o Di ;
fDi : é a frequência da classe que contém o Di ;
h : é a altura (amplitude) da classe que contém o Di ;
No exemplo do teor de chumbo nas amostras temos:
D1 = 42 ppm. Interpretação: 10% dos pontos de sondagem apresentaram um teor de chumbo abaixo de 42
ppm, ou equivalentemente 90% dos pontos de sondagem apresentaram um teor de chumbo acima de 42 ppm.
D2 = 52, 97 ppm. Interpretação: 20% dos pontos de sondagem apresentaram um teor de chumbo abaixo de
52, 97 ppm, ou equivalentemente 80% dos pontos de sondagem apresentaram um teor de chumbo acima de 52, 97
ppm.
ppm.
ppm.
ppm.

ppm.
ppm.
ppm.
ppm.
164, 5 ppm.
7.17.4 Percentil
São valores que dividem uma série de dados ordenados em 100 partes iguais. A Figura abaixo mostra
graficamente a divisão do conjunto de dados por meio de dos percentis.
P1 P2 P3 ··· P50 P51 ··· P98 P99 P100
0% 1% 2% 3% · · · 50% 51% · · · 98% 99% 100%

em que
P1 : é o primeiro percentil, deixa 1% dos elementos abaixo dele;
P2 : é o segundo percentil, deixa 2% dos elementos abaixo dele;
P3 : é o terceiro percentil, deixa 3% dos elementos abaixo dele;
.. .. .. .. ..
. . . . .
P10 : é o centésimo percentil, deixa 100% dos elementos abaixo dele;
O i-ésimo percentil, i = 1, 2, ...., 100, de um conjunto de observações organizadas na forma de uma distribuição
de frequências pode ser obtido por:
 n 
i
P
× fi − Fant
 100 i=1 
Pi = LIPi +  ×h
 fPi 
em que
LIPi : é o limite inferior da classe que contém o Pi ;
Fant : é a frequência acumulada anterior à classe que contém o Pi ;
fPi : é a frequência da classe que contém o Pi ;
h : é a altura (amplitude) da classe que contém o Pi ;
No exemplo do teor de chumbo nas amostras vamos determinar os percentis P33 , P84 , e P99 :
Cálculo do trigésimo terceiro percentil (P33 ): Exemplo do teor de chumbo das amostras.
 
k
33
P
 100 fi − Fant  33
× 270 − 76

i=1
P33 = LIP33 +   × h = 60, 5 + 100 × 13
 
 fP33  51
P33 = 63, 84 ppm.

Interpretação: 33% dos pontos de sondagem apresentaram um teor de chumbo abaixo de 63, 84 ppm, ou
Cálculo do octogésimo quarto terceiro percentil (P84 ): Exemplo do teor de chumbo das amostras.
 
k
84
P
 100 fi − Fant  84
× 270 − 221

i=1
P84 = LIP84 +   × h = 99, 5 + 100 × 13
 
 fP84  30
P84 = 102, 01 ppm.

Cálculo do nonagésimo nono percentil (P99 ): Exemplo do teor de chumbo das amostras.
 
k
84
P
 100 fi − Fant  99
100 × 270 − 262

i=1
P99 = LIP99 +   × h = 99, 5 + × 13
 
 fP99  6
P99 = 136, 98 ppm.

Observação: Podemos verificar no exemplo do teor de chumbo nas amostras que
M e = Q2 = D5 = P50 = 75, 23 ppm.
e que
T3 = Q4 = D10 = P100 = LSk = 164, 5 ppm.
7.18 Medidas de assimetria
Como foi visto anteriormente, várias medidas sintetizadoras da amostra são apresentadas, destacando-se as
medidas de tendência central e as medidas de dispersão, cada qual com suas particularidades e caracterı́sticas. São
apresentadas, também, formas gráficas para avaliação da natureza da distribuição dos dados. Neste último caso por
uma inspeção empı́rica o pesquisador podia inferir que tipo de distribuição os dados de sua pesquisa apresentavam.
Naquele instante deu-se ênfase a simetria da distribuição, ou seja, se a forma da distribuição apresentava uma
concentração maior dos valores em torno do valor central e se à medida que se afastassem em ambas as direções
deste centro, o comportamento se mantinha semelhante, reduzindo-se as frequências. Uma forma de se estimar o
grau de assimetria pode ser dada pelo coeficiente de assimetria. Nesse trabalho apresentamos os três coeficientes
de assimetria mais usados:
Primeiro coeficiente de assimetria de Pearson;
Segundo coeficiente de assimetria de Pearson;
Coeficiente de assimetria via método dos momentos;
Para todos os coeficientes de assimetria acima citados vale a interpretação da Tabela (12) que apresenta a
classificação das distribuições quanto a assimetria.
Tabela 12: Classificação das distribuições quanto a assimetria.
CS = 0 Distribuição simétrica perfeita.

CS > 0 Distribuição assimétrica à direita (assimétrica positiva).
CS < 0 Distribuição assimétrica à esquerda (assimétrica negativa).
A Figura 14 apresenta os tipos de distribuições quanto ao coeficiente de assimetria.
Figura 14: Distribuição assimétrica negativa, simétrica e assimétrica positiva.

Nas situações reais da pesquisa, esta informação é de grande valia, uma vez, que os processos de decisão
e estimação são baseados em distribuições simétricas. Como os dados destas pesquisas referem-se a amostras de
uma população, dificilmente o coeficiente de assimetria será exatamente igual à zero, mesmo quando proveniente
de uma distribuição sabidamente simétrica. Em geral temos distribuições aproximadamente simétricas. Por essa
razão, vários autores adotam escalas para o coeficiente de assimetria, tais como a escala abaixo:
Se CS < −0, 10 então temos uma distribuição assimétrica à esquerda ou assimétrica negativa.
Se −0, 10 < CS < 0, 10 então temos uma distribuição aproximadamente simétrica.
Se CS > 0, 10 então temos uma distribuição assimétrica à direita ou assimétrica positiva.
7.18.1 Primeiro coeficiente de assimetria de Pearson
O primeiro coeficiente de assimetria de Pearson é expresso por:
X − Mo
CS1 = ,
S
em que
X : é a média do conjunto de dados;
M o : é a moda de Czuber do conjundo de dados;
S : é o desvio padrão do conjunto de dados;
Podemos observar que tal medida considera apenas a distância entre a média e a moda. Em nosso exemplo
do teor de chumbo encontrado dos pontos de sondagem do solo da Fazenda Ponta da Serra, temos:
X − Mo 75, 52 − 76, 84
CS1 = =
S 25, 23
CS1 = −0, 0520
Interpretação: De acordo com o primeiro coeficiente de assimetria de Pearson, como temos −0, 10 < CS =
−0, 0520 < 0, 10 podemos afirmar que temos uma distribuição aproximadamente simétrica.
7.18.2 Segundo coeficiente de assimetria de Pearson
O segundo coeficiente de assimetria de Pearson é expresso por:

3 X − Me
CS2 =
S
em que:
X : é a média do conjunto de dados;
M e : é a mediana do conjundo de dados;
S : é o desvio padrão do conjunto de dados;
Podemos observar que tal medida considera apenas a distância entre a média e a mediana. Em nosso exemplo
do teor de chumbo encontrado dos pontos de sondagem do solo da Fazenda Ponta da Serra, temos

3 X − Me 3 (75, 52 − 75, 23)
CS2 = =
S 25, 23
CS2 = 0, 0343.

Interpretação: De acordo com o segundo coeficiente de assimetria de Pearson, como temos −0, 10 < CS =
0, 0343 < 0, 10 podemos afirmar que temos uma distribuição aproximadamente simétrica.
7.18.3 Momentos
Momento de ordem r de um conjunto quantitativo de dados: Considere um conjunto de dados

quantitativos (discreto ou contı́nuo) dado por X1 , X2 , ..., Xn . Então seu r-ésimo momento é dado por
n
Xir
P
r i=1 X1r + X2r + ... + X3r
M = = , r = 1, 2, 3, ...
n n
Observação: Se r = 1 temos que o primeiro momento é igual a média dos dados, ou seja, M 1 = X.
Momento de ordem r em relação a uma origem C de um conjunto quantitativo de dados:

Considere um conjunto de dados quantitativos (discreto ou contı́nuo) dado por X1 , X2 , ..., Xn . Então seu r-ésimo
momento em relação a uma origem C é dado por:
n
P r
(Xi − C) r r r
r i=1 (X1 − C) + (X2 − C) + ... + (Xn − C)
M(C) = = , r = 1, 2, 3, ...
n n
Momento de ordem r em relação a média de um conjunto quantitativo de dados: Considere um
conjunto de dados quantitativos (discreto ou contı́nuo) dado por X1 , X2 , ..., Xn . Então seu r-ésimo momento em
relação a média é dado por:
n
P r
Xi − X r r r
i=1 X1 − X + X2 − X + ... + Xn − X
M(rX ) = = , r = 1, 2, 3, ...
n n
Se r = 1, temos que M 1X = 0, conforme visto nas propriedades da média.

( )
Se r = 2, temos que M 2X = σ 2 , ou seja, o segundo momento de um conjunto de dados quantitativos em
( )
relação a sua média é a própria variância populacional dos dados.
Momento de ordem r em relação a média considerando um conjunto quantitativo de dados

agrupados em k classes: Considere um conjunto de dados quantitativos (discreto ou contı́nuo) agrupados em
classes, tal que o ponto médio de cada classe dado por X1 , X2 , ..., Xk tenha sua respectiva frequência absoluta
f1 , f2 , ..., fk . Então seu r-ésimo momento em relação a média é dado por:
k
P r
fi Xi − X r r r
i=1 f1 X1 − X + f2 X2 − X + ... + fk Xk − X
M(rX ) = k
= k
, r = 1, 2, 3, ...
P P
fi fi
i=1 i=1
Se r = 2, temos que M 2X = σ 2 , ou seja, o segundo momento de um conjunto de dados quantitativos em

( )
relação a sua média é a própria variância populacional dos dados.
Para o cálculo dos coeficientes de assimetria e curtose, para dados agrupados em classes, via métodos dos
momentos, que serão vistos a seguir, precisaremos respectivamente dos momentos 3 e 4 em relação a média.
Portanto, para o cálculo das medidas de assimetria e curtose, precisamos acrescentar colunas na Tabela (11) para
determinar, primeiramente, os momentos de ordem 3 e ordem 4, respectivamente, conforme mostra a Tabela (13):


3 4
Classes fi Xi fi Xi Fi F ri % fi Xi2 fi Xi − X fi Xi − X
8, 5 ` 21, 5 2 15 30 2 0, 74 450 −443.329, 63 26.830.308, 92
21, 5 ` 34, 5 10 28 280 12 4, 44 7.840 −1.073.073, 07 50.992.432, 29
34, 5 ` 47, 5 26 41 1066 38 14, 07 43.706 −1.069.512, 12 36.919.558, 27
47, 5 ` 60, 5 38 54 2052 76 28, 15 110.808 −378.713, 16 8.149.907, 22
60, 5 ` 73, 5 51 67 3417 127 47, 07 228.939 −31.541, 98 268.737, 67
73, 5 ` 86, 5 60 80 4800 187 69, 26 384.000 5.394, 92 24.169, 26
86, 5 ` 99, 5 34 93 3162 221 81, 85 294.066 181.594, 71 3.174.275, 60
99, 5 ` 112, 5 30 106 3180 251 92, 96 337.080 849.505, 40 25.892.924, 52
112, 5 ` 125, 5 11 119 1309 262 97, 04 155.771 904.193, 31 39.314.325, 30
125, 5 ` 138, 5 6 132 792 268 99, 26 104.544 1.081.023, 95 61.056.232, 51
138, 5 ` 151, 5 1 145 145 269 99, 63 21.025 335.412, 64 23.304.470, 46
151, 5 ` 164,P 5 1 158 158 270 100 24.964 561.107, 35 46.280.134, 14
270 20.391 1.713.193 922.062, 3 322.207.476
7.18.4 Coeficiente de assimetria via método dos momentos
O coeficiente de assimetria via método dos momentos é dado por:

3
MX
CS = 1,5 ,
(S 2 )
em que:
3
MX : é o terceiro momento em relação a média considerando dados agrupados em classes, expresso por
k
P 3
fi Xi − X
3 i=1
MX = k
.
P
fi
i=1
S 2 : é a variância amostral dos dados agrupados em classes.

Em nosso exemplo do teor de chumbo encontrado dos pontos de sondagem do solo da Fazenda Ponta da
Serra, temos que o terceiro momento em relação a média é dado por:
k
P 3
fi Xi − X
3 i=1 922062, 3
MX = k
=
P 270
fi
i=1
3
MX = 3415, 046.
3
Após o cálculo do terceiro momento em relação a média (MX ) considerando dados agrupados em classes,
usamos tal medida para determinar o coeficiente de assimetria via métodos dos momentos da seguinte forma:
3
MX 3415, 046
CS = 1,5 =
(S 2 ) 643, 941,5
CS = 0, 2090.
Interpretação: De acordo com o segundo coeficiente de assimetria via métodos dos momentos, como temos
CS = 0, 2090 > 0, 10 então temos uma distribuição assimétrica positiva ou assimétrica à direita.

7.19 Medidas de curtose ou achatamento
Uma outra medida para verificar a natureza da distribuição, é denominada de curtose. Esta é uma medida
do grau de achatamento da distribuição quando comparada ao de uma distribuição conhecida como distribuição
normal que será vista mais adiante. Apresentamos a seguir duas das principais medidas de curtose: o coeficiente
percentı́lico de curtose e o coeficiente de curtose via métodos dos momentos.
7.19.1 Coeficiente percentı́lico de curtose
O coeficiente percentı́lico de curtose é dado por:

Q3 − Q1
CKP = ,
2 (P90 − P10 )
em que:
Q1 : é o primeiro quartil da distribuição;

Q3 : é o terceiro quartil da distribuição;
P10 : é o décimo percentil da distribuição;
P90 : é o nonagésimo percentil da distribuição;
A classificação para esse coeficiente é a seguinte:
Se CKP < 0, 263 : a distribuição é leptocúrtica;

Se CKP = 0, 263 : a distribuição é mesocúrtica;
Se CKP > 0, 263 : a distribuição é platicúrtica;
Serra, temos que o coeficiente percentı́lico de curtose é dado por:
Q3 − Q1 92, 43 − 57, 59
CKP = =
2 (P90 − P10 ) 2 (109, 03 − 42)
CKP = 0, 2599.
Interpretação: De acordo com o coeficiente percentı́lico de curtose temos CKP < 0, 263, então trata-se de
uma distribuição leptocúrtica.
7.20 Coeficiente de curtose via métodos dos momentos
O coeficiente de curtose via métodos dos momentos é expresso por:

4
MX
CK = 2,
(S 2 )
em que
4
MX : é o quarto momento em relação a média considerando dados agrupados em classes, expresso por
k
P 4
fi Xi − X
4 i=1
MX = k
P
fi
i=1
S 2 : é a variância amostral dos dados agrupados em classes.

A Tabela (14) apresenta a classificação das distribuições quanto ao coeficiente de curtose.

Tabela 14: Classificação das distribuições quanto ao coeficiente de curtose.
CK = 3 Distribuição mesocúrtica (Distribuição Normal).

CK < 3 Distribuição leptocúrtica (mais afiniladas que a Normal).
CK > 3 Distribuição platicúrtica (mais achatadas que a Normal).
A Figura (15) apresenta os tipos de distribuições quanto ao coeficiente de curtose.
Figura 15: Distribuição platicúrtica, mesocúrtica e leptocúrtica
Na prática, dificilmente encontraremos um coeficiente de curtose exatamente igual a CK = 3. O mais comum

é encontrarmos conjunto de dados aproximadamente mesocúrtico (aproximadamente normal). Então, assim como
no caso do coeficiente de assimetria, adotamos a seguinte escala de interpretação:
Se CK < 2, 5 então temos uma distribuição leptocúrtica (mais afinilada que a distribuição normal).
Se 2, 5 < CK < 3, 5 então temos uma distribuição mesocúrtica (aproximadamente normal).
Se CK > 3, 5 então temos uma distribuição platicúrtica (mais achatada que a distribuição normal).
Serra, temos que o quarto momento em relação a media é dado por:
k
P 4
fi Xi − X
4 i=1 322.207.476
MX = k
=
P 270
fi
i=1
4
MX = 1.193.361.
4
Após o cálculo do quarto momento em relação a média (MX ) considerando dados agrupados em classes,
usamos tal medida para determinar o coeficiente de curtose via métodos dos momentos da seguinte forma:
4
MX 1.193.361
CK = 2 = 643, 942
(S 2 )
CK = 2, 8779.
Interpretação: De acordo com o segundo coeficiente de curtose via métodos dos momentos, como temos
2, 5 < CK = 2, 8779 < 3, 5 então temos uma distribuição aproximadamente mesocúrtica (aproximadamente nor-
mal).

8 Exercı́cios propostos sobre estatı́stica descritiva
Exercı́cios de estatı́stica descritiva para dados sem agrupamento
Exercı́cio 1: Aplicações em indústrias siderúrgicas. Em uma linha de produção de uma grande

indústria siderúrgica, três máquinas semi-automáticas são programadas para cortes de chapas de aço. O setor de
controle de qualidade deseja comparar as chapas produzidas por estas três máquinas do que diz respeito a sua
largura (em cm). Para isto, coletou-se uma amostra de n = 15 chapas de aço produzidas por cada máquina, e os
resultados encontram-se abaixo:
Largura (em cm) de 15 chapas de aço.

Chapas (Indivı́duos) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Máquina I 37 34 28 38 33 30 33 20 30 34 27 39 19 48 33
Máquina II 58 61 49 61 48 50 61 54 66 44 45 63 71 41 50
Máquina III 26 55 53 39 40 39 76 44 39 51 39 45 34 45 44
a. Encontre a largura mediana e a largura modal das chapas de aço de cada uma das três máquinas.
b. Encontre o Coeficiente de Variação Amostral de cada uma das três máquinas para apontar qual delas
apresentou a maior variabilidade na largura.
Exercı́cio 2: Aplicações em controle da qualidade da água. Foi medida a concentração de Mercúrio

(em mg/l) nas estações de tratamento de água de n = 3 cidades diferentes e os resultados encontram-se no quadro
abaixo:
Medições de mercúrio (em mg/l) em três ETA’s.
ETA do municı́pio 1 0, 11 0, 05 0, 15 0, 10 0, 11 0, 13 0, 10 0, 13
ETA do municı́pio 2 0, 13 0, 05 0, 03 0, 07 0, 09 0, 11 0, 06 0, 10
ETA do municı́pio 3 0, 08 0, 13 0, 13 0, 10 0, 13 0, 12 0, 15 0, 12
Compare a variabilidade da concentração de mercúrio das três ETA’s por meio do Coeficiente de Variação e
faça comentários pertinentes.
Exercı́cio 3: Aplicações na agroindústria. Em uma grande propriedade rural situada na Região Oeste
da Bahia é cultivada a Soja. Para analisar a qualidade do solo, foi realizada uma sondagem em 50 pontos diferentes
na área e foi medido o nı́vel de Potássio (em mg/m3 ) e o teor de acidez P h. As Tabelas abaixo apresentam os
resultados obtidos nessa propriedade:
Tabela 1. Nı́veis de Potássio (mg/m3 ) em 50 pontos diferentes no solo.

74 96 90 74 112 98 84 80 56 59
76 81 118 72 90 80 78 75 95 86
77 82 62 56 91 84 77 70 79 65
94 83 75 80 86 57 135 58 74 82
82 92 79 58 64 82 84 49 89 75
Tabela 2. Teor de P h em 50 pontos diferentes no solo.
5.5 5.3 5.2 4.6 5.2 5.1 5.1 5.1 4.9 4.9
4.9 4.7 5.2 4.7 5.2 4.6 5.5 4.8 6.1 5.1
4.9 5.2 4.6 4.8 4.6 5.1 4.8 5.0 5.2 5.4
4.6 5.0 5.0 4.5 5.1 5.5 4.7 4.6 5.7 4.9
4.9 6.0 5.1 4.6 5.0 4.7 5.1 4.6 5.7 4.8
Encontrar a média amostral X, a moda M o, a mediana M e, a amplitude A, a variância amostral S 2 , o

desvio-padrão amostral S e o coeficiente de variação CV dos nı́veis de Potássio no solo. Em seguida, encontrar as
mesmas medidas descritivas para o teor de P h no solo.
Exercı́cio 4: Aplicações em controle da qualidade da água. Foi medido o teor de chumbo (em ppm)
das estações de tratamento de água de quatro cidades diferentes e os resultados foram X1 , X2 , X3 , X4 . Sabendo

que X = 35 ppm, A = 18 ppm, M o = 35 ppm e M e = 35 ppm, encontre o valor do teor de chumbo para cada uma
das estações de tratamento de água, isto é, encontre os valores de X1 , X2 , X3 , X4 .
Exercı́cio 5: Aplicações em dados educacionais. Em um bairro da zona Sul de São Paulo, há três
escolas estaduais nas quais a evasão escolar ocorre já há cinco anos. As autoridades das escolas divulgaram os
dados de evasão semestral em número de alunos, conforme abaixo:
Escola A 16 10 12 17 14 18 25 37 29 14
Escola B 13 12 17 43 18 10 23 15 10 11
Escola C 11 17 15 16 10 28 39 33 8 9
a. Qual escola possui o menor número médio de alunos evadidos?

b. Analise os desvios-padrão de cada grupo.
c. Analise os coeficientes de variação.
Exercı́cio 6: Aplicações em biologia. Foram pesados n = 9 indivı́duos de uma determinada espécie de

ratos. Os dados abaixo estão ordenados crescentemente (pesos em gramas):
X(1) 102 X(3) 184 X(5) 217 X(7) 223 417
9
P
Sabendo que A = 342 gramas, M e = 185 gramas, M o = 223 gramas e que Xi = 1793 gramas, determine
i=1
o peso em gramas dos ratos X(1) , X(3) , X(5) e X(7) .
Exercı́cio 7: Aplicações em pesquisas de aprendizagem. Alguns pesquisadores da Oxford Research

for Education afirmam que a aprendizagem está relacionada à capacidade de concentração. Segundo eles, essa
capacidade depende da audição do aluno. Um teste audiométrico é feito emitindo-se 100 formas de sons. Os dados
a seguir indicam quanto os alunos conseguiram compreender dos sons emitidos em toques alternados. Note que
uma amostra de 11 alunos por grupo foi selecionada aleatoriamente e que em cada grupo havia alunos com audição
normal ou com necessidades auditivas especiais.
Grupo 1 12 78 45 30 27 34 29 88 28 9 26
Grupo 2 12 38 45 29 35 39 17 78 23 6 25
Grupo 3 19 29 25 36 29 21 10 34 35 8 29
Grupo 4 16 65 45 37 21 22 18 38 66 2 26
Grupo 5 13 27 65 30 27 28 19 31 26 7 36
a. Qual grupo apresentou a menor capacidade média de compreender os sons?

b. Qual grupo apresentou o maior coeficiente de variação?
Exercı́cio 8: Aplicações da indústria. Em uma linha de produção foram examinados 3 lotes de um

determinado item. Cada lote tem 8 unidades e cada unidade foi pesada (peso em gramas). Calcule a média X e
o desvio-padrão amostral (S) de cada lote e determine qual lote apresentou o maior Coeficiente de Variação (CV ).
Lote 1 22 18 21 17 23 21 20 20
Lote 2 28 11 23 19 22 22 22 22
Lote 3 16 26 25 27 20 23 22 16
Exercı́cio 9: Aplicações nas empresas. Foi realizada uma pesquisa de salários em uma grande empresa
multinacional. Foi analisada uma amostra de n = 9 funcionários desta empresa em que foi anotado o salário (em
dólares) de cada um deles e os dados ordenados crescentemente estão abaixo:
X(1) 1020 X(3) 1840 X(5) 2170 X(7) 2230 4170
9
P
Sabendo que A = 3420 dólares, M e = 1850 dólares, M o = 2230 dólares e que Xi = 17930 dólares
i=1
determine:
a. O salário dos funcionários X(1) , X(3) , X(5) e X(7) .
b. O coeficiente de variação amostral CV . Ajuda: Encontre primeiramente a média X e o desvio-padrão
amostral S.

Exercı́cio 10: Aplicações gerais. Seja um conjunto de dados formado por (50, 80, 40, 60, X5 ) onde X = 55.
n
P
Qual o valor de X5 ? Ajuda: Use o fato de que Xi = nX.
i=1
Exercı́cio 11: Aplicações em biologia. Foram pesados quinze coelhos cobaias em um laboratório de
pesquisa após certo tratamento, e os resultados encontram-se abaixo (pesos em gramas):
502 426 545 546 334 443 509 549 463 538 717 433 517 598 564
Encontrar a média amostral X, a moda M o, a mediana M e, a amplitude A, o desvio-padrão amostral S e o

coeficiente de variação CV .
7 7
Xi2 = 140, encontre a média amostral X,
P P
Exercı́cio 12: Aplicações gerais. Sabendo que Xi = 28 e
i=1 i=1
o desvio-padrão amostral S e o coeficiente de variação CV . Ajuda: Use o fato de que a variância amostral dada
n 2
1
por S 2 = n−1
P
Xi − X também pode ser reescrita como:
i=1
n n 2
1 X 2 2X X nX
S2 = Xi − Xi + .
n − 1 i=1 n − 1 i=1 n−1
Exercı́cio 13: Aplicações sanitárias e em saúde pública. Em uma fiscalização da vigilância sanitária
foram auditados todos os N restaurantes de grande porte do municı́pio de Barreiras, em que que foram pontuados
as irregularidades encontradas em cada um dos N estabelecimentos. Considere a variável quantitativa X como
N N
Xi2 = 140. Sabendo
P P
sendo o número de irregularidades encontradas. Os resultados foram tais que Xi = 30 e
i=1 i=1
que a variância populacional encontrada foi de σ 2 = 5, quantos restaurantes de grande porte foram auditados?
Em outras palavras, qual o valor de N ? Ajuda: Para encontrar o valor de N use o fato de que a variância
N N
2
populacional expressa por σ 2 = N1 (Xi − µ) também pode ser expressa por σ 2 = N1 Xi2 − µ2 . Em seguida,
P P
i=1 i=1
utilize a equação do segundo
√
grau dada por ax2 + bx + c = 0, (a 6= 0) com ∆ = b2 − 4ac, e determine as raı́zes
reais por meio de x = −b± 2a
∆
. Mostre que há dois possı́veis valores para N , isto é, há duas raı́zes que podem ser
0 00
tratadas como a quantidade de restaurantes auditados, N e N .
Exercı́cio 14: Aplicações em pesquisas socioeconômicas. Em uma pesquisa socioeconômica no mu-

nicı́pio de Barreiras, foram entrevistadas n = 12 famı́lias. Dentre diversas variáveis estudadas, uma delas foi o
número X de filhos de cada uma dessas famı́lias (variável quantitativa discreta). Os resultados foram tais que
12 12 12 12
Xi2 = 98, Xi3 = 360 e Xi4 = 1430.
P P P P
Xi = 30,
i=1 i=1 i=1 i=1
a. Encontre o coeficiente de variação CV. Ajuda: Encontre primeiramente a média X. Para encontrar o
n 2
1
desvio-padrão amostral S, use o fato de que a variância amostral dada por S 2 = n−1
P
Xi − X também pode
i=1
ser reescrita como:
n n 2
1 X 2 2X X nX
S2 = Xi − Xi + .
n − 1 i=1 n − 1 i=1 n−1
b. Use as propriedades do somatório para encontrar o valor numérico da expressão
12
1 Xh 2 2
i
4Xi (2Xi − 6) − 8
73 i=1
Exercı́cio 15: Aplicações gerais. Considere um conjunto quantitativo de dados X1 , X2 , ..., X6 tal que
6 6 6 6
Xi2 = 91, Xi3 = 441 e Xi4 = 2275.
P P P P
Xi = 21,
i=1 i=1 i=1 i=1
a. Encontre o coeficiente de variação CV . Ajuda: Para encontrar o CV encontre primeiramente o valor

numérico da média amostral X̄ e do desvio-padrão amostral S.

b. Use as propriedades do somatório para determinar o valor numérico da soma

6
1 Xh 2 2
i
2Xi (3Xi − 7) − 4
64 i=1
Exercı́cio 16. Seja um conjunto de dados quantitativos formado por X1 , X2 , ..., Xn e seja Yi = Xi X,
2
i = 1, 2, ..., n. Mostre que a média da variável Y é o quadrado da média da variável X, isto é, mostre que Y = X .
Exercı́cio 17. Seja um conjunto de dados quantitativos formado por X1 , X2 , ..., Xn e seja Yi = X X
i
, i =
1, 2, ..., n. Mostre que a média da variável Y é a constante 1, independentemente dos valores da variável X, isto é,
mostre que Y = 1.
Exercı́cio 18. Seja um conjunto de dados quantitativos formado por X1 , X2 , ..., Xn e seja outro conjunto
de dados quantitativos formado por Y1 , Y2 , ..., Yn tal que Yi > Xi , i = 1, 2, ..., n. Em outras palavras, temos dois
conjuntos de dados quantitativos de mesma dimensão tal que Y1 > X1 , Y2 > X2 , ..., Yn > Xn . Mostre que, nesse
contexto, a média da variável Y é maior que a média da variável X, isto é, mostre que Y > X. Ajuda: Sabemos
que, se Yi > Xi , então Yi − Xi = bi > 0, i = 1, 2, ..., n, o que implica em Yi = Xi + bi , i = 1, 2, ..., n.
Exercı́cio 19. Sejam a e b duas constantes arbitrárias (a, b ∈ R) tal que a < b. Seja X1 , X2 , ..., Xn um
conjunto de dados quantitativos tal que a < Xi < b, i = 1, 2, ..., n. Mostre que a média da variável X também está
entre as constantes a e b, isto é, a < X < b.
Exercı́cio 20. Considere X1 , X2 , ..., XN um conjunto de dados quantitativos com média µ e seja (Xi − µ)
o i-ésimo desvio em relação a média, i = 1, 2, ..., N . Mostre que a soma de todos os desvios de um conjunto
quantitativo de dados é sempre nula, isto é, mostre que
N
X
(Xi − µ) = 0.
i=1
2
Exercı́cio
Seja X1 , X2 , ..., XN um conjunto de dados quantitativos com média µX e variância σX .
21.
Seja Zi = Xiσ−µ
X
X
, i = 1, 2, ..., N . Mostre que a média populacional e a variância populacional da variável Z,
2 2
denotados respectivamente por µZ e σZ são µZ = 0 e σZ = 1.

X−µX
Observação: A variável Z = σX é conhecida como variável padronizada.
N
1 2
Exercı́cio 22. Mostre que a variância populacional dada por σ 2 =
P
N (Xi − µ) também pode ser expressa
i=1
por
N
1 X 2
σ2 = X − µ2 .
N i=1 i
2
Exercı́cio 23. Seja um conjunto de dados formado por X1 , X2 , ..., Xn com média µX e variância σX . Seja
2
outro conjunto de dados formado por Y1 , Y2 , ..., Yn com média µY e variância σY . Seja Zi = Xi + Yi , i = 1, 2, ..., n.
2
Mostre que a variância de Z1 , Z2 , ..., Zn denominada de σZ é dada por
n
!
2 2 2 1X
σZ = σX + σY + 2 Xi Yi − µX µY
n i=1
Exercı́cio 24. Se Yi = a + bXi , i = 1, 2, ..., n, mostre que Y = a + bX.

Exercı́cios de estatı́stica descritiva para dados agrupados em classes
Para cada um dos exercı́cios seguintes, determine:
a. X : média amostral. Interprete;

b. M o : moda de Czuber. Interprete;
c. M e : mediana. Interprete;
d. s2 : variância amostral;
e. s : desvio-padrão amostral;
f. CV : coeficiente de variação amostral;
g. Q1 : primeiro quartil da distribuição. Interprete;
h. Q3 : terceiro quartil da distribuição. Interprete;
i. D1 : primeiro decil da distribuição. Interprete;
j. D6 : sexto decil da distribuição. Interprete;
k. D9 : nono decil da distribuição. Interprete;
l. P33 : trigésimo terceiro percentil da distribuição. Interprete;
m. P84 : octogésimo quarto percentil da distribuição. Interprete;
n. P99 : nonagésimo nono percentil da distribuição. Interprete;
o. CS1 : primeiro coeficiente de assimetria de Pearson;
p. CS2 : segundo coeficiente de assimetria de Pearson;
q. CSM : coeficiente de assimetria via método dos momentos;
r. CKp : coeficiente percentı́lico de curtose;
s. CKM : coeficiente de curtose via método dos momentos;
Exercı́cio 1. Um grande jornal de São Paulo deseja entender o movimento de assinaturas segundo a faixa etária
de seus assinantes. A proposta é avaliar o perfil do assinante para o lançamento de campanhas promocionais.
Distribuição amostral de idades do Jornal ”A”.
Idade (em anos) Frequência fi
15 ` 20 18
20 ` 25 42
25 ` 30 78
30 ` 35 115
35 ` 40 178
40 ` 45 107
45 ` 50 88
50 ` 55 52
55 ` 60 30
60 ` 65 11
Exercı́cio 2. A tabela abaixo apresenta as estatı́sticas brasileiras para as mortes em acidentes nas estradas
estaduais e federais, segundo a idade (2000 a 2002).
Distribuição amostral das mortes em acidentes de trânsito
em rodovias estaduais e federais do Brasil (2000 a 2002).
Idade (em anos) Frequência fi
15 ` 20 427
20 ` 25 672
25 ` 30 781
30 ` 35 896
35 ` 40 2469
40 ` 45 2107
45 ` 50 588
50 ` 55 252
55 ` 60 130
60 ` 65 109
Exercı́cio 3. Na Tabela abaixo temos a distribuição dos salários dos funcionários da Companhia A, em reais,
no ano de 2001.

Distribuição dos salários dos funcionários da

Companhia A, em reais, no ano de 2001.
Salários (R$) frequência fi
500 ` 700 90
700 ` 900 54
900 ` 1100 37
1100 ` 1300 11
1300 ` 1500 4
Exercı́cio 4. Na Tabela abaixo temos a distribuição dos salários de 176 funcionários do Banco ALFA.
Distribuição dos salários dos 176 funcionários

do Banco ALFA.
Salários (R$) frequência fi
400 ` 600 79
600 ` 800 45
800 ` 1000 31
1000 ` 1200 12
1200 ` 1400 9
Exercı́cio 5. Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição:
Distribuição do número de horas (vida útil)

da peça A no ano de 2001.
Número de horas frequência fi
0 ` 100 6
100 ` 200 42
200 ` 300 86
300 ` 400 127
400 ` 500 64
500 ` 600 8
Exercı́cio 6. O gerente de uma loja de departamentos decidiu premiar com um brinde 10% dos clientes que
consumirem mais no mês de outubro. Para isso ele verificou a distribuição amostral do consumo por nota da loja
”A”em reais no ano de 2002.
Distribuição do consumo por nota da loja ”A”
em reais no ano de 2002.
Consumo por nota (R$) frequência fi
0 ` 50 10
50 ` 100 28
100 ` 150 12
150 ` 200 2
200 ` 250 1
250 ` 300 1
Exercı́cio 7. A tabela abaixo apresenta a distribuição do consumo de energia elétrica (em Kw/h) em 2002.
Distribuição do consumo em 2002.

Consumo (Kw/h) frequência fi
0 ` 50 2
50 ` 100 15
100 ` 150 32
150 ` 200 47
200 ` 250 50
250 ` 300 80
300 ` 350 24

Exercı́cio 8. A tabela abaixo apresenta a distribuição de vendas semanais por vendedor (em reais) em 2002.
Distribuição de vendas semanais por vendedor,

em reais, em 2002.
Vendas (R$) frequência fi
0 ` 10000 1
10000 ` 20000 12
20000 ` 30000 27
30000 ` 40000 31
40000 ` 50000 10
Exercı́cio 9. A tabela abaixo apresenta a distribuição amostral de notas de 500 alunos em um teste de geografia:
Nota Número de estudantes

1, 0 ` 2, 5 44
2, 5 ` 4, 0 70
4, 0 ` 5, 5 92
5, 5 ` 7, 0 147
7, 0 ` 8, 5 115
8, 5 ` 10, 0 32
Total: 500
Exercı́cio 10. A tabela abaixo apresenta a distribuição amostral de idades dos membros de um sindicato:
Idade frequência
15 ` 20 18
20 ` 25 42
25 ` 30 78
30 ` 35 115
35 ` 40 178
40 ` 45 107
45 ` 50 88
50 ` 55 52
55 ` 60 30
60 ` 65 11
Total: 719
Exercı́cio 11. Com o objetivo de verificar quanto tempo demora para um certo medicamento fazer efeito,
realizou-se uma pesquisa onde foi anotado o tempo (em minutos) de 333 pessoas que tomaram tal medicamento.
Devido a alguns problemas práticos de coleta de informações e por falta de treinamento do pessoal, perdeu-se
algumas informações a respeito dos dados agrupados, conforme mostra a tabela de distribuição de frequências
abaixo. Complete corretamente a tabela e determine o que se pede.
Tempos: (fi ) (Fi ) (F ri %) Xi fi Xi fi Xi2

0 ` 4 12
4 ` 8 48
8 ` 12 860
12 ` 16 261
16 ` 20 1152
20 ` P 24
333

Parte III
Probabilidade e Variáveis Aleatórias

9 Introdução à teoria das probabilidades
A origem e o desenvolvimento da teoria das probabilidades encontram-se nos jogos de azar por volta do século
XVII. Na sociedade francesa em 1650, por exemplo, o jogo era hábito popular e elegante.
Ainda hoje em tempos contemporâneos há muitas aplicações que envolvem jogos de azar, tais como os diversos
tipos de loterias, os cassinos, as corridas de cavalos, etc. Hoje em dia, os governos, as empresas, as organizações
profissionais, incorporam a teoria das probabilidades em seus processos de deliberações, pois a probabilidade auxilia
a desenvolver estratégias.
9.1 Conceitos básicos
Em geral, os experimentos da natureza podem ser classificados em:
Experimentos determinı́sticos: São aqueles que, repetidos várias vezes, produzem resultados idênticos.
Experimentos probabilı́sticos ou aleatórios: São aqueles que, repetidos várias vezes, produzem resulta-
dos distintos.
Alguns conceitos básicos em probabilidade são:
Espaço amostral: É o conjunto de todos os resultados possı́veis de um experimento aleatório. Em geral é

denotado pela letra grega maiúscula Ω.
Evento: É um subconjunto do espaço amostral Ω. Em geral é denotado por letras maiúsculas do nosso
alfabeto: A, B, C, etc.
Ensaio: É uma repetição de um experimento aleatório. Por exemplo, se um experimento aleatório for
repetido 10 vezes, então temos 10 ensaios deste experimento.
A seguir apresentamos alguns exemplos de experimento probabilı́stico e seu espaço amostral:
Exemplo 1. Lançar uma moeda e observar a face voltada para cima.
Ω = {c, k} , em que c = cara; k = coroa;
Exemplo 2. Lançar um dado e observar a face voltada para cima.
Ω = {1, 2, 3, 4, 5, 6}
Exemplo 3. Lançar uma moeda indefinidamente, parar quando obter a primeira cara e contar o número de
coroas obtidas.
Ω = {0, 1, 2, 3, ...}
Exemplo 4. Escolher ao acaso uma famı́lia da população e contar o número de filhos desta famı́lia.
Ω = {0, 1, 2, 3, ...}
Exemplo 5. Escolher ao acaso um indivı́duo da população medir sua altura em metros.
Ω = {X : altura | X > 0 cm}
Observação: Os exemplos 1 ao 4 referem-se a um espaço amostral discreto (pontos da reta) e o exemplo 5

refere-se a um espaço amostral contı́nuo (intervalos da reta).
Exemplo com eventos. Considere o lançamento de um dado e observe a face voltada para cima. Temos
então que Ω = {1, 2, 3, 4, 5, 6}. Agora considere os seguintes eventos:

Evento A: “ocorre face par”.

Evento B: “ocorre face menor ou igual a 3”.
Evento C: “ocorre face ı́mpar”.
Evento D: “ocorre face maior que 5”.
Evento E: “ocorre face maior que 20”.
Evento F: “ocorre face maior ou igual a 1 e menor ou igual a 6”.
Temos então o seguinte:
A = {2, 4, 6}.
B = {1, 2, 3}.
C = {1, 3, 5}.
D = {6}.
E = {} = ∅.
F = Ω.
Observação. O evento E é chamado de evento impossı́vel e o evento F é chamado de evento certo.
A figura abaixo apresenta a representação do espaço amostral e dos eventos associados a ele:
9.2 Operações básicas com eventos
A teoria dos conjuntos é um ramo da matemática extremamente útil no estudo probabilı́stico de eventos uma
vez que os eventos nada mais são que subconjuntos de um espaço amostral. Consideremos um espaço amostral
finito dado por
Ω = {ω1 , ω2 , ..., ωn }
então temos três operações básicas com eventos aleatórios: união, intersecão e complementação.
União: Sejam A e B dois eventos quaisquer associados ao espaço amostral Ω. Então A ∪ B é o evento
formado pelos pontos amostrais ω que pertencem a pelo menos um dos eventos A e B.
Definição: A ∪ B = {ω ∈ Ω : ω ∈ A ou ω ∈ B}.

Intersecção: Sejam A e B dois eventos quaisquer associados ao espaço amostral Ω. Então A ∩ B é o evento
formado pelos pontos amostrais ω que pertencem simultaneamente aos eventos A e B.
Definição: A ∩ B = {ω ∈ Ω : ω ∈ A e ω ∈ B}
Complementação: Seja A um evento qualquer associado ao espaço amostral Ω. Então Ac é o evento

formado pelos pontos amostrais ω que não pertencem a ao evento A.
Definição: Ac = {ω ∈ Ω : ω ∈
/ A} = Ω − A
Exemplo 2. Considere o lançamento de um dado e observe a face voltada para cima. Temos então que o
espaço amostral deste experimento aleatório é Ω = {1, 2, 3, 4, 5, 6}. Agora considere os seguintes eventos:
Evento A: “ocorre face par”.
Evento B: “ocorre face menor ou igual a 3”.
Evento C: “ocorre face ı́mpar”.
Evento D: “ocorre face maior que 5”.
Evento E: “ocorre face maior que 20”.
Evento F: “ocorre face maior ou igual a 1 e menor ou igual a 6”.
Evento A ∪ B.
Evento A ∩ B.
Evento A ∪ C.
Evento A ∩ C.
Evento B ∪ C.

Evento B ∩ C.
Evento A ∪ E.
Evento A ∩ E.
Evento A ∪ D.
Evento A ∩ D.
Solução: Considerando os eventos acima, temos que
A = {2, 4, 6}.
B = {1, 2, 3}.
C = {1, 3, 5}.
D = {6}.
E = {} = ∅.
F = Ω.
A ∪ B = {1, 2, 3, 4, 6}
A ∩ B = {2}
A ∪ C = {1, 2, 3, 4, 5, 6} = Ω
A ∩ C = {} = ∅
B ∪ C = {1, 2, 3, 5}
B ∩ C = {1, 3}
A ∪ E = {2, 4, 6} = A
A ∩ E = {} = ∅
A ∪ D = {2, 4, 6} = A
A ∩ D = {6}
9.3 Propriedades básicas com eventos
Com base nas três operações básicas dos conjuntos seguem as seguintes propriedades

a. Idempotentes A∩A=A A∪A=A
b. Comutativas A∪B =B∪A A∩B =B∩A
c. associativas A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∪ (B ∪ C) = (A ∪ B) ∪ C
d. Distributivas A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
e. Absorções A ∪ (A ∩ B) = A A ∩ (A ∪ B) = A
f. Identidades A∩Ω=A A∪Ω=Ω
A∩∅=∅ A∪∅=A
g. Complementares ΩC = ∅ ∅C = Ω
A ∩ AC = ∅ A ∪ AC = Ω
C
AC =A
C C
h. Leis de Morgan (A ∩ B) = AC ∪ B C (A ∪ B) = AC ∩ B C
Exemplo: Um número é selecionado ao acaso, entre os números 1 a 10. Considere os eventos:

A: “o número selecionado é múltiplo de 3”.
B: “o número selecionado é par”.
Descrever os seguintes eventos
a. A∩B b. A∪B c. A ∩ BC d. AC ∩ B
Resolução: temos que o espaço amostral Ω é dado por Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} e, então, os eventos são
dados por
A = {3, 6, 9} e B = {2, 4, 6, 8, 10}
Então temos
a. A ∩ B = {6}
b. A ∪ B = {2, 3, 4, 6, 8, 9, 10}
c. A ∩ B C = A − B = {3, 9}
d. AC ∩ B = B − A = {2, 4, 8, 10}
Fazendo o diagrama de Venn temos:

Exemplo 1.) Lançam-se três moedas. Enumerar o espaço amostral e os eventos:

A: Faces iguais.
B: Cara na 1 moeda.
C: Coroa na 2 e 3 moeda.
Resolução: O espaço amostral Ω é dado por:
Ω = {(c, c, c) , (c, c, k) , (c, k, c) , (c, k, k) , (k, c, c) , (k, c, k) , (k, k, c) , (k, k, k)}

Onde c = cara e k = coroa. Então temos os eventos A, B e C:
A = {(c, c, c) , (k, k, k)}.
B = {(c, c, c) , (c, c, k) , (c, k, c) , (c, k, k)}.
C = {(c, k, k) , (k, k, k)}.
Exemplo 2.) Considere a experiência que consiste em pesquisar famı́lias com três crianças, em relação ao
sexo das mesmas, segundo a ordem de nascimento. Enumerar o espaço amostral e os eventos abaixo:
A: Ocorrência de dois filhos do sexo masculino.
B: Ocorrência de pelo menos um filho do sexo masculino.
C: Ocorrência de no máximo duas crianças do sexo feminino.
Resolução: o espaço amostral Ω é dado por:
Ω = {(0, 0, 0) , (0, 0, 1) , (0, 1, 0) , (0, 1, 1) , (1, 0, 0) , (1, 0, 1) , (1, 1, 0) , (1, 1, 1)}

Onde 0 = feminino e 1 = masculino. Então temos os eventos A, B e C:
A = {(0, 1, 1) , (1, 1, 0) , (1, 0, 1)}.
B = {(0, 0, 1) , (0, 1, 0) , (0, 1, 1) , (1, 0, 0) , (1, 0, 1) , (1, 1, 0) , (1, 1, 1)} ou
B = Ω − {(0, 0, 0)}
C = {(0, 0, 1) , (0, 1, 0) , (0, 1, 1) , (1, 0, 0) , (1, 0, 1) , (1, 1, 0) , (1, 1, 1)} ou
C = Ω − {(0, 0, 0)}
Exercı́cio proposto: Sejam A, B e C três eventos de um espaço amostral. Exprimir os eventos abaixo,
usando as operações união, intersecção e complementação:
a) somente A ocorre.
b) A e C ocorrem, mas B não.
c) A, B e C ocorrem.
d) Pelo menos um ocorre.
e) exatamente um ocorre.
f) nenhum ocorre.
g) exatamente dois ocorrem.
h) pelo menos dois ocorrem.
i) no máximo dois ocorrem.
Respostas:
a) A ∩ B C ∩ C C
b) A ∩ C ∩ B C
c) A ∩ B ∩ C
d) A ∪ B ∪ C
e) A ∩ B C ∩ C C ∪ AC ∩ B ∩ C C ∪ AC ∩ B C ∩ C
f) AC ∩ B C ∩ CC
g) A ∩ B ∩ C C ∪ A ∩ B C ∩ C ∪ AC ∩ B ∩ C
h) A ∩ B ∩ C C ∪ A ∩ B C ∩ C ∪ AC ∩ B ∩ C ∪ (A ∩ B ∩ C)
C
i) (A ∩ B ∩ C)

10 Probabilidades
Ideia clássica de probabilidade: Probabilidade é a possibilidade ou a chance de ocorrência, ou a men-

suração de ocorrência, de um evento definido sobre um espaço amostral, que por sua vez está relacionado à algum
fenômeno. Note-se que a probabilidade é a proporção ou fração própria cujos valores variam de 0 a 1 inclusives,
sendo que um evento que não tem chance de ocorrer (evento nulo) tem probabilidade de 0 e que um evento que
certamente ocorrerá (evento certo) tem probabilidade de 1.
O entendimento da probabilidade pode ser melhor elucidado com as indagações, que se referem às três
abordagens sobre o esse tema:
1. Qual é a chance de se retirar uma carta de ouros de um baralho comum?
2. Qual é a chance de que um indivı́duo prefira um produto a outro?
3. Qual é a chance de que um novo produto, lançado no mercado, tenha sucesso junto ao consumidor?
Na primeira indagação a abordagem refere-se à probabilidade prévia clássica, em que a probabilidade de
ocorrência de um evento (no caso: carta de ouros) ligado ao experimento (na indagação: retirada de uma carta
de um baralho comum) baseia-se no conhecimento prévio do processo envolvido. No caso mais simples, onde cada
repetição do fenômeno aleatório é igualmente possı́vel, a probabilidade de ocorrência de um evento A definido sobre
Ω, notada por P (A), pode ser definida por:
número de casos favoráveis ao evento A nA
P (A) = = .
número total de elementos do espaço Ω nΩ
onde:
nA : é o número de resultados favoráveis à ocorrência do evento A;
nΩ : é o número total de resultados igualmente possı́veis do espaço Ω.
assim, para a primeira indagação a resposta correta é:
13 1
P (ouros) = = = 0, 25
52 4
Ou 25%, uma vez que existem 13 cartas de ouro em um baralho comum que possui 52 cartas. O número de
resultados favoráveis à ocorrência do evento e o número total de resultados foram conhecidos a partir da composição
do baralho comum.
O que nos diz esse valor de probabilidade? Se a carta for reposta no baralho depois de ser retirada, uma em
cada quatro cartas selecionadas será de ouros? Essa afirmação não pode ser enunciada com certeza porque não se
sabe que carta será extraı́da a seguir. No entanto, pode-se dizer que, se esse processo de seleção for continuamente
repetido, após algum tempo a proporção de cartas de ouros extraı́das irá se estabilizar em torno de 25%.
A segunda indagação sobre a abordagem da probabilidade faz referência à probabilidade clássica empı́rica
ou frequentista. Embora a probabilidade de ocorrência de um evento seja ainda definida como o quociente entre
o número de resultados favoráveis a essa ocorrência e o número total de resultados, esses resultados baseiam-se
na observação de dados obtidos em pesquisas e não no conhecimento prévio do processo de observação. Esse tipo
de probabilidade poderia se referir, segundo algum levantamento de dados próximo às eleições, à proporção de
eleitores que preferem certo candidato polı́tico a outro, por exemplo.
A terceira indagação sobre a abordagem da probabilidade faz referência à probabilidade subjetiva. Enquanto
que nas duas situações anteriores a probabilidade de ocorrência de um evento foi calculada objetivamente, ou a
partir do conhecimento prévio do processo ou com base em dados obtidos em pesquisas reais, a probabilidade
subjetiva de ocorrência de um evento é atribuı́da por um indivı́duo em particular. Por exemplo, um quı́mico
que produz um novo perfume para senhoras pode atribuir uma probabilidade de aceitação de seu perfume junto
às senhoras bastante diferente da atribuı́da pelo dono do estabelecimento que estiver considerando a hipótese de
negociar esse perfume. A atribuição de probabilidades subjetivas para a ocorrência de alguns eventos baseia-se
numa combinação de muitos fatores para cada indivı́duo, tais como, a experiência passada, a opinião pessoal e o
poder de análise de uma especı́fica situação. Quando a probabilidade de ocorrência de certo evento não puder ser
determinada empiricamente, a probabilidade subjetiva é especialmente útil para se tomar decisões.
Por exemplo, no lançamento de um dado honesto, observando-se a face voltada para cima, determinar a
probabilidade de ocorrência dos eventos:
a) face ı́mpar
b) face maior do que 2
c) face ı́mpar ou maior do que 2
d) face maior do que 2 e face ı́mpar
Solução: no espaço amostral Ω = {1, 2, 3, 4, 5, 6} tem-se que
a) P (f ace ı́mpar) = P ({1, 3, 5}) = 3/6 = 0, 5 ou 50%.
b) P (f ace maior do que 2) = P (3, 4, 5, 6) = 4/6 = 2/3 = 0, 667 ou 66, 7%.

c) P (f ace ı́mpar ou f ace maior do que 2) = P ({1, 3, 4, 5, 6}) = 5/6 = 0, 833 ou 83, 3%.
d) P (f ace maior do 2 e f ace ı́mpar) = P ({3, 5)} = 2/6 = 1/3 = 0, 333 ou 33, 3%.
Definição axiomática de probabilidade: Probabilidade é uma função P que liga partes do espaço amos-
tral, ou seja, os eventos, ao intervalo [0, 1], obedecendo os seguintes axiomas:
i. Se A é um evento associado ao espaço amostral Ω, então
0 ≤ P (A) ≤ 1.
ii. Se Ω é o espaço amostral, então
P (Ω) = 1.
iii. Sejam A1 , A2 , ..., An eventos dois a dois disjuntos, isto é, dois a dois mutuamente exclusivos, então
n
! n
[ X
P Ai = P (Ai ) .
i=1 i=1
10.1 Partição do espaço amostral
Sejam A1 , A2 , ..., An eventos associados ao espaço amostral Ω, conforme figura abaixo:
Dizemos que A1 , A2 , ..., An são eventos que formam uma partição do espaço amostral se:
Ai 6= φ
Ai ∩ Aj = φ, com i = 1, 2, ..., n e j 6= i
n

S
Ai = Ω
i=1
10.2 Teorema da probabilidade total
Sejam A1 , A2 , ..., An eventos que formam uma partição do espaço amostral e B um outro evento associado ao
espaço amostral Ω, conforme figura abaixo:

Então
n
X
P (B) = P (B|Ai ) P (Ai )
i=1
10.3 Teorema de Bayes

Um ministro protestante inglês com atuações em filosofia e lógica, Thomas Bayes (1702–1761), escreveu um
único trabalho matemático, intitulado Essay towards solving a problem in the doctrine of chances, publicado pela
Royal Society em 1763, três anos depois de sua morte. Este trabalho o imortalizou tamanha a sua originalidade e
a importância do conceito de probabilidade inversa introduzido por Bayes.
As conclusões de Bayes foram aceitas por Laplace em um artigo de 1781 que deduziu, no segundo volume
de sua Thèorie Analytique, a fórmula hoje conhecida como teorema de Bayes. Essa expressão dá a probabilidade
de uma dada hipótese (ou causa) a posteriori de observações feitas, em função de sua probabilidade a priori e da
probabilidade de ocorrência das observações assumindo verdadeira a hipótese dada (a probabilidade de verossimi-
lhança).
Os conceitos de Bayes deram origem a uma importante escola de inferência estatı́stica com propostas alter-
nativas aos chamados métodos clássicos da Estatı́stica. No entanto, tais conceitos foram questionados pelo famoso
matemático e lógico inglês George Boole (1815–1864) em seu trabalho An Investigation into the Laws of Thought,
on Which Are Founded the Mathematical Theories of Logic and Probabilities publicado em 1854. A partir daı́ o
conceito bayesiano de probabilidade tem sido motivo de controvérsias, tanto nos aspectos filosóficos de interpretação
do que seja probabilidade (objetiva versus subjetiva), como na aplicação em inferência estatı́stica.
Um aspecto de caráter mais filosófico levantado pelos estatı́sticos clássicos (não-paramétricos) contra a es-
tatı́stica bayesiana é a consideração, por esta, de parâmetros como variáveis com distribuições de probabilidade
e não como constantes desconhecidas. No entanto, além da questão filosófica de uma probabilidade subjetiva, a
questão prática que se coloca ao método bayesiano é a de se ter uma especificação consistente das probabilidades a
priori dos parâmetros e métodos para minimizar a sensibilidade das conclusões da análise estatı́stica com relação
a essa especificação.
O surgimento da computação de alto desempenho aliada a algoritmos eficientes, que permitem uma pre-
cisão maior nessa especificação, possibilitou que métodos bayesianos sejam hoje aplicados com sucesso na análise
estatı́stica de diversas aplicações importantes.
Teorema de Bayes: Sejam A1 , A2 , ..., An eventos que formam uma partição do espaço amostral e B um
outro evento associado ao espaço amostral Ω, conforme figura abaixo:
Então a probabilidade do evento Ai ter ocorrido dado que o evento B ocorreu é
P (B|Ai ) P (Ai )
P (Ai |B) = P
n
P (B|Ai ) P (Ai )
i=1
Exemplo 1: Aplicações em indústrias. Uma grande indústria montadora de eletrodomésticos recebe

uma determinada peça de 4 diferentes fábricas. Cada fábrica tem uma produção mensal de peças bem como o
número de peças defeituosas produzidas, conforme apresenta a Tabela abaixo:

Fábrica Produção Mensal Número de peças defeituosas

F1 3300 132
F2 6750 405
F3 2250 180
F4 2700 297
O setor de controle de qualidade desta montadora de eletrodomésticos seleciona ao acaso uma peça da
produção mensal.
a. Encontrar a probabilidade a priori da peça selecionada ser defeituosa.
b. Encontrar a probabilidade a posteriori da peça selecionada ter sido fabricado pela fábrica F3 dado que é
defeituosa.
Resolução do item a. Temos que a quantidade total mensal de peças produzidas pelas 4 fábricas é 15000.
Consideramos os seguintes eventos:
D : A peça fabricada é defeituosa;
D|F1 : A peça defeituosa é produzida pela fábrica 1;
D|F2 : A peça defeituosa é produzida pela fábrica 2.
F1 : A peça foi produzida pela fábrica 1.
Pelo teorema da probabilidade total segue que:
4
X
P (D) = P (D|Fi ) P (Fi )
i=1
= P (D|F1 ) P (F1 ) + P (D|F2 ) P (F2 ) + P (D|F3 ) P (F3 ) + P (D|F4 ) P (F4 )
132 3300 405 6750 180 2250 297 2700
= × + × + × + ×
3300 15000 6750 15000 2250 15000 2700 15000
P (D) = 0, 0676.
Dessa maneira, a probabilidade a priori da peça selecionada ser defeituosa é P (D) = 0, 0676 ou 6, 76%.
Resolução do item b. Pelo teorema de Bayes temos
P (D|F3 ) P (F3 )
P (F3 |D) = 4
P
P (D|Fi ) P (Fi )
i=1
180 2250
2250 × 15000
=
0, 0676
P (F3 |D) = 0, 1775.
Então, a probabilidade a posteriori da peça selecionada ter sido fabricado pela fábrica F3 dado que é defeituosa
é P (F3 |D) = 0, 1775 ou 17, 75%.

11 Variáveis aleatórias discretas
Definição de variável aleatória: Uma variável aleatória X é uma função que liga partes do espaço amostral
Ω à reta real, isto é,
X : Ω −→ R.
Denota-se uma variável por letra maiúscula (por exemplo X, Y , Z) e os valores assumidos por ela por letra
minúscula (x, y, z).
Definição de variável aleatória discreta: Se X é uma variável aleatória (v.a) que assume pontos da reta
x1 , x2 , ..., xn , então dizemos que X é uma variável aleatória discreta (v.a.d ) se:
(i) 0 ≤ P (X = xk ) ≤ 1, para k = 1, 2, ..., n.
n
X
(ii) P (X = xk ) = 1.
k=1
Os itens (i) e (ii) compõem a chamada distribuição de probabilidades de X.
Alguns exemplos de variáveis aleatórias discretas (v.a.d ) são: número de filhos por famı́lia, número de aci-
dentes de trânsito numa certa rodovia, número de ovos depositados por um inseto, número de peças defeituosas,
número de clientes insatisfeitos, número de alunos reprovados, etc.
11.1 Exemplo de variável aleatória discreta
Suponha o lançamento de 4 moedas honestas (equilibradas), ou seja, quatro moedas com resultados equi-
prováveis: para cada moeda temos a probabilidade igual a 0, 50 (ou 50%) de ocorrer cara e 0, 50 (ou 50%) de
ocorrer coroa.
O espaço amostral deste experimento aleatório é composto por 16 pontos amostrais:

(cccc) (ccck) (cckc) (cckk) (ckcc) (ckck) (ckkc) (ckkk)
Ω=
(kccc) (kcck) (kckc) (kckk) (kkcc) (kkck) (kkkc) (kkkk)
Considere X uma variável aleatória discreta (v.a.d ) que conta o número de caras obtidas neste experimento
aleatório. Então os possı́veis valores que X pode assumir é X = 0, 1, 2, 3, 4, conforme ilustração a seguir:

Observe que cada parte do espaço amostral Ω deste experimento aleatório está associado a um dos cinco
pontos da reta. Desta forma temos a seguinte distribuição de probabilidades:
P (X = 0) = 1/16;
P (X = 1) = 4/16;
P (X = 2) = 6/16;
P (X = 3) = 4/16;
P (X = 4) = 1/16.
Note que cada probabilidade está no intervalo [0, 1] e a soma de todas as probabilidades vale 1, isto é,
4
X
P (X = k) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
k=0
1 4 6 4 1
= + + + +
16 16 16 16 16
16
=
16
4
X
P (X = k) = 1.
k=0
11.2 Função distribuição
A função distribuição, ou distribuição acumulada de probabilidades, é a probabilidade da v.a. X ser menor

ou igual a um ponto arbitrário x, isto é,
F (x) = P (X ≤ x) .
Em nosso exemplo do lançamento das quatro moedas honestas onde temos X = 0, 1, 2, 3, 4, segue que a função
distribuição para cada um dos valores que essa v.a.d assume é dada por

1
F (0) = P (X ≤ 0) = P (X = 0) =
16
5
F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) =
16
11
F (2) = P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =
16
15
F (3) = P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) =
16
16
F (4) = P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) = = 1.
16
11.3 Esperança matemática de uma Variável aleatória discreta
A esperança matemática de uma variável aleatória discreta é definida como:
X
E (X) = kP (X = k) .
k
A esperança matemática pode ser interpretada como a média dos resultados de um experimento aleatório,
quando este é realizado muitas vezes. Em nosso exemplo do lançamento das 4 moedas temos:
4
X
E (X) = kP (X = k)
k=0
=
0P (X = 0) + 1P (X = 1) + 2P (X = 2) + 3P (X = 3) + 4P (X = 4)
1 4 6 4 1
= 0× +1× +2× +3× +4×
16 16 16 16 16
32
=
16
E (X) = 2 caras.
Interpretação: Neste exemplo esperamos um número médio de 2 caras, isto é, ao repetir este experimento
aleatório muitas vezes, a média a longo prazo dos resultados obtidos será de 2 caras.
11.4 Variância de uma variável aleatória
A variância de uma variável aleatória é definida pela diferença entre a esperança do segundo momento de X
e o quadrado da esperança do primeiro momento de X, isto é,
2
V ar (X) = E X 2 − [E (X)] ,

em que
X 2
E X2 = k P (X = k) .
k
Em nosso exemplo do lançamento das quatro moedas honestas temos que a esperança do segundo momento
é dada por:

4
X
E X2 k 2 P (X = k)

=
k=0
= 0 P (X = 0) + 12 P (X = 1) + 22 P (X = 2) + 32 P (X = 3) + 42 P (X = 4)
2
1 4 6 4 1
= 0× +1× +4× +9× + 16 ×
16 16 16 16 16
80
=
16
E X2 = 5 caras2 .

Desta forma, a variância de X é tal que
2
= E X 2 − [E (X)] = 5 − 22 = 1 cara2

V ar (X)
V ar (X) = 1 cara2 .
Observação: A unidade da variância é o quadrado da unidade da esperança de X. Desta maneira pode-se

usar o desvio padrão de X, denotado por σ (X), que é a raiz quadrada da variância.
p √
σ (X) = V ar (X) = 1 cara2 = 1 cara
σ (X) = 1 cara.
11.5 Propriedades da esperança matemática e da variância
As propriedades da esperança matemática e da variância de uma variável aleatória são de extrema importância
para os principais tópicos em inferência estatı́stica, como a teoria da amostragem e a estimação de parâmetros
populacionais, que serão estudados posteriormente. Veremos posteriormente neste material didático que próprio
conceito de amostra aleatória envolve a aplicação direta das propriedades da esperança e da variância.
11.5.1 Propriedades da esperança de uma variável aleatória
Considere X uma Variável aleatória e c uma constante arbitrária, tal que c ∈ R. Então
Propriedade 1. A esperança da constante é a própria constante.
E (c) = c
Propriedade 2. A esperança de uma v.a X adicionado ou subtraı́do uma constante c, é dada por
E (X ± c) = E (X) ± c.
Propriedade 3. A esperança de uma v.a X multiplicada por uma constante c, é dada por
E (Xc) = E (X) c.
Propriedade 4. Sejam duas constantes arbitrárias a e b. Então, pelas propriedades 1, 2 e 3, temos
E (a ± bX) = a ± bE (X) .

Propriedade 5. Sejam X e Y duas v.as, então a esperança da soma ou da diferença é a soma ou diferença
das esperanças.
E (X ± Y ) = E (X) ± E (Y ) .
Observação: Esta propriedade vale para mais de 2 Variáveis aleatórias.
Propriedade 6. Considere X1 , X2 , ..., Xn Variáveis aleatórias. Então a esperança da soma é a soma das
esperanças.
n
! n
X X
E Xi = E (Xi ) .
i=1 i=1
Propriedade 7. Considere X1 , X2 , ..., Xn Variáveis aleatórias independentes. Então a esperança do produto

é o produto das esperanças.
n
! n
Y Y
E Xi = E (Xi ) .
i=1 i=1
11.5.2 Propriedades da variância de uma variável aleatória
Propriedade 1. A variância de uma constante é nula.
V ar (c) = 0.
Propriedade 2. A variância de uma v.a X adicionado ou subtraı́do uma constante c, é a própria variância
de X
V ar (X ± c) = V ar (X) .
Propriedade 3. A variância de uma v.a X multiplicada por uma constante c, é a variância de X multiplicada
pela constante c ao quadrado.
V ar (Xc) = V ar (X) c2 .
Propriedade 4. Sejam duas constantes arbitrárias a e b. Pelas propriedades 1, 2 e 3, temos
V ar (a ± bX) = b2 V ar (X) .
Propriedade 5. Sejam X e Y duas v.as, então a variância da soma ou da diferença é dada por.
V ar (X ± Y ) = V ar (X) + V ar (Y ) ± 2COV (X, Y ) ,

onde COV denota a covariância entre as variáveis X e Y , e é dada pela esperança do produto menos o
produto das esperanças:
COV (X, Y ) = E (XY ) − E (X) E (Y )
Propriedade 6. Considere X1 , X2 , ..., Xn variáveis aleatórias. Então a variância da soma é dada por
n
! n n X
X X X
V ar Xi = V ar (Xi ) + COV (Xi Xj ) .
i=1 i=1 i=1 j6=i
Observação: Se X1 , X2 , ..., Xn são variáveis aleatórias independentes, então a variância da soma é a soma
das variâncias
n
! n
X X
V ar Xi = V ar (Xi )
i=1 i=1

11.6 Covariância: variância da soma
Consideremos duas variáveis aleatórias X e Y . Sabemos, a partir das propriedades da esperança, que a
esperança da soma é a soma das esperanças. De forma análoga, a esperança da diferença é a diferença das
esperanças, ou seja:
E (X + Y ) = E (X) + E (Y )
E (X − Y ) = E (X) − E (Y )
Sabemos também, pelas propriedades da variância, que:
V ar (X + Y ) = V ar (X) + V ar (Y ) + 2Cov (X, Y ) (16)

V ar (X − Y ) = V ar (X) + V ar (Y ) − 2Cov (X, Y )
em que Cov (X, Y ) denota a covariância entre as variáveis X e Y , dada pela esperança do produto menos o
produto das esperanças, ou seja:
Cov (X, Y ) = E (XY ) − E (X) E (Y ) (17)
11.6.1 Exemplo numérico para motivação
Considere X e Y duas variáveis aleatórias que assumem de forma equiprovável os seguintes valores:
Variável X : 4 10 8 6 10 5 10 5
Variável Y : 12 20 16 20 24 18 16 20
Vamos encontrar a esperança e a variância de cada uma das variáveis. Encontremos primeiramente E (X) e
V ar (X):
8
X
E (X) = kP (X = k)
k=1
= 4P (X = 4) + 10P (X = 10) + 8P (X = 8) + 6P (X = 6) + 10P (X = 10)
+
5P (X = 5) + 10P (X = 10) + 5P (X = 5)
1 1 1 1 1 1 1 1
= 4 × + 10 × + 8 × + 6 × + 10 × + 5 × + 10 × + 5 ×
8 8 8 8 8 8 8 8
1
= [4 + 10 + 8 + 6 + 10 + 5 + 10 + 5]
8
58
=
8
⇒ E (X) = 7, 25.

Para encontrar a variância de X vamos determinar a esperança do segundo momento E X 2 :

8
X
2
k 2 P (X = k)

E X =
k=1
= 42 P (X = 4) + 102 P (X = 10) + 82 P (X = 8) + 62 P (X = 6) + 102 P (X = 10)
+ 52 P (X = 5) + 102 P (X = 10) + 52 P (X = 5)
1 1 1 1 1 1 1 1
= 16 × + 100 × + 64 × + 36 × + 100 × + 25 × + 100 × + 25 ×
8 8 8 8 8 8 8 8
1
= [16 + 100 + 64 + 36 + 100 + 25 + 100 + 25]
8
466
=
8
⇒ E X2

= 58, 25.
Dessa maneira, a variância de X é obtida por:
2
= E X 2 − [E (X)]

V ar (X)
= 58, 25 − 7, 252
⇒ V ar (X) = 5, 6875.
Da mesma forma que procedemos com X, vamos agora encontrar a esperança e a variância de variável Y :
8
X
E (Y ) = kP (Y = k)
k=1
= 12P (Y = 12) + 20P (Y = 20) + 16P (Y = 16) + 20P (Y = 20) + 24P (Y = 24)
+
18P (Y = 18) + 16P (Y = 16) + 20P (Y = 20)
1 1 1 1 1 1 1 1
= 12 × + 20 × + 16 × + 20 × + 24 × + 18 × + 16 × + 20 ×
8 8 8 8 8 8 8 8
1
= [12 + 20 + 16 + 20 + 24 + 18 + 16 + 20]
8
146
=
8
⇒ E (Y ) = 18, 25.

Para encontrar a variância de Y vamos determinar a esperança do segundo momento E Y 2 :
8
X
2
k 2 P (Y = k)

E Y =
k=1
= 12 P (Y = 12) + 202 P (Y = 20) + 162 P (Y = 16) + 202 P (Y = 20) + 242 P (Y = 24)
2
+ 182 P (Y = 18) + 162 P (Y = 16) + 202 P (Y = 20)

1 1 1 1 1 1 1 1
= 144 × + 400 × + 256 × + 400 × + 576 × + 324 × + 256 × + 400 ×
8 8 8 8 8 8 8 8
1
= [144 + 400 + 256 + 400 + 576 + 324 + 256 + 400]
8
2756
=
8
2

⇒E Y = 344, 5.
Dessa maneira, a variância de Y é obtida por:

2
E Y 2 − [E (Y )]

V ar (Y ) =
= 344, 5 − 18, 252
⇒ V ar (Y ) = 11, 4375.
Após a obtenção da esperança e da variância de X e Y , vamos considerar agora a variável S que denota a
soma das duas variáveis, isto é S = X + Y (o caso negativo é análogo). Note que os valores que S assume são
S = 16, 30, 24, 26, 34, 23, 26, 25, conforme apresentado abaixo:
X = 4 10 8 6 10 5 10 5
+ + + + + + + + +
Y = 12 20 16 20 24 18 16 20
⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓
S =X +Y = 16 30 24 26 34 23 26 25
Neste contexto, determinemos a esperança e a variância da soma S:
8
X
E (S) = kP (S = k)
k=1
= 16P (S = 16) + 30P (S = 30) + 24P (S = 24) + 26P (S = 26) + 34P (S = 34)
+
23P (S = 23) + 26P (S = 26) + 25P (S = 25)
1 1 1 1 1 1 1 1
= 16 × + 30 × + 24 × + 26 × + 34 × + 23 × + 26 × + 25 ×
8 8 8 8 8 8 8 8
1
= [16 + 30 + 24 + 26 + 34 + 23 + 26 + 25]
8
204
=
8
⇒ E (S) = 25, 5.
A esperança do segundo momento de S é tal que:
8
X
2
k 2 P (S = k)

E S =
k=1
= 162 P (S = 16) + 302 P (S = 30) + 242 P (S = 24) + 262 P (S = 26) + 342 P (S = 34)
232 P (S = 23) + 262 P (S = 26) + 252 P (S = 25)
+
1 1 1 1 1 1 1 1
= 256 × + 900 × + 576 × + 676 × + 1156 × + 529 × + 676 × + 625 ×
8 8 8 8 8 8 8 8
1
= [256 + 900 + 576 + 676 + 1156 + 529 + 676 + 625]
8
5394
=
8
⇒ E S2

= 674, 25.
Portanto, a variância de S é dada por:

2
= E S 2 − [E (S)]

V ar (S)
= 674, 25 − 25, 52
⇒ V ar (S) = 24.
Em resumo, considerando as variáveis X, Y e a soma S = X + Y temos:
E (X) = 7, 25 e V ar (X) = 5, 6875
E (Y ) = 18, 25 e V ar (Y ) = 11, 4375
E (S) = 25, 5 e V ar (S) = 24
Note que, a partir dos resultados obtidos das esperanças, observamos que o valor numérico da esperança da
soma, E (X + Y ), é igual a soma das esperanças, E (X) + E (Y ), isto é,
E (S) = E (X + Y ) = 25, 5
= 7, 25 + 18, 25
= E (X) + E (Y ) .
Note também que este fato não ocorre no caso da variância, ou seja, a variância da soma não é simplesmente
a soma das variâncias, pois
V ar (S) = V ar (X + Y ) = 24
6= V ar (X) + V ar (Y ) = 17, 125
⇒ V ar (X + Y ) 6= V ar (X) + V ar (Y )
Dando continuidade ao nosso exemplo numérico, vamos encontrar a covariância entre X e Y expressa por
Cov (X, Y ) = E (XY ) − E (X) E (Y ). Encontremos primeiramente a esperança do produto E (XY ), em que XY
assume os valores XY = 48, 200, 128, 120, 240, 90, 160, 100, conforme apresentado abaixo:
X = 4 10 8 6 10 5 10 5
× × × × × × × × ×
Y = 12 20 16 20 24 18 16 20
⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓
XY = 48 200 128 120 240 90 160 100

8
X
E (XY ) = kP (XY = k)
k=1
= 48P (XY = 48) + 200P (XY = 200) + 128P (XY = 128) + 120P (XY = 120) + 240P (XY = 240)
+ 90P (XY = 90) + 160P (XY = 160) + 100P (XY = 100)
1 1 1 1 1 1 1 1
= 48 × + 200 × + 128 × + 120 × + 240 × + 90 × + 160 × + 100 ×
8 8 8 8 8 8 8 8
1
= [48 + 200 + 128 + 120 + 240 + 90 + 160 + 100]
8
1086
=
8
⇒ E (XY ) = 135, 75.
E finalmente, a covariância é obtida por
Cov (X, Y ) = E (XY ) − E (X) E (Y )

= 135, 75 − 7, 25 × 18, 25
⇒ Cov (X, Y ) = 3, 4375.
Agora que temos o valor da covariância, vamos encontrar e verificar o valor da variância da soma, isto é,
V ar (X + Y ) = V ar (X) + V ar (Y ) + 2Cov (X, Y )

= 5, 6875 + 11, 4375 + 2 × 3, 4375
= 24
= V ar (S)
Note que, somando duas vezes a covariância, obtemos finalmente o valor da variância da soma V ar (S) = 24.
11.6.2 Propriedades da covariância
Propriedade 1. Considere X uma variável aleatória, então a covariância de X com ele mesmo é a própria
variância de X, ou seja:
Cov (X, X) = V ar (X) . (18)
Demonstração de (18): Pela definição de covariância expressa em (17), temos:
Cov (X, Y ) = E (XY ) − E (X) E (Y )

⇒ Cov (X, X) = E (XX) − E (X) E (X)
2
E X 2 − [E (X)]

=
= V ar (X) .
O que demonstra o resultado expresso em (18).

Propriedade 2. Considere X e Y duas variáveis aleatórias, então a covariância entre X e Y é numericamente

igual ao valor da covariância entre Y e X, isto é,
Cov (X, Y ) = Cov (Y, X) . (19)
Demonstração de (19): Pela definição da covariância entre X e Y temos:
COV (X, Y ) = E (XY ) − E (X) E (Y )

= E (Y X) − E (Y ) E (X)
COV (X, Y ) = COV (Y, X) .
Propriedade 3. Considere X e Y duas variáveis aleatórias, e sejam a e b duas constantes reais (a, b 6= 0)
então:
Cov (aX, bY ) = abCov (X, Y ) . (20)
Demonstração de (20): Usando a definição da covariância entre X e Y expressa em (17), temos que:
Cov (aX, bY ) = E (aXbY ) − E (aX) E (bY )

= abE (XY ) − aE (X) bE (Y )
= abE (XY ) − abE (X) E (Y )
= ab[E (XY ) − E (X) E (Y )]
| {z }
Cov(X,Y )
⇒ Cov (aX, bY ) = abCov (X, Y ) .

Propriedade 4. Considere X e Y duas variáveis aleatórias, e sejam a e b duas constantes reais (a, b 6= 0)
então:
Cov (X + a, Y + b) = Cov (X, Y ) . (21)
Demonstração de (21): Novamente a partir da definição da covariância entre X e Y expressa em (17), temos
que:
Cov (X + a, Y + b) = E [(X + a) (Y + b)] − E (X + a) E (Y + b)

= E [XY + Xb + aY + ab] − [E (X) + a] [E (Y ) + b]
= E (XY ) + bE (X) + aE (Y ) + ab − E (X) E (Y ) − E (X) b − E (Y ) a − ab
= E (XY ) − E (X) E (Y )
| {z }
Cov(X,Y )
⇒ Cov (X + a, Y + b) = Cov (X, Y ) .


11.6.3 Matriz de variâncias e covariâncias
Podemos perceber que, para estas duas variáveis X e Y , temos quatro configurações de covariâncias, conforme
mostra a matriz quadrada 2 × 2 abaixo:
Cov (X, X) Cov (X, Y )

Cov (Y, X) Cov (Y, Y )
Como já vimos que a covariância de uma variável com ela mesma trata-se de sua covariância, então a matriz
quadrada acima se reduz na seguinte matrix 2 × 2:
V ar (X) Cov (X, Y )

Cov (Y, X) V ar (Y )
A matriz acima é chamada de matriz de variâncias e covariâncias. Na diagonal principal temos as

variâncias. Fora da diagonal principal temos as covariâncias. Como já sabemos que Cov (X, Y ) = Cov (Y, X) é por
esta razão que nas expressões dadas em (16) soma-se ou subtrai-se 2 vezes o valor da covariância entre X e Y .
Considerando agora três variáveis aleatórias X, Y e Z, temos nove configurações de covariâncias, conforme
mostra a matriz quadrada 3 × 3 abaixo:
Cov (X, X) Cov (X, Y ) Cov (X, Z)

Cov (Y, X) Cov (Y, Y ) Cov (Y, Z)
Cov (Z, X) Cov (Z, Y ) Cov (Z, Z)
.
Considerando o resultado dado em (18), temos:
V ar (X) Cov (X, Y ) Cov (X, Z)

Cov (Y, X) V ar (Y ) Cov (Y, Z)
Cov (Z, X) Cov (Z, Y ) V ar (Z)
.
De forma genérica, considerando X1 , X2 , . . . , Xn variáveis aleatórias, então a matriz de variâncias e Co-

variâncias de dimensão n × n é expressa da seguinte forma:
V ar (X1 ) Cov (X1 , X2 ) Cov (X1 , X3 ) ... Cov (X1 , Xn )
Cov (X2 , X1 ) V ar (X2 ) Cov (X2 , X3 ) ... Cov (X2 , Xn )
Cov (X3 , X1 ) Cov (X3 , X2 ) V ar (X3 ) ... Cov (X3 , Xn )
.. .. .. .. ..
. . . . .
Cov (Xn , X1 ) Cov (Xn , X2 ) Cov (Xn , X3 ) . . . V ar (Xn )

Dessa maneira, a variância da soma é expressa dada por
n
! n
X X n
V ar Xi = V ar (Xi ) + Cov (Xi Xj )
i=1 i=1
2
n
X n X
X
= V ar (Xi ) + Cov (Xi Xj ) .
i=1 i=1 j6=i
Fato: Se X e Y forem independentes, então E (XY ) = E (X) E (Y ) e, portanto, Cov (X, Y ) = 0. De

forma generalizada, se X1 , X2 , . . . , Xn são independentes entre si, então E (Xi Xj ) = E (Xi ) E (Xj ) e, portanto,
Cov (Xi , Xj) = 0, para i = 1, 2, . . . , n e j 6= i.
Assumindo que as variáveis aleatórias X1 , X2 , . . . , Xn sejam independentes entre si, então a matriz de
variâncias e Covariâncias de dimensão n × n é reduzida numa matriz diagonal da seguinte forma:
V ar (X1 ) 0 0 ... 0
0 V ar (X2 ) 0 ... 0
0 0 V ar (X3 ) . . . 0
.. .. .. .. ..
. . . . .
0 0 0 ... V ar (Xn )
Note que a diagonal principal da matriz é composta pelas variâncias das variáveis aleatórias X1 , X2 , . . . , Xn .
Fora da diagonal principal temos valores nulos.
Neste caso, como X1 , X2 , ..., Xn são variáveis aleatórias independentes, então a variância da soma é simples-
mente a soma das variâncias, conforme abaixo:
n
! n
X X
V ar Xi = V ar (Xi ) .
i=1 i=1

11.7 Exemplo de aplicação em jogos de azar
Suponha que, em um determinado jogo, o apostador faz o lançamento de dois dados independentes de seis
faces cada. Cada dado é equilibrado e numerado de 1 a 6, ou seja, cada face tem a mesma probabilidade de ocorrer.
Em outras palavras, os dois dados possuem faces equiprováveis. Para ilustrar, observe a figura abaixo:
Definamos como S a variável aleatória discreta que denota a soma das duas faces voltadas para cima. Resolver
os itens a seguir:
item a. Determine a distribuição de probabilidades de S.
item b. Determine a função distribuição de probabilidades de S.
item c. Encontre a esperança de S.
item d. Encontre a Variância e o desvio-padrão de S.
Resolução do item a: Neste exemplo de aplicação, para determinarmos a distribuição de probabilidades

de S, é necessário encontrarmos primeiramente o espaço amostral Ω deste experimento aleatório que é dado por:
 

 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) 


 


 

(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)

 


 


 


 

 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)

 


Ω=
(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)

 


 


 


 

(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)

 


 


 


 

(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
 
Observe que o mı́nimo da soma dos dois dados vale 2 quando os dois dados apresentam a face número 1
voltada para cima, e o máximo vale 12 quando os dois dados apresentam a face número 6 voltada para cima.
Portanto, a soma S das duas faces voltadas para cima é uma v.a.d que assume os seguintes valores:

S = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.
Dessa maneira, a distribuição de probabilidades de S é dada por:
P (S = 2) = 1/36
P (S = 3) = 2/36
P (S = 4) = 3/36
P (S = 5) = 4/36
P (S = 6) = 5/36
P (S = 7) = 6/36
P (S = 8) = 5/36
P (S = 9) = 4/36
P (S = 10) = 3/36
P (S = 11) = 2/36
P (S = 12) = 1/36
Note que a soma de todas as probabilidades vale 1, isto é,
12
X
P (S = k) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 12)
k=2
1 2 3 4 5 6 5 4 3 2 1
= + + + + + + + + + +
36 36 36 36 36 36 36 36 36 36 36
36
=
36
12
X
P (S = k) = 1.
k=2
Resolução do item b: Sabemos que, por definição, a função distribuição da variável aleatória S é expressa
por F (a) = P (S ≤ a), para a ≤ S. Portanto, a função distribuição de S é tal que:
F (2) = P (S ≤ 2) = P (S = 2) = 1/36.
F (3) = P (S ≤ 3) = P (S = 2) + P (S = 3) = 3/36.
F (4) = P (S ≤ 4) = P (S = 2) + P (S = 3) + P (S = 4) = 6/36.
F (5) = P (S ≤ 5) = P (S = 2) + P (S = 3) + P (S = 4) + P (S = 5) = 10/36.
F (6) = P (S ≤ 6) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 6) = 15/36.
F (7) = P (S ≤ 7) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 7) = 21/36.
F (8) = P (S ≤ 8) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 8) = 26/36.
F (9) = P (S ≤ 9) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 9) = 30/36.
F (10) = P (S ≤ 10) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 10) = 33/36.
F (11) = P (S ≤ 11) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 11) = 35/36.
F (12) = P (S ≤ 12) = P (S = 2) + P (S = 3) + P (S = 4) + · · · + P (S = 12) = 36/36.
Resolução do item c: Uma vez determinada a distribuição de S a sua esperança matemática é dada por:

12
X
E (S) = kP (S = k)
k=2
= 2P (S = 2) + 3P (S = 3) + 4P (S = 4) + 5P (S = 5) + 6P (S = 16) + 7P (S = 7)
+
8P (S = 8) + 9P (S = 9) + 10P (S = 10) + 11P (S = 11) + 12P (S = 12)
1 2 3 4 5 6 5 4
= 2× +3× +4× +5× +6× +7× +8× +9×
36 36 36 36 36 36 36 36
3 2 1
+ 10 × + 11 × + 12 ×
36 36 36
256
=
36
E (S) = 7.
Interpretação: O número esperado da soma das duas faces voltadas para cima neste experimento aleatório
é 7. Em outras palavras, se este experimento aleatório for repetido muitas vezes, a média dos resultados obtidos
será 7.
Resolução do item d: Para encontrarmos a variância de S, é necessário encontrar primeiramente a esperança

do segundo momento de S, conforme a seguir:
12
X
2
k 2 P (S = k)

E S =
k=2
= 2 P (S = 2) + 32 P (S = 3) + 42 P (S = 4) + 52 P (S = 5) + 62 P (S = 16) + 72 P (S = 7)
2
+ 82 P (S = 8) + 92 P (S = 9) + 102 P (S = 10) + 112 P (S = 11) + 122 P (S = 12)

1 2 3 4 5 6 5 4
= 4× +9× + 16 × + 25 × + 36 × + 49 × + 64 × + 81 ×
36 36 36 36 36 36 36 36
3 2 1
+ 100 × + 121 × + 144 ×
36 36 36
1974
=
36
329
E S2

= .
6
Por sua vez, sabemos que a variância de S é a diferença entre a esperança do segundo momento e o quadrado
da esperança do primeiro momento de S, isto é:
2
= E S 2 − [E (S)]

V ar (S)
329
= − 72
6
35
V ar (S) = = 5, 8333.
6
O desvio-padrão, por sua vez, é a raı́z quadrada da variância de S, ou seja:
p
σ (S) = V ar (S)
r
35
=
6
σ (S) = 2, 4153.

11.8 Exemplo de aplicação em empresas seguradoras de veı́culos
Em uma empresa de seguros automobilı́sticos, o número X de sinistros anuais por automóvel segurado é uma
variável aleatória discreta que assume os valores 0, 1, 2, 3, 4. Sua distribuição de probabilidades é dada por:
10 − (2k + 1)
P (X = k) = , para k = 0, 1, 2, 3, 4.
25
a. Determine e interprete a esperança do número de sinistros anuais para cada automóvel segurado.
b. Determine a variância e o desvio-padrão do número de sinistros anuais para cada automóvel segurado.
Resolução do item a. Para calcular a esperança matemática da variável X vamos determinar primeiramente
a sua distribuição de probabilidades:
Para k = 0, temos P (X = 0) = 9/25.
Para k = 1, temos P (X = 1) = 7/25.
Para k = 2, temos P (X = 2) = 5/25.
Para k = 3, temos P (X = 3) = 3/25.
Para k = 4, temos P (X = 4) = 1/25.
Por definição, sabemos que a definição de esperança para uma variável aleatória discreta é expressa por:
4
X
E (X) = kP (X = k)
k=0
=
0P (X = 0) + 1P (X = 1) + 2P (X = 2) + 3P (X = 3) + 4P (X = 4)
9 7 5 3 1
= 0× +1× +2× +3× +4×
25 25 25 25 25
30
=
25
E (X) = 1, 2 sinistro.
Interpretação: O número anual esperado de sinistros para cada automóvel segurado é de 1, 2. Em outras
palavras, a média anual do número de sinistros por automóvel segurado nesta empresa é de 1, 2.
Resolução do item b. Para calcular a variância da variável X é necessário encontrar primeiramente a

esperança do segundo momento de X, conforme a seguir:
4
X
E X2 k 2 P (X = k)

=
k=0
= 0 P (X = 0) + 12 P (X = 1) + 22 P (X = 2) + 32 P (X = 3) + 42 P (X = 4)
2
9 7 5 3 1
= 0× +1× +4× +9× + 16 ×
25 25 25 25 25
70
=
25
E X2 = 2, 8 sinistros2 .

A variância, por sua vez, é determinada por:

2
= E X 2 − [E (X)]

V ar (X)
= 2, 8 − 1, 22
V ar (X) = 1, 36 sinistros2 .
Dessa forma, o desvio padrão do número de sinistros, que é a raı́z quadrada da variância, é dado por
p
σ (X) = V ar (X)
q
= 1, 36 sinistros2
σ (X) = 1, 17 sinistro.

11.9 Exemplo de aplicação na área comercial
Em uma grande rede de loja de calçados, os funcionários ganham um adicional no salário em função das
vendas. Esse adicional é dado em número de bônus que variam de 0 a 8. O número X de bônus que cada
funcionário ganha, além do salário fixo, é uma Variável aleatória discreta tal que sua distribuição de probabilidades
é dada por:
2
(9 − k)
P (X = k) = , k = 0, 1, 2, ..., 8. (22)
285
a. Encontre a probabilidade de um funcionário qualquer ganhar no máximo 7 bônus no final do mês.

b. Encontre a probabilidade de um funcionário qualquer ganhar pelo menos 2 bônus no final do mês.
c. Encontre e interprete a esperança do número X de bônus a receber no final do mês.
d. Encontre a variância e o desvio padrão do número X de bônus a receber no final do mês. Ajuda: Encontre
primeiramente a esperança do segundo momento da Variável aleatória X, isto é, E X 2 .
e. Considere Y como a quantia em reais que o funcionário ganha em função dos bônus. Sabendo que cada
bônus equivale à 300 reais, encontre a esperança, a variância e o desvio padrão de Y . Interprete a esperança
encontrada.
Solução do item a: A distribuição de probabilidades de X expressa em (22) é expressa por extenso por:
81 64 49
P (X = 0) = ; P (X = 1) = ; P (X = 2) =
285 285 285
36 25 16
P (X = 3) = ; P (X = 4) = ; P (X = 5) =
285 285 285
9 4 1
P (X = 6) = ; P (X = 7) = ; P (X = 8) =
285 285 285
Portanto, a probabilidade de um funcionário qualquer ganhar no máximo 7 bônus no final do mês é
P (X ≤ 7) 1 − P (X = 8)
=
1
= 1−
285
284
⇒ P (X ≤ 7) = = 0, 9965 ou 99, 65%.
285
Interpretação: A probabilidade de um funcionário qualquer nesta empresa ganhar no máximo 7 bônus no

final do mês é de 0, 9965 ou 99, 65%. Em termos frequentistas podemos afirmar que 99, 65% dos funcionários desta
grande rede de loja de calçados ganham no máximo 7 bônus no final do mês.
Solução do item b. A probabilidade de um funcionário qualquer ganhar pelo menos 2 bônus no final do
mês é
P (X ≥ 2) 1 − P (X = 0) − P (X = 1)
=
81 64 140
= 1− − =
285 285 285
⇒ P (X ≥ 2) = 0, 4912 ou 49, 12%.

Interpretação: A probabilidade de um funcionário qualquer nesta empresa ganhar pelo menos 2 bônus no
final do mês é de 0, 4912 ou 49, 12%. Em termos frequentistas podemos afirmar que 49, 12% dos funcionários desta
grande rede de loja de calçados ganham pelo menos 2 bônus no final do mês.
Solução do item c. Pela definição, a esperança do número X de bônus a receber no final do mês é tal que:
8
X
E (X) = kP (X = k)
k=0
=
0P (X = 0) + 1P (X = 1) + 2P (X = 2) + ... + 8P (X = 8)
81 64 49 36 25 16 9 4 1
= 0× +1× +2× +3× +4× +5× +6× +7× +8×
285 285 285 285 285 285 285 285 285
540
=
285
⇒ E (X) = 1, 89 bônus.
Interpretação: O número mensal esperado de bônus para cada funcionário é de 1, 89. Em outras palavras,
a média mensal do número de bônus para cada funcionário nesta rede de loja de calçados é de 1, 89.
Solução do item d. Para determinarmos a variância,é necessário encontrarmos primeiramente a esperança

do segundo momento da Variável aleatória X, isto é, E X 2 :
8
X
E X2 k 2 P (X = k)

=
k=0
= 02 P (X = 0) + 12 P (X = 1) + 22 P (X = 2) + ... + 82 P (X = 8)
81 64 49 36 25 16
= 02 × + 12 × + 22 × + 32 × + 42 × + 52 ×
285 285 285 285 285 285
9 4 1
+ 62 × + 72 × + 82 ×
285 285 285
81 64 49 36 25 16
= 0× +1× +4× +9× + 16 × + 25 ×
285 285 285 285 285 285
9 4 1
+ 36 × + 49 × + 64 ×
285 285 285
1968
=
285
2
6, 91 bônus2 .

E X =
A variância de X, por sua vez, é tal que:
2
= E X 2 − [E (X)]

V ar (X)
= 6, 91 − 1, 892
⇒ V ar (X) = 3, 34 bônus2 .
Dessa forma, como a Variância é V ar (X) = 3, 34, então o desvio padrão do número X de bônus a receber
no final do mês é σ (X) = 1, 83 bônus.
Solução do item e. Se Y é a quantia em reais que o funcionário ganha em função dos bônus, temos que
Y = Xc, onde a constante c é o valor do bônus. Sabendo que cada bônus equivale a 300 reais, e utilizando
corretamente as propriedades da esperança e da variância, temos que a esperança de Y é dada por:

E (Y ) = E (Xc)
= cE (X)
= 300 × 1, 89
⇒ E (Y ) = 567 reais.
Interpretação: A quantia mensal esperada em reais para cada funcionário no fim do mês é de 567 reais.
Em outras palavras, a quantia média mensal em reais que cada funcionário nesta rede de loja de calçados ganha
no fim do mês é de 567 reais.
No caso da variância temos
V ar (Y ) = V ar (Xc)
= c2 V ar (X)
= 3002 × 3, 34
⇒ V ar (Y ) = 300.600 reais2 .
Dessa forma, o desvio-padrão da quantia em reais que cada funcionário nesta rede de loja de calçados ganha
no fim do mês é tal que:
p
σ (Y ) = V ar (Y )
√
= 300.600
⇒ σ (Y ) = 548, 27 reais.

11.10 Exemplo de aplicação em apostas e premiações
Um apostador faz a seguinte aposta: lançam-se 3 moedas honestas, isto é, moedas equilibradas ou não-
viciadas, e observam-se as três faces voltadas para cima. Se cair 3 coroas, o apostador perde 80 dólares. Se cair 1
ou 2 caras, o apostador perde 40 dólares. Se cair 3 caras, o apostador ganha 320 dólares. Determinar a esperança,
a variância e o desvio-padrão da quantia em dólares que o apostador ganha nesta aposta.
Solução: Podemos observar que a quantia em dólares a ser ganha pelo apostador depende do número de
caras obtidas neste jogo. Portanto, encontremos primeiramente o espaço amostral deste experimento aleatório:
Ω = {(ccc) , (cck) , (ckc) , (ckk) , (kcc) , (kck) , (kkc) , (kkk)}

Dessa forma, seja X o número de caras obtidas no lançamento destas três moeadas, então temos que X =
0, 1, 2, 3. A distribuição de probabilidades de X é dada por:
P (X = 0) = 1/8; P (X = 1) = 3/8; P (X = 2) = 3/8; P (X = 3) = 1/8.
Seja Y a quantia em dólares que o apostador ganha, então temos que Y = 320, −40, −80. A distribuição de
probabilidades de Y é dada por:
P (Y = 320) = P (X = 3) = 1/8.
P (Y = −40) = P (X = 1) + P (X = 2) = 6/8.
P (Y = −80) = P (X = 0) = 1/8.
Dessa maneira, a esperança de Y é obtida por
E (Y ) 320P (Y = 320) + (−40) P (Y = −40) + (−80) P (Y = −80)

=
1 6 1
= 320 × − 40 × − 80 ×
8 8 8
320 − 240 − 80 320 − 320
= =
8 8
E (Y ) = 0 dólares.
Interpretação: A quantia média em dólares que o apostador espera ganhar nesta aposta é de 0 dólares. Em
outras palavras, se este apostador fizer o jogo muitas vezes, toda a quantia que ele ganha será igual a quantia que
ele gasta para apostar e, dessa maneira, a média é nula.
A variância, por sua vez, depende primeiramente da esperança do segundo momento de Y .
2 2
E Y2 3202 P (Y = 320) + (−40) P (Y = −40) + (−80) P (Y = −80)

=
1 6 1
= 102400 × + 1600 × + 6400 ×
8 8 8
102400 + 9600 + 6400 118400
= =
8 8
2
E Y2

= 14800 dólares .
Dessa maneira temos que:
2
E Y 2 − [E (Y )]

V ar (Y ) =
= 14800 − 02
V ar (Y ) = 14800 dólares2 .
Portanto, o desvio-padrão da quantia em dólares que o apostador ganha nesta aposta é tal que:
p
σ (Y ) = 14800 dólares2 . = 121, 66 dólares.

11.11 Distribuição uniforme discreta
Definição: Suponha uma variável aleatória discreta que assume os valores inteiros 1, 2, 3, . . . , N , cuja distri-
buição é equiprovável, ou seja,
1
P (X = k) = , com k = 1, 2, 3, . . . , N. (23)
N
Então dizemos que X tem distribuição uniforme discreta.
Notação: X ∼ Ud (1, N ).
Lê-se: “X tem distribuição uniforme discreta de 1 a N , ou X segue o modelo uniforme discreto de 1 a N ”.
A esperança matemática de X bem como a sua variância são expressas por:
N +1 N2 − 1
E (X) = e V ar (X) = . (24)
2 12
A função distribuição de X, ou distribuição acumulada de probabilidades de X, é expressa por:
k
F (k) = P (X ≤ k) = , para k = 1, 2, 3, . . . , N. (25)
N
Demonstração de (24): Considerando a expressão dada em (23), temos a seguinte distribuição de probabili-
dades para esta v.a.d X:
P (X = 1) = 1/N
P (X = 2) = 1/N
P (X = 3) = 1/N
..
.
P (X = N ) = 1/N.
N
P
Note que P (X = k) = 1, pois trata-se de uma distribuição de probabilidades. Sabemos que, por definição,
k=1
a esperança matemática de uma v.a.d X é expressa por
X
E (X) = kP (X = k)
k
Aplicando a definição da esperança usando a distribuição de probabilidades dada em (23) temos o seguinte:

N
X
E (X) = kP (X = k)
k=1
= 1P (X = 1) + 2P (X = 2) + 3P (X = 3) + · · · + N P (X = N )
1 1 1 1
= 1 + 2 + 3 + ··· + N
N N N N
1
= (1 + 2 + 3 + · · · + N )
N | {z }
Soma de N 1ºs termos duma P.A
1 N (1 + N )
=
N 2
N +1
E (X) = .
2
No caso da variância devemos determinar

primeiramente a esperança do segundo momento de X, ou esperança
do quadrado de X, denotada por E X 2 , da seguinte forma:
N
X
E X2 k 2 P (X = k)

=
k=1
= 1 P (X = 1) + 22 P (X = 2) + 32 P (X = 3) + · · · + N 2 P (X = N )
2
1 1 1 1
= 12 + 2 2 + 3 2 + · · · + N 2
N N N N
1
12 + 2 2 + 3 2 + · · · + N 2

=
N | {z }
Soma do quadrado de N 1ºs termos
1 N (N + 1) (2N + 1)
=
N 6
(N + 1) (2N + 1)
E X2

= .
6
Como a variância de uma variável aleatória é dada pela diferença entre a esperança do segundo momento e
2
o quadrado da esperança do primeiro momento, isto é, V ar (X) = E X 2 − [E (X)] , temos que:
2
= E X 2 − [E (X)]

V ar (X)
2
(N + 1) (2N + 1) N +1
= −
6 2
2
2N 2 + N + 2N + 1 (N + 1)
= −
6 22
2 2
2N + 3N + 1 N + 2N + 1
= −
6 4
4N 2 + 6N + 2 − 3N 2 − 6N − 3
=
12
N2 − 1
V ar (X) = .
12
Demonstrando assim os resultados expressos em (24).

Demonstração de (25): Por definição temos que a função distribuição é dada por
F (k) = P (X ≤ k)
= P (X = 1) + P (X = 2) + · · · + P (X = k)
1 1 1
= + + ··· +
N
| N {z N }
k vezes
k
F (k) = .
N
Para todo k = 1, 2, 3, . . . , N , demonstrando assim o resultado expresso em (25).
Exemplo de aplicação: Suponha o lançamento de um dado equilibrado de seis lados e seja X a variável
aleatória que denota o número da face obtida, ou seja, X = 1, 2, 3, 4, 5, 6.
Como o dado é equilibrado, isto é, as faces são equiprováveis, temos a seguinte distribuição de probabilidades
de X:
P (X = 1) = 1/6
P (X = 2) = 1/6
P (X = 3) = 1/6
P (X = 4) = 1/6
P (X = 5) = 1/6
P (X = 6) = 1/6.
Como N = 6, temos neste exemplo de aplicação:
N +1
E (X) =
2
6+1
=
2
E (X) = 3, 5.
Interpretação: Se repetirmos este experimento aleatório muitas vezes, isto é, se lançarmos este dado equi-
librado muitas vezes, então a média dos resultados obtidos converge para o valor numérico 3, 5 (“média a longo
prazo”).
No caso da variância associada a este experimento aleatório temos o seguinte
N2 − 1
V ar (X) =
12
36 − 1
=
12
35
V ar (X) = = 2, 9197.
12
O desvio-padrão, por sua vez, é tal que
p
σ (X) = V ar (X)
p
= 2, 9197
σ (X) = 1, 7078.

12 Variáveis aleatórias contı́nuas
Alguns exemplos de variáveis aleatórias contı́nuas (abreviação v.a.c) são: peso e altura de indivı́duos, ı́ndice
de massa corporal, pressão atmosférica, temperatura diária de uma determinada região, ı́ndice pluviométrico para
medir a quantidade de chuva, velocidade do vento, vazão de um rio, tempo de vida útil de um determinado
componente eletrônico, salários dos funcionários de uma empresa, renda familiar ou renda per capita, etc.
12.1 Definição e conceitos básicos
Definição: Dizemos que a variável aleatória X é uma variável aleatória contı́nua (v.a.c) se:
Zb
i. 0 ≤ P (a < X < b) = f (x) dx ≤ 1.
a
+∞
Z
ii. f (x) dx = 1.
−∞
em que f (x) é chamada de função densidade de probabilidade (f.d.p).
12.2 Função distribuição
A função distribuição, ou distribuição acumulada de probabilidades, é a probabilidade da v.a.c X ser menor

ou igual a um ponto arbitrário x, isto é,
Zx
F (x) = P (X ≤ x) = f (x) dx.
−∞
Resultado 1: A derivada da função distribuição é a função densidade de probabilidade (f.d.p):

0
F (x) = f (x) = f.d.p.
Resultado 2: O limite da F (x) quando x → −∞ é zero, e o limite de F (x) quando x → +∞ é um, isto é,
lim F (x) = 0
x→−∞
lim F (x) = 1.
x→+∞
12.3 Mediana de uma variável aleatória contı́nua
Por definição a mediana é uma medida de tendência central que divide um conjunto quantitativo ordenado
de dados em duas partes iguais. Contextualizando para o caso de uma variável aleatória contı́nua, a mediana é o
valor que deixa uma área igual a 0, 5 abaixo e 0, 5 acima dela. Para encontrar o valor da mediana basta encontrar
o valor M e que satisfaça a expressão abaixo:
ZM e
1
f (x) dx = .
2
−∞

12.4 Moda de uma variável aleatória contı́nua
A moda de uma variável aleatória contı́nua é o valor numérico de x que maximiza f (x), caso exista o máximo
0
da função. Para isso, basta encontrar a derivada f (x) e igualar a zero. Neste caso, x é chamado de moda ou valor
modal. A figura abaixo apresenta um exemplo de variável aleatória contı́nua e seu valor modal.
12.5 Esperança matemática e variância de uma variável aleatória contı́nua
A esperança matemática de uma variável aleatória contı́nua é definida como:
+∞
Z
E (X) = xf (x) dx.
−∞
A variância, por sua vez, é definida como a esperança do segundo momento menos o quadrado da esperança
do primeiro momento, isto é,
2
V ar (X) = E X 2 − [E (X)] ,

em que
+∞
Z
2
x2 f (x) dx.

E X =
−∞

12.6 Exemplo de aplicação genérica
Considere X uma variável aleatória contı́nua (v.a.c) tal que sua f.d.p seja dada por:

 3x2 /125 se 0 < x < 5.
f (x) =
0 caso contrário

a. Verifique se f (x) é uma f.d.p.

b. Determine a função distribuição F (x).
c. Determine P (2 < X < 4).
d. Encontre a mediana da v.a.c X.
e. Determine a esperança matemática da v.a.c X.
f. Determine a variância da v.a.c X.
Resolução do item a. Para que f (x) seja uma f.d.p, o valor numérico de sua integral na reta tem que ser
1.
+∞ Z5
3x2
Z 3
3 x
f (x) dx = dx = |50
125 125 3
−∞ 0
3
03

3 5 3 125
= − = ×
125 3 3 125 3
+∞
Z
f (x) dx = 1.
−∞
Logo, f (x) é uma função densidade de probabilidade (f.d.p).
Resolução do item b. Por definição temos que F (x) = P (X ≤ x). Aplicando em nosso exemplo temos:
Zx
F (x) = P (X ≤ x) = f (x) dx
−∞
Zx
3x2
3
3 x
= dx = |x0
125 125 3
0
3
03 x3

3 x
= − =
125 3 3 125
3
x
F (x) = .
125
0
Note que F (x) = f (x), ou seja, a derivada da função distribuição é a própria função densidade de probabi-
lidade.
Resolução do item c. Para encontrar a probabilidade da v.a.c estar num intervalo definido [a, b], basta
integrar f (x) neste intervalo, isto é,

Z4 Z4
3x2
P (2 < X < 4) = f (x) dx = dx
125
2 2
3 3
23

3 x 3 4
= |42 = −
125 3 125 3 3

3 64 8 3 56 56
= − = × =
125 3 3 125 3 125
P (2 < X < 4) = 0, 4480.
Resolução do item d. Encontrar a mediana da v.a.c X.
ZM e ZM e
1 3x2 1
f (x) dx = =⇒ dx =
2 125 2
0 0
3
3 x 1
=⇒ |M e
0 =
125 3 2
3 3

3 Me 0 1
=⇒ − =
125 3 3 2
3
Me 1
=⇒ =
125 2
=⇒ M e = 3, 9685.
Isto significa que o valor numérico 3, 9685 deixa uma área igual a 0, 5 (50%) abaixo de si, e uma área de 0, 5
(50%) acima de si.
Resolução do item e. Determinar a esperança matemática da v.a.c X.
+∞ Z5 Z5 3
3x2
Z
3x
E (X) = xf (x) dx = x dx = dx
125 125
−∞ 0 0
4 4 4

3 x 5 3 5 0 3 625 15
= |0 = − = × =
125 4 125 4 4 125 4 4
E (X) = 3, 75.
Interpretação: Se repetirmos este experimento muitas vezes, a média dos resultados obtidos será 3, 75.
Resolução do item f. Para determinar a variância, é necessário encontrar primeiramente a esperança do

segundo momento de X.
+∞ Z5 Z5 4
Z 2
2 2 2 3x 3x

E X = x f (x) dx = x dx = dx
125 125
−∞ 0 0
5 5 5

3 x 3 5 0 3 3125
= |50 = − = ×
125 5 125 5 5 125 5
E X2

= 15.
A variância é dada pela esperança do segundo momento menos o quadrado da esperança do primeiro momento.
2
= E X 2 − [E (X)] = 15 − 3, 752

V ar (X)
V ar (X) = 0, 9375.

12.7 Exemplo de aplicação na engenharia de tráfego rodoviário
A incidência de acidentes em um trecho de 80 km de um rodovia federal ocorre de maneira uniforme. Em

outras palavras, se X é a variável aleatória contı́nua (v.a.c) que denota o trecho contı́nuo da rodovia, então a sua
função densidade de probabilidade (f.d.p) é expressa por:

 1/80 se 0 < x < 80.
f (x) =
0 caso contrário


b. Determine a função distribuição F (x).
c. Determine a probabilidade da ocorrência de acidentes entre os km20 e km70, isto é, P (20 < X < 70).
d. Encontre o valor mediano deste trecho rodoviário, isto é, a mediana da v.a.c X.
e. Determine a esperança matemática da v.a.c X.
f. Determine a variância da v.a.c X.
Resolução do item a. Para que f (x) seja uma f.d.p, o valor numérico de sua integral na reta vale 1.
+∞
Z Z80
1 1
f (x) dx = dx = (x) |80
0
80 80
−∞ 0
1 1
= (80 − 0) = × 80
80 80
Z80
f (x) dx = 1.
0
Logo, esta f (x) é uma função densidade de probabilidade (f.d.p).
Resolução do item b. Por definição temos que F (x) = P (X ≤ x). Aplicando em nosso exemplo temos:
Zx
F (x) = P (X ≤ x) = f (x) dx
−∞
Zx
1 1
= dx = (x) |x0
80 80
0
1 x
= (x − 0) =
80 80
x
F (x) = .
80
0
Note que F (x) = f (x), ou seja, a derivada da função distribuição é função densidade de probabilidade.
Resolução do item c. Para encontrar a probabilidade da v.a.c estar num intervalo definido [a, b], basta
integrar f (x) neste intervalo, isto é,
Z70 Z70
1
P (20 < X < 70) = f (x) dx = dx
80
20 20
1 1
= (x) |70
20 = (70 − 20)
80 80
1 50
= × 50 = = 0, 6250
80 80
P (20 < X < 70) = 0, 6250 ou 62, 50%.

Interpretação: a probabilidade da ocorrência de acidentes entre os km20 e km70 é de 0, 6250 ou 62, 50%.
Resolução do item d. Encontrar a mediana da v.a.c X.
ZM e ZM e
1 1 1
f (x) dx = =⇒ dx =
2 80 2
0 0
1 1
=⇒ (x) |M e
0 =
80 2
1 1
=⇒ (M e − 0) =
80 2
Me 1
=⇒ =
80 2
80
=⇒ Me =
2
=⇒ M e = 40 km.
Interpretação: Isto significa que o km 40 deixa uma área igual a 0, 5 (50%) abaixo de si, e de 0, 5 (50%)
acima de si. Em outras palavras, metade dos acidentes ocorrem até o trecho km 40 e a outra metade após o km 40.
Resolução do item e. Determinar a esperança matemática da v.a.c X.
+∞
Z Z80 Z80
x 1
E (X) = xf (x) dx = dx = xdx
80 80
−∞ 0 0
1 x2 80 1 802 02

1 6400 6400
= |0 = − = × =
80 2 80 2 2 80 2 160
E (X) = 40.
Interpretação: Se repetirmos este experimento muitas vezes, o km médio da ocorrência de acidentes é o
km40.
Resolução do item f. Para determinar a variância, é necessário encontrar primeiramente a esperança do

segundo momento de X.
+∞
Z Z80 2 Z80 3
2
2 x 1 x
E X = x f (x) dx = dx = dx
80 80 3
−∞ 0 0
3 3 3
803

1 x 1 80 0 1 6400
= |80
0 = − = × =
80 3 80 3 3 80 3 3
6400
E X2

= .
3
A variância é dada pela esperança do segundo momento menos o quadrado da esperança do primeiro momento.
2 6400
= E X 2 − [E (X)] = − 402

V ar (X)
3
1600
V ar (X) = .
3
O desvio-padrão, por sua vez, é dado por
p
σ (X) = V ar (X)
r
1600
=
3
σ (X) = 23, 09.

12.8 Exemplo de aplicação na engenharia industrial
O tempo X de acionamento de um sistema industrial automático numa linha de produção é uma variável
aleatória contı́nua (v.a.c), cuja função densidade de probabilidades (f.d.p) é expressa por
−3x2 + 36x − 60
f (x) = , 2 ≤ x ≤ 10.
256
a. Verifique se esta f (x) é, de fato, uma f.d.p.

b. Determinar P (4 ≤ X ≤ 8), isto é, a probabilidade do tempo de acionamento estar entre 4 e 8 minutos.
c. Encontre o tempo modal M o, ou seja, o tempo de acionamento mais frequente deste sistema.
d. Encontre o tempo mediano de acionamento deste sistema. Mostre que a mediana dessa v.a.c não possui
forma explı́cita e é dada pela solução de um polinômio de grau 3.
e. Encontre a esperança matemática E (X). Use o valor numérico da esperança matemática no polinômio do
item (d) e faça comentários pertinentes.
f. Encontre a variância V ar (X) do tempo de acionamento deste sistema. Em seguida encontre o desvio-
padrão σ (X).
Resolução do item a. Para que f (x) seja uma f.d.p temos que verificar se
+∞
Z
f (x) dx = 1.
−∞
Em nosso exemplo temos que
+∞ Z10
−3x2 + 36x − 60
Z
f (x) dx = dx
256
−∞ 2
−3x3 36x2

1
= + − 60x |10
2
256 3 2
1
−x3 + 18x2 − 60x |10

= 2
256
1
= [(−1000 + 1800 − 600) − (−8 + 72 − 120)]
256
1
= (200 + 56)
256
1
= × 256 = 1
256
+∞
Z
f (x) dx = 1.
−∞
Logo, esta f (x) é de fato uma f.d.p.
Resolução do item b. Para determinar a probabilidade do tempo de acionamento estar entre 4 e 8 minutos,
basta integrar f (x) no intervalo [4 , 8], ou seja:

Z8
−3x2 + 36x − 60
P (4 ≤ X ≤ 8) = dx
256
4
−3x3 36x2

1
= + − 60x |84
256 3 2
1
−x3 + 18x2 − 60x |84

=
256
1
= [(−512 + 1152 − 480) − (−64 + 288 − 240)]
256
1
= (160 + 16)
256
1
= × 176 = 0, 6875
256
P (4 ≤ X ≤ 8) = 0, 6875 ou 68, 75%.
Interpretação: A probabilidade do tempo de acionamento deste sistema industrial estar entre 4 e 8 minutos
é de 0, 6875 ou 68, 75%. Ou ainda podemos dizer que, em 68, 75% das vezes, o tempo de acionamento deste sistema
industrial está entre 4 e 8 minutos.
Resolução do item c. Para encontrar o tempo modal M o de acionamento do sistema, basta encontrar o
valor numérico de x que maximize f (x). Para isso, é necessário encontrarmos a sua derivada, isto é:
0 −6x + 36
f (x) = .
256
Igualando a derivada a zero, temos:
−6x + 36
=0
256
⇒ −6x + 36 = 0
⇒ −6x = −36
36
⇒ x=
6
⇒ x = 6 minutos.
Logo, o valor de x que maximiza f (x) é 6. Portanto, o tempo modal de acionamento deste sistema é de
M o = 6 minutos.
Interpretação: O tempo de acionamento mais frequente neste sistema industrial é de 6 minutos.
Resolução do item d. Para encontrar o tempo mediano de acionamento deste sistema, basta fazer:
ZM e
1
f (x) dx =
2
−∞
Dessa maneira temos que

ZM e
−3x2 + 36x − 60 1
dx =
256 2
2
3x3 36x2

1 1
=⇒ − + − 60x |M e
2 =
256 3 2 2
1 1
−x3 + 18x2 − 60x |M e

=⇒ 2 =
256 2
1 1
−M e + 18M e − 60M e − −23 + 18 × 22 − 60 × 2 =
3 2

=⇒
256 2
1 3 2
1
=⇒ −M e + 18M e − 60M e + 56 =
256 2
=⇒ −M e3 + 18M e2 − 60M e + 56 = 128
=⇒ −M e3 + 18M e2 − 60M e − 72 = 0.
Dessa forma, a mediana não possui forma explı́cita e é dada pela solução do polinômio acima. Podemos
verificar que, por se tratar de uma distribuição perfeitamente simétrica (parábola), o valor da moda 6 minutos é a
solução deste polinômio, o que significa que a mediana também é M e = 6 minutos.
Interpretação: O tempo mediano de acionamento neste sistema industrial é de 6 minutos, isto é, em 50%
das vezes este sistema tem um tempo de acionamento menor do que 6 minutos e em 50% das vezes maior do que
6 minutos.
Resolução do item e. A esperança matemática é E (X) = 6, que é a própria solução do polinômio no item
a.
+∞
Z
E (X) = xf (x) dx
−∞
Z10
−3x2 + 36x − 60
= x dx
256
2
Z10
−3x3 + 36x2 − 60x
= dx
256
2
3x4 36x3 60x2 10

1
= − + − |2
256 4 3 2
1 1536
= [1500 − (−36)] = =6
256 256
E (X) = 6 minutos.
Interpretação: Se este sistema industrial for acionado muitas vezes, então a média dos tempos obtidos é de
6 minutos, ou seja, o tempo esperado neste experimento aleatório é de 6 minutos.
Observação: Assim como o valor da moda, o valor numérico da esperança matemática E (X) = 6 também é
a própria solução do polinômio no item d.. Toda distribuição perfeitamente simétrica apresenta os mesmos valores
numéricos para as medidas de tendência central, isto é, E (X) = M o = M e.
Resolução do item f. Para encontrar a variância é necessário encontrar primeiramente a esperança do

segundo momento

+∞
Z
2
x2 f (x) dx

E X =
−∞
Z10
−3x2 + 36x − 60
= x2 dx
256
2
Z10
−3x4 + 36x3 − 60x2
= dx
256
2
3x5 36x4 60x3 10

1
= − + − |2
256 5 4 3
1 10035, 2
= [10000 − (−35, 2)] =
256 256
E X2 = 39, 2 minutos2 .

E, finalmente, a variância é dada por
2
= E X 2 − [E (X)]

V ar (X)
= 39, 2 − 62
V ar (X) = 3, 2 minutos2 .
O desvio-padrão, por sua vez, é expresso pela raı́z quadrada da variância, isto é
σ (X) = 1, 79 minutos.

13 Modelo ou Distribuição de Bernoulli
Em estatı́stica há vários modelos discretos e contı́nuos usados em pesquisas cientı́ficas para as mais diversas
finalidades. Modelos são descrições aproximadas da realidade cujo objetivo é substituir, de maneira simplificada
e objetiva, um problema real. Podemos afirmar que um modelo é uma tentativa de representar as caracterı́sticas
mais importantes de um problema para a tomada de decisões. Dessa maneira, os modelos demandam um nı́vel
adicional de abstração por ser descrições aproximadas de modelos. Por meio do formalismo matemático tentamos
substituir nosso modelo do problema real por um modelo matemático, necessário para o prosseguimento dos estudos
em amostragem e inferência estatı́stica via técnicas de estimação de parâmetros populacionais.
Alguns exemplos de modelos probabilı́sticos discretos são: Bernoulli, binomial, Poisson, geométrico, hiper-
geométrico, multinomial, binonimial negativo.
Alguns exemplos de modelos probabilı́sticos contı́nuos são: uniforme, normal, qui-quadrado, t-student, t-
student não-central, F de Snedecor, F não-central, Cauchy, gama, beta, beta não-central, exponencial, Weibull,
Gumbel (ou valor extremo), log-normal, logı́stico, modelos truncados, modelos mistos, Rayleigh, normal dobrada,
Rice, normal estendida.
Neste material didático os modelos probabilı́sticos estudados são: modelo de Bernoulli, modelo Binomial,
modelo de Poisson e o modelo Normal (também denominado de modelo Gaussiano).
Dentre os inúmeros modelos discretos, o modelo binomial é um dos modelos mais importantes e usados nas
diversas áreas. Entretanto, para introduzirmos este assunto, é necessário abordarmos um outro modelo discreto
que deu base para o modelo binomial. Trata-se da distribuição ou modelo de Bernoulli.
Jakob Bernoulli5 (Ou Jacques Bernoulli, Basileia 1654 − 1705) foi o primeiro matemático a desenvolver o
cálculo infinitesimal para além do que fora feito por Newton e Leibniz, aplicando-o a novos problemas.
Publicou a primeira integração de uma equação diferencial; deu solução ao problema dos isoperı́metros, que
abriu caminho ao cálculo das variações de Euler e Lagrange e estendeu suas principais aplicações ao cálculo das
probabilidades. É considerado o pai do cálculo exponencial. Foi professor de matemática em Basileia, tendo sido
importantı́ssima sua contribuição à geometria analı́tica, à teoria das probabilidades e ao cálculo de variações.
Em 1713, depois de sua morte, foi publicado seu grande tratado sobre a teoria das probabilidades Ars
Conjectandi, que ainda oferece interesse prático na aplicação da teoria da probabilidade no seguro e na estatı́stica.
Definição da distribuição de Bernoulli: Considere Y uma variável aleatória discreta (v.a.d ) que assume
apenas dois resultados possı́veis. Por exemplo:
Face obtida voltada para cima em um lançamento de uma moeda: cara ou coroa;
Nascimento de filhote macho ou fêmea de uma espécie de mamı́fero;
Fabricação de uma peça defeituosa ou não defeituosa numa linha de produção;
Uma empresa de extração de petróleo encontra ou não petróleo num ponto de sondagem;
O gerente do banco libera ou não libera o empréstimo para um determinado cliente;
O indivı́duo é ou não portador de uma determinada doença;
O aluno é aprovado ou reprovado numa determinada disciplina;
Usualmente adota-se o valor numérico 1 (um) para a ocorrência do evento de interesse, que chamamos de
sucesso e adota-se o valor numérico 0 (dois) se não ocorrer o evento de interesse, que chamamos de fracasso, de
tal forma que
5 Jakob Bernoulli era da famı́lia Bernoulli, que destacou-se devido ao fato de ter dado ao mundo, durante um século, oito notáveis
cientistas na área da matemática e da fı́sica. O progenitor Nicolau residia em Antuérpia na Bélgica, foi forçado a abandonar o paı́s
por ser protestante, na época da perseguição dos espanhóis aos não católicos. Mudou-se para Basileia, na Suı́ça onde se continuou
a dedicar ao negócio das especiarias, vindo a casar com Margarette Schoenauer ligada a uma grande famı́lia de banqueiros, tendo-se
tornado um mercador de sucesso. Dos três filhos apenas o mais novo, Nicolau (apelidado o filho), seguiu os passos do pai. Os outros,
bem como a descendência, dedicaram-se às matemáticas. A história dos descendentes seria muito semelhante: não revelando queda
para o negócio da famı́lia, inscreveram-se na Universidade onde cursaram Magistratura ou Medicina. Anos mais tarde acabariam por
se dedicar à Matemática onde viriam a dar contribuições importantes, nomeadamente na área do cálculo.


1 se sucesso, tal que P (X = 1) = p
X=
0 se fracasso, tal que P (X = 0) = 1 − p
Dizemos que X tem distribuição de Bernoulli ou X segue o modelo de Bernoulli de parâmetro p com distri-
buição de probabilidades é dada por
1−k
P (X = k) = pk (1 − p) , k = 0, 1.
A esperança matemática e a variância de X são dadas respectivamente por
E (X) = p e V ar (X) = p (1 − p) . (26)
Notação: X ∼ Bernoulli (p).
Lê-se: “X tem distribuição de Bernoulli ou X segue o modelo de Bernoulli com parâmetro p”.
Demonstração
P de (26): Por definição, a esperança matemática de uma variável aleatória discreta é tal que
E (X) = kP (X = k). Dessa maneira temos que:
k
X
E (X) = kP (X = k)
k
= 0P (X = 0) + 1P (X = 1)
= 0 (1 − p) + 1p
E (X) = p.
Por sua vez, para encontrarmos a variância de X, é necessário determinarmos a esperança do segundo momento
da v.a.d X, conforme a seguir:
X
E X2 k 2 P (X = k)

=
k
= 02 P (X = 0) + 12 P (X = 1)
= 0 (1 − p) + 1p
2

E X = p.
Como a variância de uma v.a.d é a diferença entre a esperança do segundo momento e o quadrado da esperança
do primeiro momento, temos
2
= E X 2 − [E (X)]

V ar (X)
= p − p2
V ar (X) = p (1 − p) .
Demonstrando assim a expressão dada em (26).

14 Modelo ou Distribuição Binomial
Seja X uma variável aleatória discreta (v.a.d ) que conta o número k de sucessos em n ensaios independentes
de Bernoulli cada qual com probabilidade de sucesso igual a p (0 < p < 1). Então X assume os valores inteiros de
contagem 0, 1, 2, . . . , n. A probabilidade de observarmos k sucessos nestes n ensaios independentes de Bernoulli,
isto é, a probabilidade da v.a.d X assumir o valor k é expressa por:

n k n−k
P (X = k) = p (1 − p) , k = 0, 1, 2, ..., n. (27)
k
A expressão (27) é denominada de distribuição binomial de probabilidades de X. A esperança matemática e

a variância de X são dadas respectivamente por
E (X) = np e V ar (X) = np (1 − p) . (28)
Notação: X ∼ Binomial (n, p).
Lê-se: “X tem distribuição binomial com parâmetros n e p, ou X segue o modelo binomial com parâmetros
n e p ”.
14.1 Exemplo de aplicação na área genética
A probabilidade de que alguém apresente uma determinada caracterı́stica genética é de 0, 25 (ou 25%). Em
uma amostra de 8 indivı́duos, calcule a probabilidade de que
a.) 3 indivı́duos apresentem tal caracterı́stica genética.

b.) 5 indivı́duos apresentem tal caracterı́stica genética.
c.) pelo menos 1 indivı́duo apresente tal caracterı́stica genética.
d.) no máximo 2 indivı́duos apresentem tal caracterı́stica genética.
e.) nenhum indivı́duo apresente tal caracterı́stica genética.
f.) Determine a esperança e a variância do número de indivı́duos que apresentam tal caracterı́stica genética.
Resolução do item a. Como temos n = 8 indivı́duos na amostra e estamos interessados em k = 3 sucessos,

segue que

n k n−k
P (X = k) = p (1 − p)
k

8 8−3
⇒ P (X = 3) = 0, 253 (1 − 0, 25)
3
⇒ P (X = 3) = 0, 2076
Interpretação: A probabilidade de que 3 indivı́duos apresentem tal caracterı́stica genética, neste grupo de
8 indivı́duos, é de 0, 2076 ou 20, 76%.
Resolução do item b. Como estamos interessados em k = 5 sucessos na amostra, segue que

n k n−k
P (X = k) = p (1 − p)
k

8 8−5
⇒ P (X = 5) = 0, 255 (1 − 0, 25)
5
⇒ P (X = 5) = 0, 0231

Interpretação: A probabilidade de que 5 indivı́duos apresentem tal caracterı́stica genética, neste grupo de
8 indivı́duos, é de 0, 0231 ou 2, 31%.
Resolução do item c. Como temos n = 8 indivı́duos na amostra e estamos interessados em pelo menos um
sucesso, isto é, k ≥ 1 sucesso1, segue que
P (X ≥ 1) = P (X = 1) + P (X = 2) + ... + P (X = 8)
= 1 − P (X = 0)

8 8−0
= 1− 0, 250 (1 − 0, 25)
0
= 1 − 0, 1001
P (X ≥ 1) = 0, 8999
Interpretação: A probabilidade de que pelo menos 1 indivı́duo apresente tal caracterı́stica genética, neste
grupo de 8 indivı́duos, é de 0, 8999 ou 89, 99%.
Resolução do item d. Estamos interessados na ocorrência de no máximo 2 sucessos, isto é, k ≤ 2. Dessa
forma temos que:
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)

8 8−0 8 8−1 8 8−2
= 0, 250 (1 − 0, 25) + 0, 251 (1 − 0, 25) + 0, 252 (1 − 0, 25)
0 1 2
= 0, 1001 + 0, 2670 + 0, 3115
P (X ≤ 2) = 0, 6786
Interpretação: A probabilidade de que no máximo 2 indivı́duos apresentem tal caracterı́stica genética, neste
grupo de 8 indivı́duos, é de 0, 6786 ou 67, 86%.
Resolução do item e. Estamos interessados em nenhuma ocorrência, isto é, em nenhum sucesso nesta
amostra de 8 indivı́duos (k = 0). Neste contexto segue que:

n k n−k
P (X = k) = p (1 − p)
k

8 8−0
P (X = 0) = 0, 250 (1 − 0, 25)
0
P (X = 0) = 0, 1001
Interpretação: A probabilidade de que nenhum indivı́duo apresente tal caracterı́stica genética, neste grupo
de 8 indivı́duos, é de 0, 1001 ou 10, 01%.
Resolução do item f. Como temos n = 8 indivı́duos e a probabilidade de sucesso igual a p = 0, 25, segue
que a esperança de X é dada por:
E (X) = np = 8 × 0, 25
E (X) = 2.
Interpretação: O número esperado de indivı́duos que apresentam tal caracterı́stica genética é de 2 in-
divı́duos. Em outras palavras, se este experimento pudesse ser realizado muitas vezes, a média dos resultados
obtidos é de 2 indı́viduos com tal caracterı́stica genética para cada grupo de 8 indivı́duos.
A variância, por sua vez, é tal que

V AR (X) = np (1 − p) = 8 × 0, 25 × 0, 75
V AR (X) = 1, 5.
Observação: A variância do número de indivı́duos que apresentam tal caracterı́stica genética é de 1, 5
indivı́duos2 . A fim de trabalharmos com a mesma unidade de medida da esperança, pode-se considerar a sua raı́z,
denominada de desvio-padrão: σ = 1, 22 indivı́duos com tal caracterı́stica.

14.2 Exemplo de aplicação na exploração de petróleo
Num processo de sondagem para a instalação de uma plataforma de exploração de petróleo em águas oceânicas,
numa certa região, a probabilidade de encontrar petróleo é de 0, 04. Uma empresa de extração de petróleo e seus
derivados realiza a sondagem em 25 pontos diferentes nessa região. Qual a probabilidade de que
a.) em apenas 2 pontos de sondagem encontre petróleo.

b.) em 10 pontos de sondagem encontre petróleo.
c.) pelo menos 1 ponto de sondagem encontre petróleo.
d.) determine a esperança do número de pontos de sondagem que encontre petróleo.
Resolução do item a. Como temos n = 25 pontos de sondagem, probabilidade de sucesso igual a p = 0, 04,
e estamos interessados na ocorrência de 2 sucessos, segue imediatamente que:

n k n−k
P (X = k) = p (1 − p)
k

25 25−2
P (X = 2) = 0, 042 (1 − 0, 04)
2
P (X = 2) = 0, 1877
Interpretação: A probabilidade de que em apenas 2 pontos de sondagem encontre petróleo, dentre as 25
sondagens nessa região é de 0, 1877 ou 18, 77%.
Resolução do item b. Mantendo o cenário de n = 25 pontos de sondagem e probabilidade de sucesso igual

a p = 0, 04, dessa vez estamos interessados na ocorrência de 10 sucessos. Neste contexto, segue imediatamente que:

n k n−k
P (X = k) = p (1 − p)
k

25 25−10
P (X = 10) = 0, 0410 (1 − 0, 04)
10
P (X = 10) ∼
= 0
Interpretação: A probabilidade de que em 10 pontos de sondagem encontre petróleo, dentre as 25 sondagens
nessa região é aproximadamente igual a zero.
Resolução do item c. Estamos interessados na ocorrência de pelo menos um sucesso, dentre as 25 sondagens,
ou seja, estamos interessados em observar um número k ≥ 1 de sucessos. Dessa maneira segue que:
P (X ≥ 1) = P (X = 1) + P (X = 2) + ... + P (X = 25)
= 1 − P (X = 0)

25 25−0
= 1− 0, 040 (1 − 0, 04)
0
= 1 − 0, 3604
P (X ≥ 1) = 0, 6396.
Interpretação: A probabilidade de que pelo menos 1 ponto de sondagem encontre petróleo, dentre as 25
sondagens nessa região é de 0, 6396 ou 63, 96%.
Resolução do item d. Como temos n = 25 sondagens nesta região e a probabilidade de sucesso igual a
p = 0, 04, segue que a esperança de X é dada por:
E (X) = np = 25 × 0, 04
E (X) = 1.
Interpretação: O número esperado de pontos de sondagem que encontra petróleo nessa região é de 1 ponto.
Em outras palavras, se este experimento pudesser ser repetido muitas vezes, a média dos resultados obtidos será
de 1 ponto de sondagem com a ocorrência de petróleo.

15 Distribuição ou modelo de Poisson
Em estatı́stica, especificamente na Teoria das Probabilidades, a distribuição ou o modelo de Poisson é uma

distribuição de probabilidades de uma variável aleatória discreta (v.a.d.) que expressa a probabilidade de uma
série de eventos independentes ocorrer num certo perı́odo de tempo.
A distribuição foi descoberta por Siméon-Denis Poisson6 (1781–1840) e publicada, conjuntamente com a sua
teoria da probabilidade, em 1838 no seu trabalho Recherches sur la probabilité des jugements en matières criminelles
et matière civile (“Inquérito sobre a probabilidade em julgamentos sobre matérias criminais e civis”). O trabalho
focava-se basicamente em variáveis aleatórias discretas que contavam, entre outras coisas, o número de ocorrências
discretas durante um intervalo de tempo determinado.
São alguns exemplos de variáveis que seguem uma distribuição de Poisson:

1. Número diário de acidentes de trânsito em uma grande cidade;
2. Número de aeronaves que pousam ou decolam em um determinado perı́odo de tempo em um aeroporto;
3. Número de filhos por famı́lia em uma determinada comunidade;
4. Número de chamadas telefônicas recebidas em uma central, num perı́odo de tempo;
5. Número de ovos depositados por uma determinada espécie de tartaruga;
No contexto da distribuição binomial, quando o tamanho da amostra aumenta (n −→ ∞) e quando a proba-
bilidade de sucesso diminui (p −→ 0), o produto np converge para uma constante λ, isto é,
np −→ λ > 0, quando n −→ ∞ e p −→ 0.
Dessa maneira, dizemos que X tem distribuição de Poisson ou X segue o modelo de Poisson com parâmetro
λ se sua distribuição de probabilidades é dada por:
e−λ λk
P (X = k) = , para k = 0, 1, 2, ... (29)
k!
em que
e: é a base do logaritmo natural (2, 718282...).
λ: é uma constante positiva (λ > 0) que denota o número esperado de ocorrências num intervalo de tempo.
k! é o fatorial do número k.
A esperança e a variância são dados por:

E (X) = V ar (X) = λ. (30)
Notação: X ∼ P oisson (λ).
Lê-se: “X tem distribuição de Poisson ou X segue o modelo de Poisson com parâmetro λ”.
Observação: A distribuição de Poisson possui a propriedade interessante de que a esperança matemática de

X é sempre igual a sua variância.
A Figura (16) abaixo apresenta a forma da distribuição de Poisson considerando três valores distintos para o
parâmetro lâmbda.
6 Siméon Denis Poisson (Pithiviers, 21 de junho de 1781 — Paris, 25 de abril de 1840) foi um matemático e fı́sico francês. Em 1798
entrou na École Polytechnique em Paris, como primeiro colocado de sua turma, atraindo imediatamente a atenção dos professores da
escola, deixando-o livre para escolher o que estudar. Em 1800, menos de dois anos depois de seu ingresso, publicou duas memórias,
uma sobre o método da eliminação de Étienne Bézout, e a outra sobre o número de integrais de uma equação em diferenças finitas.
Esta última foi examinada por Sylvestre François Lacroix e Adrien-Marie Legendre, que recomendaram sua publicação no Recueil des
savants étrangers, uma honra sem precedentes para um jovem de dezoito anos. Poisson desenvolveu o expoente de Poisson, usado
na transformação adiabática de um gás. Este expoente é a razão entre a capacidade térmica molar de um gás a pressão constante e
a capacidade térmica molar de um gás a volume constante. A lei de transformação adiabática de um gás diz que o produto entre a
pressão de um gás e o seu volume elevado ao expoente de Poisson é constante.

Figura 16: Distribuição de Poisson com diferentes valores de λ.
Demonstração de 29: Vamos mostrar que a distribuição expressa em (29) trata-se de fato de uma distribuição
de probabilidades.
∞ ∞
X X e−λ λk
P (X = k) =
k!
k=0 k=0
∞
X λk
= e−λ
k!
k=0
Como
∞
X xk x0 x1 x2 x3
= + + + + ... = ex , ∀x ∈ R,
k! 0! 1! 2! 3!
k=0
∞
λk
= eλ . Portanto
P
temos que k!
k=0
∞
X
P (X = k) = e−λ eλ = 1.
k=0
o que demonstra a expressão (29).
Demonstração de 30: Vamos demonstrar que E (X) = λ. Por definição temos que a esperança de uma
variável aleatória discreta é tal que
X
E (X) = kP (X = k) .
k
Então

∞
X
E (X) = kP (X = k)
k=0
∞
X e−λ λk
= k
k!
k=0
∞
X e−λ λk
=
(k − 1)!
k=1
∞
X λk−1
= e−λ λ
(k − 1)!
k=1
Fazendo s = k − 1 temos
∞
−λ
X λs
E (X) = e λ .
s=0
s!
∞
λs
= eλ , ∀λ ∈ R. Temos então que
P
Como s!
s=0
E (X) = e−λ λeλ = λ.

Vamos demonstrar agora que V ar (X) = λ. Primeiramente devemos encontrar a esperança do segundo
momento de X, isto é, E X 2 , que é expressa por:
X 2
E X2 = k P (X = k) .
k
Então
∞
X
E X2 k 2 P (X = k)

=
k=0
∞
X e−λ λk
= k2
k!
k=0
∞
X e−λ λk
= k
(k − 1)!
k=1
∞
X e−λ λk−1
= λ k
(k − 1)!
k=1
Fazendo k = s + 1 temos
∞ ∞ ∞
X e−λ λs X e−λ λs X e−λ λs
E X2 = λ

(s + 1) =λ s +λ
s=0
s! s=0
s! s=0
s!
∞ −λ
∞
λs e−λ λs
se
P P
Como s! = E (X) = λ e s! = 1, então segue que:
s=0 s=0
E X 2 = λλ + λ = λ2 + λ.

Por definição, sabemos que a variância de uma variável aleatória é expressa pela diferença entre a esperança
do segundo momento e o quadrado da esperança do primeiro momento, isto é,
2
V ar (X) = E X 2 − [E (X)]

= λ2 + λ − λ2
V ar (X) = λ.
Desta forma está provado a relação dada em (30).

15.1 Exemplo de aplicação em doenças raras
A probabilidade de que uma pessoa da população tenha uma determinada doença rara é de 1 em 80000.
Numa população de 400000 habitantes, determine a probabilidade de que:
a. Haja exatamente 3 indivı́duos com a doença.
b. Haja exatamente 1 indivı́duo com a doença.
c. Haja pelo menos 1 indivı́duo com a doença.
d. Determine a esperança e a variância do número X de indivı́duos com a doença nesta população.
Resolução do item a. Como o tamanho da população é de n = 400000 e a probabilidade de sucesso

1 1
é p = 80000 , então o parâmetro lâmbda da distribuição de Poisson é λ = np = 400000 × 80000 = 5, isto é,
X ∼ P oisson (5). Dessa maneira segue que
e−λ λk
P (X = k) =
k!
e−5 53
=⇒ P (X = 3) =
3!
P (X = 3) = 0, 1404.
Interpretação: A probabilidade de que haja exatamente 3 indivı́duos com a doença nesta população é de
0, 1404 ou 14, 04%.
Resolução do item b. Para k = 1 indivı́duo com esta doença rara temos:
e−λ λk
P (X = k) =
k!
e−5 51
=⇒ P (X = 1) =
1!
P (X = 1) = 0, 0337.
Interpretação: A probabilidade de que haja exatamente 1 indivı́duo com a doença nesta população é de
0, 0337 ou 3, 37%.
Resolução do item c. Considerando a probabilidade de pelo menos 1 indivı́duo com a doença nesta
população temos:
P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−5 50
= 1−
0!
= 1 − 0, 0067
P (X ≥ 1) = 0, 9933.
Interpretação: A probabilidade de que haja pelo menos 1 indivı́duo com a doença nesta população é de
0, 9933 ou 99, 33%.
Resolução do item d. Como no modelo de Poisson tanto esperança quanto a variância são iguais ao
parâmetro lâmbda, então temos que
E (X) = V ar (X) = λ = 5.
Interpretação da esperança: Esperamos, a longo prazo, um número médio de 5 indivı́duos com a doença
nesta população. Em outras palavras, se pudéssemos realizar esse experimento muitas vezes, a média dos resultados
obtidos é de 5 indivı́duos com a doença.

15.2 Exemplo de aplicação: abalos sı́smicos
O número diário X de abalos sı́smicos em uma determinada região do Japão é uma variável aleatória discreta
que segue uma distribuição de Poisson com parâmetro λ = 3, isto é, X ∼ P oisson (3). Encontrar a probabilidade
de que, em um determinado dia,
a. Ocorra exatamente 2 abalos sı́smicos.

b. Ocorra exatamente 4 abalos sı́smicos.
c. Ocorra no máximo 4 abalos sı́smicos.
d. Ocorra exatamente 1 abalo sı́smico.
e. Ocorra no mı́nimo 1 abalo sı́smico.
f. Determine a esperança e a variância do número diário X de abalos sı́smicos desta região do Japão.
Resolução do item a. Para k = 2 abalos sı́smicos temos
e−λ λk
P (X = k) =
k!
e−3 32
=⇒ P (X = 2) =
2!
P (X = 2) = 0, 2240.
Interpretação: A probabilidade de que ocorra exatamente 2 abalos sı́smicos, em um determinado dia, nesta
região do Japão, é de 0, 2240 ou 22, 40%.
Resolução do item b. Para k = 4 abalos sı́smicos temos
e−λ λk
P (X = k) =
k!
e−3 34
=⇒ P (X = 4) =
4!
P (X = 4) = 0, 1680.
Interpretação: A probabilidade de que ocorra exatamente 4 abalos sı́smicos, em um determinado dia, nesta
Resolução do item c. Considerando no máximo 4 abalos sı́smicos temos
P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)
e−3 30 e−3 31 e−3 32 e−3 33 e−3 34
= + + + +
0! 1! 2! 3! 4!
= 0, 0498 + 0, 1494 + 0, 2240 + 0, 2240 + 0, 1680
P (X ≤ 4) = 0, 8152.
Interpretação: A probabilidade de que ocorra no máximo 4 abalos sı́smicos, em um determinado dia, nesta

Resolução do item d. Considerando a probabilidade de ocorrer extamente 1 abalo sı́smico temos:
e−λ λk
P (X = k) =
k!
e−3 31
P (X = 1) =
1!
P (X = 1) = 0, 1494.
Interpretação: A probabilidade de que ocorra exatamente 1 abalo sı́smico, em um determinado dia, nesta
Resolução do item e. Considerando a probabilidade de ocorrer pelo menos 1 abalo temos:
P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−3 30
= 1−
0!
= 1 − 0, 0498
P (X ≥ 1) = 0, 9502.
Interpretação: A probabilidade de que ocorra no mı́nimo 1 abalo sı́smico, em um determinado dia, nesta
Resolução do item f. Como no modelo de Poisson tanto esperança quanto a variância são iguais ao
parâmetro lâmbda, então temos que
E (X) = V ar (X) = λ = 3.
Interpretação da esperança: Esperamos, a longo prazo, um número médio diário de 3 abalos sı́smicos
nesta região do Japão. Em outras palavras, se observarmos o número diário de abalos sı́smicos durante um longo
perı́odo, verificarı́amos um número médio diário de 3 abalos sı́smicos nesta região.

16 Distribuição da soma de distribuições de Poisson
Neste Capı́tulo vamos supor um conjunto finito de distribuições de Poisson. É muito comum em aplicações
práticas o interesse na distribuição da soma destas distribuições.
Proposição. Considere X1 , X2 , . . . , Xn variáveis aleatórias discretas e independentes tal que Xi ∼ P oisson (λi ),
Pn
com i = 1, 2, . . . , n. Então a soma Y = Xi também tem distribuição de Poisson tal que:
i=1
n n
!
X X
Y = Xi ∼ P oisson λi . (31)
i=1 i=1
Em particular, se λi = λ, com i = 1, 2, . . . , n, então
n
X
Y = Xi ∼ P oisson (nλ) . (32)
i=1
Demonstração de 31: Pelas propriedades da esperança e da variância de uma variável aleatória, temos que
n
!
X
E (Y ) = E Xi
i=1
n
X
= E (Xi )
i=1
= E (X1 ) + E (X2 ) + · · · + E (Xn )
= λ1 + λ2 + · · · + λn
Xn
E (Y ) = λi .
i=1
A variância, por sua vez, é tal que
n
!
X
V ar (Y ) = V ar Xi
i=1
n
X
= V ar (Xi )
i=1
= V ar (X1 ) + V ar (X2 ) + · · · + V ar (Xn )
= λ1 + λ2 + · · · + λn
Xn
V ar (Y ) = λi .
i=1
Uma vez que no modelo de Poisson temos que o valor numérico da esperança é igual ao valor numérico da
n
P
variância, então E (Y ) = V ar (Y ) = λi , está provado a expressão (31).
i=1
A demonstração da expressão (32) se dá de forma direta e imediata.

16.1 Exemplo de aplicação no tráfego urbano
Em um grande municı́pio há 5 avenidas principais. O número mensal de acidentes de trânsito para cada uma
delas segue uma distribuição de Poisson, conforme quadro abaixo:
Avenida Descrição Poisson com parâmetro
X1 Número mensal de acidentes na avenida 1 λ = 0, 8
Assuma a variável aleatória discreta Y como sendo a soma do número total de acidentes de trânsito nestas 5
5
P
avenidas, isto é, Y = Xi .
i=1
a.) Qual a probabilidade de observarmos um total de 8 acidentes em um determinado mês?

b.) Qual a probabilidade de observarmos pelo menos 1 acidente em um determinado mês?
Resolução do item a.) Primeiramente é necessário encontrarmos a distribuição de probabilidades da soma,

5
P
isto é, a distribuiçao de Y = Xi . Calculemos a esperança:
i=1
5
! 5
X X
E (Y ) = E Xi = E (Xi )
i=1 i=1
= E (X1 ) + E (X2 ) + E (X3 ) + E (X4 ) + E (X5 )
= λ1 + λ2 + λ3 + λ4 + λ5
= 0, 8 + 2, 0 + 1, 5 + 1, 2 + 0, 5 = 6
E (Y ) = 6 acidentes mensais.
Logo, Y tem uma distribuição de probabilidades de Poisson com parâmetro λ = 6, isto é,
Y ∼ P oisson (6) ,
e, portanto,
e−6 6k
P (X = k) = , k = 0, 1, 2, . . .
k!
Dessa forma, a probabilidade de observarmos um total de 8 acidentes em um determinado mês é dada por:
e−6 68
⇒ P (X = 8) = = 0, 1033 ou 10, 33%.
8!
Interpretação: A probabilidade de ocorrer exatamente 8 acidentes em um determinado mês é de 0, 1033 ou
10, 33%.
Resolução do item b.) A probabilidade de observarmos pelo menos 1 acidente em um determinado mês é
dada por:
P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−6 60
= 1−
0!
= 1 − 0, 0025
P (X ≥ 1) = 0, 9975 ou 99, 75%.
Interpretação: A probabilidade de ocorrer pelo menos 1 acidente em um determinado mês é de 0, 9975 ou
99, 75%.

16.2 Exemplo de aplicação em modelagem de acidentes em rodovias
Suponha que o número diário de acidentes em uma rodovia estadual siga o modelo de Poisson tal que o
número médio é de λ = 0, 5 acidente para cada trecho de 25 km. Determine a probabilidade que ocorra pelo menos
um acidente:
a.) Considerando um trecho de 50 km.

b.) Considerando um trecho de 100 km.
c.) Considerando um trecho de 300 km.
d.) Considerando um trecho de 500 km.
Resolução do item a.) Como temos um número médio de λ = 0, 5 acidente para cada trecho de 25 km,
isto implica que, num trecho de 50 km, temos λ = 1 acidente.
P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
1 − P (X = 0)
=
e−1 10
= 1−
0!
= 1 − 0, 3679
P (X ≥ 1) = 0, 6321 ou 63, 21%.
Interpretação: Nesta rodovia, a probabilidade de que ocorra pelo menos um acidente neste trecho de 50 km é
de 0, 6321 ou 63, 21%.
Resolução do item b.) Como temos um número médio de λ = 0, 5 acidente para cada trecho de 25 km,
isto implica que, num trecho de 100 km, temos λ = 2 acidentes.
P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−2 20
= 1−
0!
= 1 − 0, 1353
P (X ≥ 1) = 0, 8647 ou 86, 47%.
Interpretação: Nesta rodovia, a probabilidade de que ocorra pelo menos um acidente neste trecho de 100 km
é de 0, 8647 ou 86, 47%.
Resolução do item c.) Considerando um trecho de 300 km temos λ = 6 acidentes.

P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−6 60
= 1−
0!
= 1 − 0, 0025
P (X ≥ 1) = 0, 9975 ou 99, 75%.
é de 0, 9975 ou 99, 75%.
Resolução do item d.) Considerando um trecho de 500 km temos λ = 10 acidentes.

P (X ≥ 1) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + . . .
= 1 − P (X = 0)
e−10 100
= 1−
0!
= 1 − 0, 000045
P (X ≥ 1) = 0, 999955 ou aproximadamente 100%.
é de 0, 999955 ou aproximadamente 100%.

17 Distribuição Normal
17.1 Introdução
Esta é a mais importante distribuição de probabilidade para descrever uma variável aleatória contı́nua abran-
gendo uma grande variedade de fenômenos. A distribuição normal de probabilidade é utilizada em uma ampla
variedade de aplicações práticas pois diversas variáveis aleatórias contı́nuas seguem uma distribuição ou modelo
normal de probabilidades. Alguns exemplos são: altura de indivı́duos, peso de indivı́duos, ı́ndice de massa corpo-
ral, pressão, temperatura, velocidade, vazão de um rio, tempo, salários dos funcionários de uma empresa, renda
familiar, etc.
A distribuição normal foi estudada inicialmente no século XVIII, quando uma análise de erros experimentais
levou a uma curva em forma de sino. Embora ela tenha aparecido pela primeira vez em 1733 por meio de DeMoivre7 ,
a distribuição normal recebe o nome de distribuição gaussiana, em homenagem ao cientista alemão Johann Carl
Friedrich Gauss8 , que foi o primeiro a utilizá-la em 1809.
Nos séculos 18 e 19, matemáticos e fı́sicos desenvolveram uma função densidade de probabilidade que descrevia
bem os erros experimentais obtidos em medidas fı́sicas. Esta função densidade de probabilidade resultou na bem
conhecida curva em forma de sino, chamada de distribuição normal ou gaussiana. Esta distribuição fornece uma
boa aproximação de curvas de frequência para medidas de dimensões e caracterı́sticas humanas, como a altura de
uma população. Conhecida como a curva em forma de sino, a distribuição normal tem sua origem associada aos
erros de mensuração. A distribuição normal desempenha papel preponderante na estatı́stica, e os processos de
inferência nela baseados têm larga aplicação.
É a mais importante distribuição ou modelo de probabilidades, pois os testes estatı́sticos paramétricos requer
a normalidade dos dados. Considere o seguinte experimento aleatório: observamos o peso (em quilos) de 1500
pessoas selecionadas ao acaso da população. Os dados foram agrupados em classes e o Histograma de freqüência
encontra-se na figura abaixo:
Figura 17: Histograma de freqüências dos pesos de 1500 pessoas da população.
7 Abraham de Moivre (Vitry-le-François, Champagne, França, 26 de maio de 1667 — Londres, Reino Unido, 27 de novembro de
1754) foi um matemático francês famoso pela Fórmula de De Moivre, que relaciona os números complexos com a trigonometria, e
por seus trabalhos na distribuição normal e na teoria das probabilidades. De Moivre foi o primeiro a usar princı́pios atuariais e bases
cientı́ficas para o cálculo de seguros de vida, no ano de 1725. Era huguenote e migrou para a Inglaterra em 1685, com a revogação do
Édito de Nantes. Foi eleito membro da Royal Society em 1697. Foi amigo de Isaac Newton e Edmond Halley. Dentre seus alunos mais
notáveis destaca-se James Dodson.
8 Johann Carl Friedrich Gauss (ou Gauss) (Braunschweig, 30 de abril de 1777 — Göttingen, 23 de fevereiro de 1855) foi um
matemático, astrônomo e fı́sico alemão que contribuiu muito em diversas áreas da ciência, dentre elas a teoria dos números, estatı́stica,
análise matemática, geometria diferencial, geodésia, geofı́sica, eletroestática, astronomia e óptica. Gauss tinha uma marca influente em
muitas áreas da matemática e da ciência e é um dos mais influentes na história da matemática. Ele considerava a matemática como ”a
rainha das ciências”.

Observe agora a figura a seguir em que há uma curva sobreposta ao histograma:
Figura 18: Curva normal sobreposta ao histograma de frequências.
A curva sobreposta ao histograma de frequências é a distribuição Normal ou Gaussiana de probabilidades.

Trata-se de um modelo teórico em que a grande maioria dos conjuntos de dados quantitativos contı́nuos se ajustam.
17.2 O modelo normal e suas propriedades
Definição: Dizemos que a variável aleatória contı́nua X tem distribuição normal se sua função densidade de
probabilidade (f.d.p) é expressa por:

1 1 2
f (x) = √ exp − 2 (x − µ) .
2πσ 2 2σ
Com −∞ < x < ∞, −∞ < µ < ∞ e σ 2 > 0.

Notação: X ∼ N µ, σ 2 .
Lê-se: “X tem distribuição Normal ou X segue o modelo normal com parâmetros µ e σ 2 ”.
A esperança matemática de X bem como a sua variância são dadas por:
E (X) = µ ; V ar (X) = σ 2
A esperança de X também é denominada de parâmetro de locação µ ou ainda média da curva normal. A

variância de X, por sua vez, é o parâmetro de escala σ 2 , cuja raiz quadrada é o desvio-padrão σ (X).
Destacamos a seguir algumas propriedades da curva normal:

A área toda abaixo da curva é 1, pois f (x) é uma função densidade de probabilidade (f.d.p).
A curva é assintótica no eixo x.
A curva tem forma campanular (sino).
A curva é perfeitamente simétrica em torno de µ.
O ponto máximo da função densidade de probabilidade f (x) ocorre em µ.
A esperança matemática de X é exatamente igual ao parâmetro µ que, por sua vez, coincide com as demais
medidas de tendência central: mediana e moda, isto é, E (X) = µ = M e = M o.
A variância de X é o parâmetro de escala σ 2 , e o desvio-padrão é o parâmetro σ.
Os pontos de inflexão da curva ocorrem em [µ − σ , µ + σ].
O intervalo [µ − σ , µ + σ] contem 68, 26% dos dados.
O intervalo [µ − 2σ , µ + 2σ] contem 95, 44% dos dados.
O intervalo [µ − 3σ , µ + 3σ] contem 99, 74% dos dados.
Forma campanular da curva normal: A distribuição normal tem forma campanular (forma de sino)
conforme figura a seguir:
Figura 19: Forma campanular da curva normal.

Exemplo 1. Suponha que o peso X dos estudantes de uma grande Universidade tenha distribuição normal
com média µ = 70 kg e variância σ 2 = 121 kg 2 , isto é,
X ∼ N (70, 121)
Dessa forma a curva normal da variável peso é esboçada conforme a Figura (20):
Figura 20: Curva normal do peso X (em kg) dos estudantes de uma grande Universidade.
Podemos notar, de acordo com a Figura (20), que:
68, 26% dos estudantes desta Universidade pesam entre 59 kg e 81 kg.
Exemplo 2. Suponha que a altura X dos indivı́duos de um determinado municı́pio siga o modelo normal
com média µ = 168 cm e variância σ 2 = 100 cm2 , ou seja,
X ∼ N (168, 100)
Neste contexto a curva normal da variável altura (em cm) é ilustrada conforme a Figura (21):

Figura 21: Curva normal da altura X (em cm) dos indivı́duos de um determinado municı́pio.
68, 26% dos indivı́duos deste municı́pio tem uma altura entre 158 cm e 178 cm.
Exemplo 3. Suponha que a altura X dos pés-de-feijão de uma grande área produtora de feijões tenha
distribuição normal com média µ = 45 cm e variância σ 2 = 81 cm2 , isto é,
X ∼ N (45, 81)
Dessa forma a curva normal da variável altura é esboçada conforme a Figura (22):
Figura 22: Curva normal da altura X (em cm) dos pés-de-feijão de uma grande área produtora.

68, 26% dos pés-de-feijão desta área produtora tem uma altura entre 36 cm e 54 cm.
Exemplo 4. Suponha que a vazão diária X de um determinado rio, em um determinado ponto, siga o modelo
2
normal com média µ = 15 m3 /s e variância σ 2 = 16 m3 /s , ou seja,
X ∼ N (15, 16)
Neste contexto a curva normal da variável vazão do rio (em m3 /s) é ilustrada conforme a Figura (23):
Figura 23: Curva normal da vazão diária X (em m3 /s) de um determinado rio.
Em 68, 26% das vezes a vazão deste rio está entre 11 m3 /s e 19 m3 /s.
Exemplo 5. Em uma grande empresa prestadora de serviços, suponha que o tempo X (em minutos) para a
realização de um determinado serviço tenha distribuição normal com média µ = 36 minutos e variância σ 2 = 36
minutos2 , isto é,
X ∼ N (36, 36)
Dessa forma a curva normal da variável tempo é esboçada conforme a Figura (24):

Figura 24: Curva normal do tempo X (em minutos) para a realização de um determinado serviço.
Em 68, 26% das vezes o tempo para a realização deste serviço está entre 30 e 42 minutos.
A figura (25) apresenta curvas normais com médias diferentes e desvios padrão iguais.
Figura 25: Curvas normais com médias diferentes e desvios padrão iguais.
A figura (26) apresenta curvas normais com médias iguais e desvios padrão diferentes.

Figura 26: Curvas normais com médias iguais e desvios padrão diferentes.
17.3 Distribuição normal padrão
Uma área sob uma curva de densidade é uma proporção das observações em uma distribuição. Podemos res-
ponder qualquer pergunta acerca de qual proporção de observações está em uma determinada amplitude de valores,
determinando uma área sob a curva. Como todas as distribuições normais são iguais quando as padronizamos,
podemos determinar áreas sob a curva Normal utilizando uma única tabela que forneça as áreas sob a curva para
a distribuição normal padrão.

Resultado: Se X é uma v.a.c tal que X ∼ N µ, σ 2 , então
X −µ
Z= ∼ N (0, 1) . (33)
σ
A figura (27) apresenta a curva normal padrão:
Figura 27: Distribuição normal padrão.

A distribuição normal padrão também é chamada de distribuição normal padronizada, distribuição normal
reduzida, distribuição Z, distribuição standard ou ainda distribuição zero um.
2

Demonstraçãode (33):
Sabemos que, se X ∼ N µ, σ , então E (X) = µ e V ar (X) = σ 2 .
Fazendo Z = X−µ σ , encontremos primeiramente a esperança da variável Z:

X −µ
E (Z) = E
σ
E (X − µ)
=
σ
E (X) − E (µ)
=
σ
µ−µ
=
σ
E (Z) = 0.
Com relação à variância de Z temos:

X −µ
V ar (Z) = V ar
σ
V ar (X − µ)
=
σ2
V ar (X) + V ar (µ)
=
σ2
σ2 + 0
=
σ2
2
σ
=
σ2
V ar (Z) = 1.
Demonstramos que E (Z) = 0 e V ar (Z) = 1. Sabendo que Z é uma combinação linear de X, pois
X −µ
Z =
σ
X µ
= −
σ σ
1 µ
= X−
σ σ
1 µ
= X+ −
σ
|{z} | {zσ }
a b
Z = aX + b
então está demonstrado o resultado expresso em (33).
A figura (28) ilustra a padronização da distribuição normal.

Figura 28: Padronização da distribuição normal

17.4 Exemplo de aplicação: vazão de rio
Uma grande empresa construtora deseja estudar a vazão de um rio afim de construir uma ponte em concreto
armado em um determinado ponto de sua extensão. Sabe-se que nesta localidade, a vazão diária X (em m3 /s) é
uma variável aleatória contı́nua (v.a.c) que segue uma distribuição normal com média µ = 1250 m3 /s e variância
2
σ 2 = 102.400 m3 /s , isto é,
X ∼ N (1250 ; 102400)
Neste contexto, o valor numérico do desvio padrão da vazão é σ = 320 m3 /s. Esboçando a distribuição
normal da vazão temos a seguinte curva:
Figura 29: Curva normal da vazão diária do rio.
Qual a probabilidade de que, num determinado dia, a vazão deste rio

a. esteja entre 1250 m3 /s e 1800 m3 /s.
b. esteja entre 350 m3 /s e 1250 m3 /s.
c. esteja entre 500 m3 /s e 1500 m3 /s.
d. esteja entre 725 m3 /s e 2120 m3 /s.
e. seja menor do que 2000 m3 /s.
f. seja maior do que 1980 m3 /s.
g. seja menor do que 400 m3 /s.
Resolução do item a. Probabilidade da vazão estar entre 1250 m3 /s e 1800 m3 /s.

1250 − 1250 1800 − 1250
P (1250 ≤ X ≤ 1800) = P ≤Z≤
320 320
= P (0 ≤ Z ≤ 1, 72)
Ou seja, a probabilidade da variável X estar entre 1250 e 1800 é a mesma probabilidade da variável Z estar
entre 0 e 1, 72, conforme ilustrado nas Figuras abaixo:

Buscando na Tabela Z o valor da área compreendida entre 0 e 1, 72 temos 0, 4573. Desta maneira temos que
P (1250 ≤ X ≤ 1800) = 0, 4573 ou 45, 73%.
Interpretação: A probabilidade de que, num determinado dia, a vazão do rio esteja entre 1250 m3 /s e 1800
3
m /s é de 0, 4573 ou 45, 73%. Em termos frequentistas, podemos afirmar que em 45, 73% das vezes, a vazão deste
rio está entre 1250 m3 /s e 1800 m3 /s.
Resolução do item b. Probabilidade da vazão estar entre 350 m3 /s e 1250 m3 /s.

350 − 1250 1250 − 1250
P (350 ≤ X ≤ 1250) = P ≤Z≤
320 320
= P (−2, 81 ≤ Z ≤ 0)
entre −2, 81 e 0, conforme ilustrado nas Figuras abaixo:
Buscando na Tabela Z o valor da área compreendida entre −2, 81 e 0 temos 0, 4975. Desta maneira temos
que
P (350 ≤ X ≤ 1250) = 0, 4975 ou 49, 75%.

3

Resolução do item c. Probabilidade da vazão estar entre 500 m3 /s e 1500 m3 /s.

500 − 1250 1500 − 1250
P (500 ≤ X ≤ 1500) = P ≤Z≤
320 320
= P (−2, 34 ≤ Z ≤ 0, 78)
entre −2, 34 e 0, 78, conforme ilustrado nas Figuras abaixo:
Como a Tabela Z adotada neste material fornece sempre a área compreendida entre 0 e Z, devemos buscar
então as áreas compreendidas entre −2, 34 e 0 e entre 0 e 0, 78 para somá-las. Desta maneira temos que
P (−2, 34 ≤ Z ≤ 0, 78) = P (−2, 34 ≤ Z ≤ 0) + P (0 ≤ Z ≤ 0, 78)

= 0, 4904 + 0, 2823
= 0, 7727.
Portanto, temos que
P (500 ≤ X ≤ 1500) = 0, 7727 ou 77, 27%.
m3 /s é de 0, 7727 ou 77, 27%. Em termos frequentistas, podemos afirmar que em 77, 27% das vezes, a vazão deste
Resolução do item d. Probabilidade da vazão estar entre 725 m3 /s e 2120 m3 /s.

725 − 1250 2120 − 1250
P (725 ≤ X ≤ 2120) = P ≤Z≤
320 320
= P (−1, 64 ≤ Z ≤ 2, 72)
entre −1, 64 e 2, 72, conforme ilustrado nas Figuras abaixo:

Como a Tabela Z adotada neste material fornece sempre a área compreendida entre 0 e Z, devemos buscar
então as áreas compreendidas entre −1, 64 e 0 e entre 0 e 2, 72 para somá-las. Desta maneira temos que
P (−1, 64 ≤ Z ≤ 2, 72) = P (−1, 64 ≤ Z ≤ 0) + P (0 ≤ Z ≤ 2, 72)

= 0, 4495 + 0, 4967
= 0, 9462.
Portanto, temos que
P (725 ≤ X ≤ 2120) = 0, 9462 ou 94, 62%.
3
Resolução do item e. Probabilidade da vazão ser menor do que 2000 m3 /s.

2000 − 1250
P (X ≤ 2000) = P Z≤
320
= P (Z ≤ 2, 34)
Ou seja, a probabilidade da variável X ser menor do que 2000 é a mesma probabilidade da variável Z ser
menor do que 2, 34, conforme ilustrado nas Figuras abaixo:

Buscando na Tabela Z o valor da área compreendida entre 0 e 2, 34 temos 0, 4904. Note que, além disso,
devemos somar com toda a área compreendida entre −∞ e 0, isto é, devemos somar 0, 5. Desta maneira temos que
P (Z ≤ 2, 34) = 0, 5 + P (0 ≤ Z ≤ 2, 34)
= 0, 5 + 0, 4904
P (X ≤ 2000) = 0, 9904.
Portanto temos que:
P (X ≤ 2000) = 0, 9904 ou 99, 04%.
Interpretação: A probabilidade de que, num determinado dia, a vazão do rio esteja menor que 2000 m3 /s
é de 0, 9904 ou 99, 04%. Em termos frequentistas, podemos afirmar que em 99, 04% das vezes, a vazão deste rio
está menor que 2000 m3 /s.
Resolução do item f. Probabilidade da vazão ser maior do que 1980 m3 /s.

1980 − 1250
P (X ≥ 1980) = P Z≥
320
= P (Z ≥ 2, 28)
Ou seja, a probabilidade da variável X ser maior do que 1980 é a mesma probabilidade da variável Z ser
maior do que 2, 28, conforme ilustrado nas Figuras abaixo:
Buscando na Tabela Z o valor da área compreendida acima de 2, 28 notamos que é a diferença entre 0, 5 e
área compreendida entre 0 e 2, 28. Desta maneira temos que
P (Z ≥ 2, 28) = 0, 5 − P (0 ≤ Z ≤ 2, 28)
= 0, 5 − 0, 4887
P (X ≥ 1980) = 0, 0113.
Portanto temos que:
P (X ≥ 1980) = 0, 0113 ou 1, 13%.
Interpretação: A probabilidade de que, num determinado dia, a vazão do rio esteja maior que 1980 m3 /s
é de 0, 0113 ou 1, 13%. Em termos frequentistas, podemos afirmar que em 1, 13% das vezes, a vazão deste rio está
maior que 1980 m3 /s.

Resolução do item g. Probabilidade da vazão ser menor do que 400 m3 /s.

400 − 1250
P (X ≤ 400) = P Z≤
320
= P (Z ≤ −2, 66)
Ou seja, a probabilidade da variável X ser maior do que 400 é a mesma probabilidade da variável Z ser maior
do que −2, 66, conforme ilustrado nas Figuras abaixo:
Buscando na Tabela Z o valor da área compreendida abaixo de −2, 66 notamos que é a diferença entre 0, 5 e
área compreendida entre −2, 66 e 0. Desta maneira temos que
P (Z ≤ −2, 66) = 0, 5 − P (−2, 66 ≤ Z ≤ 0)

= 0, 5 − 0, 4961
P (Z ≤ −2, 66) = 0, 0039.
Portanto temos que:
P (X ≤ 400) = 0, 0039 ou 0, 39%.
Interpretação: A probabilidade de que, num determinado dia, a vazão do rio esteja menor que 400 m3 /s é
de 0, 0039 ou 0, 39%. Em termos frequentistas, podemos afirmar que em 0, 39% das vezes, a vazão deste rio está
menor que 400 m3 /s.

18 Combinação Linear de Distribuições Normais
É muito comum na prática termos o interesse na distribuição de uma função linear (ou também chamada de
combinação linear) de distribuições normais, como por exemplo a soma de distribuições normais.
Resultado: Seja X uma variável aleatória contı́nua que segue o modelo normal com parâmetros µ e σ 2 ,
então qualquer função linear de X também tem distribuição normal. Em outras palavras, se X ∼ N µ, σ 2 , então
Y = aX + b também tem distribuição normal com média aµ + b e variância a2 σ 2 , isto é,
Y ∼ aµ + b , a2 σ 2 .

(34)
Demonstração de (34): Encontrando primeiramente a esperança matemática de Y temos:
E (Y ) = E (aX + b)
= E (aX) + E (b)
= aE (X) + b
E (Y ) = aµ + b.
No caso da variância de Y temos que:
V ar (Y ) = V ar (aX + b)
= V ar (aX) + V ar (b)
= a2 V ar (X) + 0
V ar (Y ) = a2 σ 2 .
Como temos E (Y ) = aµ + b e V ar (Y ) = a2 σ 2 e sabendo que Y = aX + b é uma função linear de X, está

demonstrado o resultado expresso em (34).
18.1 Distribuição da soma de distribuições normais

Se X1 , X2 , . . . , Xn são n variáveis aleatórias independentes tal que Xi ∼ N µi , σi2 , para i = 1, 2, . . . , n,
então a soma destas variáveis também tem distribuição normal com média igual a soma das médias das variáveis
e variância igual a soma das variâncias das variáveis, isto é,
n n n
!
X X X
Xi ∼ N µi , σi2 . (35)
i=1 i=1 i=1
O resultado acima obedece diretamente as propriedades da esperança e da variância de uma variável aleatória.
n
P
Demonstração de (35): Encontrando primeiramente a esperança matemática de Xi temos:
i=1
n
! n
X X
E Xi = E (Xi )
i=1 i=1
= E (X1 ) + E (X2 ) + · · · + E (Xn )
= µ1 + µ2 + · · · + µn
n
! n
X X
E Xi = µi .
i=1 i=1

n
P
Por sua vez, a variância de Xi é tal que:
i=1
n
! n
X X
V ar Xi = V ar (Xi )
i=1 i=1
= V ar (X1 ) + V ar (X2 ) + · · · + V ar (Xn )
= σ12 + σ22 + · · · + σn2
n
! n
X X
V ar Xi = σi2 .
i=1 i=1
n
P
Como Xi é uma combinação linear de distribuições normais, então esta soma também trata-se de uma
i=1
distribuição normal e segue imediatamente o resultado dado em (35).
Em particular, se µi = µ e σi2 = σ 2 , para i = 1, 2, . . . , n, então a expressão (35) será expressa por:
n
X
Xi ∼ N nµ, nσ 2 .

i=1
18.2 Exemplo de aplicação genérica
Considere X e Y duas variáveis aleatórias contı́nuas tal que X ∼ N (100, 100) e Y ∼ N (120, 400). Use as
propriedades da esperança e da variância para determinar qual a distribuição da variável aleatória W , em que
W = 260 + 4X − 3Y .
Resolução: Devemos encontrar primeiramente a esperança matemática da variável aleatória W :
E (W ) = E (260 + 4X − 3Y )
= E (260) + E (4X) − E (3Y )
= 260 + 4E (X) − 3E (Y )
= 260 + 4 × 100 − 3 × 120
E (W ) = 300.
Em seguida, devemos encontrar a variância da variável aleatória W :
V ar (W ) = V ar (260 + 4X − 3Y )
= V ar (260) + V ar (4X) + V ar (3Y )
= 0 + 16V ar (X) + 9V ar (Y )
= 16 × 100 + 9 × 400
V ar (W ) = 5200.
Como a variável W é uma combinação linear das distribuições normais X e Y , temos que W também segue
uma distribuição normal tal que:
W ∼ N (300, 5200) .

18.3 Exemplo de aplicação em carga de elevadores
Suponha que o peso X de indivı́duos adultos segue uma distribuição normal com média µ = 70 kg e variância
σ 2 = 121 kg 2 . O fabricante de um elevador diz que, por motivos de segurança, ele pára toda vez que o peso total
da carga do elevador for superior a 1500 kg. Uma amostra de n = 22 pessoas entrou no elevador.
a. Encontre a probabilidade de uma pessoa qualquer no elevador pesar acima de 75 quilos.

b. Encontre a distribuição de probabilidades da carga total deste elevador para determinar a probabilidade
do elevador parar por motivos de segurança.
Solução do item a. Como o peso X dos indivı́duos segue uma distribuição de probabilidades tal que
X ∼ N (70, 121), temos que:

75 − 70
P (X > 75) = P Z>
11
= P (Z > 0, 45)
= 0, 5 − P (0 < Z < 0, 45)
= 0, 5 − 0, 1736
⇒ P (X > 75) = 0, 3264 ou 32, 64%.
Logo, a probabilidade probabilidade de uma pessoa qualquer no elevador pesar acima de 75 quilos é 0, 3264
ou 32, 64%. Ou ainda, em 32, 64% das vezes, os indivı́duos que entram neste elevador tem um peso acima de 75
quilos.
Solução do item b. Devemos encontrar primeiramente a distribuição de probabilidades da carga total

22
P
T do elevador, isto é, a a distribuição de probabilidades da variável aleatória Xi . Iniciemos pela esperança
i=1
matemática:
22
!
X
E (T ) = E Xi
i=1
22
X
= E (Xi )
i=1
= E (X1 ) + E (X2 ) + · · · + E (X22 )
= µ + µ + ··· + µ
= 70 + 70 + · · · + 70
| {z }
22×70
⇒ E (T ) = 1540 kg.
22
P
Em seguida, devemos encontrar a variância da variável aleatória T = Xi :
i=1

22
!
X
V ar (T ) = V ar Xi
i=1
22
X
= V ar (Xi )
i=1
= V ar (X1 ) + V ar (X2 ) + · · · + V ar (X22 )
= σ2 + σ2 + · · · + σ2
= 121 + 121 + · · · + 121
| {z }
22×121
⇒ V ar (T ) = 2662 kg 2 .
22
P 22
P
Como a variável T = Xi é uma combinação linear de distribuições normais, temos que T = Xi também
i=1 i=1
segue uma distribuição normal. Logo, a distribuição de probabilidades da carga total deste elevador é dada por
22
X
T = Xi ∼ N (1540, 2662)
i=1
Portanto, a probabilidade do elevador parar por motivos de segurança é determinada da seguinte forma:
22
!
X
P (T > 1500) = P Xi > 1500
i=1

1500 − 1540
= P Z> √
2662
= P (Z > −0, 78)
= P (−0, 78 < Z < 0) + P (Z > 0)
= 0, 2823 + 0, 5
P (T > 1500) = 0, 7823 ou 78, 23%.
Logo, a probabilidade do elevador parar por motivos de segurança é 0, 7823 ou 78, 23%. Ou ainda, em 78, 23%
das vezes que entram 22 indivı́duos neste elevador, ele pára por motivos de segurança.

19 Exercı́cios sobre probabilidade e variáveis aleatórias
EXERCÍCIOS SOBRE CONJUNTOS
Exercı́cio 1. Seja Ω = {1, 2, 3, ...}, A = {1, 2, 3, 4} e B = {3, 4, 5, 6}, achar:

a.) A ∪ B b.) A − B c.) A ∩ B d.) AC
Exercı́cio 2. Quais desses conjuntos são iguais: {r, s, t}, {t, s, r}, {s, r, t} e {t, r, s}?
Exercı́cio 3. Seja Ω = {a, b, c, d, e}, A = {a, b, d} e B = {b, d, e}, achar:
a.) A∪B f.) A ∪ BC
b.) B∩A g.) AC ∩ B C
c.) BC h.) B C − AC
C
d.) B−A i.) (A ∩ B)
C
e.) AC ∩ B j.) (A ∪ B)
Exercı́cio 4. Dados os conjuntos A = {1, 2, 3, 4}, B = {2, 3} e C = {4, 5}, determine:

a.) A ∩ B b.) A ∩ C c.) B ∩ C d.) A ∩ B ∩ C
Exercı́cio 5. Dados os conjuntos A = {0, 2, 4, 6, 8}, B = {4, 6, 8, 9}, C = {4, 6, 8} e D = {1, 3, 5, 7, 9} determine:
a.) A ∩ B b.) A ∩ C c.) A ∩ D d.) C ∩ D
e.) B ∩ C f.) B ∩ D g.) A ∩ B ∩ C h.) A ∩ B ∩ C ∩ D
Exercı́cio 6. Dados os conjuntos A = {a, c}, B = {b, d, e, f, g}, C = {a, c, g} e D = {b, e, f } determine:
a.) A ∪ B b.) A ∪ C c.) A ∪ D d.) B ∪ C
e.) B ∪ D f.) C ∪ D g.) (A ∪ B) ∪ C h.) (A ∪ B) ∪ (C ∪ D)
Exercı́cio 7. Dados os conjuntos A = {1, 3, 5, 7, 9, 11}, B = {7, 8, 9}, C = {2, 4, 6, 8, 10} determine:
a.) A − B b.) A − C c.) B − C
d.) B − A e.) C − A f.) C − B
Exercı́cio 8. Classifique em V (verdadeiro) ou F (falso) as setenças, admitindo que A e B são conjuntos
quaisquer:
a.) ( ) A−B =B−A
b.) ( ) (A − B) ⊂ (A ∪ B)
c.) ( ) A−B ⊂A
d.) ( ) A−B ⊂B
e.) ( ) (A − B) ∪ (A ∩ B) = A
Exercı́cio 9. Num colégio, onde estudam 500 alunos, houve no final do ano recuperação nas disciplinas de
Matemática e Fı́sica. Vinte alunos fizeram a recuperação das duas matérias, 84 fizeram recuperação de matemática
e 374 alunos não fizeram recuperação. Faça o diagrama de Venn e responda:
a.) Quantos alunos ficaram, no total, em recuperação?
b.) Quantos fizeram recuperação apenas de Fı́sica?
c.) Quantos ficaram em apenas uma matéria?
Exercı́cio 10. Sejam os conjuntos A = {1, 2, 3, 4, 5, 6}, B = {2, 3, 6, 7}, C = {1, 2, 4, 5} determine:
a.) A ∩ B b.) A ∪ C c.) B − C d.) (A ∪ B) − C
Exercı́cio 11. Um colégio ofereceu cursos de inglês e francês, devendo os alunos se matricularem em pelo menos
um deles. Dos 45 alunos de uma classe, 13 resolveram estudar tanto inglês como francês, em francês matricularam-se
22 alunos. Quantos alunos se matricularam no curso de inglês? Faça o diagrama de Venn.
Exercı́cio 12. Numa universidade com N alunos, 80 alunos estudam Fı́sica, 90 alunos estudam Biologia,
55 alunos estudam Quı́mica, 32 alunos estudam Biologia e Fı́sica, 23 alunos estudam Quı́mica e Fı́sica, 16 alunos
estudam Biologia e Quı́mica e 8 alunos estudam nos três cursos. Sabendo-se que esta Universidade somente mantém
estes três cursos, quantos alunos estão matriculados na Universidade? Faça o diagrama de Venn.
Exercı́cio 13. Um levantamento efetuado entre 600 filiados ao INSS mostrou que muitos deles mantinham
convênio com duas empresas particulares de assistência médica, A e B, conforme o quadro abaixo:
Convênio com A Convênio com B Filiados somente ao INSS

430 160 60
Qual o número de filiados simultaneamente às duas empresas A e B?

Exercı́cio 14. Seja Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9}, A = {1, 2, 3, 4} e B = {2, 4, 6, 8} e C = {3, 4, 5, 6}, achar:
C
a.) AC b.) A ∩ C c.) (A ∩ C) d.) A ∪ B e.) B − C

EXERCÍCIOS SOBRE PROBABILIDADE
Questão 1. Em um lançamento de quatro moedas idênticas e honestas (equilibradas), qual a probabilidade de

cair duas caras e duas coroas?
Questão 2. Um aluno prestou vestibular em apenas duas Universidades. Suponha que, em uma delas, a
probabilidade de que ele seja aprovado é de 30%, enquanto na outra, pelo fato de a prova ter sido mais fácil, a
probabilidade de sua aprovação sobe para 40%. Nessas condições, qual é a probabilidade deque esse aluno seja
aprovado em pelo menos uma dessas Universidades?
Questão 3. Quatro moedas honestas são lançadas simultaneamente. Qual é a probabilidade de ocorrer coroa
em uma só moeda?
Questão 4. Jogamos dois dados honestos. Qual a probabilidade de que o total de pontos seja igual a 10?
Questão 5. Qual é a probabilidade de que um dos cem números 1, 2, 3, . . . , 100, escolhido ao acaso, seja múltiplo
de 6 e de 10 ao mesmo tempo?
Questão 6. Considere uma prova de Matemática constituı́da de quatro questões de múltipla escolha, com
quatro alternativas cada uma, das quais apenas uma é correta. Um candidato decide fazer essa prova escolhendo,
aleatoriamente, uma alternativa em cada questão. Então, qual é a probabilidade de esse candidato acertar, nessa
prova, exatamente uma questão?
Questão 7. Numa universidade com N alunos, 80 alunos estudam Fı́sica, 90 alunos estudam Biologia, 55 alunos
estudam Quı́mica, 32 alunos estudam Biologia e Fı́sica, 23 alunos estudam Quı́mica e Fı́sica, 16 alunos estudam
Biologia e Quı́mica e 8 alunos estudam nos três cursos. Sabendo-se que esta Universidade somente mantém estes
três cursos, quantos alunos estão matriculados na Universidade?
Questão 8. Num colégio, onde estudam 500 alunos, houve no final do ano recuperação nas disciplinas de
Matemática e Fı́sica. Vinte alunos fizeram a recuperação das duas matérias, 84 fizeram recuperação de matemática
e 374 alunos não fizeram recuperação. Quantos alunos fizeram recuperação apenas de Fı́sica??
Exercı́cio 9. Dados dois eventos A e B associados
a um espaço amostral Ω, então a probabilidade de que
exatamente um dos eventos ocorra é P A ∩ B C ∪ AC ∩ B . Mostre que:
P A ∩ B C ∪ AC ∩ B = P (A) + P (B) − 2P (A ∩ B)

Exercı́cio 10. Em uma prova caı́ram dois problemas. Sabe-se que 132 alunos acertaram o primeiro, 86 erraram
o segundo, 120 acertaram os dois e 54 acertaram apenas um problema. Qual a probabilidade de que um aluno,
escolhido ao acaso:
a. não tenha acertado nenhum problema?
b. tenha acertado apenas o segundo problema?
Exercı́cio 11. Em uma cidade onde se publicam três jornais A, B e C, constatou-se que entre 1000 famı́lias,
os assinantes se dispõem da seguinte forma:
Jornais: A B C AeB AeC BeC AeBeC
Número de famı́lias: 470 420 315 110 220 140 75
Faça o diagrama de Venn. Escolhendo-se ao acaso uma famı́lia, qual a probabilidade de que esta famı́lia:
a. não assine nenhum dos três jornais?
b. assine apenas um dos três jornais?
c. assine pelo menos dois jornais?
Exercı́cio 12. A tabela abaixo dá a distribuição das probabilidades dos quatro tipos sanguı́neos, numa certa
comunidade:
Tipo sanguı́neo: A B AB O
Probabilidade de ter o tipo especificado: 0, 20
Probabilidade de não ter o tipo especificado: 0, 90 0, 95
Calcule e probabilidade de que:
a. um indivı́duo, sorteado ao acaso nessa comunidade, tenha o tipo O.
b. dois indivı́duos, sorteados ao acaso nessa comunidade, tenham tipo A e tipo B, nessa ordem;
c. um indivı́duo, sorteado ao acaso nessa comunidade, não tenha o tipo B ou não tenha o tipo AB.
Exercı́cio 13. Dados dois eventos A e B associados a um mesmo espaço amostral Ω, mostre que
P AC ∩ B C = 1 − P (A) − P (B) + P (A ∩ B)

Exercı́cio 14. Em uma universidade a distribuição de 300 estudantes segundo o sexo e a área de concentração
é dada pela tabela abaixo:

Biologia Exatas Humanas

Masculino 52 40 58
Feminino 38 32 80
Se um estudante for sorteado ao acaso determine a probabilidade de que:
a. ele seja do sexo feminino e da área de humanas;
b. ele seja do sexo masculino e não seja da área biológica;
c. dado que foi selecionado um estudante da área de humanas, determine a probabilidade de que ele seja do
sexo masculino;
d. dado que foi selecionado um estudante do sexo feminino, determine a probabilidade de que ele seja da área
de exatas;
Exercı́cio 15. Considere dois lançamentos de um dado equilibrado (honesto). Determine a probabilidade
condicional de se obter a face 2 no primeiro lançamento, dada a informação de que a soma dos resultados foi 7.
Exercı́cio 16. Em uma urna onde existiam 2 bolas brancas e 2 bolas vermelhas foi perdida uma bola de cor
desconhecida. Uma bola foi retirada da urna. Dado que a bola retirada foi branca, qual a probabilidade da bola
perdida ter sido uma bola vermelha?
Exercı́cio 17. Sejam A e B dois eventos associados a um mesmo espaço de probabilidades. Se P (A) = 0, 7 e
P (B) = 0, 6, determine os valores máximo e mı́nimo de P (A ∩ B).
Exercı́cio 18. Sejam A e B dois eventos associados a um mesmo espaço de probabilidades. Suponha que
P (A) = 0, 4 e P (A ∪ B) = 0, 7 e P (B) = p.
a. Para que valor de p os eventos A e B são mutuamente exclusivos?
b. Para que valor de p os eventos A e B são independentes?
Exercı́cio 19. Em uma urna onde existiam oito bolas brancas e três azuis, perdeu-se ao acaso uma bola de cor
desconhecida. Uma bola foi selecionada ao acaso da urna. Determine a probabilidade da bola perdida ser branca,
dado que a bola selecionada é branca.
Exercı́cio 20. A fábrica A produziu 4000 lâmpadas e a fábrica B produziu 6000 lâmpadas. 80% das lâmpadas
de A são boas e 60% das lâmpadas de B são boas também. Escolhe-se ao acaso uma lâmpada entre as 10000
lâmpadas. Qual a probabilidade de que:
a. seja boa sabendo-se que é da marca A?
b. seja boa?
c. seja defeituosa e da marca B?
d. sendo defeituosa, tenha sido fabricado por B?
Exercı́cio 21. Um determinado teste para diagnosticar a presença de uma doença tem probabilidades de 92%
de dar resultado positivo quando aplicado a um indivı́duo doente (sensibilidade do teste) e 96% de dar resultado
negativo quando aplicado a um indivı́duo são (especificidade do teste). Se 0, 5% da população tiver a doença e o
teste for aplicado a um indivı́duo selecionado ao acaso da população, qual a probabilidade de que o resultado do
teste seja positivo?
Exercı́cio 22. A probabilidade de que um estudante saiba a resposta de uma questão de um exame de múlitpla
escolha é p. Há n respostas possı́veis para cada questão, das quais apenas uma é correta. Se o estudante não sabe a
questão, ele escolhe ao acaso uma das n respostas possı́veis. Se o estudante respondeu corretamente uma questão,
então qual a probabilidade de que ele tenha chutado a resposta?
Exercı́cio 23. Se P (A) = P (B) = p e P (A ∪ B) = p (2 − p), então qual o valor de P (A ∩ B)?
Exercı́cio 24. Estudos epidemiológicos indicam que 20% dos idosos sofrem de uma deterioração neuropsi-
cológica. Sabemos que a tomografia axial computadorizada (TAC) é capaz de detectar esse transtorno em 80% dos
que sofrem disso, mas que também resulta 3% falsos positivos entre pessoas com boa saúde. Se escolhermos um
idoso ao acaso, qual a probabilidade de que ele realmente esteja enfermo dado que o TAC deu positivo?
Exercı́cio 25. Suponha que numa determinada população 9, 8% dos indivı́duos são leitores da revista A, 30%
são leitores da revista B e 5% são leitores de ambas. Determine a probabilidade de uma pessoa escolhida ao acaso:
a. Ser leitor de alguma das revistas.
b. Ser leitor apenas da revista A.
c. Não ser leitor de nenhuma das revistas.
d. Ser leitor da revista A sabendo que também é leitor da revista B.
Exercı́cio 26. Aos armazéns de uma empresa chegam dois lotes de 1000 produtos cada, um de uma fábrica
A e outro de uma fábrica B. Admita que o fornecimento da fábrica A tem 10% de produtos defeituosos e o da B
20%. Supondo que se misturou ao acaso os produtos dos 2 lotes e que, extraindo um produto, também ao acaso,
se verificou que era defeituoso, determine a probabilidade do produto ter sido produzido pela fábrica A.
Exercı́cio 27. Se A é um evento independente de B, mostre que AC também é independente de B C .

EXERCÍCIOS SOBRE VARIÁVEIS ALEATÓRIAS DISCRETAS
Exercı́cio 1: Aplicações gerais. Considere X uma variável aleatória discreta (v.a.d ) cuja distribuição de
probabilidades seja tal que
k
P (X = k) = , k = 1, 2, ..., 10.
55
a
k = a(a+1)
P
a. Encontre F (a) = P (X ≤ a), k = 1, 2, ..., 10. Ajuda: 2 .
k=1
b. Determine E (X) e V AR (X).
Exercı́cio 2: Aplicações em seguradoras de veı́culos. Em uma empresa de seguros automobilı́sticos,

o número X de sinistros anuais por automóvel segurado é uma variável aleatória discreta que assume os valores
0, 1, 2, 3, 4. Sua distribuição de probabilidades é dada por:
3
126 − (k + 1)
P (X = k) = , para k = 0, 1, 2, 3, 4.
405
a. Determine e interprete a esperança do número de sinistros anuais para cada automóvel segurado.
b. Determine a variância e o desvio-padrão do número de sinistros anuais para cada automóvel segurado.
Exercı́cio 3: Aplicações em ecologia. (1, 5 pontos) Seja X uma v.a.d que denota o número de ovos que
uma determinada espécie de réptil bota em uma única vez, tal que sua distribuição de probabilidades é expressa
por
P (X = k) = c (31 − k) para k = 1, 2, ..., 30. (36)
Após encontrar o valor numérico da constante c afim de que a expressão (36) seja, de fato, uma distribuição de
probabilidades, encontre a esperança matemática E (X), a variância V ar (X), o desvio-padrão σ (X) e a função
distribuição avaliada no ponto a, (a ≤ 30), isto é, F (a) = P (X ≤ a).
Exercı́cio 4: Aplicações em administração. (2,0 pontos) Em uma grande rede de loja de calçados, os
funcionários ganham um adicional no salário em função das vendas. Esse adicional é dado em número de bônus que
variam de 1 a 5. O número X de bônus que cada funcionário ganha, além do salário fixo, é uma variável aleatória
discreta tal que sua distribuição de probabilidades é dada por:
21 − k (k − 1)
P (X = k) = , k = 0, 1, 2, 3, 4, 5.
86
a. Encontre e interprete a esperança do número X de bônus a receber no final do mês.
b. Encontre a variância e o desvio padrão do número X de bônus a receber no final do mês.
Exercı́cio 5: Aplicações gerais. Uma variável aleatória W assume os valores 1, 2, ..., N com igual proba-
bilidades, isto é, P (W = k) = N1 , k = 1, 2, ..., N . Determine:
a) E(W ) b) V AR(W ) c) P (W ≤ c), c ≤ N .

N N
N (N +1) N (N +1)(2N +1)
k2 =
P P
Ajuda: k= 2 e 6 .
k=i k=i
Exercı́cio 6: Aplicações gerais. Se P (X = k) = 15 , para k = 1, 2, 3, 4, 5, calcule E (X) e V ar (X).
Exercı́cio 7: Aplicações em biologia. Um determinado inseto bota uma quantidade de ovos que varia
sempre entre 1 e N . Seja X : número de ovos depositados por esse inseto, isto é, X = 1, 2, ..., N . Sabendo que
P (X = k) = ck, para k = 1, 2, ..., N , determinar
a.) c b.) E (X) c.) V AR (X)
Ajuda 1: Determine primeiramente o valor da constante c, e depois encontre a distribuição de probabilidades
de X.
N N N h i2
k = N (N2+1) ; k 2 = N (N +1)(2N +1) 3 N (N +1)
P P P
Ajuda 2: 6 e k = 2
k=1 k=1 k=1
Exercı́cio 8: Aplicações gerais. Seja X uma v.a discreta tal que sua distribuição de probabilidades é
dada por:

2
P (X = k) = (1 − q) kq k−1 , k = 1, 2, 3, ...
e q é uma constante positiva tal que 0 < q < 1.
∞
P
a. Mostre que P (X = k) = 1.
k=1
P (X=k+1)
b. Determine o quociente P (X=k) e mostre que
P (X = k + 1)
lim = q.
k→∞ P (X = k)
c. Determine P (X ≥ 2) em função de q.
d. Determine E (X) e mostre que lim E (X) = 1.
q→0
∞ ∞
1 (1+q)
kq k−1 = k 2 q k−1 =
P P
Ajudas: para 0 < q < 1 temos (1−q)2
e (1−q)3
.
k=1 k=1
EXERCÍCIOS SOBRE VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Exercı́cio 1. Seja X uma variável aleatória contı́nua e f (x) dada por f (x) = a + 4x, para 0 ≤ x ≤ 1/2.
a. Determine o valor numérico de a para que f (x) seja de fato uma f.d.p.
b. Determine P (X ≤ 1/3).
Exercı́cio 2. Seja X uma variável aleatória contı́nua tal que:

2x
f (x) = , 0 ≤ x ≤ θ.
θ2
a. Mostre que se trata de uma f.d.p.
b. Obtenha E (X) e V ar (X).
c. Obtenha F (x) = P (X ≤ x) e a mediana de X, ou seja, o valor do qual existe uma probabilidade 50% de
X ocorrer.

8 − 2x
f (x) = , 0 ≤ x ≤ 1.
7
Determine:
b. P (X ≤ 1/2).
c. P (X ≥ 1/3).
d. P (1/4 ≤ X ≤ 3/4).
e. F (x) = P (X ≤ x).
f. F (7/8).
Exercı́cio 4. Seja X uma variável aleatória contı́nua tal que f (x) = 2x, com 0 ≤ x ≤ 1.
a. Verifique se f (x) é de fato uma f.d.p.
b. Determine P (X ≤ 1/2).
Exercı́cio 5. Dada a função:
2e−2x , x ≥ 0

f (x) =
0, x < 0
a. Verifique se f (x) é de fato uma f.d.p.
b. Determine P (X ≥ 10).

f (x) = c x2 + 5x + 6 ,

0 ≤ x ≤ 4.
Determine:
a. O valor da constante c para que esta f (x) seja de fato uma f.d.p.
b. Determine P (0 ≤ X ≤ 1).
c. Determine F (2) = P (X ≤ 2).
d. Determine F (3) = P (X ≤ 3).
e. Determine F (x).
f. Determine P (X ≥ 7/2).
Exercı́cio 7. Seja X uma v.a.c tal que sua f.d.p (função densidade de probabilidade) é dada por:
3x2
f (x) = , − a < x < a.
2a3
Determine
a. P (−a/2 < X < a/2). b. E (X). c. V AR (X).
Exercı́cio 8. Seja X uma v.a.c tal que sua f.d.p (função densidade de probabilidade) é dada por:
3x2
f (x) = , 0 < x < 5.
125
a. Verifique que se trata de uma f.d.p
b. Determine P (X < 1) e P (X > 3).
c. Encontre a E (X) e V AR (X).
d. Encontre a mediana M e.
e. Determine F (x) = P (X ≤ x).
Exercı́cio 9. Seja X uma v.a contı́nua tal que sua f.d.p é dada por:
3x2
f (x) = , − 5 < x < 5.
250
a. Verifique que se trata de uma f.d.p.
b. Mostre que M e = E (X) = 0.
c. Determine V AR (X) e σ (X).
Exercı́cio 10: Aplicações em engenharia. Considere X uma variável aleatória contı́nua (v.a.c) que
denota o tempo em minutos que um sistema automático leva para realizar a montagem de um dispositivo na linha
de produção. Seja sua função densidade de probabilidades (f.d.p) expressa por
f (x) = −x2 + 8x + 10 c,

para 3 ≤ x ≤ 8.
a. Após encontrar o valor numérico da constante c para que f (x) seja uma (f.d.p), encontre P (4 ≤ X ≤ 7).
b. Encontre o valor modal M o, o valor mediano M e e a esperança matemática E (X).
c. Encontre a variância de X, denotada por V AR (X) e a função distribuição F (x) = P (X ≤ x).
Exercı́cio 11: Aplicações em engenharia. Considere X uma variável aleatória contı́nua (v.a.c) que
denota o tempo (em minutos) que um sistema automático leva para realizar a montagem de um dispositivo na
linha de produção. Seja sua função densidade de probabilidades (f.d.p) expressa por
f (x) = c −x2 + 6x + 10 ,

3 ≤ x ≤ 6.
Após encontrar o valor numérico da constante c afim de que f (x) seja, de fato, uma f.d.p, mostre que a
distribuição do tempo de montagem não é simétrica, isto é: E (X) 6= M e 6= M o.

EXERCÍCIOS SOBRE A DISTRIBUIÇÃO BINOMIAL
Exercı́cio 1. Segundo um levantamento da secretaria da saúde do municı́pio de Barreiras, 28 a cada 100

pessoas da cidade tem o hábito de fumar. Supondo que o número X de pessoas fumantes numa amostra de tamanho
n = 14 obedeça uma distribuição binomial, qual a probabilidade:
a. de que haja pelo menos 2 pessoas fumantes?
b. de que haja exatamente 7 pessoas fumantes?
c. no máximo 12 pessoas fumantes?
Exercı́cio 2. Considerando cada uma das distribuições abaixo, determine o que se pede.
a. Se X ∼ Binomial (4; 0, 12), determine P (X = 0).
b. Se X ∼ Binomial (10; 0, 40), determine P (X = 9).
c. Se X ∼ Binomial (10; 0, 50), determine P (X = 8).
d. Se X ∼ Binomial (6; 0, 83), determine P (X = 5).
e. Se X ∼ Binomial (10; 0, 90), determine P (X = 9).
Exercı́cio 3. Determine E (X) e V ar (X) para cada um dos casos abaixo:

a. X ∼ Binomial (40; 0, 10).
b. X ∼ Binomial (40; 0, 40).
c. X ∼ Binomial (50; 0, 80).
d. X ∼ Binomial (30; 0, 50).
e. X ∼ Binomial (20; 0, 25).
Exercı́cio 4. Para efetuar a regulação hormonal de uma linha metabólica, injeta-se em ratos albinos um
fármaco que inibe a sı́ntese de proteı́nas do organismo. Geralmente, quatro de cada vinte ratos morrem por
causa do fármaco antes que o experimento tenha sido concluı́do. Se tratarmos dez animais com o fármaco, qual
a probabilidade de que pelo menos oito cheguem vivos ao final do experimento? Ajuda: Se 4 de cada 20 ratos
morrem por causa do fármaco, então 16 de cada 20 ratos vivem.
Exercı́cio 5. Uma moeda honesta é lançada 20 vezes. Qual a probabilidade de saı́rem 8 caras? Ajuda: Se
a moeda é honesta, então a probabilidade da cara é 0, 50 e, portanto, a probabilidade de sucesso neste exercı́cio é
p = 0, 50.
Exercı́cio 6. Sabe-se que o número X de pessoas com uma certa patologia dentre n pessoas escolhidas ao
acaso segue uma distribuição binomial. Para esta patologia especı́fica sabe-se que X ∼ Binomial (n, p) tal que
E (X) = 7, 2 e V ar (X) = 4, 32. Então quais são os valores numéricos dos parâmetros n e p? Ajuda: Use o fato
de que, no modelo binomial temos E (X) = np e V ar (X) = np (1 − p).
Exercı́cio 7. O número de mulheres grávidas que sofrem de complicações no momento do parto segue
uma distribuição Binomial, ou seja, X ∼ Binomial (n, p) tal que P (X = 4) = P (X = 5). Então qual o valor do
parâmetro p em função den? Ajuda: Use o fato de que, no modelo binomial a probabilidade da ocorrência de k
n−k
sucessos é P (X = k) = nk pk (1 − p) para aplicar na igualdade:

n 4 n−4 n 5 n−5
P (X = 4) = P (X = 5) =⇒ p (1 − p) = p (1 − p) .
4 5
Exercı́cio 8. O número de pessoas com uma certa doença dentre n pessoas escolhidas ao acaso segue uma
distribuição Binomial (n, p) tal que E (X) = 5 e V ar (X) = 3, 75. Quais os valores numéricos dos parâmetros n e
p? Ajuda: Use o fato de que, no modelo binomial temos E (X) = np e V ar (X) = np (1 − p).
Exercı́cio 9. O número X de lâmpadas defeituosas para cada lote de n unidades produzidas em uma
fábrica é uma variável alatória discreta que segue um modelo binomial tal que E (X) = 1, 25V AR (X). Encontre
a probabilidade de haver pelo menos uma lâmpada defeituosa num lote de n = 12 lâmpadas. Ajuda: Use o fato
de que, no modelo binomial temos E (X) = np e V ar (X) = np (1 − p).
Exercı́cio 10: Aplicações em geociências. Uma empresa exploradora de petróleo pretende instalar
uma plataforma em uma determinada região oceânica. Nesta região o número k de sondagens que apresentam
petróleo dentre n sondagens (k ≤ n) é uma variável aleatória discreta (v.a.d) que segue o modelo binomial tal
que E (X) = 2V ar (X). Encontre o valor numérico do parâmetro p para determinar a probabilidade de que, em
uma amostra de n = 22 sondagens, pelo menos uma sondagem apresente petróleo. Ajuda: Use o fato de que, no
modelo binomial temos E (X) = np e V ar (X) = np (1 − p) para encontrar o valor numérico de p.

EXERCÍCIOS SOBRE A DISTRIBUIÇÃO DE POISSON
Exercı́cio 1: Aplicações gerais. Suponha uma distribuição de Poisson com parâmetro λ.

a. Se λ = 2, determine P (X ≥ 2).
b. Se λ = 8, determine P (X ≥ 3).
c. Se λ = 0, 5, determine P (X ≤ 1).
d. Se λ = 4, determine P (X ≥ 1).
e. Se λ = 5, determine P (X ≤ 3).
Exercı́cio 2: Aplicações na saúde pública. Em uma certa população, observou-se um número médio
anual de 12 mortes por câncer de pulmão. Se o número de mortes causado por esta enfermidade segue uma
distribuição de Poisson, qual a probabilidade de que, durante o ano
a. haja exatamente 10 mortes por câncer de pulmão?
b. morram 2 ou mais pessoas por causa desta enfermidade?
c. morram 2 ou menos pessoas por causa desta enfermidade?
Exercı́cio 3: Aplicações em estudos de rodovias. Numa estrada há em média 2 acidentes para cada
100km. Qual a probabilidade de que em:
a. 250km ocorram pelo menos 3 acidentes?
b. 300km ocorram 5 acidentes?
Ajuda: Se nesta estrada há 2 acidentes para cada 100km, então há em média 1 acidente para cada 50km.
Exercı́cio 4: Aplicações em indústrias. Numa determinada linha de produção de uma fábrica, a ex-
periência mostra que de cada 400 lâmpadas, 2 se queimam ao serem ligadas. Qual a probabilidade de que numa
instalação de:
a. 600 lâmpadas, no mı́nimo 3 se queimem?
b. 900 lâmpadas, exatamente 8 se queimem?
Ajuda: Se para cada 400 lâmpadas, em média 2 se queimam, então para cada 200 lâmpadas, em média 1
lâmpada se queima.
Exercı́cio 5: Aplicações em linha de montagem de automóveis. Uma fábrica de automóveis verificou

que ao testar seus carros na pista de prova há, em média, um estouro de pneu em cada 300km, e que o número de
pneus estourados segue razoavelmente uma distribuição de Poisson. Qual a probabilidade de que:
a. num teste de 900 km haja no máximo um pneu estourado?
b. um carro ande 450 km na pista sem estourar nenhum pneu?
Exercı́cio 6: Aplicações no setor bancário. Um caixa de banco atende 150 clientes por hora. Qual a
probabilidade de que atenda:
a. Nenhum cliente em 4 minutos.
b. No máximo 2 clientes em 2 minutos.
Ajuda: Se 150 clientes em média são atendidos por hora neste banco, então 2, 5 clientes são atendios em
média por minuto.
Exercı́cio 7: Aplicações em biologia. O número X de ovos que uma determinada espécie de avestruz
bota obedece uma distribuição de Poisson de parâmetro lâmbda, isto é, X ∼ P oisson (λ), tal que P (X = 4) =
5P (X = 5). Então qual o valor da esperança matemática do número de ovos que essa espécie de avestruz bota?
Ajuda: Use o fato de que, a partir da distribuição de Poisson, temos que a igualdade apresentada no enunciado é
tal que:
e−λ λ4 e−λ λ5
P (X = 4) = 5P (X = 5) ⇒ =5
4! 5!
para encontrar o valor numérico do parâmetro lâmbda.
Exercı́cio 8: Aplicações gerais. Seja X ∼ P oisson (λ), tal que P (X = 0) = 2P (X = 1). Então qual o
valor numérico do parâmetro lâmbda? Ajuda: Use a ajuda do exercı́cio anterior.
Exercı́cio 9: Aplicações em biologia. A quantidade X de filhotes que um determinado carnı́voro tem em

uma única gestação segue uma distribuição Poisson tal que P (X = 2) = 43 P (X = 4).
a. Qual o valor da E (X)?
b. Determine P (X = 6).

Ajuda: Use o fato de que, a partir da distribuição de Poisson, temos que a igualdade apresentada no
enunciado é tal que:
3 e−λ λ2 3 e−λ λ4
P (X = 2) = P (X = 4) ⇒ =
4 2! 4 4!
para encontrar o valor numérico do parâmetro lâmbda.
Exercı́cio 10: Aplicações na ensino superior. O número X de alunos que são jubilados, anualmente,
em uma universidade segue uma distribuição de Poisson tal que P (X ≥ 1) = 0, 9502 ou 95, 02%.
a. Nessa situação, qual o número esperado de alunos jubilados anualmente nessa universidade? Ajuda:
Para encontrar o valor da E (X) encontre primeiramente o valor numérico do parâmetro λ, usando a probabilidade
complementar dada por P (X ≥ 1) = 1 − P (X = 0).
b. Qual a probabilidade de que, em um determinado ano letivo, 2 alunos sejam jubilados?
Exercı́cio 11: Aplicações na aviação civil. No aeroporto internacional de Guarulhos, a probabilidade de

que pelo menos 1 avião pouse na pista de pousos num intervalo de 5 minutos é de 0, 9933 ou 99, 33%. Determine a
probabilidade de, num intervalo de meia hora, exatamente 25 aviões pousem na pista. Ajuda: Use o fato de que
P (X ≥ 1) = 1 − P (X = 0) e aplique na distribuição de probabilidades de Poisson para encontrar o valor numérico
do parâmetro lâmbda.
EXERCÍCIOS SOBRE A DISTRIBUIÇÃO NORMAL
Exercı́cio 1: Aplicações na garantia de produtos. Um fabricante de baterias sabe, por experiência

passada, que as baterias de sua fabricação têm um tempo de vida X aproximadamente normal com média µ = 600
dias e desvio-padrão σ = 100 dias. Oferece-se uma garantia de 312 dias, isto é, troca as baterias que apresentarem
falhas num perı́odo menor que 312 dias. Fabrica-se 10.000 baterias mensalmente. Quantas baterias o fabricante
deverá mensalmente trocar pelo uso da garantia?
Exercı́cio 2: Aplicações no tempo de vida de pneus. Uma fábrica de carros sabe que o tempo X de
duração dos motores de sua fabricação têm distribuição normal com média 150.000km e desvio-padrão de 5.000km.
Qual a probabilidade de que um carro, escolhido ao acaso nesta fábrica, tenha motor que dure:
a. menos de 170.000km?
b. entre 140.000km e 165.000km?
Exercı́cio 3: Aplicações em estudos antropométricos. Foi feito um estudo sobre a altura X dos
alunos de uma faculdade, observando-se que ela se distribuı́a normalmente com média µ = 1, 72m e desvio-padrão
σ = 5cm. Qual a porcentagem dos alunos com altura:
a. entre 1, 57m e 1, 87m?

b. acima de 1, 90m?
Exercı́cio 4: Aplicações no tempo de chegada. O tempo X (em minutos) que os alunos gastam para
chegar a uma certa universidade é uma variável aleatória contı́nua que segue uma distribuição aproximadamente
normal com média µ = 28 minutos e desvio-padrão σ = 7 minutos. Determine a probabilidade de que, um aluno
escolhido ao acaso, gaste um tempo para chegar a universidade
a. Entre 28 e 40 minutos.
b. Entre 12 e 28 minutos.
c. Entre 10 e 40 minutos.
d. Mais de 45 minutos.
e. Menos de 8 minutos.
f. Entre 15 e 20 minutos.
g. Supondo que a universidade tenha 1200 alunos, determine a quantidade de alunos para cada um dos
intervalos acima.

Exercı́cio 5: Aplicações em indústrias. Numa fábrica foram instaladas 1.000 lâmpadas novas. Sabe-se
que o tempo de vida X destas lâmpadas segue uma distribuição normal com média µ = 800 horas e desvio-padrão
de σ = 100 horas. Determinar a quantidade de lâmpadas nesta fábrica que espera-se durar:
a. menos de 500 horas.

b. mais de 700 horas.
c. entre 516 e 684 horas.
Exercı́cio 6: Aplicações em indústrias. Um fabricante de máquinas de lavar sabe, por longa experiência,
que o tempo de vida X de suas máquinas tem distribuição normal com média µ = 1.000 dias e desvio-padrão
σ = 200 dias. Oferece-se uma garantia de 1 ano (365 dias). Sabendo-se que o fabricante produz mensalmente 2.000
máquinas. Quantas máquinas espera-se trocar mensalmente pelo uso da garantia dada?
Exercı́cio 7: Aplicações em meteorologia. Suponha que a temperatura T durante o mês de Junho

na cidade de Ribeirão Preto obedeça a uma distribuição normal com média µ = 34C e desvio-padrão σ = 3C.
Encontre a probabilidade da temperatura, num determinado dia do mês de Junho, estar entre 35C e 40C.
Exercı́cio 8: Aplicações no estudo de salários. Em uma determinada indústria metalúrgica o salário X

dos funcionários segue uma distribuição Normal com média µ = R$1.850, 00 e desvio-padrão σ = R$350, 00. Um
funcionário é escolhido ao acaso desta metalúrgica. Qual a probabilidade de que ele tenha um salário
a. Entre R$1.000, 00 e R$2.000, 00 ?

b. Acima de R$2.500, 00 ?
c. Abaixo de R$900, 00 ?
Exercı́cio 9: Aplicações em estudos de vazão. A vazão diária X de um rio (em m3 /s) é uma v.a.c que
2
segue um modelo normal com média µ = 1400m3 /s e variância σ 2 = 122.500 m3 /s . Encontre a vazão Xα tal
que P (X ≤ Xα ) = 0, 95.
Exercı́cio 10: Aplicações no estudo de salários. Em uma grande indústria metalúrgica com 2.500
funcionários, o salário X dos funcionários segue uma distribuição normal com média µ = 2.480, 00 reais e desvio-
padrão σ = 535, 00 reais. Determine o salário Xα tal que:
a. P (X ≤ Xα ) = 0, 85, isto é, encontre e interprete o octogésimo quinto percentil dos salários da empresa.
b. P (X ≤ Xα ) = 0, 20, isto é, encontre e interprete o segundo decil dos salários da empresa.
c. Encontre a quantidade de funcionários que ganham abaixo de 1.000 reais.
d. Encontre a quantidade de funcionários que ganham acima de um salário mı́nimo, isto é, acima de 678
reais.
e. Encontre a quantidade de funcionários que ganham entre 800 e 3.800 reais.
Exercı́cio 11: Aplicações em variáveis ambientais. A vazão diária X de um rio (em m3 /s) é uma v.a.c
2
que segue um modelo normal com média µ = 260 m3 /s e variância σ 2 = 1764 m3 /s . Encontre a probabilidade
de que, num determinado dia, a vazão esteja:
a. acima de 100 m3 /s. Interprete.

b. abaixo de 380 m3 /s. Interprete.
c. encontre a vazão Xα tal que P (X ≤ Xα ) = 0, 75. Interprete.
d. encontre a vazão Xα tal que P (X ≥ Xα ) = 0, 85. Interprete.

EXERCÍCIOS SOBRE COMBINAÇÃO LINEAR DE DISTRIBUIÇÕES NORMAIS
Exercı́cio 1: Aplicações gerais. Sejam X1 , X2 , ..., X60 variáveis aleatórias independentes tal que Xi ∼
P60
N (20, 16), i = 1, 2, ..., 60. Encontre a distribuição de probabilidades da variável aleatória Y = Xi , para
i=1
determinar:
a. P (Y ≤ 1150) b. P [Y ≥ E (Y )] c. P (1155 ≤ Y ≤ 1265)
Exercı́cio 2: Aplicações gerais. Sejam X1 , X2 , X3 , X4 variáveis aleatórias normalmente distribuı́das e

independentes tal que X1 ∼ N (100, 20), X2 ∼ N (100, 30), X3 ∼ N (160, 40) e X4 ∼ N (200, 40). Encontre a
distribuição de probabilidades da variável aleatória Y = 2X1 − X2 + 3X3 − X4 , para determinar:
a. P (Y ≥ 420) b. P (Y ≤ 436) c. P (300 ≤ Y ≤ 480)
Exercı́cio 3: Aplicações em transporte de cargas. O peso X de um saco de café é uma variável aleatória
contı́nua que segue uma distribuição normal com média de µ = 65kg e desvio-padrão σ = 4kg. Um caminhão é
carregado com 120 sacos. Qual a probabilidade de a carga do caminhão pesar:
a. Entre 7.893kg e 7.910kg?

b. Mais de 7.722kg?
120
P
Ajuda: Defina Xi , como sendo o peso do i-ésimo saco de café, i = 1, 2, ..., 120, e considere Y = Xi como
i=1
sendo o peso total da carga caminhão. Em seguida encontre a distribuição de probabilidades da variável aleatória
Y para resolver os itens acima.
Exercı́cio 4: Aplicações em sistema de segurança. Um elevador tem seu funcionamento bloqueado

se sua carga for superior a 450kg. Sabendo que o peso X de um adulto é uma variável aleatória que segue uma
distribuição normal com média igual a µ = 70kg e desvio-padrão igual a σ = 15kg, calcule a probabilidade de
ocorrer o bloqueio numa tentativa de transportar 6 adultos.
6
P
Ajuda: Defina Xi , como sendo o peso do i-ésimo indivı́duo adulto, i = 1, 2, ..., 6, e considere Y = Xi
i=1
como sendo o peso total da carga do elevador. Em seguida encontre a distribuição de probabilidades da variável
aleatória Y para resolver os itens acima.
Exercı́cio 5: Aplicações na pecuária. Um criador possui 5.000 cabeças de vaca leiteira. Sabendo-se que a
produção diária X de cada vaca segue uma distribuição normal com média µ = 3 litros e desvio-padrão de σ = 0, 5
litros, calcular a probabilidade de produzir diariamente:
a. Mais de 15.110 litros.

b. Entre 14.910 e 14.960 litros.
Ajuda: Defina Xi , como sendo a produção diária de leite da i-ésima vaca, i = 1, 2, ..., 5000, e considere
5000
P
Y = Xi como sendo a produção diária total. Em seguida encontre a distribuição de probabilidades da variável
i=1
aleatória Y para resolver os itens acima.
Exercı́cio 6: Aplicações na indústria metalúrgica. A montagem de uma peça é feita em 3 etapas,

independentes entre si. Os tempos de montagem de cada etapa são normalmente distribuı́dos, como segue:
Etapa Média Desvio-padrão

Fase 1 3 horas 30 minutos

Qual a probabilidade de que a montagem da peça seja feita:

a. em mais de 660 minutos?
b. entre 896 minutos e 915 minutos?
Ajuda: Defina como X1 , X2 , X3 os tempos de montagem das fases 1, 2 e 3 respectivamente, e considere

3
P
Y = Xi como sendo o tempo total de montagem da peça. Em seguida encontre a distribuição de probabilidades
i=1
da variável aleatória Y para resolver os itens acima.
Exercı́cio 7: Aplicações gerais. Sejam as variáveis X ∼ N (120, 64) e Y ∼ N (100, 100) onde X e Y são
independentes. Considere também as variáveis W = 20 + 3X − 2Y e T = 80 − 5X + 7Y , em que W e T são
independentes. Defina as variáveis S e D representando a soma e a diferença respectivamente das variáveis W e
T , isto é, S = W + T e D = W − T . Encontre a distribuição das variáveis S e D para determinar:
a. P (260 ≤ S ≤ 460) d. P (D ≤ −300)

b. P (S ≥ 500) e. P (D ≥ 150)
c. P (S ≤ 220) f. P (−235 ≤ D ≤ 180)
Exercı́cio 8: Aplicações em linha de montagem de automóveis. Numa indústria montadora de

automóveis, o tempo T de montagem do automóvel KAPPA é uma combinação de tempos com distribuições
normais e independentes, divididos em 4 etapas, conforme quadro abaixo:
Etapa Tempo da etapa Tempo médio Variância do tempo

1 X1 45 minutos 64 minutos2
Sabendo que esta empresa monta 5.000 automóveis por ano, encontre a quantidade de automóveis que são
montados em um tempo total de montagem entre 170 minutos e 200 minutos.
Exercı́cio 9: Aplicações em linha de produção. A montagem de um equipamento eletro eletrônico é

um processo composto por 4 etapas de montagem. Cada etapa tem um tempo de duração de montagem que segue
uma distribuição normal de acordo com a tabela abaixo:
Etapas de montagem Variável Tempo médio de montagem Desvio-padrão do tempo

Etapa 1 X1 µ1 = 120 segundos σ1 = 31 segundos
Sabendo que as etapas são independentes entre si, encontre a probabilidade do tempo total de montagem do
equipamento eletro eletrônico ser maior do que 20 minutos.

Parte IV
Inferência Estatı́stica: Técnicas de Estimação de
Parâmetros

20 Amostragem
“Não é preciso beber toda a garrafa para saber se o vinho é bom”. Esta frase bastante popular ilustra melhor
do que qualquer exemplo técnico o conceito de inferência estatı́stica: dar informação sobre o todo, com base no
conhecimento da parte. Os experimentos são feitos com amostras, mas o pesquisador não quer suas conclusões
restritas à amostra com a qual trabalhou. Ao contrário, o pesquisador quer estender os resultados que obteve para
toda a população. Então o pesquisador quer fazer inferência. A inferência estatı́stica é o conjunto de procedimentos
estatı́sticos que têm por finalidade generalizar conclusões de uma amostra para uma população.
Para poder generalizar as conclusões obtidas da amostra para a população, não basta saber descrever con-
venientemente os dados da amostra, é preciso garantir que o processo de amostragem seja eficiente, ou seja, que
a amostra seja representativa da população. Isto significa que a amostra deve possuir as mesmas caracterı́sticas
básicas da população, no que diz respeito às variáveis que desejamos pesquisar. A partir desta generalização surge
o conceito fundamental de erro provável.
A possibilidade de erro é inerente ao processo de inferência, ou seja, sempre que estudamos uma população a
partir de uma amostra, existe a possibilidade de cometermos algum tipo de erro de conclusão. A grande aplicação
da Inferência Estatı́stica é fornecer métodos que permitam quantificar esse erro provável.
Neste Capı́tulo introduzimos a teoria da amostragem abordando as definições e os conceitos básicos. Embora
elenquemos os diversos tipos de amostragens tanto probabilı́sticas quanto amostragens não-probabilı́sticas, nosso
foco é a amostragem aleatória simples (A.A.S), de suma importância e aplicação na inferência estatı́stica. Apresen-
tamos a relação entre a média populacional e a média amostral no contexto da amostragem em população finita.
Conceitos como número de amostras extraı́das, erro-padrão da média, fator de correção para população finita são
utilizados. Finalmente apresentamos a distribuição da média amostral para populações consideradas infinitas, por
serem muito grandes.
A Figura 30 apresenta a ilustração do esquema estatı́stico entre população e amostra.
Figura 30: Esquema estatı́stico entre população e amostra

A teoria da amostragem e os processos de amostragem são aplicáveis em muitas áreas do conhecimento e, em

diversas vezes, é a única ferramenta que possibilita esse conhecimento cientı́fico da realidade, por meio da obtenção
de parte das suas informações. Outros processos ou métodos alternativos, por diversos motivos, não se mostram
adequados ou até mesmo possı́veis. A teoria da amostragem é o estudo da relação existente entre amostra e
população, ou seja, é uma técnica para recolher amostras que garante, tanto quanto possı́vel, o acaso na escolha, de
modo a garantir a amostra o caráter de representatividade. A amostragem é usualmente realizada com o objetivo
de estimar parâmetros da população, como por exemplo, a média populacional µ, a variância populacional σ 2 ou
a proporção populacional p de uma determinada caracterı́stica.
Enquanto o censo envolve o levantamento de todos os elementos de um dado grupo, a amostragem envolve
o estudo de apenas uma parte dos elementos. A amostragem consiste em selecionar parte de uma população e
observá-la com o objetivo de estimar uma ou mais caracterı́sticas para a totalidade da população.
20.1 Vantagens da amostragem em relação ao censo
A amostragem apresenta muitas vantagens em relação ao censo. Uma vez que o censo é o estudo envolvendo
todos os elementos da população determinando o valor exato de cada parâmetro da população, esse processo pode
ser caro, lento e oneroso. Por esta razão o uso de amostras se torna preferı́vel ao censo, devido as seguintes razões:
Custo reduzido: Como os dados são tomados de uma fração da população, a amostragem é mais barata
que o censo.
Maior rapidez: Em decorrência do menor volume de dados, esses são coletados e tabulados mais rapidamente
na amostragem, o que diminui o tempo para a obtenção dos resultados.
Maior amplitude: Em certas pesquisas há a necessidade de utilização de uma equipe bem treinada e
equipamento sofisticado para a obtenção dos dados tornando o censo inviável.
Maior exatidão: Com um volume reduzido de dados, trabalha-se com uma equipe melhor treinada obtendo
uma coleta de dados mais exata e confiável.
20.2 Alguns conceitos importantes
Alguns conceitos importantes em inferência estatı́stica são:
População: Também chamada de Universo estatı́stico, a população corresponde ao sistema ou ao todo

que se quer descrever. É sempre um conjunto de elementos com caracterı́sticas em comum.
População finita: É a população onde se pode contar ou enumerar todos os seus elementos. Exemplos:
Número de habitantes em uma determinada cidade;

Número de estudantes em uma determinada Universidade;
Quantidade de peças fabricadas diariamente por uma indústria;
Número de acidentes de trânsito, num certo dia, numa determinada rodovia;
Número de pacientes com uma determinada doença em um hospital;
Número de animais em um determinado zoológico;
População infinita: É aquela população onde é impossı́vel contar ou enumerar todos os seus elementos.
Exemplos:
Quantidade total de peças fabricadas por uma indústria, sem um perı́odo especificado;
Número de indivı́duos de uma determinada espécie de mamı́fero no planeta;
Vazão de um determinado rio;
Número de acidentes de trânsito em uma determinada rodovia, sem um perı́odo especificado;
Número de indivı́duos que morrem por decorrência de uma certa doença no Brasil, sem um perı́odo especifi-
cado;

Censo: É o estudo ou levantamento de todos os elementos de uma população, em relação a uma ou mais
variáveis descritivas.
Parâmetro: É um valor numérico de uma caracterı́stica populacional.
Amostra aleatória: Parte da população. Conjunto de n variáveis aleatórias, independentes e identicamente
distribuı́das (i.i.d ), em que cada elemento da população tem a mesma probabilidade de ser incluı́do na amostra.
O processo de generalização da informação contida na amostra para a totalidade de uma população é chamada de
inferência estatı́stica.
Amostragem: Processo de obtenção de amostra(s).
Tamanho da amostra: Número n de variáveis aleatórias independentes e identicamente distribuı́das (i.i.d )
que compõe a amostra.
Função de verossimilhança: Distribuição de probabilidade da amostra aleatória, dada (em geral) pelo
produtório das distribuições de probabilidades dos dados individualmente.
Estatı́sticas: Funções de (e apenas de) observações amostrais, ou seja, de variáveis aleatórias (dados) e que,
portanto são elas próprias variáveis aleatórias.
Estimação: Processo de obtenção de aproximações numéricas para parâmetros associados a f (·).
Estimativa: Uma aproximação numérica particular (ou seja, em uma dada amostra) para parâmetro(s)
associado(s) a f (·).
Estimador: Função dos dados (amostra) que permite a geração de estimativas.
20.3 Amostragem não-probabilı́stica
Uma amostragem não-probabilı́stica é obtida quando o acesso a informações não é tão simples ou os recursos
forem limitados, assim o pesquisador faz uso de dados que estão mais a seu alcance, é a chamada amostragem por
conveniência. Por exemplo, se por restrições orçamentárias ou de outra ordem não for possı́vel obter uma amostra
tão numerosa ou se ela é de difı́cil acesso, podemos restringir nossa amostra a uma pequena região delimitada
de fácil acesso e de custo reduzido, usuários de uma cidade, por exemplo. Essa é a chamada amostragem não-
probabilı́stica. No caso em que a única possibilidade é o uso de uma amostragem não-probabilı́stica, deve-se ter a
consciência de que as conclusões apresentam alguma limitação.
A seguir, apresentamos algumas das principais técnicas de amostragem não-probabilı́stica.
Amostragem intencional: A amostra intencional é composta por elementos da população selecionados

intencionalmente pelo investigador, porque este considera que esses elementos possuem caracterı́sticas tı́picas ou
representativas da população. Exemplo: escolha de localidades representativas em tempo de eleições. legislativas.
Amostragem Snowball : A amostra snowball é um tipo de amostra intencional em que o investigador escolhe
um grupo inicial de indivı́duos e pede-lhes o nome de outros indivı́duos pertencentes à mesma população. A amostra
vai assim crescendo como uma bola de neve à medida que novos indivı́duos são indicados ao investigador. É um
tipo de amostragem bastante útil quando se pretende estudar pequenas populações muito especı́ficas (exemplo: os
”sem abrigo”). No entanto pode originar em resultados enviesados uma vez que as pessoas tendem a indicar o
nome de pessoas intimas ou amigos (com comportamentos e pensamentos similares).
Amostragem por quotas: A amostra por quotas é obtida dividindo a população por categorias ou estratos
e selecionando um certo número (quota) de elementos de cada categoria de modo não aleatório.
Amostragem de conveniência: A amostra de conveniência é formada por elementos que o pesquisador

reuniu simplesmente porque dispunha deles. Então, se o professor tomar os alunos de sua classe como amostra de
toda a escola, está usando uma amostra de conveniência. Os estatı́sticos têm muitas restrições ao uso de amostras de
conveniência. Mesmo assim, as amostras de conveniência são comuns na área de saúde, em que se fazem pesquisas
com pacientes de uma só clı́nica ou de um só hospital. Mais ainda, as amostras de conveniência constituem, muitas
vezes, a única maneira de estudar determinado problema.
De qualquer forma, o pesquisador que utiliza amostras de conveniência precisa de muito senso crı́tico. Os
dados podem ser tendenciosos. Por exemplo, para estimar a probabilidade de morte por desidratação não se
deve recorrer aos dados de um hospital. Como só são internados os casos graves, é possı́vel que a mortalidade
entre pacientes internados seja maior do que entre pacientes não-internados. Consequentemente, a amostra de
conveniência constituı́da, nesse exemplo, por pacientes internados no hospital, seria tendenciosa.
Finalmente, o pesquisador que trabalha com amostras sempre pretende fazer inferência, isto é, estender os
resultados da amostra para toda a população. Então é muito importante caracterizar bem a amostra e estender os
resultados obtidos na amostra apenas para a população da qual a amostra proveio.

20.4 Amostragem probabilı́stica
A amostragem é dita probabilı́stica se todos os elementos da população tiverem probabilidade conhecida, e

diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-probabilı́stica.
Segundo essa definição, a amostragem probabilı́stica implica sorteio com regras bem determinadas, cuja
realização só será possı́vel se a população for finita e totalmente acessı́vel. A utilização de uma amostragem
probabilı́stica é a melhor recomendação que se deve fazer no sentido de garantir a representatividade da amostra,
pois o acaso é o único responsável por eventuais discrepâncias entre população e amostra.
A seguir, apresentamos algumas das principais técnicas de amostragem probabilı́stica.
Amostragem aleatória simples (A.A.S): Esse tipo de amostragem, também chamada simples ao acaso,
casual, elementar, randômica etc., é equivalente a um sorteio lotérico. Nela, todos os elementos da população
têm igual probabilidade de pertencer à amostra e todas as possı́veis amostras têm igual probabilidade de ocorrer.
Assumindo N como sendo o tamanho da população e n o tamanho da amostra, então cada elemento da população
tem probabilidade n/N de pertencer à amostra. Essa relação n/N é denominada de fração de amostragem.
Dessa forma, uma amostra aleatória simples de n elementos de uma população deN elementos é um sub-
conjunto de n elementos distintos da população, extraı́dos de modo que qualquer das N n amostras possı́veis tem
N −1

igual probabilidade n de ser selecionada.
A amostragem aleatória simples pode ser feita com reposição, isto é, cada elemento da população pode
entrar mais do que uma vez na amostra. Neste caso há N n possı́veis amostras distintas que podem ser extraı́das.
Considerando um processo sem reposição, isto é, cada elemento da população só pode entrar uma vez na amostra,
então há N
n possı́veis amostras que podem ser extraı́das da população.
Observação: Neste material, para fins de inferência estatı́stica, consideramos apenas esse tipo de amostra.
Amostragem casual sistemática: Quando os elementos da população se apresentam ordenados e a retirada

dos elementos da amostra é feita periodicamente, temos uma amostragem sistemática. Assim, por exemplo, em uma
linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção
diária. Assim, teremos uma produção total de N itens e extrairemos uma amostra de tamanho n, selecionando as
unidades a cada dez itens. Para seleção do primeiro item, um número entre 1 e 10 é sorteado aleatoriamente e os
demais subsequentes são obtidos sistematicamente. Por exemplo, as unidades sorteadas poderão ser 8, 18, 28, 38,
48, e assim por diante, repetindo-se o procedimento até o n-ésimo item.
A principal vantagem da amostragem sistemática está na grande facilidade na determinação dos elementos
da amostra. O perigo em adotá-la está na possibilidade da existência de ciclos de variação da variável de interesse,
especialmente se o perı́odo desses ciclos coincidir com o perı́odo de retirada dos elementos da amostra. Por outro
lado, se a ordem dos elementos na população não tiver qualquer relacionamento com a variável de interesse, então a
amostragem sistemática tem efeitos equivalentes à amostragem casual simples, podendo ser utilizada sem restrições.
Amostragem estratificada: Muitas vezes, a população se divide em subpopulações ou estratos, sendo

razoável supor que, de estrato para estrato, a variável de interesse apresente um comportamento substancialmente
diverso, tendo, entretanto, comportamento razoavelmente homogêneo dentro de cada estrato. Em tais casos, se o
sorteio dos elementos da amostra for realizado sem se levar em consideração a existência dos estratos, pode acontecer
que os diversos estratos não sejam convenientemente representados na amostra, a qual seria mais influenciada pelas
caracterı́sticas da variável nos estratos mais favorecidos pelo sorteio.
Evidentemente, a tendência à ocorrência de tal fato será tanto maior quanto menor o tamanho da amostra.
Para evitar isso, pode-se adotar uma amostragem estratificada.
Constituem exemplos em que uma amostragem estratificada parece ser recomendável, a estratificação de uma
cidade em bairros, quando se deseja investigar alguma variável relacionada à renda familiar; a estratificação de uma
população humana em homens e mulheres, ou por faixas etárias; a estratificação de uma população de estudantes
conforme suas especificações, etc.
Amostragem por Clusters ou conglomerados: Assim como na amostragem estratificada, na amostra-

gem por clusters ou conglomerados, a população é dividida em grupos, ou clusters. Este tipo de amostragem
torna-se particularmente útil quando a população se encontra dividida num reduzido número de grupos, caracte-
rizados por terem uma dispersão idêntica à população total, isto é, os grupos deverão, tanto quanto possı́vel, ser
”microcosmos”da população a estudar. Primeiro, selecionam-se aleatoriamente alguns dos grupos e em seguida,
incluem-se na amostra todos os indivı́duos pertencentes aos grupos seleciona-dos.
Trata-se de um processo amostral casual simples em que cada unidade é o cluster. Neste tipo de amostragem

exige apenas que se disponha de uma listagem dos grupos (de indivı́duos ou elementos da população) e não uma
listagem completa dos elementos da população, como é o caso das amostragens anteriores. Um exemplo deste tipo
de amostragem é o caso em que se pretende fazer uma sondagem de opinião aos alunos de uma escola (população),
da qual apenas se dispõe de uma listagem das turmas (grupos de alunos). Uma amostra por clusters obtém-se
selecionando uma amostra aleatória de turmas e inquirindo, dentro de cada turma escolhida, todos os alunos.
Amostragem multi-etapas: O primeiro passo deste tipo de amostra é idêntico ao anterior. A população
encontra-se dividida em vários grupos e selecionam-se aleatoriamente alguns desses grupos. No passo seguinte,
também os elementos de cada grupo são escolhidos aleatoriamente. Este processo pode multiplicar-se em mais de
duas etapas se os grupos estiverem divididos em sub-grupos. Um exemplo deste tipo de amostragem é o caso de
uma sondagem de opinião aos alunos do ensino secundário em que se pode começar por selecionar aleatoriamente
algumas direções escolares. Em seguida, de cada uma delas, selecionar aleatoriamente algumas escolas, de cada uma
das escolas escolhidas selecionar aleatoriamente algumas turmas e, finalmente, de cada uma das turmas escolhidas
seleccionar aleatoriamente alguns alunos. Este exemplo consiste em 4 etapas.
Como desvantagem deste método adiante-se de que os possı́veis erros de amostragem se podem multiplicar,
dado que ao longo deste processo se vão utilizando várias sub-amostras com a possibilidade de erros de amostragem
em cada uma delas.
Amostragem multi-fásica: Este processo de amostragem não deve ser confundido com o processo de
amostragem multi-etapas. No primeiro processo as unidades amostrais variam de uma etapa para outra. No
exemplo referido no ponto anterior, as unidades amostrais eram, sucessivamente, as direções escolares, as escolas,
as turmas e os alunos, enquanto que na amostragem multi-fásica se define sempre a mesma unidade amostral em
todas as fases de extração da amostra. Neste caso, em cada fase da amostragem, consideram-se sempre os elementos
da população, obtendo-se de alguns mais informações do que de outros.
Na primeira fase, recolhem-se dados sobre determinadas caracterı́sticas dos respondentes - por exemplo, o
seu comportamento e frequência quanto ao consumo de determinado produto, variáveis demográficas, tamanho das
empresas, a sua disponibilidade para responder novamente a um inquérito. Esta informação pode ser usada para a
definição de uma listagem dos possı́veis respondentes na segunda fase do inquérito. É então retirada desta listagem
uma segunda amostra que responderá a um questionário com um nı́vel de profundidade mais elevado.
Deste modo, nem todos os inquiridos respondem a todas as questões, isto permite reduzir os custos e permite
ainda que a amostra principal seja utilizada como base de amostragem para amostragens seguintes.
20.5 Numero de amostras: população finita
Processo com reposição: Seja uma população finita de tamanho N . Então o número k de amostras
possı́veis que podem ser retiradas desta população, num processo com reposição é
k = Nn
Processo sem reposição: Seja uma população finita de tamanho N . Então o número k de amostras
possı́veis que podem ser retiradas desta população, num processo sem reposição é

N N!
k= = .
n n! (N − n)!
Exemplo: Numa população composta por N = 80 coelhos, quantas amostras possı́veis podem ser extraı́das
de tamanho:
a. n = 2 (sem reposição) Solução:

N 80
k= = = 3.160 possı́veis amostras.
n 2
b. n = 4 (sem reposição) Solução:

N 80
k= = = 1.581.580 possı́veis amostras.
n 4

c. n = 2 (com reposição) Solução:
k = N n = 802 = 6.400 possı́veis amostras.
d. n = 4 (com reposição) Solução:
k = N n = 804 = 40.960.000 possı́veis amostras.
20.6 Erro padrão da média
Se forem tomadas todas as amostras possı́veis de tamanho n de uma população de tamanho N , então teremos
k médias amostrais:
X 1 , X 2 , ...X k
Se fizermos a média das médias amostrais, denominada de X, então X terá o mesmo valor da média popula-
cional µ, isto é
k
1X
X= X i = µ.
k i=1
2 2
Se fizermos a variância das médias amostrais, denominada de σX , então σX será n vezes menor que a variância
2
populacional σ . Para essa relação chamamos de erro-padrão da média, que nada mais é que o desvio-padrão da
distribuição amostral das médias, expresso por
2 σ2 σ
σX = ⇒ σX = √
n n
20.7 Fator de correção para populações finitas

N −n
Como a população é finita usaremos o fator de correção para população finita dado por N −1 . Dessa forma
temos:
σ2 N − n

2
σX =
n N −1
2
A expressão acima mostra que a variância da média amostral (σX ) é n vezes menor que a variância popula-
2
cional (σ ) corrigido pelo fator de correção para população finita. Equivalentemente temos que o desvio-padrão da
média amostral (σX ) é raı́z quadrada de n vezes menor que o desvio-padrão populacional (σ) corrigido pela raı́z
quadrada do fator de correção para população finita, isto é,
s
σ N −n
σX = √
n N −1
O termo √σn também é chamado de erro-padrão da média amostral. É fácil observar que a medida que o
tamanho populacional N aumenta temos

N −n
lim = 1.
N −→∞ N −1
Portanto, para populações infinitas, a média das médias amostrais, X terá um valor igual a média populacional
µ e a variância das médias amostrais será n vezes menor que a variância populacional. Na prática, se o tamanho
n da amostra representa menos que 5% do tamanho populacional N , então a população já é considerada uma
população infinita.

20.8 Exemplo genérico de aplicação em população finita
Suponha uma população de tamanho N = 10 formada pelos elementos
{10, 20, 30, 40, 50, 60, 70, 80, 90, 100}
Então temos que a média populacional µ é dada por µ = 55 e a variância populacional é dada por σ 2 = 825.
Agora vamos determinar todas as amostras possı́veis de tamanho n = 2 que podem ser extraı́das desta população
num processo sem reposição. O número k total de amostras é

N 10 10!
k= = = = 45.
n 2 2! (10 − 2)!
Então temos k = 45 possı́veis amostras de tamanho n = 2 que podem ser extraı́das dessa população. Para
cada uma das 45 amostras determinaremos a sua média amostral conforme Tabela abaixo.
Tabela 15: Resultados das 45 possı́veis amostras do exemplo.

Amostra Dados da Média Amostra Dados da Média Amostra Dados da Média
de Nº Amostra Xi de Nº Amostra Xi de Nº Amostra Xi
1 (10 ; 20) 15 16 (20 ; 90) 55 31 (50 ; 60) 55
2 (10 ; 30) 20 17 (20 ; 100) 60 32 (50 ; 70) 60
3 (10 ; 40) 25 18 (30 ; 40) 35 33 (50 ; 80) 65
4 (10 ; 50) 30 19 (30 ; 50) 40 34 (50 ; 90) 70
5 (10 ; 60) 35 20 (30 ; 60) 45 35 (50 ; 100) 75
6 (10 ; 70) 40 21 (30 ; 70) 50 36 (60 ; 70) 65
7 (10 ; 80) 45 22 (30 ; 80) 55 37 (60 ; 80) 70
8 (10 ; 90) 50 23 (30 ; 90) 60 38 (60 ; 90) 75
9 (10 ; 100) 55 24 (30 ; 100) 65 39 (60 ; 100) 80
10 (20 ; 30) 25 25 (40 ; 50) 45 40 (70 ; 80) 75
11 (20 ; 40) 30 26 (40 ; 60) 50 41 (70 ; 90) 80
12 (20 ; 50) 35 27 (40 ; 70) 55 42 (70 ; 100) 85
13 (20 ; 60) 40 28 (40 ; 80) 60 43 (80 ; 90) 85
14 (20 ; 70) 45 29 (40 ; 90) 65 44 (80 ; 100) 90
15 (20 ; 80) 50 30 (40 ; 100) 70 45 (90 ; 100) 95
Calculando agora a média das médias amostrais, denotada por X temos
45
1 X
X = Xi
45 i=1
15 + 20 + 25 + ... + 85 + 90 + 95
=
45
X = 55.
Podemos perceber então que a média das médias amostrais (X = 55) coincide com a média populacional
(µ = 55). Calculando agora a variância das médias amostrais temos

45 2
2 1 X
σX = Xi − X
45 i=1
2 2 2 2 2 2
(15 − 55) + (20 − 55) + (25 − 55) + ... + (85 − 55) + (90 − 55) + (95 − 55)
=
45
16500
=
45
2 1100
σX =
3
Aplicando o fator de correção para população finita temos a seguinte relação
σ2 N − n

2
σX =
n N −1

825 10 − 2
= ×
2 10 − 1
2 1100
σX =
3
Podemos observar então, que a média das médias amostrais sempre será a média populacional e a variância das
médias amostrais será n vezes menor que a variância populacional corrigido pelo fator de correção para população
finita. A Figura (31) apresenta a distribuição das 45 médias amostrais deste exemplo.
Figura 31: Gráfico da distribuição de frequências das 45 médias amostrais do exemplo.
A Figura (31) mostra claramente que há uma maior quantidade de amostras com médias próximas do valor
55 e, a medida que nos afastamos deste valor para mais ou para menos, a quantidade de amostras vai diminuindo.
Por exemplo, se considerarmos as as amostras com médias que variam de 45 a 65 temos um total de 21 amostras,
o que equivale a aproximadamente 47% do total de 45 amostras.
Por outro lado, se considerarmos as amostras com médias iguais ou abaixo de 20 e iguais ou acima de 90
temos apenas 4 amostras, o que equivale a aproximadamente 9% do total de 45 amostras.
Diante deste contexto, este exemplo numérico sugere que é razoável supormos que a probabilidade de escolher-
mos uma amostra ao acaso com uma média amostral X perto da média populacional µ é maior do que escolhermos
uma amostra com média X longe do parâmetro µ, já que a quantidade de amostras com médias próximas de µ é
maior do que as amostras com médias distantes de µ.

21 Estimação pontual de parâmetros
21.1 Introdução
Um estimador é uma função exclusivamente dos dados (amostra) usada para estimar parâmetros da população.
Qualquer valor numérico resultante de um estimador é denominado de estimativa. A Tabela (16) apresenta alguns
parâmetros populacionais e seus estimadores mais usuais.
Tabela 16: Alguns parâmetros populacionais e seus estimadores.
Caracterı́stica Parâmetro Estimador Estatı́stica

Populacional (População) (Amostra) (Amostra)
Média µ µ
b X
Variância σ2 c2
σ S2
Desvio-padrão σ σ
b S
Proporção p pb pb
Número de indivı́duos N N
b N
b
Os estimadores devem possuir boas propriedades como não-enviesamento, consistência e eficiência. Para
estudar tais propriedades, o aluno deve saber as propriedades da esperança e da variância de uma variável aleatória.
21.2 Propriedades dos estimadores
Não-enviesamento: Seja θb um estimador para o parâmetro θ. Então dizemos que θb é um estimador não-
enviesado (ou não-viciado) para o parâmetro θ se

E θb = θ.
Consistência: Seja θb um estimador para o parâmetro θ. Então dizemos que θb é um estimador consistente
para o parâmetro θ se

lim E θb = θ.
n→∞

lim V ar θb = 0.
n→∞
Eficiência: Sejam θb1 e θb2 dois estimadores não-viciados para o parâmetro θ. Então dizemos que θb1 é mais
eficiente que θb2 se

V ar θb1 < V ar θb2 .

21.3 Exemplo 1: a média amostral como estimador da média populacional
Considere uma população com média µ e variância σ 2 . Vamos verificar se a média amostral X é um estimador
não viciado para a média populacional µ.
n
! n
!
1X 1 X
E X = E Xi = E Xi
n i=1 n i=1
1
= E [X1 + X2 + ... + Xn ]
n
1
= [E (X1 ) + E (X2 ) + ... + E (Xn )]
n
1
= [µ + µ + ... + µ]
n
1
= × nµ
n
E X = µ.
Logo, a média amostral X é um estimador não-viciado para a média populacional µ.
Vamos verificar, agora, se a média amostral X é um estimador consistente para a média populacional µ.

lim E X = lim µ = µ.
n→∞ n→∞
Encontrando a variância do estimador X:
n
!
1X
V ar X = V ar Xi
n i=1
n
!
1 X
= V ar Xi
n2 i=1
1
= V ar (X1 + X2 + ... + Xn )
n2
1
= [V ar (X1 ) + V ar (X2 ) + ... + V ar (Xn )]
n2
1 2
σ + σ 2 + ... + σ 2

=
n2
nσ 2
=
n2
σ2
V ar X = .
n
Dessa forma temos que
σ2

lim V ar X = lim = 0.
n→∞ n→∞ n
Logo, a média amostral X é um estimador consistente para a média populacional µ.

21.4 Exemplo 2: vários estimadores não viciados para o mesmo parâmetro popula-
cional
Considere uma população com caracterı́stica X tal que X ∼ N 10 2

3 θ, σ e sejam X1 , X2 , X3 , X4 , X5 uma
amostra aleatória extraı́da desta população. Com o objetivo de estimar o parâmetro θ foram considerados os três
estimadores abaixo:
5
3 X
θb1 = Xi
50 i=1
7
θb2 = X1 − X2
10
X1 X2 X3 X4 X5
θb3 = + + + +
30 15 10 15 30
Verificar quais destes estimadores são não-viciados para o parâmetro θ e encontre o mais eficiente, isto é,
aquele que possui a menor variância.
Primeiro passo: Encontrar a esperança de cada um dos estimadores propostos para o parâmetro θ. Vamos
encontrar primeiramente a esperança matemática do estimador θb1 .
5
! 5
! 5
3 X 3 X 3 X
E θb1 = E Xi = E Xi = E (Xi )
50 i=1 50 i=1
50 i=1
3
= [E (X1 ) + E (X2 ) + E (X3 ) + E (X4 ) + E (X5 )]
50
3 10 10 10 10 10
= θ+ θ+ θ+ θ+ θ
50 3 3 3 3 3

3 50
= θ
50 3

E θb1 = θ.
Logo, o estimador θb1 é um estimador não-viciado para o parâmetro θ.
Vamos encontrar agora a esperança matemática do estimador θb2 .

7 7 7
E θb2 = E X1 − X2 = E (X1 ) − E X2 = E (X1 ) − E (X2 )
10 10 10
10 7 10 10 7
= θ− × θ= θ− θ
3 10 3 3 3
3
= θ
3
E θb2 = θ.
Logo, o estimador θb2 também é um estimador não-viciado para o parâmetro θ.
Vamos encontrar agora a esperança matemática do estimador θb3 .


X1 X2 X3 X4 X5
E θb3 = E + + + +
30 15 10 15 30

X1 X2 X3 X4 X5
= E +E +E +E +E
30 15 10 15 30
1 1 1 1 1
= E (X1 ) + E (X2 ) + E (X3 ) + E (X4 ) + E (X5 )
30 15 10 15 30
1 10 1 10 1 10 1 10 1 10
= × θ+ × θ+ × θ+ × θ+ × θ
30 3 15 3 10 3 15 3 30 3
10 1 1 1 1 1 10 3
= θ + + + + = θ× =θ
3 30 15 10 15 30 3 10

E θb3 = θ.
Logo, o estimador θb3 também é um estimador não-viciado para o parâmetro θ.
Segundo passo: Para encontrar qual é o estimador mais eficiente, dentre estes três estimadores não-viciados,
temos que encontrar a variância de cada um deles. Vamos encontrar primeiramente a variância do estimador θb1 .
5
! 5
! 5
3 X 9 X 9 X
V ar θb1 = V ar Xi = V ar Xi = V ar (Xi )
50 i=1 2500 i=1
2500 i=1
9
= [V ar (X1 ) + V ar (X2 ) + V ar (X3 ) + V ar (X4 ) + V ar (X5 )]
2500
9 2 9
σ + σ2 + σ2 + σ2 + σ2 = × 5σ 2 = 0, 018σ 2

=
2500 2500
V ar θb1 = 0, 018σ 2 .
Vamos encontrar agora a variância do estimador θb2 .

7 7
V ar θb2 = V ar X1 − X2 = V ar (X1 ) + V ar X2
10 10
49 49
= V ar (X1 ) + V ar (X2 ) = σ 2 + × σ 2 = 1, 49σ 2
100 100
V ar θb2 = 1, 49σ 2 .
Vamos encontrar agora a variância do estimador θb3 .

X1 X2 X3 X4 X5
V ar θb3 = V ar + + + +
30 15 10 15 30

X1 X2 X3 X4 X5
= V ar + V ar + V ar + V ar + V ar
30 15 10 15 30
1 1 1 1 1
= V ar (X1 ) + V ar (X2 ) + V ar (X3 ) + V ar (X4 ) + V ar (X5 )
900 225 100 225 900
1 1 1 1 1
= × σ2 + × σ2 + × σ2 + × σ2 + × σ2
900 225 100 225 900
2 1 1 1 1 1
= σ + + + + = 0, 0211σ 2
900 225 100 225 900

V ar θb3 = 0, 0211σ 2 .

Logo, como temos V ar θb1 < V ar θb3 < V ar θb2 , o estimador mais eficiente ou mais preciso para estimar
o parâmetro θ é o estimador θb1 pois possui a menor variância.

22 Estimação intervalar da média populacional considerando variância

populacional conhecida
22.1 Introdução
Vimos anteriormente que a média amostral X é um estimador que gera estimativas da média populacional µ.
Quando a estimativa de um parâmetro populacional qualquer é dada por um único valor numérico denominamos
de estimativa por ponto ou estimativa pontual. Entretanto, esse procedimento não permite verificar qual a possı́vel
magnitude do erro que se está cometendo. Neste contexto surge a ideia de construir os intervalos de confiança, que
são baseados na distribuição amostral de probabilidades do estimador pontual.
A estimativa de um parâmetro populacional dada por dois valores numéricos a e b (com a < b), entre os
quais se considera que contenha-se o parâmetro desconhecido, é denominada estimativa por intervalo ou estimativa
intervalar. As estimativas intervalares indicam a sua precisão ou exatidão, por isto são preferı́veis às estimativas
pontuais. A declaração da precisão de uma estimativa por intervalo denomina-se grau de confiança ou nı́vel de
confiança, justificando a denominação de intervalo de confiança.
22.2 Distribuição da média amostral

Considere uma população com caracterı́stica X tal que X ∼ N µ, σ 2 . Sejam X1 , X2 , ..., Xn uma amostra
aleatória extraı́da de X. Então a média amostral X também tem distribuição normal com média µ e variância n
vezes menor que a variância da população, isto é,
σ2

X∼N µ, . (37)
n
Demonstração de (37:) Usando as propriedades da esperança e da variância, vamos encontrar primeiramente

a esperança matemática da variável aleatória X:
n
!
1X
E X = E Xi
n i=1
n
!
1 X
= E Xi
n i=1
1
= E [X1 + X2 + ... + Xn ]
n
1
= [E (X1 ) + E (X2 ) + ... + E (Xn )]
n
1
= [µ + µ + ... + µ]
n
1
= × nµ
n
E X = µ.
Logo, a esperança da média amostral X é a média populacional µ. Isso significa que X é um estimador
não-viciado para o parâmetro µ.
Vamos encontrar agora a variância da variável aleatória X:

n
!
1X
V ar X = V ar Xi
n i=1
n
!
1 X
= V ar Xi
n2 i=1
1
= V ar (X1 + X2 + ... + Xn )
n2
1
= [V ar (X1 ) + V ar (X2 ) + ... + V ar (Xn )]
n2
1 2
σ + σ 2 + ... + σ 2

= 2
n
nσ 2
=
n2
σ2
V ar X = .
n
Logo, a variância da média amostral X é n vezes menor que a variância populacional σ 2 . Como X é uma
combinação linear de distribuições normais, então está provado a expressão (37).
A Figura (32) apresenta a passagem da distribuição normal para a distribuição da média amostral.

Figura 32: Distribuição normal e distribuição da média amostral.

22.3 Construção do intervalo de confiança para a média populacional com variância

populacional σ 2 conhecida
Nesta Seção vamos determinar o intervalo de confiança para a média populacional µ. Adotaremos a notação
IC (1 − α) 100%, em que (1 − α) denota o nı́vel de confiança do intervalo, isto é, a probabilidade do intervalo de
confiança retratar a realidade. O termo α denota o nı́vel de significância do intervalo, isto é, a probabilidade do
intervalo de confiança não retratar a realidade. Padronizando a distribuição da variável aleatória X, expressa em
(37), temos a distribuição normal padrão, isto é,
X −µ
Z= ∼ N (0, 1) (38)
√σ
n
Demonstração de (38:) Vamos encontrar primeiramente a esperança matemática da variável aleatória Z:
!
X −µ
E (Z) = E
√σ
n

E X −µ
=
√σ
n

E X − E (µ)
=
√σ
n
µ−µ
=
√σ
n
0
=
√σ
n
E (Z) = 0.
Vamos encontrar agora a variância da variável aleatória Z:
!
X −µ
V ar (Z) = V ar
√σ
n

V ar X − µ
= σ2
n

V ar X + V ar (µ)
= σ2
n
σ2
n +0
= σ2
n
2
σ n
= × 2 =1
n σ
V ar (Z) = 1.
Logo, a variância da variável aleatória Z é 1. Como Z é uma combinação linear de distribuições normais fica
provada e expressão (38).

Considerando a padronização dada em (38) temos o que o intervalo de confiança IC (1 − α) 100% para a
média populacional µ considerando a variância populacional σ 2 conhecida é expresso por:
σ
X ± Zα/2 √ . (39)
n
Demonstração de (39:) Vamos considerar a probabilidade da variável aleatória Z estar em uma área (1 − α)
simetricamente em torno da origem zero, isto é, a probabilidade de Z estar na área da confiança:

⇒ P −Zα/2 ≤ Z ≤ Zα/2 = 1 − α
!
X −µ
⇒ P −Zα/2 ≤ σ ≤ Zα/2 = 1 − α
√
n

σ σ
⇒ P −Zα/2 √ ≤ X − µ ≤ Zα/2 √ =1−α
n n

σ σ
⇒ P −X − Zα/2 √ ≤ −µ ≤ −X + Zα/2 √ =1−α
n n

σ σ
⇒ P X + Zα/2 √ ≥ µ ≥ X − Zα/2 √ =1−α
n n

σ σ
⇒ P X − Zα/2 √ ≤ µ ≤ X + Zα/2 √ =1−α
n n
Logo, como

σ σ
P X − Zα/2 √ ≤ µ ≤ X + Zα/2 √ = 1 − α,
n n
fica provada a expressão (39).

Atenção: A interpretação de um intervalo de confiança requer cautela. Por exemplo, em um intervalo de

confiança de 95% para o parâmetro µ é errado afirmar que a probabilidade de µ estar neste intervalo é de 95%.
Lembremos que µ não é aleatório e sim um parâmetro, uma constante. Quem é aleatório é o intervalo. Portanto,
o correto é afirmar que a probabilidade deste intervalo conter o parâmetro µ é de 95%.
A Tabela (17) apresenta alguns valores de Zα/2 para a construção de intervalos com diversos nı́veis de
confiança.
Tabela 17: Alguns nı́veis de confiança e seus respectivos valores de Zα/2 .

Nı́vel de confiança Valor de Zα/2
70% 1, 04
75% 1, 15
80% 1, 28
85% 1, 44
90% 1, 645
95% 1, 96
96% 2, 054
97% 2, 17
98% 2, 33
99% 2, 575
99, 5% 2, 81
99, 9% 3, 27
É importante dizer que não existe intervalo de confiança 100%, pois, na estimação de parâmetros estamos
sempre inseridos num processo de amostragem e, portanto, parte da população. Por outro lado, mesmo que
estivéssemos no contexto populacional fazendo um censo, ainda assim não faz sentido falar em intervalo de confiança
100%, já que na população não se faz estimação, e sim censo.

22.4 Exemplo 1. Aplicações na indústria de eletrônicos
Numa fábrica de computadores a administração pretende estimar o tempo médio µ de vida de um determinado
tipo de processador. Para isso, foi selecionada uma amostra aleatória constituı́da por n = 15 processadores. Com
base nesta amostra obteve-se um tempo médio amostral de vida igual a X = 27.350 horas. Supondo que o tempo
X de vida segue uma distribuição normal com desvio padrão populacional σ = 3.000 horas, vamos construir
e interpretar os intervalos de confiança IC (90) %, IC (95) % e IC (99) % para o tempo médio µ de vida dos
processadores produzidos por esta fábrica.
Construção do IC (90) % para o tempo médio µ: Analisando a Tabela da distribuição normal padrão
Z e considerando um nı́vel de confiança de 90%, verificamos que devemos usar o valor Zα/2 = 1, 645, pois
P (−1, 645 < Z < 1, 645) = 0, 90. Desta forma temos:
σ
X ± Zα/2 √
n
3000
⇒ 27350 ± 1, 645 × √
15
⇒ 27350 ± 1274, 21
Portanto, o IC (90%) para o tempo médio µ de vida dos processadores é:
[26.075, 79 horas ; 28.624, 21 horas]

Interpretação: Temos 90% de confiança de que o intervalo [26.075, 79 horas ; 28.624, 21 horas] contem o
tempo médio populacional µ de vida dos processadores.
σ
X ± Zα/2 √
n
3000
⇒ 27.350 ± 1, 96 × √
15
⇒ 27.350 ± 1518, 21
[25.831, 79 horas ; 28.868, 21 horas]

σ
X ± Zα/2 √
n
3000
⇒ 27350 ± 2, 575 × √
15
⇒ 27350 ± 1994, 59
[25.355, 41 horas ; 29.344, 59 horas]


22.5 Exemplo 2. Aplicações na indústria metalúrgica
Numa indústria de metalurgia, foram medidos os comprimentos de n = 32 chapas de aço produzidas por
uma máquina obtendo uma média amostral X = 1400mm. Assumindo que o comprimento X (em mm) é uma
variável aleatória com distribuição normal com média µ desconhecida e desvio-padrão populacional σ = 100mm,
vamos construir e interpretar os intervalos de confiança IC (90) %, IC (95) % e IC (99) % para o comprimento
médio populacional µ das chapas de aço produzidas por essa indústria.
Construção do IC (90) % para o comprimento médio µ: Analisando a Tabela da distribuição normal

padrão Z e considerando um nı́vel de confiança de 90%, verificamos que devemos usar o valor Zα/2 = 1, 645, pois
σ
X ± Zα/2 √
n
100
⇒ 1400 ± 1, 645 × √
32
⇒ 1400 ± 29, 08
Portanto, o IC (90%) para o comprimento médio µ das chapas de aço produzidas por essa indústria é:
[1370, 92 mm ; 1429, 08 mm]

Interpretação: Temos 90% de confiança de que o intervalo [1370, 92 mm ; 1429, 08 mm] contem o comprimento
médio µ das chapas de aço produzidas por essa indústria.

σ
X ± Zα/2 √
n
100
⇒ 1400 ± 1, 96 × √
32
⇒ 1400 ± 34, 65
[1365, 35 mm ; 1434, 65 mm] .


σ
X ± Zα/2 √
n
100
⇒ 1400 ± 2, 575 × √
32
⇒ 1400 ± 45, 52
[1354, 48 mm ; 1445, 52 mm] .


22.6 Confiança versus precisão
Nesta Seção vamos abordar a relação entre dois conceitos extremamente importantes na estimação intervalar:
a confiança e a precisão. Lembrando que a estimação intervalar é assim expressa:
σ
X ± Zα/2 √
|{z} n
Estimativa Pontual | {z }
Erro de Estimativa
Considerando os dois exemplos anteriores dispomos no quadro abaixo os intervalos de confiança obtidos:
Intervalos de Exemplo 1 Exemplo 2

Confiança Aplicações na indústria de eletrônicos: Aplicações na indústria metalúrgica: Estimação do
Estimação do tempo médio µ de vida comprimento médio µ das chapas de aço
IC (90%) [26.075, 79 horas ; 28.624, 21 horas] [1370, 92 mm ; 1429, 08 mm]
Podemos observar por meio dos intervalos de confiança obtidos nos dois exemplos da Seção anterior que, a
medida que aumentamos a confiança do intervalo, sua amplitude também aumenta, isto é, o intervalo fica mais
aberto (perdemos precisão). Da mesma maneira, a medida que diminuı́mos a confiança do intervalo, sua amplitude
diminui, isto é, o intervalo fica mais fechado (ganhamos precisão).
É fácil notarmos que a única maneira de aumentarmos o nı́vel de confiança sem perder precisão é aumentar
o tamanho da amostra.
Na prática porém, não se altera o nı́vel de confiança. Em geral convenciona-se o nı́vel de confiança de 95%
nos processos de estimação para a grande maioria das áreas do conhecimento. Alguns exemplos são:
Pesquisa de intenção de votos num perı́odo eleitoral;

Teoria da confiabilidade de sistemas nas engenharias;
Gestão da qualidade total de produtos e serviços nas indústrias; Controle Estatı́stico de Processos (CEP)
utilizada nos processos produtivos;
Previsão da inflação ou rendimento da bolsa de valores ao longo do tempo, por meio de modelos de previsão
para séries temporais em economia e econometria;
Previsão de temperaturas e chuvas em meteorologia;

Em medicina podemos citar o estudo do tempo de vida de pacientes com uma determinada doença, a
comparação da eficácia de tratamentos distintos, ou ainda utilização de um novo medicamento na população.
Quando temos o interesse ou a necessidade de aumentar o tamanho n da amostra é com o objetivo de aumentar
a precisão das estimativas e não para alterar o nı́vel de confiança. Como já mencionamos, a confiança do intervalo
é sempre fixa num processo de estimação.

22.7 Empate técnico entre intervalos
Num processo de estimação, considere duas amostras independentes, cada qual gerando uma estimativa
pontual e um erro de estimativa para um determinado parâmetro, com um nı́vel de confiança previamente definido.
Neste contexto, temos duas estimativas intervalares: A e B. Empate técnico é uma intersecção qualquer entre dois
ou mais intervalos de confiança, conforme ilustrado pela Figura (33):
Figura 33: Ilustração do empate técnico entre intervalos.
Se há qualquer intersecção, por menor que seja, entre dois intervalos, então dizemos que tais intervalos
estão tecnicamente empatados, isto é, não há diferença estatı́stica entre os dois, para o nı́vel de confiança
considerado. Em outras palavras, não há diferença estatı́stica entre as estimativas dos parâmetros populacionais,
ainda que pontualmente um seja maior que o outro.

Exemplo ilustrativo 1 de empate técnico: A eficiência de um novo medicamento indicado para Cefaléia
é mensurada pelo tempo X (em minutos) do seu efeito. O laboratório testou este medicamento em quatro faixas
etárias, e os intervalos de confiança obtidos foram os seguintes:
Figura 34: Situação hipotética 1: Intervalos de confiança com empates.
Podemos observar na Figura acima que os intervalos de confiança para as faixas etárias infantil e idoso estão
tecnicamente empatados. Da mesma forma observamos um empate técnico entre as faixas etárias juvenil e adulto.
Isso significa que este medicamento age de forma igual para crianças e idosos, e de forma igual para jovens e adultos.
Em termos mais simples, embora tenhamos quatro faixas etárias (quatro estratos), o medicamento se comporta de
duas maneiras distintas: tem um tempo médio de efeito menor para crianças e idosos, e um tempo médio maior
para jovens e adultos. Em sı́ntese, é como se houvesse apenas dois estratos na amostragem, e não quatro estratos
(quatro categorias de idade).
Vamos imaginar agora um outro contexto hipotético onde não há empates técnicos entre os estratos, conforme
mostra a Figura (35):
Figura 35: Situação hipotética 2: Intervalos de confiança sem nenhum empate.
Podemos observar na Figura acima que não há empate técnico em nenhuma categoria de idade (ou estratos).
Isso implica que o tempo X de efeito do medicamento está correlacionado com a faixa etária. Em outras palavras,

a idade do paciente está correlacionada com o tempo de efeito deste novo medicamento e, portanto, com a sua
eficiência.
Vamos imaginar agora um outro contexto hipotético onde há empates técnicos entre os estratos, conforme
Figura 36: Situação hipotética 3: Todos os intervalos de confiança com empate técnico entre si.
A partir da Figura acima, percebemos que os quatro intervalos de confiança estão tecnicamente empatados.
Isso implica que o tempo X de efeito do medicamento não está correlacionado com a faixa etária. Em outras
palavras, a idade do paciente não está correlacionada com a eficiência deste novo medicamento. Qualquer que seja
a idade dos indivı́duos, o medicamento tem o mesmo tempo médio de efeito e, portanto, a mesma eficiência.
Exemplo ilustrativo 2 de empate técnico: Numa grande pesquisa epidemiológica, uma nova vacina está
sendo desenvolvida para uma determinada epidemia e está sendo testada conforme protocolo simplificado abaixo:
Grupo Teste Grupo Controle
Aplicação da Aplicação do
Vacina Placebo
Considere agora a estimativa intervalar obtida para proporção de curados em ambos os grupos conforme
ilustrado pela Figura (37). Notamos claramente que a proporção de curados no grupo que tomou a vacina (grupo
teste) é maior do que a proporção de curados no grupo que não tomou a vacina (grupo controle ou placebo). Desta
forma podemos afirmar que a vacina é eficaz quando comparada ao placebo.

Suponha agora uma situação hipotética em que a estimativa intervalar obtida para proporção de curados em
ambos os grupos é tal como ilustrado pela Figura (38). Percebemos que há uma intersecção entre os intervalos
de confiança da proporção de curados no grupo que tomou a vacina (grupo teste) com a proporção de curados no
grupo que não tomou a vacina (grupo controle ou placebo). Desta forma podemos afirmar que não há diferença
entre o grupo que tomou a vacina e o grupo que tomou placebo.
Na parte 5 deste livro fazemos um aprofundamento desses procedimentos de comparação de grupos por meio
da teoria dos testes de hipóteses.

23 Estimação intervalar da média populacional considerando variância

populacional desconhecida
Resultado 1: Se Z tem distribuição normal padrão, ou seja, Z ∼ N (0, 1), então o quadro da variável
aleatória Z tem distribuição denominada de Qui-quadrado com 1 grau de liberdade, isto é
Z 2 ∼ χ1 . (40)

X−µ
Como Z = σ , então o resultado expresso em (40) equivale a:
2
X −µ
∼ χ1 .
σ
Resultado 2: Sejam Z1 , Z2 , ..., Zn variáveis aleatórias independentes cada qual com distribuição normal
padrão, ou seja, Zi ∼ N (0, 1), com i = 1, 2, . . . , n, então a soma do quadrado destas variáveis tem distribuição
Qui-quadrado com n graus de liberdade, isto é
n
X
Zi2 ∼ χn . (41)
i=1

Xi −µ
Como Zi = σ , para i = 1, 2, . . . , n, então o resultado expresso em (41) equivale a:
n 2
X Xi − µ
∼ χn .
i=1
σ
Resultado 3: Supondo que o parâmetro populacional µ seja desconhecido e substituindo µ pela estatı́stica
amostral X, temos que
n 2
X Xi − X
∼ χn−1 . (42)
i=1
σ
Como
n 2 n
X Xi − X 1 X 2
= 2
Xi − X
i=1
σ σ i=1
n−1
e multiplicando por n−1 , temos que
n n 2
(n − 1) 1 X 2 (n − 1) X Xi − X (n − 1) S 2
Xi − X = =
(n − 1) σ 2 i=1 σ 2 i=1 n−1 σ2
Logo, a expressão dada em (42) equivale a
(n − 1) S 2
∼ χn−1 .
σ2
Resultado 4: Se Z segue uma distribuição normal padrão e Y segue uma distribuição Qui-quadrado com k
graus de liberdade, então

Z
t= q ∼ tk
Y
k
em que tk denota a distribuição t-student com k graus de liberdade.

X−µ (n−1)S 2
Como Z = √σ , e fazendo Y = σ2 , temos que
n
X−µ X−µ X−µ

Z √σ
n
√σ
n
√σ
n X −µ
t = =r =q = S
=
√S
q
Y (n−1)S 2 S2
σ2
σ n
k σ2
n−1
Logo, a estatı́stica t tem a seguinte distribuição
X −µ
t= ∼ tn−1 . (43)
√S
n
Ou seja, quando a variância populacional σ 2 for desconhecida, então temos que a estatı́stica t expressa em
(43) tem distribuição t-student com n − 1 graus de liberdade.
Considerando a padronização dada em (43) temos o que o intervalo de confiança IC (1 − α) 100% para a
média populacional µ considerando a variância populacional σ 2 desconhecida é expresso por:
S
X ± tα/2 √ . (44)
n
Exemplo de aplicação: Em uma pesquisa de saúde pública no ambiente universitário da cidade de Barreiras,
uma das variáveis estudadas é a altura. Com o objetivo de estimar a altura média populacional µ foi selecionada
ao acaso uma amostra de n = 12 indivı́duos. Os resultados (em cm) seguem abaixo:
162 159 183 184 169 161 159 155 194 181 174 171.
Vamos encontrar os intervalos de confiança 90%, 95% e 99% para a altura média populacional µ.
Construção do intervalo de 90% de confiança para µ: A média amostral é de X = 171 cm, o desvio-padrão
amostral é S = 12, 36, e o valor da estatı́stica tα/2 é de 1, 7959 e segue que
S
X ± tα/2 √
n
12, 36
⇒ 171 ± 1, 7959 √
12
⇒ 171 ± 6, 41 cm.
Logo, o intervalo de 90% de confiança para a altura média populacional µ é:
[164, 59 cm ; 177, 41 cm]

Interpretação: Temos 90% de confiança de que o intervalo [164, 59 cm ; 177, 41 cm] contem a altura média
populacional µ dos alunos universitários.
Construção do intervalo de 95% de confiança para µ: O valor da estatı́stica tα/2 é de 2, 2010 e segue que
S
X ± tα/2 √
n
12, 36
⇒ 171 ± 2, 2010 √
12
⇒ 171 ± 7, 85 cm.

[163, 15 cm ; 178, 85 cm]

Construção do intervalo de 99% de confiança para µ: O valor da estatı́stica tα/2 é de 3, 1058 e segue que
S
X ± tα/2 √
n
12, 36
⇒ 171 ± 3, 1058 √
12
⇒ 171 ± 11, 08 cm.
[159, 92 cm ; 182, 08 cm]

23.1 Determinação do tamanho da amostra
Considerando o erro de estimativa

S
e = tα/2 √ ,
n
temos que o tamanho da amostra deve ser
2
tα/2 S
n= .
e
Note que o tamanho da amostra depende de
i. Nı́vel de confiança adotado (tα/2 ).
ii. Erro de estimativa e adotado (arbitrário).
iii. Estimativa do desvio-padrão populacional, dada pelo desvio padrão amostral S.
Por esta razão, para determinar o tamanho de amostra ideal, é necessário uma amostra prévia, chamada de
amostra piloto, que serve para dar uma ideia da variabilidade dos dados por meio do desvio padrão amostral S.
Exemplo de determinação do tamanho da amostra: Considerando o exemplo anterior sobre a altura

dos 12 alunos universitários, qual deveria ser o tamanho n da amostra para estimar a altura média populacional
µ, considerando 95% de confiança e um erro de estimativa de 6 cm?
tα/2 S 2
2
2, 2010 × 12, 36
n= = = 21 alunos.
e 6
Como a amostra inicial ou piloto tem tamanho n = 12 alunos, basta selecionar mais 9 alunos para compor a
amostra.
Se assumı́ssemos, por exemplo, um erro de estimativa de 3 cm, o tamanho n da amostra deveria ser:
tα/2 S 2
2
2, 2010 × 12, 36
n= = = 82 alunos.
e 3
Como a amostra inicial ou piloto tem tamanho n = 12 alunos, basta selecionar mais 70 alunos para compor
a amostra.
E para um erro de estimativa de 9 cm, a amostra piloto foi suficiente?
tα/2 S 2
2
2, 2010 × 12, 36
n= = = 9 alunos.
e 9
Para um erro de 9 cm percebemos que a amostra piloto foi suficiente, pois bastaria 9 alunos e a amostra
inicial tem 12 alunos.

23.2 Exemplo 1: Aplicações em estudos ambientais
Pesquisadores de um grande estudo sobre os impactos ambientais no Cerrado Baiano coletaram dados de
vazão de diversos rios. Um dos objetivos da pesquisa é estimar a vazão média µ do Rio Grande durante o perı́odo
seco e a vazão média µ durante o perı́odo chuvoso, próximo ao municı́pio de Barreiras. Para isso, considerou-se
uma amostra de 48 medições diárias da vazão durante o perı́odo seco e 48 medições diárias durante o perı́odo
chuvoso, conforme o quadro abaixo (vazão em m3 /s):
Medições diárias da vazão do rio durante 48 dias (perı́odo seco)

2, 9 4, 5 3, 9 3, 3 3, 7 5, 3 4, 5 3, 6 3, 9 5, 9 3, 2 3, 8
4, 7 6, 5 3, 7 6, 5 3, 5 3, 2 6, 5 5, 3 5, 8 4, 3 4, 8 1, 8
3, 9 4, 5 3, 9 3, 3 3, 7 5, 3 5, 5 4, 6 3, 9 5, 9 3, 2 3, 8
2, 7 6, 5 3, 7 6, 5 3, 5 3, 2 4, 5 2, 3 5, 8 4, 3 4, 8 1, 8
Medições diárias da vazão do rio durante 48 dias (perı́odo chuvoso)
7, 1 7, 6 8, 5 7, 5 5, 0 3, 5 5, 0 6, 5 5, 7 3, 4 6, 7 5, 7
5, 7 6, 5 3, 7 6, 5 3, 5 3, 2 6, 5 5, 3 5, 8 4, 3 4, 8 5, 8
4, 7 5, 2 6, 6 2, 3 8, 3 5, 9 6, 4 4, 9 5, 7 5, 1 3, 9 7, 2
5, 9 6, 7 5, 1 6, 3 4, 2 6, 6 4, 2 5, 9 5, 6 5, 1 8, 6 5, 2
Determine e interprete o intervalo de confiança IC (95%) para a vazão média µ durante o perı́odo seco e durante
o perı́odo chuvoso, nesta localização.
Solução: Com relação ao perı́odo seco temos n = 48 medições diárias, uma vazão média amostral de X =
4, 30 m3 /s e um desvio-padrão de S = 1, 23 m3 /s. O valor de tα/2 encontrado na distribuição t-student associado à
confiança de 95% com 47 graus de liberdade é tα/2 = 2, 0117. Portanto, o IC (95%) para a vazão média µ durante
o perı́odo seco é determinado por:
S
X ± tα/2 √
n
1, 23
=⇒ 4, 30 ± 2, 0117 √
48
=⇒ 4, 30 ± 0, 36
Portanto, o IC (95%) para a vazão média µ durante o perı́odo seco é:
3, 94 m3 /s ; 4, 65 m3 /s .

Interpretação: Temos 95% de confiança de que o intervalo 3, 94 m3 /s ; 4, 65 m3 /s contém a vazão média
µ para o perı́odo seco. Ou ainda em outras palavras, a probabilidade deste intervalo conter a vazão média µ para
o perı́odo seco é de 95%.
Para o perı́odo chuvoso temos n = 48 medições diárias, uma vazão média amostral de X = 5, 61 m3 /s e um
desvio-padrão de S = 1, 40 m3 /s. O valor de tα/2 é o mesmo do perı́odo seco, pois é o mesmo tamanho de amostra
(n = 48), que na distribuição t-student associado à confiança de 95% com 47 graus de liberdade é tα/2 = 2, 0117.
Portanto, o IC (95%) para a vazão média µ durante o perı́odo chuvoso é:
S
X ± tα/2 √
n
1, 40
=⇒ 5, 61 ± 2, 0117 √
48
=⇒ 5, 61 ± 0, 41
Portanto, o IC (95%) para a vazão média µ durante o perı́odo chuvoso é:
5, 21 m3 /s ; 6, 02 m3 /s .

Interpretação: Temos 95% de confiança de que o intervalo 5, 21 m3 /s ; 6, 02 m3 /s contém a vazão média
µ para o perı́odo chuvoso. Ou ainda em outras palavras, a probabilidade deste intervalo conter a vazão média µ
para o perı́odo chuvoso é de 95%.
Observação: Podemos verificar a partir dos resultados obtidos que a vazão média amostral do perı́odo
chuvoso é maior do que a do perı́odo seco e que não há intersecção entre os intervalos de confiança. Dessa maneira
podemos concluir que o perı́odo chuvoso fornece uma vazão média maior que a vazão média do perı́odo seco. Caso
houvesse alguma intersecção entre os intervalos, por menor que fosse, concluirı́amos que as vazões médias estariam
tecnicamente empatadas e, dessa maneira, não haveria diferença estatı́stica significativa entre os perı́odos seco e
chuvoso.

23.3 Exemplo 2: Aplicações em pesquisas antropométricas
Em um grande estudo sobre a saúde pública dos estudantes universitários do municı́pio de Barreiras, no
Estado da Bahia, uma das variáveis estudadas foi o peso X dos indivı́duos. Há o interesse em estimar o peso médio
µ dos estudantes. Para isso, considerou-se uma amostra aleatória de n = 30 indivı́duos e os resultados encontram-se
abaixo:
Pesos (em kg) de 30 estudantes universitários de Barreiras
Masculino 82 71 67 62 65 77 87 88 66 83 61 66 80 87 65
Feminino 42 54 65 59 41 67 59 52 55 66 33 79 61 64 53
Determine o intervalo de confiança IC (95%) para:

Item a. o peso médio dos estudantes universitários do municı́pio de Barreiras.
Item b. o peso médio dos estudantes universitários do sexo masculino.
Item c. o peso médio dos estudantes universitários do sexo feminino.
Solução: A fim de se obter os intervalos de confiança, primeiramente é conveniente construirmos um quadro

com as estatı́sticas amostrais conforme abaixo:
Sexo Tamanho da amostra Peso médio Desvio-padrão tα/2

Ambos os sexos 30 65, 23 kg 13, 77 kg 2, 0452
Masculino 15 73, 80 kg 9, 94 kg 2, 1448
Feminino 15 56, 67 kg 11, 68 kg 2, 1448
Resolução do item a. Usando os dados amostrais referentes a ambos os sexos temos:
S
X ± tα/2 √
n
13, 77
⇒ 65, 23 ± 2, 0452 √
30
⇒ 65, 23 ± 5, 14
Dessa forma, o intervalo de confiança de 95% para o peso médio µ dos estudantes é:
[60, 09 kg ; 70, 37 kg]
Interpretação: Temos 95% de confiança de que o intervalo [60, 09 kg ; 70, 37 kg] contém o peso médio µ dos
estudantes universitários de Barreiras. Ou ainda em outras palavras, a probabilidade deste intervalo conter o peso
médio µ dos estudantes universitários de Barreiras é de 95%.
Resolução do item b. Usando os dados amostrais referentes ao sexo masculino temos:
S
X ± tα/2 √
n
9, 94
⇒ 73, 80 ± 2, 1448 √
15
⇒ 73, 80 ± 5, 51
Dessa forma, o intervalo de confiança de 95% para o peso médio µ dos estudantes do sexo masculino é:
[68, 29 kg ; 79, 31 kg]
estudantes universitários do sexo masculino. Ou ainda em outras palavras, a probabilidade deste intervalo conter
o peso médio µ dos estudantes universitários do sexo masculino é de 95%.

Resolução do item c. Usando os dados amostrais referentes ao sexo feminino temos:
S
X ± tα/2 √
n
11, 68
⇒ 56, 67 ± 2, 1448 √
15
⇒ 56, 67 ± 6, 47
Dessa forma, o intervalo de confiança de 95% para o peso médio µ das estudantes do sexo feminino é:
[50, 20 kg ; 63, 14 kg]
estudantes universitários do sexo feminino. Ou ainda em outras palavras, a probabilidade deste intervalo conter o
peso médio µ dos estudantes universitários do sexo feminino é de 95%.
Observação: Podemos observar que, a partir dos resultados obtidos, não há intersecção entre os intervalos
de confiança do sexo masculino e do sexo feminino, ou seja, não há empate técnico nos intervalos. Isso nos leva a
concluir que a altura média dos alunos é estatisticamente maior que a altura média das alunas.

23.4 Exemplo 3: Aplicações em estudos de comparação de rendimento acadêmico.
A Coordenação Geral dos Núcleos Acadêmicos da UFOB deseja estimar o rendimento médio dos estudantes
do curso de Engenharia Civil e o rendimento médio dos estudantes do curso de Engenharia Ambiental na disciplina
de Métodos Estatı́sticos. Para isso, considerou-se uma amostra aleatória de 28 estudantes do curso de Engenharia
Civil e uma outra de 42 estudantes do curso de Engenharia Ambiental e tabulado suas notas finais do semestre.
Os resultados encontram-se no quadro abaixo:
Notas finais de 28 estudantes do curso de Engenharia Civil

7, 2 6, 5 5, 7 4, 1 6, 3 6, 4 5, 6 4, 9 6, 6 8, 3 6, 5 7, 2 5, 4 7, 4
6, 0 6, 6 5, 7 7, 2 5, 7 7, 3 5, 4 5, 4 5, 9 5, 3 6, 9 5, 2 7, 0 6, 9
Notas finais de 42 estudantes do curso de Engenharia Ambiental
5, 2 6, 5 6, 8 4, 6 3, 6 4, 8 5, 7 8, 7 7, 4 5, 4 4, 0 4, 2 5, 5 6, 3
5, 3 6, 6 7, 5 7, 2 7, 4 5, 0 7, 4 7, 3 2, 9 8, 7 8, 0 5, 0 5, 7 7, 9
2, 5 5, 3 5, 2 7, 5 4, 4 3, 0 6, 9 5, 5 9, 8 4, 3 4, 0 3, 6 5, 6 5, 7
Determinar e interpretar o intervalo de confiança 95% para o rendimento médio µ dos estudantes do curso
de Engenharia Civil e dos estudantes do curso de Engenharia Ambiental na disciplina de Métodos Estatı́sticos.
Solução: Para facilitar a obtenção dos intervalos de confiança, vamos construir primeiramente um quadro
resumo com as estatı́sticas amostrais conforme abaixo:
Curso Tamanho da amostra Rendimento médio Desvio-padrão tα/2
Engenharia Civil n = 28 X = 6, 24 0, 9282 2, 0518
Engenharia Ambiental n = 42 X = 5, 81 1, 7018 2, 0195
Determinando o intervalo de confiança 95% para o rendimento médio µ dos estudantes do curso de Engenharia
Civil, usando os dados amostrais referentes ao curso:
S
X ± tα/2 √
n
0, 9282
⇒ 6, 24 ± 2, 0518 √
28
⇒ 6, 24 ± 0, 36
Dessa forma, o intervalo de confiança de 95% para o rendimento médio µ dos estudantes do curso de Enge-
nharia Civil é:
[5, 88 ; 6, 60]
Interpretação: Temos 95% de confiança de que o intervalo [5, 88 ; 6, 60] contém o rendimento médio µ dos
estudantes do curso de Engenharia Civil na disciplina Métodos Estatı́sticos. Ou ainda em outras palavras, a
probabilidade deste intervalo conter o rendimento médio µ dos estudantes da Civil é de 95%.
Determinando o intervalo de confiança 95% para o rendimento médio µ dos estudantes do curso de Engenharia
Ambiental, usando os dados amostrais referentes ao curso:
S
X ± tα/2 √
n
1, 7018
⇒ 5, 81 ± 2, 0195 √
42
⇒ 5, 81 ± 0, 53
Dessa forma, o intervalo de confiança de 95% para o rendimento médio µ dos estudantes do curso de Enge-
nharia Ambiental é:
[5, 28 ; 6, 34]
Interpretação: Temos 95% de confiança de que o intervalo [5, 28 ; 6, 34] contém o rendimento médio µ dos
estudantes do curso de Engenharia Ambiental na disciplina Métodos Estatı́sticos. Ou ainda em outras palavras, a
probabilidade deste intervalo conter o rendimento médio µ dos estudantes da Engenharia Ambiental é de 95%.

23.5 Fluxograma sı́ntese da estimação da média populacional µ
A Figura (39) apresenta o fluxograma sı́ntese para a estimação da média populacional µ.
Figura 39: Fluxograma da estimação da média populacional.

24 Estimação intervalar da proporção populacional
Em diversas pesquisas podemos ter o interesse em estimar a proporção ou porcentagem populacional de um

determinado evento. Alguns exemplos são: proporção de indivı́duos fumantes no Brasil, proporção de clientes
satisfeitos com um produto, proporção de alunos reprovados em uma certa disciplina, proporção de indivı́duos com
uma certa doença na cidade de São Paulo, proporção de eleitores favoráveis a um certo candidato, etc. As pesquisas
eleitorais bem como as pesquisas de mercado se valem da metodologia de estimação da proporção populacional.
24.1 Distribuição da proporção amostral
Suponha uma variável aleatória X que assume apenas dois resultados possı́veis. Por exemplo:
a. Face obtida em um lançamento de uma moeda: cara ou coroa;

b. Nascimento de filhote macho ou fêmea de uma espécie de mamı́fero;
c. Fabricação de uma peça defeituosa ou não defeituosa numa linha de produção;
d. Uma empresa de extração de petróleo encontra ou não petróleo num ponto de sondagem;
e. O gerente do banco libera ou não libera o empréstimo para um determinado cliente;
f. O indivı́duo é ou não portador de uma determinada doença;
g. O aluno é aprovado ou reprovado numa determinada disciplina;
Então X é uma variável aleatória discreta tal que X ∼ Bernoulli (p). Isto é,

1 se sucesso, tal que P (Y = 1) = p
X=
0 se fracasso, tal que P (Y = 0) = 1 − p
A esperança matemática e a variância de X são dadas respectivamente por
E (X) = p e V ar (X) = p (1 − p) .
Considere X1 , X2 , ..., Xn uma amostra aleatória extraı́da de X, e seja X a média amostral

n
P
Xi
i=1 X1 + X2 + ... + Xn
X= = .
n n
Como X1 , X2 , ..., Xn assumem os valores 0 ou 1, segue que
Número de sucessos
X = pb =
Tamanho da amostra
Resultado: Se np > 5 e np (1 − p) > 5, então pb tem distribuição assintoticamente normal com média p e
com variância p(1−p)
n , isto é,

p (1 − p)
pb ∼ N p; . (45)
n
Demonstração de 45: A esperança matemática de pb é tal que

n
!
1X
E (b
p) = E Xi
n i=1
n
1X
= E (Xi )
n i=1
E (X1 ) + E (X2 ) + ... + E (Xn )
=
n
p + p + ... + p
=
n
np
=
n
E (b
p) = p.
Logo, a proporção amostral pb é um estimador não viciado para a proporção populacional p. A variância de
pb, por sua vez, é tal que
n
!
1X
V ar (b
p) = V ar Xi
n i=1
n
1 X
= V ar (Xi )
n2 i=1
V ar (X1 ) + V ar (X2 ) + ... + V ar (Xn )
=
n2
p (1 − p) + p (1 − p) + ... + p (1 − p)
=
n
np (1 − p)
=
n2
p (1 − p)
V ar (b
p) = .
n
Assumindo as condições np > 5 e np (1 − p) > 5, então segue o resultado assintótico para a distribuição
normal expressa em (45).
Padronizando a distribuição da variável aleatória pb, expressa em (45), temos:
pb − p
Z=q ∼ N (0, 1) . (46)
p(1−p)
n
A partir da padronização acima, temos o seguinte intervalo de confiança IC (1 − α) 100% para a proporção
populacional p:
r
pb (1 − pb)
pb ± Zα/2 (47)
n
Demonstração de (47:) Considerando a padronização dada em (46) temos o que o intervalo de confiança
IC (1 − α) 100% para a proporção populacional p, de acordo com a Figura abaixo, é:


⇒ P −Zα/2 ≤ Z ≤ Zα/2 = 1 − α
 
p − p
⇒ P −Zα/2 ≤ q ≤ Zα/2  = 1 − α
b
p(1−p)
n
r r !
p (1 − p) p (1 − p)
⇒ P −Zα/2 ≤ pb − p ≤ Zα/2 =1−α
n n
r r !
p (1 − p) p (1 − p)
⇒ P −b
p − Zα/2 ≤ −p ≤ −bp + Z−α/2 =1−α
n n
Multiplicando por (−1) temos

r r !
p (1 − p) p (1 − p)
⇒P +b
p + Zα/2 ≥ p ≥ +b
p − Z−α/2 = 1 − α,
n n
ou seja,
r r !
p (1 − p) p (1 − p)
P pb − Zα/2 ≤ p ≤ pb + Z−α/2 =1−α
n n
Portanto, o intervalo de confiança IC (1 − α) 100% para a proporção populacional p é
" r r #
p (1 − p) p (1 − p)
pb − Zα/2 ; pb + Z−α/2
n n
ou equivalentemente
r
pb (1 − pb)
pb ± Zα/2 ,
n
Fato: A proporção amostral pb é o melhor estimador para a proporção populacional p pois é um estimador não
viciado, consistente e o mais preciso, pois possui a menor variância dentro da classe dos estimadores não-viciados.

24.2 Exemplo 1: Aplicações em pesquisas de mercado
Em uma pesquisa de mercado há o interesse em saber qual o nı́vel de aceitação de um novo produto. Para isso,
entrevistou-se 150 clientes, dentre os quais 92 se declaram satisfeitos com o produto. Vamos construir o intervalo
95% de confiança para a proporção populacional p de clientes satisfeitos.
Solução: Como foram observados 92 sucessos em uma amostra de tamanho n = 150, temos então a seguinte
proporção amostral:
Número de sucessos 92
pb = = = 0, 6133.
Tamanho da amostra 150
A estatı́stica do valor Zα/2 associado ao nı́vel de confiança de 95% é de Zc = ±1, 96. Dessa maneira, o
IC (95%) para a proporção p é tal que:
r
pb (1 − pb)
pb ± Zα/2
n
r
0, 6133 (1 − 0, 6133)
0, 6133 ± 1, 96
150
0, 6133 ± 0, 0779
Logo, o intervalo de confiança 95% para a proporção de clientes satisfeitos é:
[0, 5354; 0, 6912] ou ainda [53, 54% ; 69, 12%] .
Interpretação: Temos 95% de confiança de que o intervalo [53, 54%; 69, 12%] contem a proporção populacional
de clientes satisfeitos com o produto.
24.3 Exemplo 2: Aplicações em biologia
Pesquisadores da área de zoologia estão estudando uma determinada espécie de mamı́fero. Um dos objetivos
da pesquisa é estimar a proporção p de nascimentos de fêmeas. Para isso, considerou-se uma amostra aleatória de
345 indivı́duos, em que foram observados 187 indivı́duos fêmeas. Construir e interpretar o intervalo de confiança
IC (95%) para a proporção p de nascimentos de fêmeas desta espécie de mamı́fero.
Solução: Como foram observados 187 sucessos em uma amostra de tamanho n = 345, temos então uma
proporção amostral pb = 0, 5420. A estatı́stica do valor Zα/2 associado ao nı́vel de confiança de 95% é de Zc = ±1, 96.
Dessa maneira, o IC (95%) para a proporção p é tal que:
r
pb (1 − pb)
pb ± Zα/2
n
r
0, 5420 (1 − 0, 5420)
⇒ 0, 5420 ± 1, 96
345
⇒ 0, 5420 ± 0, 0526
Dessa maneira, o intervalo de confiança IC (95%) para a proporção p de nascimentos de fêmeas desta espécie
de mamı́fero é
[0, 4895 ; 0, 5946] ou ainda [48, 95% ; 59, 46%] .
Interpretação: Temos 95% de confiança de que o intervalo [0, 4895 ; 0, 5946] contém a proporção p de nas-
cimentos de fêmeas desta espécie de mamı́fero. Ainda em outras palavras, a probabilidade de que este intervalo
contenha a proporção p de nascimentos de fêmeas é de 95%.

24.4 Exemplo 3: Aplicações em empresas seguradoras de veı́culos
Uma grande empresa seguradora de veı́culos deseja estimar a proporção p de clientes do sexo feminino que
apresentam algum tipo de sinistro durante a vigência do contrato. Para isso, considerou-se uma amostra aleatória
de 188 clientes, dentre as quais 45 apresentaram sinistro. Construir e interpretar o intervalo de confiança IC (95%)
para a proporção p clientes do sexo feminino que apresentam algum tipo de sinistro durante a vigência do contrato.
Solução: Como foram observados 45 sucessos em uma amostra de tamanho n = 188, temos então uma
proporção amostral pb = 0, 2394. A estatı́stica do valor Zα/2 associado ao nı́vel de confiança de 95% é de Zc = ±1, 96.
Dessa maneira, o IC (95%) para a proporção p é tal que:
r
pb (1 − pb)
pb ± Zα/2
n
r
0, 2394 (1 − 0, 2394)
⇒ 0, 2394 ± 1, 96
188
⇒ 0, 2394 ± 0, 0610
Dessa maneira, o intervalo de confiança IC (95%) para a proporção p de clientes do sexo feminino que
apresentam algum tipo de sinistro durante a vigência do contrato é
[0, 1784 ; 0, 3004] ou ainda [17, 84% ; 30, 04%] .
Interpretação: Temos 95% de confiança de que o intervalo [0, 1784 ; 0, 3004] contém a proporção p de clientes
do sexo feminino que apresentam algum tipo de sinistro durante a vigência do contrato. Ainda em outras palavras,
a probabilidade de que este intervalo contenha a proporção p de clientes do sexo feminino que apresentam algum
tipo de sinistro é de 95%.
24.5 Exemplo 4: Aplicações em pesquisa eleitoral
Em uma pesquisa eleitoral foram entrevistados 800 eleitores para verificar as intenções de votos dos candidatos
A, B e C. A tabela abaixo apresenta os resultados obtidos para esta amostra.
Candidato: Número de eleitores favoráveis:

A 246
B 118
C 274
Não souberam ou não quiseram responder 162
Total da amostra 800
Vamos construir o intervalo de confiança de 95% para a proporção populacional para cada candidato. Recor-
demos que, para um nı́vel de confiança de 95% o valor de Zα/2 é 1, 96.
Intervalo de confiança para a proporção de votos do candidato A:
A proporção amostral do candidato A é

pbA = = = 0, 3075.
Dessa forma temos
r
pbA (1 − pbA )
pbA ± Zα/2
n
r
0, 3075 (1 − 0, 3075)
0, 3075 ± 1, 96
800
0, 3075 ± 0, 0320

Logo, o intervalo de confiança 95% para a proporção de votos do candidato A é:
[0, 2755; 0, 3395] ou ainda [27, 55%; 33, 95%] .
de votos para o candidato A.
Intervalo de confiança para a proporção de votos do candidato B:
A proporção amostral do candidato B é

pbB = = = 0, 1475.
Dessa forma temos
r
pbB (1 − pbB )
pbB ± Zα/2
n
r
0, 1475 (1 − 0, 1475)
0, 1475 ± 1, 96
800
0, 1475 ± 0, 0246
Logo, o intervalo de confiança 95% para a proporção de votos do candidato B é:
[0, 1229; 0, 1721] ou ainda [12, 29%; 17, 21%] .
de votos para o candidato B.
Intervalo de confiança para a proporção de votos do candidato C:
A proporção amostral do candidato C é

pbC = = = 0, 3425.
Dessa forma temos
r
pbC (1 − pbC )
pbC ± Zα/2
n
r
0, 3425 (1 − 0, 3425)
0, 3425 ± 1, 96
800
0, 3425 ± 0, 0329
Logo, o intervalo de confiança 95% para a proporção de votos do candidato C é:
[0, 3096; 0, 3754] ou ainda [30, 96%; 37, 54%] .
de votos para o candidato C.
Observação: Podemos observar que os intervalos de confiança para os candidatos A e C tem uma intersecção.
Quando este fato ocorre, dizemos que há um empate técnico entre os candidatos A e C. Desta forma, não é possı́vel
afirmar qual candidato vai ganhar as eleições, por menor que seja tal intersecção.
Importante: Em geral as pesquisas de intenção de voto, assim como pesquisas de mercado, o tamanho n da
amostra é determinado previamente sem a necessidade de uma amostra piloto. Nesse contexto, adota-se a mesma
margem de erro para a estimação intervalar de todos os candidatos. Tal margem de erro é aquela que foi usada
para determinar o tamanho da amostra antes de ir para a população coletar os dados.

24.6 Determinação do tamanho da amostra para o caso da proporção populacional
Considerando o erro de estimativa para o caso da proporção populacional
r
pb (1 − pb)
e = Zα/2 ,
n
temos que
2
Zα/2 pb (1 − pb)
n= .
e2
Na prática, para não depender do termo pb (1 − pb), que é uma estimativa amostral da variância populacional,
substitui-se tal termo pelo valor numérico 0, 25. Desta forma não é necessário uma amostra piloto e a expressão
para determinar o tamanho necessário da amostra se reduz a:
2
Zα/2 0, 25
n= .
e2
Exemplo. Numa pesquisa eleitoral quantos eleitores devemos entrevistar para estimar a proporção popula-
cional de votos de um candidato considerando 95% de confiança e uma margem de erro de 3% para mais ou para
menos?
2
Zα/2 0, 25 1, 962 0, 25
n= = = 1067 eleitores.
e2 0, 032
E considerando uma margem de erro de 2%, qual deveria ser o tamanho da amostra?
2
Zα/2 0, 25 1, 962 0, 25
n= = = 2401 eleitores.
e2 0, 022
O quadro abaixo apresenta alguns possı́veis tamanhos de amostra para diversos erros de estimativas, consi-
derando um nı́vel de significância de 90%, 95% e 99%.
Tamanhos de amostra para diferentes casos.

Nı́vel de confiança
Margem de erro 90% 95% 99%
25% 11 15 27
20% 17 24 41
15% 30 43 74
10% 68 96 166
5% 271 384 663
4% 423 600 1036
3% 752 1067 1842
2% 1691 2401 4144
1% 6765 9604 16577
0, 5% 27060 38416 66306
Importante: Caso já exista uma amostra piloto proveniente da população, então devemos usar a estimativa
pb (1 − pb) para determinar o tamanho n da amostra, ao invés do valor numérico 0, 25.

24.7 Porque adota-se o valor numérico 0, 25?
Podemos notar que a estimativa pb (1 − pb) da variância populacional nada mais é que uma função de pb, isto é,
g (b
p):
p) = pb (1 − pb) = pb − pb2 .
g (b
O valor numérico 0, 25 é o valor máximo de g (b
p), pois derivando g (b
p) em relação a pb temos
0
p) = 1 − 2b
g (b p.
0
Igualando g (b
p) a zero, temos:
1 − 2b
p = 0
−2b
p = −1
pb = 1/2
Ou seja, g (b
p) atinge o máximo 0, 25 quando pb = 1/2, conforme figura a seguir.
O quadro abaixo apresenta alguns valores numéricos de pb (1 − pb) para vários valores de pb.
pb pb (1 − pb)
0, 01 0, 0099
0, 05 0, 0475
0, 10 0, 09
0, 20 0, 16
0, 30 0, 21
0, 40 0, 24
0, 50 0, 25
0, 60 0, 24
0, 70 0, 21
0, 80 0, 16
0, 90 0, 09
0, 95 0, 0475
0, 99 0, 0099
Podemos observar que pb (1 − pb) aumenta gradativamente até o valor 0, 25 quando pb = 0, 5 e, em seguida,
começa a decrescer novamente. O valor numérico 0, 25 garante que o tamanho n da amostra não seja menor do
que seria para qualquer outro valor de pb (1 − pb) diferente de 0, 25. Em outras palavras, o valor 0, 25 maximiza g (b
p)
que, por sua vez, maximiza n.

24.8 Exemplo 5: Procedimento estatı́stico adotado em pesquisas de intenção de voto
No Exemplo 4 fizemos a estimação da proporção populacional aplicada a pesquisas eleitorais onde o tamanho
da amostra foi arbitrariamente adotado sem justificativa ou relação com a margem de erro adotada. Na prática,
porém, em pesquisas de intenção de voto, assim como em pesquisas de mercado, o tamanho n da amostra é
determinado previamente sem a necessidade de uma amostra piloto.
Nesse contexto, adota-se a mesma margem de erro para a estimação intervalar de todos os candidatos. Tal
margem de erro é aquela que foi usada para determinar o tamanho da amostra antes de ir para a população coletar
os dados.
Exemplo de aplicação: Quantos eleitores devemos entrevistar, em uma pesquisa de intenção de voto,
considerando 95% de confiança e uma margem de erro de 2% para mais ou para menos? Em outras palavras, qual
deve ser o tamanho da amostra?
Como o valor de Zα/2 associado ao nı́vel de confiança 95% é de 1, 96, temos que
2
Zα/2 0, 25
n =
e2
1, 962 0, 25
=
0, 022
n = 2401 eleitores.
Suponha que esta pesquisa foi realizada em um Municı́pio onde há 4 candidatos e que os resultados obtidos
nesta amostra de 2401 eleitores foram os seguintes:
Tabela 18: Resultados obtidos na pesquisa de intenção de voto.
Candidato Número de eleitores Proporção Arredondamento* com

Concorrentes favoráveis amostral 2 casas decimais
A 791 0, 3294 0, 33
B 87 0, 0362 0, 04
C 596 0, 2482 0, 25
D 817 0, 3403 0, 34
Não souberam ou 110 0, 0458 0, 05

Não quiseram responder
Total da amostra 2401
*Nas pesquisas de intenção de voto e pesquisas de mercado, é usual adotar um

arredondamento de duas casas decimais depois da vı́rgula.
Podemos notar que a Tabela (18) apresenta a estimativa pontual (proporção amostral) de cada um dos 4
candidatos desta pesquisa.
Como a margem de erro adotada para determinar o tamanho da amostra foi de 0, 02 ou 2%, então temos a
estimativa intervalar para cada um dos candidatos concorrentes, conforme ilustração a seguir:

Observação: Podemos notar que os intervalos de confiança para os candidatos A e D apresentaram uma
intersecção. Quando este fato ocorre, dizemos que há um empate técnico entre os candidatos A e D. Desta
forma, não é possı́vel afirmar qual candidato vai ganhar as eleições, por menor que seja tal intersecção.
Para os municı́pios com menos de 200 mil eleitores, esta indefinição no empate técnico segue até o dia das
eleições em que as urnas são apuradas. Para os municı́pios com mais de 200 mil eleitores, esta indefinição vai para
o segundo turno.
Observando os intervalos obtidos acima, há três conclusões estatı́sticas possı́veis neste cenário:
Os candidatos B e C perdem as eleições;
Os candidatos A e D lideram as pesquisas e estão tecnicamente empatados;
Os dois itens anteriores têm probabilidade de 95% de retratar a realidade (95% de confiança).

25 Estimação intervalar da variância populacional

Considere uma população com caracterı́stica X tal que X ∼ N µ, σ 2 . Sejam X1 , X2 , ..., Xn uma amostra
aleatória extraı́da de X e seja S 2 a variância desta amostra. Então vimos em Capı́tulos anteriores que:
(n − 1) S 2
Q= ∼ χn−1 .
σ2
em que χn−1 denota a distribuição Qui-quadrado com n − 1 graus de liberdade.
Seja 1 − α a probabilidade da variável Q, com n − 1 graus de liberdade, tomar valores entre Qα/2 e Q1−α/2 ,
valores obtidos na tabela da distribuição Qui-quadrado tais que P Q < Qα/2 = P [Q > Q1−α/2 ] = α/2, conforme
Figura 40: Distribuição Qui-quadrado
Observando a equação Qα/2 ≤ Q ≤ Q1−α/2 vemos que podemos substituir Q pela expressão acima e então
obtemos
(n − 1) S 2
Qα/2 ≤ ≤ Q1−α/2 .
σ2
Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a variância,
(n − 1) S 2 (n − 1) S 2
< σ2 < .
Q1−α/2 Qα/2
Assim,
(n − 1) S 2 (n − 1) S 2

P < σ2 < = 1 − α.
Q1−α/2 Qα
Logo, o intervalo com nı́vel 100(1 − α)% de confiança para σ 2 é expresso por:
(n − 1) S 2 (n − 1) S 2

IC(σ 2 , 1 − α) = , .
Q1−α/2 Qα/2

26 Estimação da diferença de duas médias populacionais assumindo

variâncias conhecidas
Considere uma população A com caracterı́stica X, tal que X tem distribuição normal com média µX e
2
variância σX , isto é,
2

X ∼ N µX , σX
Vimos em capı́tulos anteriores que, se X1 , X2 , . . . , Xm é uma amostra aleatória extraı́da de X, então a média
amostral X tem distribuição normal com média µX e variância m vezes menor que a variância populacional, isto
é,
2

X ∼ N µX , σX /m
Considere também uma população B com caracterı́stica Y , tal que Y tem distribuição normal com média µY
e variância σY2 , isto é,
Y ∼ N µY , σY2

De forma análoga ao caso anterior, se Y1 , Y2 , . . . , Yn é uma amostra aleatória extraı́da de Y , então a média
amostral Y tem distribuição normal com média µY e variância n vezes menor que a variância populacional, isto é,
Y ∼ N µY , σY2 /n

Suponha independência estocástica entre as populações A e B. Sejam X1 , X2 , . . . , Xm uma amostra aleatória

extraı́da de X e sejam Y1 , Y2 , .. . , Yn uma amostra aleatória extraı́da de Y . Então a distribuição de probabilidades
da diferença amostral X − Y é tal que
2
σ2

σX
+ Y

X −Y ∼N µX − µY ; . (48)
m n
Padronizando a distribuição (48) temos uma distribuição normal padrão, isto é:

X − Y − (µX − µY )
Z= q 2 2
∼ N (0, 1) . (49)
σX σY
m + n
A partir da distribuição padronizada dada em (49), o IC (1 − α) 100% para a diferença populacional µX − µY

é expresso por:
r
2
σX σ2
+ Y

X − Y ± Zα/2
m n
Demonstração de 48: Usando as propriedades da esperança e da variância já trabalhadas nos capı́tulos
anteriores, vamos encontrar primeiramente a esperança matemática da diferença amostral X − Y :


E X −Y = E X −E Y
= µX − µY .
No caso da variância da diferença amostral temos:

V ar X − Y = V ar X + V ar Y
2
σX σ2
= + Y.
m n

Como a diferença amostral X − Y é uma combinação linear de distribuições normais, então está provado o
resultado (48).
Demonstração de 49: Vamos encontrar primeiramente a esperança matemática de Z:
 
X − Y − (µX − µY ) E X − Y − (µX − µY )
E (Z) = E  q 2 2
 = q 2 2
σX σY σX σY
m + n m + n

E X − Y − E (µX − µY )
= q 2 2
σX σY
m + n

E X − E Y − [E (µX ) − E (µY )]
= q 2 2
σX σY
m + n
[µX − µY ] − [µX − µY ]
= q 2 2
σX σY
m + n
µX − µY − µX + µY
= q 2 2
σX σY
m + n
0
E (Z) = q 2 2
= 0.
σX σY
m + n
Determinando a variância de Z:
 
X − Y − (µX − µY ) V ar X − Y − (µX − µY )
V ar (Z) = V ar  q 2 2
 = q 2
σX σY 2
σX 2
σY
m + n m + n

V ar X − Y + V ar (µX − µY )
= 2
σX 2
σY
m + n

V ar X + V ar Y + [V ar (µX ) + V ar (µY )]
= 2
σX 2
σY
m + n
2 2
h i
σX σY
m + n + [0 + 0]
= 2
σX 2
σY
m + n
2 2
σX σY
m + n
V ar (Z) = 2
σX 2
σY
= 1
m + n
Como Z é uma combinação linear de distribuições normais, então está provado o resultado (49).

27 Estimação da diferença de duas médias populacionais assumindo

variâncias desconhecidas
Assuma uma população A com caracterı́stica X, tal que X tem distribuição normal com média µX e variância
2
σX , isto é,
2

X ∼ N µX , σX
2
Vimos em capı́tulos anteriores que, se X1 , X2 , . . . , Xm é uma amostra aleatória extraı́da de X, e SX é a
variância desta amostra, então
2
(m − 1) SX
2 ∼ χm−1 .
σX
em que χm−1 denota a distribuição Qui-quadrado com m − 1 graus de liberdade. Sabemos também que
X − µX
t= SX
∼ tm−1 .
√
m
em que tm−1 denota a distribuição t-student com m − 1 graus de liberdade.
Assumindo também uma população B com caracterı́stica Y , tal que Y tem distribuição normal com média
µY e variância σY2 , isto é,
Y ∼ N µY , σY2

De forma análoga ao caso anterior, se Y1 , Y2 , . . . , Yn é uma amostra aleatória extraı́da de Y , e SY2 é a variância
desta amostra, então
(n − 1) SY2
∼ χn−1 .
σY2
em que χn−1 denota a distribuição Qui-quadrado com n − 1 graus de liberdade. Sabemos também que
Y − µY
t= SY
∼ tn−1 .
√
n
em que tn−1 denota a distribuição t-student com n − 1 graus de liberdade.

2
Se as variâncias populacionais σX e σY2 são desconhecidas, porém iguais, isto é, se
2
σX = σY2 = σ 2 ,
então temos

X − Y − (µX − µY )
t= q ∼ tm+n−2 (50)
2 1 1

S m+n
em que tm+n−2 denota a distribuição t-student com m + n − 2 graus de liberdade, em que m é o tamanho da
primeira amostra e n é o tamanho da segunda amostra.
Dessa maneira, a partir da distribuição dada em (50), o IC (1 − α) 100% para a diferença populacional
2
µX − µY , considerando as variâncias populacionais σX e σY2 desconhecidas, é expresso por:
s
2 1 1
X − Y ± tα/2 S + .
m n
em que
2
(m − 1) SX
2 + (n − 1) SY2
S =
m+n−2
2
é a média ponderada nos graus de liberdade das variâncias amostrais SX e SY2 .

28 Estimação intervalar da diferença de duas proporções populacio-

nais
Suponha duas populações: A população A tem caracterı́stica XA tal que
XA ∼ Bernoulli (pA )
e a população B tem a caracterı́stica XB tal que
XB ∼ Bernoulli (pB )
Considere uma amostra aleatória de tamanho m extraı́da da população A e uma amostra aleatória de tamanho
n extraı́da da população B. Definindo pbA e pbB como sendo as proporções amostrais de sucessos da amostra A e B
respectivamente, temos que a distribuição da diferença de proporções é tal que:

pA (1 − pA ) pB (1 − pB )
pbA − pbB ∼ N pA − pB ; + (51)
m n
Demonstração de (51): Temos que a esperança matemática de pbA − pbB é tal que
pA − pbB )
E (b pA ) − E (b
= E (b pB )
= pA − pB .
Por sua vez, a variância é tal que:
pA − pbB )
V ar (b = V ar (b
pA ) + V ar (b
pB )
pA (1 − pA ) pB (1 − pB )
= + .
m n
Como a estatı́stica pbA − pbB é uma combinação linear de duas distribuições normais, então segue o resultado
em (51).
Padronizando a distribuição dada em (51) temos:
pA − pbB ) − (pA − pB )
(b
Z=q ∼ N (0, 1) . (52)
pA (1−pA ) pB (1−pB )
m + n
Demonstração de (52): A esperança da variável aleatória Z é tal que:

 
(b
pA − p
b B ) − (p A − pB )
E (Z) = E q 
pA (1−pA ) pB (1−pB )
m + n
p − pbB ) − E (pA − pB )
E (b
= qA
pA (1−pA )
m + pB (1−p
n
B)
pA ) − E (b
E (b pB ) − E (pA ) − E (pB )
= q
pA (1−pA )
m + pB (1−p
n
B)
p − pB − pA + pB
= qA
pA (1−pA )
m + pB (1−p
n
B)
E (Z) = 0.
A variância de Z, por sua vez, é tal que:
 
pA − pbB ) − (pA − pB ) 
(b
V ar (Z) = V ar  q
pA (1−pA )
m + pB (1−p
n
B)
pA − pbB ) + V ar (pA − pB )
V ar (b
= q 2
pA (1−pA ) pB (1−pB )
m + n
V ar (b
pA ) + V ar (b
pB ) + V ar (pA ) + V ar (pB )
= pA (1−pA )
m + pB (1−p
n
B)
pA (1−pA )
m + pB (1−p
n
B)
+0+0
= pA (1−pA ) pB (1−pB )
m + n
pA (1−pA ) pB (1−pB )
m + n
= pA (1−pA ) pB (1−pB )
m + n
V ar (Z) = 1.
Como a estatı́stica Z é uma combinação linear de duas distribuições normais, então segue o resultado em
(52).
A partir da padronização dada em (52), o IC (1 − α) 100% para a diferença populacional (pA − pB ) por meio
pA − pbB ) é tal que:
da diferença amostral (b
" r r #
pbA (1 − pbA ) pbB (1 − pbB ) pbA (1 − pbA ) pbB (1 − pbB )
pA − pbB ) − Zα/2
(b + pA − pbB ) + Zα/2
; (b +
m n m n
ou de forma equivalente
r
pbA (1 − pbA ) pbB (1 − pbB )
pA − pbB ) ± Zα/2
(b +
m n

28.1 Exemplo 1: Aplicações em seguro de veı́culos automotivos
Uma grande empresa seguradora de veı́culos automotivos deseja estimar a diferença entre as proporções po-
pulacionais de clientes do sexo masculino e feminino que apresentam sinistro durante os 12 meses de contrato.
Para isso, considerou-se uma amostra aleatória de m = 122 clientes do sexo masculino, dentre os quais 34 apre-
sentaram sinistros. Considerou-se também uma amostra aleatória de n = 148 clientes do sexo feminino, dentre os
quais 21 apresentaram sinistros. Construa e interprete o intervalo de confiança IC (95%) para a diferença de duas
proporções populacionais pA − pB .
Solução: Para os clientes do sexo masculino (população A) observamos 34 sucessos em 122 indivı́duos
resultando numa proporção amostral pbA = 0, 2787. Para os clientes do sexo feminino (população B) observamos
21 sucessos em 148 indivı́duos resultando numa proporção amostral pbB = 0, 1419. Dessa maneira, como o valor
de Zα/2 considerando 95% de confiança é de 1, 96, temos que o intervalo de confiança IC (95%) para a diferença
pA − pB é tal que
r
(b +
m n
r
0, 2787 (1 − 0, 2787) 0, 1419 (1 − 0, 1419)
⇒ (0, 2787 − 0, 1419) ± 1, 96 +
122 148
⇒ 0, 1368 ± 0, 0974
Portanto, o intervalo de confiança IC (95%) para a diferença destas duas proporções populacionais pA − pB é
[0, 0394 ; 0, 2342] .

Interpretação: Temos 95% de confiança de que o intervalo [0, 0394 ; 0, 2342] contem a diferença destas duas
proporções populacionais pA − pB . Ainda em outras palavras, a probabilidade deste intervalo conter a diferença
destas duas proporções populacionais é de 95%. Esse resultado mostra que existe uma diferença positiva significativa
entre os dois sexos, em que a proporção do sexo masculino que apresentam sinistros é maior que a do sexo feminino.
28.2 Exemplo 2: Aplicações em pesquisa de mercado
Os diretores de uma grande empresa de televisão por assinatura deseja estimar a diferença entre as proporções
populacionais de clientes do sexo masculino e feminino que estão insatisfeitos com os pacotes de serviços oferecidos
pela empresa. Para isso, considerou-se uma amostra aleatória de m = 238 clientes do sexo masculino, dentre os
quais 152 se disseram insatisfeitos. Considerou-se também uma amostra aleatória de n = 194 clientes do sexo
feminino, dentre os quais 132 se disseram insatisfeitas. Construa e interprete o intervalo de confiança IC (95%)
para a diferença de duas proporções populacionais pA − pB .
Solução: Para os clientes do sexo masculino (população A) observamos 152 sucessos em 238 indivı́duos,
resultando numa proporção amostral pbA = 0, 6387. Para os clientes do sexo feminino (população B) observamos
132 sucessos em 194 indivı́duos resultando numa proporção amostral pbB = 0, 6804. Dessa maneira, como o valor
de Zα/2 considerando 95% de confiança é de 1, 96, temos que o intervalo de confiança IC (95%) para a diferença
pA − pB é tal que
r
(b +
m n
r
0, 6387 (1 − 0, 6387) 0, 6804 (1 − 0, 6804)
⇒ (0, 6387 − 0, 6804) ± 1, 96 +
238 194
⇒ −0, 0417 ± 0, 0896
Portanto, o intervalo de confiança IC (95%) para a diferença destas duas proporções populacionais pA − pB é
[−0, 1313 ; 0, 0479] .

Interpretação: Temos 95% de confiança de que o intervalo [−0, 1313 ; 0, 0479] contem a diferença destas duas
proporções populacionais pA − pB . Ainda em outras palavras, a probabilidade deste intervalo conter a diferença
destas duas proporções populacionais é de 95%. Uma vez que o valor numérico zero está contido neste intervalo, isto
significa que não há diferença estatı́stica significativa entre as duas proporções populacionais, ou seja, as proporções
de clientes insatisfeitos dos sexos masculino e feminino são estatisticamente iguais.

29 Exercı́cios sobre inferência estatı́stica via técnicas de estimação
EXERCÍCIOS SOBRE AMOSTRAGEM PARA POPULAÇÃO FINITA
Exercı́cio 1. Seja uma população formada pelos números {1, 2, 3, 4}, pede-se:
a. Determinar a quantidade de amostras de tamanho n = 2, sem reposição, que podem ser formadas com
essa população.
b. Identificar todas a amostras de tamanho n = 2 e calcular suas médias.
c. Comparar a média populacional µ com a média das médias amostrais X̄ ¯.
Exercı́cio 2. Seja uma população formada pelos números {20, 22, 24, 26, 28}, pede-se:
a. Determinar a quantidade de amostras de tamanho n = 2, sem reposição, que podem ser formadas com
essa população.
b. Identificar todas a amostras de tamanho n = 2 e calcular suas médias.
c. Compare a média populacional µ com a média das médias amostrais X̄ ¯ . Compare a variância populacional
2 2
σ com a variância das médias amostrais σX̄ , usando o fator de correção para população finita.
Exercı́cio 3. Numa população composta de N = 80 coelhos, quantas amostras possı́veis podem ser extraı́das
de tamanho:
a. n = 2 em um processo sem reposição. b. n = 3 em um processo sem reposição.
c. n = 4 em um processo sem reposição. d. n = 5 em um processo sem reposição.
e. n = 2 em um processo com reposição. f. n = 3 em um processo com reposição.
g. n = 4 em um processo com reposição. h. n = 5 em um processo com reposição.
Exercı́cio 4. Numa população composta de N = 25 capivaras, quantas amostras possı́veis podem ser
extraı́das de tamanho:
a. n = 4 em um processo sem reposição. b. n = 5 em um processo sem reposição.
c. n = 4 em um processo com reposição. d. n = 5 em um processo com reposição.
Exercı́cio 5. Numa população composta de N = 10 ratos, quantas amostras possı́veis sem reposição podem
ser extraı́das de tamanho:
a. n = 1 c. n = 3 e. n = 5 g. n = 7 i. n = 9
b. n = 2 d. n = 4 f. n = 6 h. n = 8 j. n = 10
EXERCÍCIOS SOBRE ESTIMAÇÃO PONTUAL
Exercı́cio 1. Considere uma população com caracterı́stica X obedecendo um distribuição normal com média
µ e variância σ 2 . Sejam X1 e X2 uma amostra aleatória de tamanho n = 2 extraı́da desta população e seja
b = X1 +2X
µ 2
2
um estimador para o parâmetro µ.
a. Determine a distribuição amostral de µ b e seus respectivos parâmetros.
b. Verifique se µb é não-viciado para o parâmetro µ.
Exercı́cio 2. O número X de avarias de um dispositivo eletrônico durante um perı́odo de tempo é uma

variável aleatória discreta que obedece uma distribuição de Poisson com parâmetro λ desconhecido. Para estimar
este parâmetro foram sugeridos dois estimadores:
X1 +X2 +...+Xn X1 +Xn
λ
b1 =
n e λ
b2 =
2
a. Classifique os estimadores propostos quanto ao enviesamento, isto é, verifique se são não-viciados para o
parâmetro λ.
b. Qual dos dois estimadores é mais eficiente? Justifique a sua escolha.
Ajuda: Sabemos que, se X ∼ P oisson (λ), então E (X) = V ar (X) = λ.
Exercı́cio 3. Suponha uma população com caracterı́stica X tal que X tem média populacional µ e variância
populacional σ 2 . Considere a amostra aleatória X1 , X2 , ..., X10 extraı́da desta população e os seguintes estimadores
para µ:

µ
b1 = (X1 + X2 + ... + X10 ) /10 e b2 = (2X1 − X6 + X4 ) /2.
µ
Classifique os estimadores propostos quanto ao enviesamento, isto é, verifique se são não-viciados para o
parâmetro µ.
Exercı́cio 4. Pesquisadores da área de biologia marinha estão interessados no estudo de tartarugas marinhas
gigantes. Para isso capturou-se n = 8 indivı́duos em idade adulta e tirou-se várias medidas, dentre elas o peso em
quilos. O resultado foi o seguinte:
62 72 65 49 65 84 65 58
Considere os seguintes estimadores para a média populacional µ dos pesos das tartarugas marinhas:
b1 = X
µ b4 = M inimo(X1 ,X2 ,...,X8 )+M
µ 2
aximo(X1 ,X2 ,...,X8 )
4
µ
b2 = M o µ
b5 = 3 M inimo (X1 , X2 , ..., X8 )
µ
b3 = M e b6 = 43 M aximo (X1 , X2 , ..., X8 ).
µ
a. Determine o valor numérico de cada uma das estimativas acima para o peso médio das tartarugas marinhas.
b. Qual é o melhor estimador para a média populacional do peso médio µ das tartarugas marinhas? Justifique.
Exercı́cio 5. Suponha uma população com a caracterı́stica X, tal que X é uma variável aleatória discreta
que assume valores 1, 2, ..., θ, e sua distribuição de probabilidades é dada por P (X = k) = 1/θ, para k = 1, 2, ..., θ.
Considere X1 , X2 , ..., Xn uma amostra aleatória extraı́da dessa população. Considere os seguintes estimadores para
o parâmetro θ:
4X1 +6X2 −2X3
θb1 = 2X , θb2 = 2X − 1 e θb3 = 4 − 1.
a. Classifique os estimadores propostos quanto ao enviesamento, isto é, verifique se são não-viciados para o
parâmetro θ.
b. Qual dos estimadores propostos é o mais eficiente?
Ajuda: Se X é uma variável aleatória discreta que assume valores 1, 2, ..., θ, e sua distribuição de probabili-
2
dades é dada por P (X = k) = 1/θ, para k = 1, 2, ..., θ, então é fácil verificar que E (X) = N2+1 e V ar (X) = N12−1 .
Exercı́cio 6. O número X de ovos que um determinado inseto bota segue uma distribuição de Poisson
com parâmetro λ. Foi extraı́da uma amostra aleatória de tamanho n = 4, isto é, foi verificado o número de ovos
depositados por 4 insetos. Foi sugerido dois estimadores para λ:
λ
b1 = (X1 + X2 + X3 + X4 ) /4 e λ
b2 = (X1 + 2X2 + 3X3 + 4X4 ) /10
a. Classifique os estimadores propostos quanto ao enviesamento, isto é, verifique se são não-viciados para λ.
b. Qual deles é o mais eficiente?
Exercı́cio 7. Considere uma população com caracterı́stica X tal que X ∼ N 10 2

3 θ, σ e sejam X1 , X2 , X3 , X4 , X5
uma amostra aleatória extraı́da desta população. Com o objetivo de estimar o parâmetro θ foram considerados os
três estimadores abaixo:
5
3 X
θb1 = Xi
50 i=1
7
θb2 = X1 − X2
10
X1 X2 X3 X4 X5
θb3 = + + + +
30 15 10 15 30
Verifique quais destes estimadores são não-viciados para o parâmetro θ e encontre o mais eficiente, isto é,
aquele que possui a menor variância.

EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA POPULACIONAL CONSIDERANDO

VARIÂNCIA CONHECIDA
Exercı́cio 1. Uma população tem média da populacional µ desconhecida e desvio-padrão populacional igual
a σ = 12. Com o objetivo de estimar o parâmetro µ, foi retirada uma amostra aleatória de tamanho n = 100 que
apresentou uma média amostral igual a X = 81. Construa e interprete os seguintes intervalos de confiança para a
média da populacional µ.
a. IC (90%) b. IC (95%) c. IC (99%)
Exercı́cio 2. Depois de fabricado e embalado, a atividade de um certo adubo pode considerar-se tendo uma
distribuição normal com µ = 120 dias e σ = 40 dias. Pretende-se enviar um lote de embalagens do referido adubo
de modo que a vida média amostral X não seja inferior a 118 dias com 95% de confiança. Qual o tamanho do lote
a enviar?
Exercı́cio 3. O tempo de vida de uma determinada marca de lâmpada é uma variável aleatória contı́nua
que segue uma distribuição normal com média populacional µ desconhecida e desvio-padrão populacional σ = 100
horas. Qual o tamanho necessário da amostra para estimar a vida média µ desta marca de lâmpada, considerando
95% de confiança, admitindo um erro de estimativa de e = 20 horas?
Exercı́cio 4. Uma companhia está procurando adquirir uma quantidade de calculadoras manuais que tenham
uma vida média de 1, 5 anos ou mais. Suponha que o tempo de vida X de tais calculadoras obedeça a uma
distribuição normal com média populacional µ desconhecida e desvio padrão populacional σ = 0, 3 ano.
a. Considerando 95% de confiança e com base numa amostra de n = 25 calculadoras analisadas que apresen-
taram vida média amostral de X = 1, 3 anos, a companhia deve comprar as calculadoras?
b. Resolva o item anterior considerando que a amostra analisada apresentou uma vida média amostral de
X = 1, 6 anos. O que você pode concluir?
Exercı́cio 5. Numa fábrica de computadores a administração pretende estimar o tempo médio µ de vida
de um determinado tipo de disco rı́gido. Para isso, foi selecionada uma amostra aleatória constituı́da por n = 15
computadores. Com base nesta amostra obteve-se um tempo médio amostral de vida igual a X = 27.350 horas.
Supondo que o tempo X de vida segue uma distribuição normal com desvio padrão populacional σ = 3.000 horas,
construa um intervalo de confiança de 99% para o tempo médio µ de vida dos discos rı́gidos.
Exercı́cio 6. Medições do comprimento de n = 25 peças produzidas por uma máquina conduziram a uma
média X = 140mm. Admita que cada peça tem comprimento aleatório com distribuição normal de valor esperado
µ e desvio-padrão σ = 10mm, e que o comprimento de cada peça é independente das restantes. Construa um
intervalo de confiança de 95% para comprimento médio populacional µ das peças produzidas por essa máquina.
Exercı́cio 7: Aplicação em estudos demográficos. Suponha que a altura X dos alunos seja uma v.a tal
2
que X segue o modelo normal com variância populacional σX = 121 cm2 e que a altura Y das alunas também seja
uma v.a tal que Y segue o modelo normal com variância populacional σY2 = 81 cm2 . Foi extraı́da uma amostra
aleatória de tamanho m = 18 alunos da população X obtendo-se uma média amostral X = 174 cm e uma amostra
aleatória de tamanho n = 26 alunas da população Y obtendo-se uma média amostral Y = 163 cm.
a. Construa e interprete o IC (95%) para a altura média µX dos alunos.

b. Construa e interprete o IC (95%) para a altura média µY das alunas.
c. Encontre a distribuição de probabilidades da diferença amostral X − Y .
d. Construa e interprete o IC (95%) para a diferença populacional µX − µY por meio da diferença amostral
X − Y . Explique o que significa na prática quando este intervalo contém o valor numérico zero.

EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA POPULACIONAL CONSIDERANDO

VARIÂNCIA DESCONHECIDA
Exercı́cio 1: Aplicações em estudos ambientais. Realizou-se um estudo em uma APP degradada em

que desconfia-se que o rio esteja contaminado por mercúrio. Para verificar o nı́vel X de contaminação no rio
mediu-se o nı́vel X de contaminação em vários pontos, obtendo-se os seguintes resultados (medições em mmHg/l):
144 171 114 135 130 117 84 77 133 127 74 87 123

181 103 124 150 91 127 119 125 143 134 140 101 166
Suponha que o nı́vel de contaminação X seja uma variável aleatória aproximadamente normal.
a. Encontre e interprete os intervalos de confiança IC (90%), IC (95%) e IC (99%) para o nı́vel médio µ de
contaminação do rio por mercúrio.
b. Considerando um nı́vel de confiança de 95%, quantos pontos deverı́amos medir no rio caso quiséssemos
um erro de estimativa de 10 mmHg/l? A amostra piloto foi suficiente? E se quiséssemos um erro de estimativa de
25 mmHg/l? quantos pontos no rio deverı́amos medir?
Exercı́cio 2: Aplicações em controle da qualidade. O departamento de controle de qualidade de uma

empresa de aparelhos eletrônicos tem o interesse em saber qual o tempo médio µ de vida útil de um determinado
componente eletrônico. Para isso, extraiu-se uma amostra aleatória de tamanho n = 9 da linha de produção. Os
resultados (tempo de vida em dias) foram: 1005, 2201, 2643, 2185, 1807, 1482, 1961, 1449 e 1098. Assumindo que
a variável tempo de vida X desse componente siga uma distribuição normal de probabilidades,
a. Determine o IC (98%) para o tempo médio µ de vida útil deste componente eletrônico. Interprete-o.
b. Com o mesmo nı́vel de confiança, qual deveria ser o tamanho da amostra considerando um erro de
estimativa de 100 dias?
c. E considerando um erro de estimativa de 550 dias? A amostra obtida é suficiente? Justifique.
Exercı́cio 3: Aplicações no setor bancário. Um gerente de banco está interessado em estimar o saldo
médio µ das contas correntes na primeira quinzena do mês. Para isso ele analisou uma amostra aleatório de
tamanho n = 14 correntistas, e os dados foram os seguintes (saldos em reais):
1136 895 761 1055 330 544 784 1317 994 1322 1371 748 608 940
Assumindo que o saldo da conta corrente siga uma distribuição normal, determine:
a. O IC (95%) para o saldo médio populacional µ das contas corrente desse banco. Interprete o intervalo de
confiança obtido.
b. O IC (98%) para o saldo médio populacional µ das contas corrente desse banco. Interprete o intervalo de
confiança obtido.
c. Considerando um nı́vel de confiança de 95%, qual deveria ser o tamanho da amostra caso o gerente quisesse
admitir um erro de estimativa de no máximo 50 reais no saldo médio?
d. E se o gerente quisesse admitir um erro de estimativa de no máximo e = 300 reais, a amostra retirada foi
suficiente para a estimação? Mostre.
Exercı́cio 4: Aplicações gerais. Uma amostra aleatória de tamanho n = 36 apresentou uma média
amostral X = 28, 35 e desvio-padrão amostral s = 7, 5. Para estimar a média populacional µ, construa o intervalo
de confiança
a. de 95%.
b. de 90%.
Exercı́cio 5: Aplicações gerais. Uma amostra aleatória de n = 40 contas de pessoas fı́sicas na filial de
um banco apresentou um saldo médio amostral X = R$1.400, 00 e desvio-padrão amostral S = R$300, 00.
a. Construa um IC(95%) para o saldo médio populacional µ.

b. Construa um IC(99%) para o saldo médio populacional µ.

Exercı́cio 6: Aplicações no setor de serviços. O tempo médio de atendimento em uma agência lotérica
está sendo analisado por técnicos. Uma amostra de n = 40 clientes foi sistematicamente monitorada em relação
ao tempo que levavam para serem atendidos, obtendo-se as seguintes estatı́sticas: tempo médio de atendimento
de 195 segundos e desvio padrão de 15 segundos. Considerando que o tempo de utilização segue uma distribuição
normal:
a. Faça uma estimação por intervalo para o tempo médio de utilização para toda a população de clientes da
agência lotérica, utilizando um nı́vel de confiança de 95%.
b. A amostra utilizada seria suficiente se fosse exigida uma precisão de 1 minuto?
c. O dono da agência garante que o tempo médio de atendimento é de 3 minutos (se for maior ele se
compromete a contratar mais um atendente). Com base nos dados da amostra a afirmação do dono é verdadeira,
ou ele deve contratar um novo atendente? Use um nı́vel de significância de 1%.
Exercı́cio 7: Aplicações em medicina. Selecionou-se uma amostra de n = 35 pacientes, e constatou-se

que o tempo de reação de uma injeção intravenosa é em média X = 2, 1 minutos, com um desvio padrão de s = 0, 1
minutos. Construa um intervalo a 90% de confiança para o tempo médio populacional µ de reação desta injeção
intravenosa.
Exercı́cio 8: Aplicações em pesquisas antropométricas. Foram pesadas n = 40 pessoas em uma grande

empresa multinacional (pesos expressos em quilos), e os resultados encontram-se na tabela abaixo. Determine a
estimativa pontual bem como o intervalo de confiança a um nı́vel de significância de α = 0, 05 para o peso
populacional µ, isto é, para a média dos pesos de todos os funcionários dessa empresa.
70, 2 73, 8 69, 2 66, 8 77, 0 82, 7 79, 4 86, 4

78, 7 59, 3 59, 0 83, 3 74, 1 76, 7 82, 0 70, 3
60, 8 63, 6 73, 2 65, 4 60, 7 60, 1 68, 6 73, 2
65, 6 80, 5 70, 7 66, 5 85, 1 61, 7 75, 2 56, 7
71, 7 67, 4 57, 1 65, 0 68, 9 84, 3 70, 4 64, 5
Exercı́cio 9: Aplicações em farmacologia. Um grande laboratório está interessado no lançamento de um

novo medicamento paracetamol (acetaminofeno) indicado para casos moderados de Cefaléia. Um dos objetivos dos
pesquisadores é saber qual o tempo que o medicamento demora para fazer efeito nas pessoas. Para isso selecionou-
se n = 36 indivı́duos que apresentavam a cefaléia e administrou-lhes o novo medicamento. O tempo médio desses
indivı́duos até que o remédio fizesse efeito foi de X = 12 minutos e o desvio-padrão foi de s = 3, 5 minutos.
a. Determine o IC (95%) para o tempo médio populacional µ que esse novo medicamento demora para fazer
efeito. Interprete-o.
b. Qual deveria ser o tamanho da amostra se quiséssemos estimar o tempo médio populacional µ que o
medicamento demora pra fazer efeito considerando 95% de confiança e um erro máximo de e = 0, 5 minutos?
Exercı́cio 10: Aplicações na indústria automobilı́stica. Nosso interesse é estimar a média de consumo
em quilômetros por litro de um novo modelo de carro da montadora lı́der do mercado de carros populares. Sabendo
que a população tem distribuição normal e o consumo em quilômetros por litro de uma amostra aleatória de n = 16
carros do novo modelo de carro é igual a X = 14, 8 km/l com desvio-padrão amostral igual a S = 2 km/l, estime
o valor do consumo médio populacional µ com:
a. intervalo de confiança IC (95%).

b. intervalo de confiança IC (90%).
Exercı́cio 11: Aplicações na pediatria. Em uma amostra de n = 18 bebês do sexo masculino com 12
semanas de vida, obteve-se um peso médio amostral X = 5.900 gramas e um desvio-padrão de S = 94 gramas.
a. Obtenha um intervalo de confiança de 95% para o peso médio populacional µ para os bebês com 12
semanas de vida.
b. Quantas crianças teriam que ser usadas para estimar tal média com precisão de 15 gramas?
Exercı́cio 12: Aplicações em pesquisas antropométricas. Foi medido a altura de n = 15 alunos em

uma grande escola (altura em centı́metros). Determine a estimativa pontual bem como o intervalo de confiança a
um nı́vel de significância de α = 0, 05 para a altura média populacional µ, ou seja, a média das alturas de todos os
alunos dessa escola.

191 187 178 190 170

165 173 171 178 168
165 174 157 175 181
Exercı́cio 13: Aplicações em biologia. Pesquisadores estudam grupos de baleias da espécie Jubarte com
o objetivo de monitorar o crescimento ou descrescimento da população. Uma das variáveis monitoradas é o peso
X dos filhotes dessa espécie de baleia. Pesou-se uma amostra de n = 7 filhotes e os resultados estão abaixo (pesos
em quilos):
1919 1624 2464 1569 1614 1490 2648
a. Determine os intervalos de confiança IC (90%), IC (95%), IC (98%) e IC (99%) para o peso médio µ dos
filhotes da baleia da espécie Jubarte. Interprete-o.
b. Qual deveria ser o tamanho da amostra de filhotes caso assumı́ssemos um erro de 200 quilos com um nı́vel
de confiança de 95%?
Exercı́cio 14: Aplicação em estudos da vazão de rios. Uma grande empreiteira vai construir uma ponte
de concreto sob um determinado rio. Como parte dos estudos preliminares de implantação, necessita-se estimar a
vazão média µ neste ponto do rio durante os perı́odos seco e chuvoso. Para isto, considerou-se uma amostra de 30
medições diárias para cada um dos perı́odos, e os resultados encontram-se no quadro abaixo (vazão em m3 /s):
Medições da vazão (em m3 /s) 2, 3 5, 5 3, 2 3, 0 0, 4 3, 9 2, 3 7, 5 1, 9 3, 3 4, 0 6, 7 2, 8

Época Seca 2, 1 1, 0 2, 2 2, 9 1, 6 5, 4 2, 8 2, 7 1, 9 3, 3 3, 7 4, 3 4, 6
Medições da vazão (em m3 /s) 6, 6 6, 6 6, 9 2, 5 7, 3 7, 3 2, 6 6, 5 9, 7 6, 1 5, 9 5, 8 5, 1
Época Chuvosa 4, 1 4, 5 4, 6 4, 8 4, 5 6, 7 6, 9 7, 5 4, 9 2, 9 6, 8 4, 3 4, 4
a. Construa e interprete o intervalo IC (95%) para a vazão média µ do rio considerando os dois perı́odos.
b. Construa e interprete o intervalo IC (95%) para a vazão média µ referente ao perı́odo seco.
c. Construa e interprete o intervalo IC (95%) para a vazão média µ referente ao perı́odo chuvoso.
d. Analisando os intervalos obtidos nos itens anteriores, há diferença na vazão média entre os perı́odos seco e
chuvoso? Argumente usando no máximo 5 linhas.
e. Quantas medições seriam necessárias para estimar a vazão média do perı́odo seco considerando um erro de
estimativa de 0, 30m3 /s? E do perı́odo chuvoso?
f. Quantas medições seriam necessárias para estimar a vazão média do perı́odo seco considerando um erro de
estimativa de 0, 20m3 /s? E do perı́odo chuvoso?
Exercı́cio 15: Aplicação em estudos de preservação. Realizou-se um estudo em uma área degradada em
que o objetivo era verificar o teor de contaminação X do solo, que segue uma distribuição normal de probabilidades.
Desconfia-se que o solo esteja contaminado por chumbo. Em uma amostra composta por n = 23 pontos de sondagem
nesse solo (medições em ppm), o IC (98%) para o nı́vel médio µ de contaminação do solo por chumbo, obtido nessa
amostra foi: [125 ppm ; 217 ppm].
a. Nesse contexto, qual o valor numérico do desvio-padrão S obtido nessa amostra?

b. Quantos pontos de sondagem deverı́amos medir, isto é, qual deveria ser o tamanho da amostra considerando
um erro de estimativa e = 35 ppm?
Exercı́cio 16. Aplicações à engenharia ambiental: Realizou-se um estudo em uma área degradada em
que o objetivo era verificar o teor de contaminação X do solo, que segue uma distribuição normal de probabilidades.
Desconfia-se que o solo esteja contaminado por chumbo. Em uma amostra composta por n = 17 pontos de sondagem
nesse solo (medições em ppm), o IC (98%) para o nı́vel médio µ de contaminação do solo por chumbo, obtido nessa
amostra foi: [135, 80 ppm ; 247, 80 ppm]. A partir do intervalo de confiança obtido nesta amostra piloto, quantos
pontos de sondagem deverı́amos medir, isto é, qual deveria ser o tamanho da amostra considerando um erro de
estimativa e = 25 ppm?

EXERCÍCIOS SOBRE ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL
Exercı́cio 1: Aplicação em pesquisa de satisfação. Uma grande construtora imobiliária está interessada
em saber qual a proporção p de clientes insatisfeitos com o prazo de entrega do imóvel. Para isso consultou-se 270
clientes, dentre os quais 123 se declararam insatisfeitos com a empresa.
a. Encontre e interprete o IC (95%) para a proporção p de clientes insatisfeitos com o prazo de entrega do
imóvel.
b. Considerando 95% de confiança, qual deveria ser o tamanho da amostra considerando um erro de estimativa
de 3%? A amostra consultada é suficiente? Justifique. Supondo que ainda não foi consultado nenhum cliente, qual
deve ser o tamanho da amostra, para esse nı́vel de confiança, considerando um erro de estimativa de 3%?
Exercı́cio 2. Aplicação no controle de qualidade de produtos: O setor de controle da qualidade de uma

grande empresa fabricante de eletrodomésticos está interessado em saber qual a proporção de produtos defeituosos
produzidos diariamente. Para isso, em um determinado dia, extraiu-se uma amostra aleatória de tamanho n = 192
produtos da linha de produção, dentre os quais, 26 apresentaram defeitos.
a. Encontre os intervalos IC (90%), IC (95%) e IC (99%) para a proporção populacional p de produtos
defeituosos e interprete os intervalos obtidos.
b. Supondo que ainda não foi colhida nenhuma amostra dessa linha de produção, qual deve ser o tamanho
da amostra considerando 95% de confiança e uma margem de erro de 2, 5%, 6% e 12%?
Exercı́cio 3. Aplicação em pesquisas de satisfação: A satisfação da população em relação a determinado

governo foi pesquisada por meio de uma amostra com a opinião de 1000 habitantes do estado. Destes, 585 se
declararam insatisfeitas com a administração estadual. Admitindo-se um nı́vel de significância de 5%, solucione os
itens abaixo.
a. Estime pontualmente o percentual da população que está insatisfeita com a administração estadual e
construa o IC (95%) para a proporção populacional p de habitantes insatisfeitos.
b. Qual o tamanho da amostra necessário para a estimação se a empresa responsável pela pesquisa estipulou
uma margem de erro de 2, 5%?
c. A atual administração decidiu que se o percentual de descontentamento fosse superior a 50% deveria ser
redirecionado o plano governamental. Utilizando a informação amostral o que pode-se concluir?
Exercı́cio 4. Aplicação em pesquisas de mercado: Em uma pesquisa de mercado, acerca da preferência

pelo produto BETA, 300 consumidores foram entrevistados, sendo que 100 declararam consumir o produto.
a. Construa o intervalo de confiança IC (95%) para a proporção populacional de pessoas que consomem o
produto.
b. Um dos diretores do fabricante exige que o intervalo de confiança para a proporção populacional tenha
99% de confiança, com uma margem de erro máxima de 2, 5%. A amostra retirada é suficiente para satisfazer estes
critérios?
c. No passado, o produto BETA era a marca lı́der de mercado, com cerca de 40% da preferência do
consumidor. Com base nos dados dessa amostra, e usando uma significância de 1%, a marca ainda tem a liderança
no mercado?
Exercı́cio 5. Aplicação em estudos ambientais: Um pesquisador pretende estudar a incidência, a nı́vel

nacional, de uma doença que ataca os pinheiros. Observações efetuadas em um paı́s resultaram em 1233 casos de
pinheiros afetados por esta doença num total de 4250 observações. Construa o intervalo de confiança IC (95%)
para a proporção populacional p de pinheiros afetados no paı́s.
Exercı́cio 6. Aplicação em estudos médicos: Somente uma parcela dos pacientes que sofrem de uma
determinada sı́ndrome neurológica consegue cura completa. Em uma amostra de 64 pacientes observados, curaram-
se 41.
a. Construa o intervalo de confiança IC (95%) para a proporção dos pacientes que são curados.
b. Quantos pacientes portadores dessa sı́ndrome deverı́amos observar para estimar a proporção de curados,
considerando uma margem de erro de 5% e uma confiança de 95%?
Exercı́cio 7. Aplicação em estudos médicos: Queremos estimar a incidência da hipertensão arterial na

gravidez. Considerando uma confiança de 95%, quantas grávidas temos que observar, para estimar tal incidência
com uma margem de erro de 2% nos seguintes casos:
a. Sabendo que, em uma sondagem prévia, se observaram 9% de hipertensas.

b. Sem nenhuma informação prévia.
Exercı́cio 8. Aplicações em pesquisas de intenção de voto: Em uma pesquisa eleitoral, deseja-se

estimar a proporção p de eleitores favoráveis a certo candidato. Determine o número de eleitores que devem ser
entrevistados, considerando um nı́vel de confiança de 95% e uma margem de erro de:
a. 15% b. 10% c. 5%
Exercı́cio 9. Refaça o exercı́cio anterior considerando um nı́vel de confiança de 90%.
Exercı́cio 10. Aplicação em estudos médicos: Sabe-se que a obesidade está diretamente relacionada a
hipertensão arterial. Em uma amostra de n = 525 indivı́duos obesos verificou-se que 378 indivı́duos apresentaram
a hipertensão arterial.
a. Determine e interprete o IC (95%) para a proporção populacional p de indivı́duos obesos com hipertensão
arterial.
b. Determine e interprete o IC (99%) para a proporção populacional p de indivı́duos obesos com hipertensão
arterial.
c. Qual deveria ser o tamanho da amostra caso assumı́ssemos um erro de 5% com um nı́vel de significância
de 5%?
d. E se o erro assumido fosse 3%, qual deveria ser o tamanho da amostra?
e. Supondo que ainda não foi coletada nenhuma amostra, qual deve ser o tamanho da amostra de indivı́duos
obesos afim de estimar a proporção populacional p de hipertensos assumindo um erro de 1, 5% com um nı́vel de
significância de 5%?
Exercı́cio 11. Aplicação em pesquisas de satisfação: O diretor de uma renomada TV por assinatura
gostaria de verificar o nı́vel de satisfação dos seus assinantes em relação ao conteúdo do canal A. Para isso analisou
uma amostra de n = 150 assinantes, e os resultados encontram-se abaixo:
Satisfeitos Insatisfeitos
Homens 68 20
Mulheres 26 36
a. O diretor afirma que mais de 50% dos assinantes estão satisfeitos com o conteúdo do canal A. Construa
um IC (95%) para a proporção populacional de assinantes satisfeitos e explique com suas palavras se o diretor tem
razão ou não. Interprete o intervalo de confiança obtido.
b. O diretor está desconfiado que metade das assinantes do sexo feminino estão insatisfeitas com o conteúdo
do canal A. Construa um IC (95%) para a proporção populacional de assinantes do sexo feminino que estão
insatisfeitas e explique com suas palavras se o diretor tem razão ou não. Interprete o intervalo de confiança obtido.
c. Construa um IC (95%) para a proporção populacional de assinantes do sexo masculino que estão satisfeitos
com o conteúdo do canal A. Interprete o intervalo de confiança obtido.
d. Construa um IC (95%) para a proporção populacional de assinantes do sexo feminino que estão satisfeitos
com o conteúdo do canal A. Interprete o intervalo de confiança obtido.
e. O que você pode perceber nos intervalos obtidos nos itens c e d a respeito da satisfação?
f. Considerando o item a.), a amostra inicial do enunciado, e assumindo o mesmo nı́vel de confiança dos
intervalos obtidos, qual deveria ser o tamanho da amostra se o diretor assumisse um erro de estimativa de 10%?
A amostra analisada no inı́cio atende a essas exigências? Explique.
g. Supondo que ainda não foi extraı́da nenhuma amostra desta população de assinantes, qual deve ser o
tamanho da amostra para o mesmo erro de estimativa do item anterior?
Exercı́cio 12. Aplicações em estudos imobiliários: Uma grande construtora imobiliária está interessada
em saber qual a proporção p de clientes insatisfeitos com o prazo de entrega do imóvel. Para isso consultou-se 265
clientes, dentre os quais 147 se declararam insatisfeitos com a empresa.
Item a. Encontre e interprete o intervalo de confiança IC (95%) para a proporção p de clientes insatisfeitos
com o prazo de entrega do imóvel.
Item b. Considerando o nı́vel de confiança de 95%, qual deveria ser o tamanho da amostra considerando um
erro de estimativa de 5%? A amostra consultada é suficiente? Justifique. Supondo que ainda não foi consultado
nenhum cliente, qual deve ser o tamanho da amostra, para esse nı́vel de confiança, considerando uma margem de
erro de 5%?

Parte V
Inferência Estatı́stica: Testes de hipótese

30 Conceitos básicos em testes de hipóteses
Frequentemente é necessário tomar decisões a respeito das populações, baseado nas informações da(s) amos-
tra(s). Para se tomar decisões é apropriado a formulação de hipóteses, que podem ser verdadeiras ou não. A tomada
de decisão será então baseada no teste desta hipótese. Um teste de hipótese é um método de inferência estatı́stica
usando dados de um estudo cientı́fico. É um procedimento estatı́stico baseado na análise de uma amostra, através
da teoria de probabilidades, usado para avaliar determinados parâmetros que são desconhecidos numa população.
Embora a teoria dos testes de hipótese e a teoria dos intervalos de confiança sejam deveras semelhantes em
seu objetivo principal de inferir, é necessário salientar a distinção conceitual por meio da definição de hipótese.
A hipótese é uma conjectura (presunção, proposição, suposição) a partir de afirmações do pesquisador,
empı́ricas ou não. Entretanto, tais afirmações podem ou não pode ser verdadeiras na realidade. Em geral as
hipóteses são oriundas de uma teoria cientı́fica ou até mesmo da própria experiência, mas que ainda não tem
comprovações. As comprovações estatı́sticas podem ocorrer quando a hipótese é bem definida e passı́vel de men-
surações.
Os testes de hipóteses também são conhecidos como testes de significância. A expressão teste de significância
foi criada por Ronald Fisher: “Critical tests of this kind may be called tests of significance, and when such tests
are available we may discover whether a second sample is or is not significantly different from the first”. Os testes
de hipótese são constituı́dos de alternativas que são testadas.
Uma população tem uma amostra retirada e através da aplicação de teoria de probabilidades é possı́vel tirar
conclusões em relação a essa amostra, como determinar sua veracidade em relação a composição da população,
distinguir entre diferentes populações das quais a amostra pode ser oriunda, auxiliar na comprovação de uma teoria
ou no remodelamento dos métodos de testes aplicados para a sua comprovação, determinar limites estatı́sticos para
uma população (doenças, intenções de voto, salário, por exemplo), checar a confiabilidade de um estudo e no auxı́lio
de qualquer tomada de decisão simples em que seja necessário um rigor estatı́stico para comprovação da escolha.
A teoria dos testes de hipóteses tem uma grande importância em diversas áreas do conhecimento, pois uma
decisão errada pode levar a grandes prejuı́zos. Esse compêndio tem por objetivo demonstrar os procedimentos para
se testar hipóteses sobre os principais parâmetros populacionais.
30.1 Elementos básicos de um teste de hipótese
Os elementos básicos de um teste de hipótese são:
Hipótese nula H0 : é a hipótese estatı́stica aceita como verdadeira até que se prove o contrário, ou seja, é
a hipótese pela qual o pesquisador deve procurar indı́cios para rejeitá-la ou aceitá-la. Em geral, trata-se do
ponto de partida mais adequado para o estudo, pois poderá ser o contrário do que o pesquisador quer provar.
Hipótese alternativa H1 : é uma hipótese complementar que fornece uma alternativa à hipótese nula H0 .
Em diversas situações é justamente o que o pesquisador quer provar.
Regra de decisão: A decisão do teste consiste em aceitar ou rejeitar a Hipótese Nula H0 , até então
considerada verdadeira, a partir do nı́vel de significância do teste.
Nı́vel de significância α : Denomina-se nı́vel de significância a probabilidade de rejeitar a hipótese nula

H0 quando esta é verdadeira. O nı́vel de significância é especificado antes de se aplicar o teste. Os nı́veis de
significância mais adotados na prática são 10%, 5% e 1%.
30.2 Tipo de erros associados a um teste de hipótese
Qualquer que seja a decisão a ser tomada, estamos sujeitos a cometer erros. Há dois tipos de erros: erro tipo
I e erro tipo II.
Erro tipo I: Este tipo de erro ocorre quando rejeitamos a hipótese nula H0 quando esta é verdadeira. Definimos
como α a probabilidade de se cometer este erro, isto é,
α = P (Erro Tipo I) = P (Rejeitar H0 dado que é verdadeira) .

Erro tipo II: Este tipo de erro ocorre quando aceitamos a hipótese alternativa H1 quando esta é falsa. Definimos
como β a probabilidade de se cometer este erro, isto é,
β = P (Erro Tipo II) = P (Aceitar H1 dado que é falsa) .
O quadro abaixo apresenta o resumo dos tipos de erros:
Resumo dos erros associados as decisões
Realidade Aceitar H0 Rejeitar H0
H0 é verdadeira Decisão Correta Erro Tipo I

1−α α
H0 é falsa Erro Tipo II Decisão Correta

β 1−β
Uma vez que a hipótese nula H0 é considerada verdadeira até que se prove o contrário, então o erro tipo I
é considerado mais grave que o erro tipo II. Em outras palavras, o fato de rejeitar a hipótese nula dada que ela
é verdadeira é mais grave do que aceitá-la caso ela seja falsa. Estabelecendo uma analogia com a linguagem do
direito penal podemos constatar que condenar um inocente (erro tipo I) é mais grave do que absolver um culpado
(erro tipo II).
30.3 Tipo de testes de hipóteses
Há três tipos de testes de hipóteses no que tange a regra de decisão: teste de hipótese bilateral, teste unilateral
à esquerda e teste unilateral à direita.
Teste de hipótese bilateral: Apresenta duas regiões de rejeição para a hipótese nula H0 , conforme for-
mulação e figura abaixo:

H0 : θ = θ 0 .
H1 : θ 6= θ0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for maior que tα/2 ou menor que −tα/2 , ou equivalentemente
se |to | > ±tα/2 . Os valores numéricos dos pontos ±tα/2 que separam as regiões de rejeição e aceitação são
denominados de t crı́tico, denotados por tc .

Teste de hipótese unilateral a direita: Apresenta uma única região de rejeição para a hipótese nula H0 ,
situada a direita da curva, conforme formulação e figura abaixo:

H0 : θ = θ 0 .
H1 : θ > θ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for maior que tα , ou equivalentemente se |to | > |tα |. Dessa
maneira, o valor numérico do ponto tα que separa a região de rejeição da região de aceitação é chamado de t crı́tico
(tc ).
Teste de hipótese unilateral a esquerda: Apresenta uma única região de rejeição para a hipótese nula
H0 , situada a esquerda da curva, conforme formulação e figura abaixo:

H0 : θ = θ 0 .
H1 : θ < θ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for menor que −tα , ou equivalentemente se |to | > |−tα |.
Dessa maneira, assim como nos casos anteriores, o valor numérico do ponto −tα que separa a região de rejeição da
região de aceitação é chamado de t crı́tico (tc ).

31 Testes de hipótese para a média populacional assumindo variância

conhecida
O objetivo do teste de hipótese para a média populacional µ com a variância populacional σ 2 conhecida é
buscar indı́cios ou evidências estatı́sticas para rejeitar uma afirmação, até então considerada verdadeira, acerca do
parâmetro populacional µ, considerando um nı́vel de significância α.
31.1 Construção do teste e formulação da hipótese
Vimos anteriormente neste

material didático que, se X tem distribuição normal com média µ e variância
σ 2 , ou seja, se X ∼ N µ, σ 2 , e se X1 , X2 , ..., Xn compõem uma amostra aleatória extraı́da de X, então a média
amostral X também tem distribuição normal com média µ e variância n vezes menor que a variância da população,
isto é,
σ2

X ∼ N µ, . (53)
n
Padronizando a distribuição da variável aleatória X, expressa em (53), temos então a distribuição normal
padrão, ou seja, Z ∼ N (0, 1), isto é,
X −µ
Z= ∼ N (0, 1) .
√σ
n
Neste contexto, quando tivermos o interesse em testar hipóteses acerca da média populacional µ considerando
a variância populacional σ 2 conhecida, calculamos a estatı́stica teste da amostra, denotada por Zo (Leia-se: “Z
observado”) da seguinte forma:
X −µ
Zo = (“Z observado”)
√σ
n
que será comparado com o valor crı́tico Zc (Leia-se: “Z crı́tico”), oriundo da distribuição normal padrão Z.
A formulação do teste de hipótese para a média populacional µ é dada da seguinte forma:
Teste de hipótese bilateral:

H0 : µ = µ0 .
H1 : µ 6= µ0 .
Regra de decisão: Rejeitar H0 se a estatı́stica Zo for maior que o valor crı́tico Zc = Zα/2 ou menor que o
valor crı́tico −Zc = −Zα/2 , ou equivalentemente se |Zo | > ±Zα/2 .
Teste de hipótese unilateral à direita:

H0 : µ = µ0 .
H1 : µ > µ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica Zo for maior que o valor crı́tico Zc = Zα , ou equivalentemente
se |Zo | > |Zα |.
Teste de hipótese unilateral à esquerda:

H0 : µ = µ0 .
H1 : µ < µ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica Zo for menor que o valor crı́tico −Zc = −Zα , ou equivalen-
temente se |Zo | > |−Zα |.

32 Testes de hipótese para a média populacional assumindo variância

desconhecida
O objetivo do teste de hipótese para a média populacional µ com a variância populacional σ 2 desconhecida é
buscar indı́cios ou evidências estatı́sticas para rejeitar uma afirmação, até então considerada verdadeira, acerca do
parâmetro populacional µ, considerando um nı́vel de significância α.

Sabemos que, se X tem distribuição normal com média µ e variância σ 2 , ou seja, se X ∼ N µ, σ 2 , e se
X1 , X2 , ..., Xn compõem uma amostra aleatória extraı́da de X, então a média amostral X também tem distribuição
normal com média µ e variância n vezes menor que a variância da população, isto é,
X ∼ N µ, σ 2 /n .

(54)
Padronizando a distribuição da variável aleatória X, expressa em (54), temos então a distribuição normal
padrão, ou seja, Z ∼ N (0, 1), isto é,
X −µ
Z= σ . (55)
√
n
Quando a variância populacional σ é desconhecida, devemos utilizar a variância amostral S 2 e, neste caso,
2
temos que a expressão (55) é dada por

X −µ
t= S ∼ tn−1 (56)
√
n
Neste contexto, quando tivermos o interesse em testar hipóteses acerca da média populacional µ considerando
a variância populacional σ 2 desconhecida, calculamos a estatı́stica teste da amostra, denotada por to (Leia-se: “t
observado”) da seguinte forma:
X −µ
to = (“t observado”)
√S
n
que será comparado com o valor crı́tico tc (Leia-se: “t crı́tico”), oriundo da distribuição t-student com n − 1
graus de liberdade e um nı́vel de significância α.
A formulação do teste de hipótese para a média populacional µ é dada da seguinte forma:


H0 : µ = µ0 .
H1 : µ 6= µ0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for maior que o valor crı́tico tc = tα/2 ou menor que o
valor crı́tico −tc = −tα/2 , ou equivalentemente se |to | > ±tα/2 .

H0 : µ = µ0 .
H1 : µ > µ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for maior que o valor crı́tico tc = tα , ou equivalentemente
se |to | > |tα |.

H0 : µ = µ0 .
H1 : µ < µ 0 .
Regra de decisão: Rejeitar H0 se a estatı́stica to for menor que o valor crı́tico −tc = −tα , ou equivalente-
mente se |to | > |−tα |.

32.2 Exemplo 1: Aplicações na indústria de pneus
Um fabricante de pneus afirma que o tempo médio µ de vida útil dos seus pneus é de 20000 km. Entretanto há
uma desconfiança de que este tempo médio seja menor do que 20000 km. Para verificar a afirmação do fabricante
foi escolhido ao acaso uma amostra de n = 18 pneus e verificado o tempo de vida de cada um deles. Os resultados
encontram-se abaixo (tempo de vida útil em km):
Tempo de vida útil (em km) de 18 pneus
24800 22400 16100 11800 12700 17300
15900 18400 14400 14600 12000 14500
28000 26700 17900 8300 16200 21200
Considerando 5% de significância, fazer o teste de hipótese adequado para testar a afirmação do fabricante
de que o tempo médio de vida útil dos pneus é de 20000 km.
Solução: A partir do enunciado percebemos que trata-se de um teste unilateral à esquerda, pois existe uma
suspeita de que o tempo médio de vida útil dos pneus seja menor do que 20000 km. Dessa forma, a formulação da
hipótese é da seguinte forma:

H0 : µ = 20000.
H1 : µ < 20000.
A estatı́stica do valor crı́tico tc encontrado na distribuição t-student associada a um nı́vel de 5% de significância

com 17 graus de liberdade (n − 1) para um teste unilateral à esquerda é tc = −1, 7396. Esboçando a distribuição
t-student com as regiões de rejeição e aceitação de H0 temos:
Analisando a figura acima podemos perceber claramente que a hipótese nula H0 será rejeitada se a estatı́stica
teste to encontrada for numericamente menor que −1, 7396.
Os dados amostrais para o cálculo da estatı́stica teste to são: n = 18, X = 17400 km e S = 5370, 73 km.
Neste contexto, a estatı́stica observada da amostra to é calculada por
X −µ
to =
√S
n
17400 − 20000
= 5370,73
√
18
⇒ to = −2, 0539.
Dessa maneira, como to = −2, 0539 e tc = −1, 7396, temos que |to | > |tc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que o tempo médio de vida útil dos pneus
seja menor do que 20000 km, considerando 5% de significância.

32.3 Exemplo 2: Aplicações em pesquisas antropométricas
Em um grande estudo sobre a saúde pública dos estudantes universitários do municı́pio de Barreiras, no
Estado da Bahia, uma das variáveis estudadas foi a altura X dos indivı́duos. Há o interesse em verificar se a altura
média µ destes estudantes é de 170 cm. Para isso foi considerada uma amostra aleatória de n = 50 indivı́duos e os
resultados encontram-se abaixo:
Altura (em cm) de 50 estudantes universitários de Barreiras
198 174 183 180 181 183 177 175 159 188
169 167 169 160 168 196 180 189 167 174
141 188 181 180 189 147 163 197 145 162
161 147 171 158 151 162 164 164 159 172
174 176 175 161 153 174 173 153 160 193
Considerando 5% de significância vamos realizar o teste de hipótese adequado para verificar se a altura média
µ dos estudantes universitários de Barreiras é, de fato, 170 cm.
Solução: Como não há indicação de que essa altura média seja menor ou maior do que 170 cm, então trata-se
de um teste de hipótese bilateral. Dessa maneira, a formulação da hipótese fica da seguinte forma:

H0 : µ = 170 cm.
H1 : µ 6= 170 cm.

para o teste bilateral, isto é, 2, 5% (área da significância dividida por dois) com 49 graus de liberdade (n − 1) é
tc = ±2, 0096. Esboçando a distribuição t-student com as regiões de rejeição e aceitação de H0 temos:
Analisando a figura acima percebemos claramente que a hipótese nula H0 será rejeitada se a estatı́stica teste
to encontrada for numericamente menor do que −2, 0096 ou maior do que 2, 0096.
Os dados amostrais são: n = 50, X = 170, 62 cm e S = 14, 0304 cm. Portanto, a estatı́stica observada to da
amostra é dada por:
X −µ
to =
√S
n
170, 62 − 170
= 14,0304
√
50
⇒ to = 0, 3125.
Dessa maneira, como to = 0, 3125 e tc = ±2, 0096, temos que |to | < |tc | e segue a seguinte decisão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que a altura média µ dos estudantes univer-
sitários do municı́pio de Barreiras é de 170 cm, considerando 5% de significância.

32.4 Exemplo 3: Aplicações em estudos de rendimento acadêmico
O coordenador do curso de Geologia da Universidade Federal do Oeste da Bahia afirma que o rendimento
médio µ dos estudantes do curso na disciplina métodos estatı́sticos é de 4, 5. Entretanto, há uma desconfiança de
que este rendimento médio seja maior do que apenas 4, 5. Para verificar tal afirmação, foi considerada uma amostra
aleatória de 42 estudantes e verificado suas notas finais. Os resultados encontram-se no quadro abaixo:
Notas finais de 42 estudantes de Geologia na disciplina de Métodos Estatı́sticos

5, 0 2, 5 4, 3 4, 2 5, 2 4, 2 5, 2 6, 4 4, 5 4, 7 4, 5 7, 2 5, 2 3, 2
6, 5 5, 2 4, 8 4, 5 6, 8 4, 3 5, 7 5, 1 5, 1 5, 6 4, 4 5, 0 4, 8 4, 4
5, 3 5, 8 5, 1 4, 9 7, 4 6, 3 6, 0 3, 8 6, 3 6, 8 3, 2 6, 1 4, 4 3, 9
Considerando 5% de significância, fazer o teste de hipótese adequado para testar a afirmação do coordenador
do curso de Geologia de que o rendimento médio de seus alunos é de 4, 5.
Solução: Uma vez que existe uma desconfiança de que este rendimento médio µ seja maior do que 4, 5 então
trata-se de um teste de hipótese unilateral a direita. Portanto, a formulação da hipótese fica da seguinte forma:

H0 : µ = 4, 5.
H1 : µ > 4, 5.

para o teste unilateral à direita com 41 graus de liberdade (n − 1) é tc = 1, 6829. Esboçando a distribuição t-student
com as regiões de rejeição e aceitação de H0 temos:
Analisando a figura acima podemos verificar de forma clara que a hipótese nula H0 será rejeitada se a
estatı́stica teste to encontrada for numericamente maior do que 1, 6829.
Os dados amostrais são: n = 42, X = 5, 09 e S = 1, 0815. Portanto, a estatı́stica observada to da amostra é
dada por:
X −µ
to =
√S
n
5, 09 − 4, 50
= 1,0815
√
42
⇒ to = 3, 5383.
Dessa maneira, como to = 3, 5383 e tc = 1, 6829, temos que |to | > |tc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que o rendimento médio µ dos estudantes do
curso de Geologia em métodos estatı́sticos seja maior do que 4, 5 considerando 5% de significância.

33 Testes de hipótese para a proporção populacional
33.1 Objetivo
O objetivo do teste de hipótese para a proporção populacional p é buscar indı́cios ou evidências estatı́sticas
para rejeitar uma afirmação, até então considerada verdadeira, acerca do parâmetro populacional p, considerando
um nı́vel de significância α.

Vimos na Parte IV deste livro, que se X é uma variável aleatória discreta tal que X ∼ Bernoulli (p), então
a esperança matemática e a variância de X são dadas respectivamente por
E (X) = p e V ar (X) = p (1 − p) .
Se tomarmos X1 , X2 , ..., Xn uma amostra aleatória extraı́da de X, então a média amostral X nada mais é
que a proporção amostral, isto é
Número de sucessos
X = pb =
Tamanho da amostra
Vimos também que, se np > 5 e np (1 − p) > 5, então pb tem distribuição assintoticamente normal com média
p e com variância p(1−p)
n , isto é,

p (1 − p)
pb ∼ N p; , (57)
n
e padronizando a distribuição da variável pb expressa em (57), temos a distribuição normal padrão Z:
pb − p
Z=q ∼ N (0, 1) .
p(1−p)
n
Neste contexto, quando tivermos o interesse em testar hipóteses acerca da proporção populacional p, calcu-
lamos a estatı́stica teste da amostra, denotada por Zo (Leia-se: “Z observado”) da seguinte forma:
pb − p
Zo = q (“Z observado”)
p
b(1−bp)
n
que será comparada com o valor de Z crı́tico (Zc ) da distribuição normal padrão, considerando um nı́vel de
significância α.
A formulação do teste de hipótese para a proporção populacional p é dada da seguinte forma:

H0 : p = p0 .
H1 : p 6= p0 .

H0 : p = p0 .
H1 : p > p0 .
se |Zo | > |Zα |.

H0 : p = p0 .
H1 : p < p0 .

33.3 Exemplo 1: Aplicações em pesquisas de satisfação
A diretoria de uma grande empresa prestadora de serviços afirma que apenas 10% de seus clientes estão
insatisfeitos com relação ao serviço DELTA. Porém há uma desconfiança de que este percentual seja maior do que
10%. A fim de verificar a afirmação da diretoria, foi analisada uma amostra aleatória de 84 clientes, dentre os quais
15 disseram estar insatisfeitos. Considerando 5% de significância, fazer o teste de hipótese adequado para verificar
a afirmação da diretoria desta empresa de que 10% de seus clientes estão insatisfeitos com o serviço DELTA.
Solução: Uma vez que existe uma desconfiança de que esta proporção p seja maior do que 0, 10 então trata-se
de um teste de hipótese unilateral a direita. Dessa maneira, o teste se inicia com a sua formulação:
Formulação da hipótese:

H0 : p = 0, 10.
H1 : p > 0, 10.
A estatı́stica do valor crı́tico Zc encontrado na distribuição normal padrão Z associada a um nı́vel de 5% de

significância para o teste unilateral à direita é Zc = 1, 645. Esboçando a distribuição Z com as regiões de rejeição
e aceitação de H0 temos:
A figura acima mostra que a hipótese nula H0 será rejeitada se a estatı́stica teste to encontrada for numeri-
camente maior do que 1, 645.
Como foram observados 15 sucessos em uma amostra de tamanho n = 84, temos então uma proporção
amostral pb = 0, 1786. A estatı́stica teste observada Zo é dada por:
pb − p
Zo = q
p
b(1−bp)
n
0, 1786 − 0, 10
= q
0,1786(1−0,1786)
84
=⇒ Zo = 1, 8808.
Dessa maneira, como Zo = 1, 8808 e Zc = 1, 645, temos que |Zo | > |Zc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que a proporção p de clientes insatisfeitos
com o serviço DELTA seja maior do que 10%, considerando 5% de significância.

33.4 Exemplo 2: Aplicações em biologia
Pesquisadores da área de zoologia estão estudando uma determinada espécie de mamı́fero. Um dos objetivos
da pesquisa é verificar se a proporção de nascimentos de fêmeas é de 50%. Para isso, considerou-se uma amostra
aleatória de 345 indivı́duos, em que foram observados 187 indivı́duos fêmeas. Considerando 5% de significância,
fazer o teste de hipótese adequado para verificar se a proporção de nascimentos de fêmeas é de 50%.
Solução: Como não há indicação de que essa proporção p de fêmeas seja menor ou maior do que 50%, então
trata-se de um teste de hipótese bilateral. Dessa maneira, o teste se inicia com a sua formulação:

H0 : p = 0, 50.
H1 : p 6= 0, 50.
A estatı́stica do valor crı́tico Zc encontrado na distribuição normal padrão Z associada a um nı́vel de 5% de

significância para o teste bilateral, isto é, 2, 5% (área da significância dividida por dois), é Zc = ±1, 96. Esboçando
a distribuição Z com as regiões de rejeição e aceitação de H0 temos:
camente menor do que −1, 96 ou maior do que 1, 96.
pb − p 0, 5420 − 0, 50
Zo = q =q
p
b(1−bp) 0,5420(1−0,5420)
n 345
=⇒ Zo = 1, 5658.
Dessa maneira, como Zo = 1, 56588 e Zc = 1, 96, temos que |Zo | < |Zc | e segue a seguinte decisão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que a proporção p de nascimento de fêmeas
seja de 50% nesta espécie de mamı́fero, considerando 5% de significância.

33.5 Exemplo 3: Aplicações em empresas seguradoras de veı́culos
Uma grande empresa seguradora de veı́culos afirma que a proporção p de clientes do sexo feminino que
apresentam algum tipo de sinistro durante a vigência do contrato é de 30%. Entretanto, existe uma desconfiança
de que esta proporção seja menor do que 30%. Para verificar a afirmação da empresa, considerou-se uma amostra
aleatória de 188 clientes, dentre as quais 45 apresentaram sinistro. Considerando 5% de significância, fazer o teste
de hipótese adequado para verificar se a proporção p de clientes do sexo feminino que apresentam algum tipo de
sinistro durante a vigência do contrato é de 30%.
Solução: Uma vez que existe uma desconfiança de que esta proporção p seja menor do que 0, 30 então trata-se
de um teste de hipótese unilateral a esquerda. Dessa maneira, o teste se inicia com a sua formulação:

H0 : p = 0, 30.
H1 : p < 0, 30.
A estatı́stica do valor crı́tico Zc encontrado na distribuição normal padrão Z associada a um nı́vel de 5%

de significância para o teste unilateral à esquerda é Zc = −1, 645. Esboçando a distribuição Z com as regiões de
rejeição e aceitação de H0 temos:
camente menor do que −1, 645.
pb − p 0, 2394 − 0, 30
Zo = q =q
p
b(1−bp) 0,2394(1−0,2394)
n 188
=⇒ Zo = −1, 9472.
Dessa maneira, como Zo = −1, 9472 e Zc = −1, 645, temos que |Zo | > |Zc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que a proporção p de clientes do sexo feminino
que apresentam algum tipo de sinistro durante a vigência do contrato é menor do que 30%, considerando 5% de
significância.

34 Testes de hipótese para a variância populacional
O objetivo do teste de hipótese para a variância populacional σ 2 é buscar indı́cios ou evidências estatı́sticas
para rejeitar uma afirmação, até então considerada verdadeira, acerca do parâmetro populacional σ 2 , considerando

Vimos em Capı́tulos anteriores que, se X é uma caracterı́stica populacional tal que X ∼ N µ, σ 2 , e se
X1 , X2 , ..., Xn é uma amostra aleatória extraı́da de X com variância amostral S 2 , então:
(n − 1) S 2
Q= ∼ χn−1 . (58)
σ2
em que χn−1 denota a distribuição Qui-quadrado com n − 1 graus de liberdade.
Seja 1 − α a probabilidade da variável Q, com n − 1 graus de liberdade, tomar valores entre Qα/2 e Q1−α/2 ,
valores obtidos na tabela da distribuição Qui-quadrado tais que P Q < Qα/2 = P [Q > Q1−α/2 ] = α/2, conforme
Figura 41: Distribuição Qui-quadrado
Observando a equação Qα/2 ≤ Q ≤ Q1−α/2 vemos que podemos substituir Q pela expressão acima e então
obtemos
(n − 1) S 2
Qα/2 ≤ ≤ Q1−α/2 .
σ2
Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a variância,

(n − 1) S 2 (n − 1) S 2
< σ2 < .
Q1−α/2 Qα/2
Assim,
(n − 1) S 2 (n − 1) S 2

P < σ2 < = 1 − α.
Q1−α/2 Qα
Logo, o intervalo com nı́vel 100(1 − α)% de confiança para σ 2 é expresso por:
(n − 1) S 2 (n − 1) S 2

IC(σ 2 , 1 − α) = , .
Q1−α/2 Qα/2
Neste contexto, considerando o resultado em (58), quando tivermos o interesse em testar hipóteses acerca da
variância populacional σ 2 , calculamos a estatı́stica teste da amostra, denotada por Qo (Leia-se: “Q observado”)
da seguinte forma:
(n − 1) S 2
Qo = : “Q observado”.
σ2
que será comparado com o valor crı́tico Qc (Leia-se: “Q crı́tico”), oriundo da distribuição Qui-quadrado com
n − 1 graus de liberdade e um nı́vel de significância α.
A formulação do teste de hipótese para a variância populacional σ 2 é dada da seguinte forma:
H0 : σ 2 = σ02 .

H1 : σ 2 6= σ02 .
Regra de decisão: Rejeitar H0 se a estatı́stica Qo for maior que o valor crı́tico Qc = Qα/2 ou menor que o
valor crı́tico −Qc = −Qα/2 , ou equivalentemente se |Qo | > ±Qα/2 .
H0 : σ 2 = σ02 .

H1 : σ 2 > σ02 .
Regra de decisão: Rejeitar H0 se a estatı́stica Qo for maior que o valor crı́tico Qc = Qα , ou equivalentemente
se |Qo | > |Qα |.
H0 : σ 2 = σ02 .

H1 : σ 2 < σ02 .
Regra de decisão: Rejeitar H0 se a estatı́stica Qo for menor que o valor crı́tico −Qc = −Qα , ou equivalen-
temente se |Qo | > |−Qα |.

Exemplo 1. Uma máquina de preenchimento automático é utilizada para encher garrafas com detergente
lı́quido. Uma amostra aleatória de n = 20 garrafas resultou em uma variância da amostra do volume de enchimento
de S 2 = 0, 0153 ml2 . Se a variância do volume de enchimento exceder a 0, 01 ml2 , existirá uma proporção inaceitável
de garrafas cujo enchimento não foi completo ou foi em demasia. Considerando 5% de significância, vamos verificar
se há evidência nos dados da amostra sugerindo que o fabricante tenha um problema com garrafas com falta ou
excesso de detergente. Considere que o volume de enchimentos tem distribuição normal.
Resolução: Formulação da hipótese:
H0 : σ 2 = 0, 01.

H1 : σ 2 > 0, 01.
Considerando os graus de liberdade n − 1 = 19 e o nı́vel de significância de 5%, encontramos um valor da

estatı́stica Qui-quadrado crı́tico Qc = 30, 14 (Usar a Tabela da distribuição Qui-quadrado no anexo deste material
didático).
Esboçando a curva da distribuição temos:
Encontrando a estatı́stica Qui-quadrado observado, isto é, Qo , temos
(n − 1) S 2
Qo =
σ2
(20 − 1) 0, 0153
=
0, 01
Qo = 29, 07.
Podemos observar que Qo < Qc , isto é, a estatı́stica do “Q-observado” encontra-se dentro da região de
aceitação da hipótese nula H0 .
Conclusão: Aceita-se H0 , isto é, não há evidências estatı́sticas de que a variância seja maior do que 0, 01,
considerando 5% de significância.

35 Testes de hipótese para a diferença de duas médias populacionais

assumindo variâncias conhecidas
35.1 Objetivo
O objetivo dos testes de hipótese para a diferença de duas médias populacionais é verificar se há diferença
estatı́stica significativa entre duas médias populacionais. Neste Capı́tulo assumimos que as variâncias populacionais
são conhecidas.
Considere uma população A com caracterı́stica X, tal que X tem distribuição normal com média µX e
2
variância σX , isto é,
2

X ∼ N µX , σX
Vimos em capı́tulos anteriores que, se X1 , X2 , . . . , Xm é uma amostra aleatória extraı́da de X, então a média
amostral X tem distribuição normal com média µX e variância m vezes menor que a variância populacional, isto
é,
2

X ∼ N µX , σX /m
Considere também uma população B com caracterı́stica Y , tal que Y tem distribuição normal com média µY
e variância σY2 , isto é,
Y ∼ N µY , σY2

De forma análoga ao caso anterior, se Y1 , Y2 , . . . , Yn é uma amostra aleatória extraı́da de Y , então a média
amostral Y tem distribuição normal com média µY e variância n vezes menor que a variância populacional, isto é,
Y ∼ N µY , σY2 /n

Suponha independência estocástica entre as populações A e B. Sejam X1 , X2 , . . . , Xm uma amostra aleatória

extraı́da de X e sejam Y1 , Y2 , .. . , Yn uma amostra aleatória extraı́da de Y . Então a distribuição de probabilidades
da diferença amostral X − Y é tal que
σ2 σ2

µX − µY ; X + Y

X −Y ∼N . (59)
m n
Padronizando a distribuição (59) temos uma distribuição normal padrão, isto é:

X − Y − (µX − µY )
Z= q 2 2
∼ N (0, 1) . (60)
σX σY
m + n

Neste contexto, quando tivermos o interesse em testar hipóteses acerca da diferença de duas médias popula-
2
cionais µX − µY considerando as variâncias populacionais σX e σY2 conhecidas, calculamos a estatı́stica teste da
amostra, denotada por Zo (Leia-se: “Z observado”) da seguinte forma:

X − Y − (µX − µY )
Zo = q 2 2
: “Z observado” (61)
σX σY
m + n
que será comparado com o valor crı́tico Zc (Leia-se: “Z crı́tico”), oriundo da distribuição normal padrão e
considerando um nı́vel de significância α.
A formulação do teste de hipótese para a diferença de duas médias populacionais µX − µY é dada da seguinte
forma:

H0 : µX = µY .
H1 : µX 6= µY .

H0 : µX = µY .
H1 : µX > µY .
se |Zo | > |Zα |.

H0 : µX = µY .
H1 : µX < µY .

36 Testes de hipótese para a diferença de duas médias populacionais

assumindo variâncias desconhecidas
36.1 Objetivo
O objetivo dos testes de hipótese para a diferença de duas médias populacionais é verificar se há diferença
estatı́stica significativa entre duas médias populacionais. Neste Capı́tulo assumimos que as variâncias populacionais
são desconhecidas e iguais.
A fim de fixar a fundamentação teórica sobre este teste, apresentamos nesta Seção três exemplos de aplicação
prática. O primeiro exemplo diz respeito a um grande estudo sobre os impactos ambientais no Cerrado Baiano em
que pesquisadores coletaram dados de vazão de diversos rios. A intenção da pesquisa é verificar se a vazão média
µX do Rio Grande durante o perı́odo seco é menor que a vazão média µY durante o perı́odo chuvoso, próximo ao
municı́pio de Barreiras.
O segundo exemplo aborda a questão do rendimento acadêmico de estudantes da UFOB. A Coordenação
Geral dos Núcleos Acadêmicos da UFOB afirma que o rendimento médio dos estudantes do curso de Engenharia
Civil é igual ao rendimento médio dos estudantes do curso de Engenharia Ambiental na disciplina de Métodos
Estatı́sticos. Porém, existe uma suspeita de que o rendimento médio da Civil seja maior que o da Ambiental.
O terceiro exemplo está relacionado ao setor de serviços em que uma grande rede de lojas de calçados deseja
verificar se há diferença estatı́stica significativa entre os volumes médios de vendas da equipe A e da equipe B.
Assuma uma população A com caracterı́stica X, tal que X tem distribuição normal com média µX e variância
2
σX , isto é,
2

X ∼ N µX , σX
2
Vimos em capı́tulos anteriores que, se X1 , X2 , . . . , Xm é uma amostra aleatória extraı́da de X, e SX é a
variância desta amostra, então
2
(m − 1) SX
2 ∼ χm−1 .
σX
em que χm−1 denota a distribuição Qui-quadrado com m − 1 graus de liberdade. Sabemos também que
X − µX
t= SX
∼ tm−1 .
√
m
em que tm−1 denota a distribuição t-student com m − 1 graus de liberdade.
Assumindo também uma população B com caracterı́stica Y , tal que Y tem distribuição normal com média
µY e variância σY2 , isto é,
Y ∼ N µY , σY2

De forma análoga ao caso anterior, se Y1 , Y2 , . . . , Yn é uma amostra aleatória extraı́da de Y , e SY2 é a variância
desta amostra, então
(n − 1) SY2
∼ χn−1 .
σY2
em que χn−1 denota a distribuição Qui-quadrado com n − 1 graus de liberdade. Sabemos também que
Y − µY
t= SY
∼ tn−1 .
√
n

2
Se as variâncias populacionais σX e σY2 são desconhecidas, porém iguais, isto é, se
2
σX = σY2 = σ 2 ,
então temos

X − Y − (µX − µY )
t= q ∼ tm+n−2 (62)
2 1
+ n1

S m
em que tm+n−2 denota a distribuição t-student com m + n − 2 graus de liberdade, em que m é o tamanho da
primeira amostra e n é o tamanho da segunda amostra, e
2
2 (m − 1) SX + (n − 1) SY2
S =
m+n−2
2
é a média ponderada nos graus de liberdade das variâncias amostrais SX e SY2 .
Neste contexto, quando tivermos o interesse em testar hipóteses acerca da diferença de duas médias popula-
2
cionais µX − µY considerando as variâncias populacionais σX e σY2 desconhecidas e iguais, calculamos a estatı́stica
teste da amostra, denotada por to (Leia-se: “t observado”) da seguinte forma:

X − Y − (µX − µY )
to = q : “t observado” (63)
2 1
+ n1

S m
que será comparado com o valor crı́tico tc (Leia-se: “t crı́tico”), oriundo da distribuição t-student com m+n−2
graus de liberdade, em que m é o tamanho da primeira amostra e n é o tamanho da segunda amostra, e considerando
A formulação do teste de hipótese para a diferença de duas médias populacionais µX − µY é dada da seguinte
forma:

H0 : µX = µY .
H1 : µX 6= µY .
Regra de decisão: Rejeitar H0 se a estatı́stica to for maior que o valor crı́tico tc = tα/2 ou menor que o
valor crı́tico −tc = −tα/2 , ou equivalentemente se |to | > ±tα/2 .

H0 : µX = µY .
H1 : µX > µY .
se |to | > |tα |.

H0 : µX = µY .
H1 : µX < µY .

36.3 Exemplo 1: Aplicações em estudos ambientais
Pesquisadores de um grande estudo sobre os impactos ambientais no Cerrado Baiano coletaram dados de
vazão de diversos rios. Um dos objetivos da pesquisa é verificar se a vazão média µX do Rio Grande durante o
perı́odo seco é menor que a vazão média µY durante o perı́odo chuvoso, próximo ao municı́pio de Barreiras. Para
isso, considerou-se uma amostra de 24 medições diárias da vazão durante o perı́odo seco e 36 medições diárias
durante o perı́odo chuvoso, conforme o quadro abaixo (vazão em m3 /s):
Medições diárias da vazão do rio durante 24 dias (perı́odo seco)

5, 9 4, 5 3, 9 3, 3 3, 7 5, 3 6, 5 6, 6 3, 9 5, 9 3, 2 3, 8
5, 7 6, 5 3, 7 6, 5 3, 5 3, 2 6, 5 5, 3 5, 8 4, 3 4, 8 5, 8
Medições diárias da vazão do rio durante 36 dias (perı́odo chuvoso)
7, 1 7, 6 8, 5 7, 5 5, 0 3, 5 5, 0 6, 5 5, 7 3, 4 6, 7 5, 7
4, 7 5, 2 6, 6 2, 3 8, 3 5, 9 6, 4 4, 9 5, 7 5, 1 3, 9 7, 2
5, 9 6, 7 5, 1 6, 3 4, 2 6, 6 4, 2 5, 9 5, 6 5, 1 8, 6 5, 2
Considerando 5% de significância, verifique se a vazão média µX durante o perı́odo seco é menor que a vazão
média µY durante o perı́odo chuvoso, nesta localização.
Solução: Como desejamos verificar se a vazão média durante o perı́odo seco é menor que a vazão média durante
o perı́odo chuvoso, trata-se de um teste unilateral a esquerda, e sua formulação é tal que:

H0 : µX = µY .
H1 : µX < µY .
para o teste unilateral à esquerda com 58 graus de liberdade (24 + 36 − 2) é tc = −1, 6716. Esboçando a distribuição
2
Os dados amostrais associados ao perı́odo seco são m = 24, X = 4, 92 e SX = 1, 5052. Quanto ao perı́odo
2
chuvoso são n = 36, Y = 5, 77 e SY = 2, 0786. A variância ponderada nos graus de liberdade, por sua vez, é tal
que:
2
2 (m − 1) SX + (n − 1) SY2 (24 − 1) 1, 5052 + (36 − 1) 2, 0786
S = =
m+n−2 24 + 36 − 2
2
⇒S = 1, 8512.
Dessa forma, a estatı́stica to é dada por

X − Y − (µX − µY ) (4, 92 − 5, 77) − (0)
to = q = q
2 1 1
1 1

S m+n 1, 8512 24 + 36
⇒ to = −2, 3707.
Como to = −2, 3707 e tc = −1, 6716, temos que |to | > |tc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que a vazão média µX do Rio Grande durante
o perı́odo seco seja menor do que a vazão média µY durante o perı́odo chuvoso, próximo ao municı́pio de Barreiras,

36.4 Exemplo 2: Aplicações em estudos de comparação de rendimento acadêmico.
A Coordenação Geral dos Núcleos Acadêmicos da UFOB afirma que o rendimento médio dos estudantes
do curso de Engenharia Civil é igual ao rendimento médio dos estudantes do curso de Engenharia Ambiental na
disciplina de Métodos Estatı́sticos. Porém, existe uma suspeita de que o rendimento médio da Civil seja maior que
o da Ambiental. Para verificar a afirmação da coordenação, considerou-se uma amostra aleatória de 28 estudantes
do curso de Engenharia Civil e uma outra de 42 estudantes do curso de Engenharia Ambiental e tabulado suas
notas finais do semestre. Os resultados encontram-se no quadro abaixo:
Notas finais de 28 estudantes do curso de Engenharia Civil

7, 2 6, 5 5, 7 4, 1 6, 3 6, 4 5, 6 4, 9 6, 6 8, 3 6, 5 7, 2 5, 4 7, 4
6, 0 6, 6 5, 7 7, 2 5, 7 7, 3 5, 4 5, 4 5, 9 5, 3 6, 9 5, 2 7, 0 6, 9
Notas finais de 42 estudantes do curso de Engenharia Ambiental
5, 2 6, 5 6, 8 4, 6 3, 6 4, 8 5, 7 8, 7 7, 4 5, 4 4, 0 4, 2 5, 5 6, 3
5, 3 6, 6 7, 5 7, 2 7, 4 5, 0 7, 4 7, 3 2, 9 8, 7 8, 0 5, 0 5, 7 7, 9
2, 5 5, 3 5, 2 7, 5 4, 4 3, 0 6, 9 5, 5 9, 8 4, 3 4, 0 3, 6 5, 6 5, 7
Considerando 5% de significância, verifique se o rendimento médio dos estudantes do curso de Engenharia
Civil é igual ao rendimento médio dos estudantes do curso de Engenharia Ambiental na disciplina de Métodos
Estatı́sticos.
Solução: Como desejamos verificar se os rendimentos médios da Civil e da Ambiental são iguais, e há uma
suspeita de que o rendimento médio da civil seja maior, então trata-se de um teste unilateral a direita, e sua
formulação é tal que:
H0 : µX = µY .
H1 : µX > µY .
para o teste unilateral à direita com 68 graus de liberdade (28 + 42 − 2) é tc = 1, 6676. Esboçando a distribuição
2
Os dados amostrais associados à turma da civil são m = 28, X = 6, 24 e SX = 0, 8616. Quanto ao perı́odo
2
chuvoso são n = 42, Y = 5, 81 e SY = 2, 8963. A variância ponderada nos graus de liberdade, por sua vez, é:
2
2 (m − 1) SX + (n − 1) SY2 (28 − 1) 0, 8616 + (42 − 1) 2, 8963
S = =
m+n−2 28 + 42 − 2
2
⇒S = 2, 0884.

X − Y − (µX − µY ) (6, 24 − 5, 81) − (0)
to = q = q
2 1 1 1

S m + n1

2, 0884 28 + 42
⇒ to = 1, 2155.
Como to = 1, 2155 e tc = 1, 6676, temos que |to | < |tc | e segue a seguinte decisão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que o rendimento médio dos estudantes do
curso de Engenharia Civil seja igual ao rendimento médio dos estudantes do curso de Engenharia Ambiental na
disciplina de Métodos Estatı́sticos, considerando 5% de significância.

36.5 Exemplo 3: Aplicações no comércio.
Uma grande rede de lojas de calçados deseja verificar se há diferença estatı́stica significativa entre os volumes
médios de vendas da equipe A e da equipe B. Para isso, considerou-se uma amostra aleatória de m = 15 vendedores
da equipe A e n = 21 vendedores da equipe B, e os resultados encontram-se abaixo (vendas em milhares de dólares):
Volume de vendas de 15 vendedores (Equipe A)

36090 39074 28715 22353 28123
29586 22001 23143 21350 32412
26304 30342 23964 7268 26850
Volume de vendas de 21 vendedores (Equipe B)
24412 17619 31528 30350 31694 22837 32353
24737 23566 16641 21702 28708 32146 25062
27543 24595 27563 24928 16749 29732 31024
Considerando 5% de significância, verifique se o volume médio de vendas da equipe A é diferente do volume
médio de vendas da equipe B.
Solução: Como desejamos verificar se os volumes médios de vendas da equipe A e da equipe B são iguais, sem
suspeita alguma de que um seja maior ou menor que o outro, trata-se de um teste bilateral e sua formulação é:

H0 : µX = µY .
H1 : µX 6= µY .

para o teste bilateral com 34 graus de liberdade (15 + 21 − 2) é tc = ±2, 0322. Esboçando a distribuição t-student
2
Os dados amostrais associados à equipe A são m = 15, X = 26505 e SX = 54895875, 29. Quanto a equipe B
2
são n = 21, Y = 25975, 67 e SY = 24864231, 53. A variância ponderada nos graus de liberdade, por sua vez, é:
2
2 (m − 1) SX + (n − 1) SY2
S =
m+n−2
(15 − 1) 54895875, 29 + (21 − 1) 24864231, 53
=
15 + 21 − 2
2
⇒S = 37230202, 49.

X − Y − (µX − µY ) (26505 − 25975, 67) − (0)
to = q = q
2 1 1 1

S m + n1

37230202, 49 15 + 21
⇒ to = 0, 2566.
Como to = 0, 2566 e tc = ±2, 0322, temos que |to | < |tc | e segue a seguinte decisão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que o volume médio de vendas da equipe A é
igual ao volume médio de vendas da equipe B, considerando 5% de significância.

37 Testes de hipótese para dados pareados
37.1 Objetivo
De maneira geral, o objetivo do teste de hipótese para dados pareados é testar se existe diferença significativa
entre o valor médio antes e o valor médio depois para um mesmo grupo de indivı́duos, considerando um nı́vel de
significância α.
37.2 Construção do teste
Considere um conjunto de observações X1 , X2 , ..., Xn , tal que cada observação foi obtida em dois momentos
diferentes, isto é
X1(Antes) X1(Depois)
.. ..
. .
Xn(Antes) Xn(Depois)
Seja di a diferença entre a i-ésima observação antes e a mesma observação depois, isto é
di = Xi(Antes) − Xi(Depois) , para i = 1, 2, ..., n,
e sejam d e Sd a média e o desvio-padrão amostrais respectivamente dos di . Então a estatı́stica amostral t

observada é expressa por:
d − µd
to = Sd
: “t observado”
√
n
que será comparada com o valor crı́tico tc (Leia-se: “t crı́tico”) tabelado, oriundo da distribuição t-student
com n − 1 graus de liberdade, em que n é o tamanho da amostra.
A formulação do teste de hipótese para dados pareados é dada da seguinte forma:

H0 : µd = µd0 .
H1 : µd > µd0 .
se |to | > |tα |.

H0 : µd = µd0 .
H1 : µd < µd0 .

37.3 Exemplo 1: Aplicações em dieta de emagrecimento humano
Uma grande empresa de produtos alimentı́cios lançou no mercado uma nova ração humana para dieta de
emagrecimento. O nutricionista responsável pelo produto afirma que esta ração é eficaz para o emagrecimento
humano. Para verificar a afirmação do nutricionista considerou-se uma amostra aleatória de 15 indivı́duos, pesando-
os antes da dieta e após a dieta de 90 dias a base da ração. Os resultados encontram no quadro abaixo:
Pesos (em quilos) dos indivı́duos antes e após a dieta de 90 dias com a ração
Indivı́duos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Peso antes da dieta 79 83 97 66 104 80 89 81 93 77 76 88 83 76 90
Peso depois da dieta 99 72 88 79 93 70 93 109 64 76 70 83 81 80 83
Considerando 5% de significância, fazer o teste de hipótese adequado para verificar se esta ração é, de fato,
eficaz para o emagrecimento humano.
Solução: Como desejamos verificar se o peso médio dos indivı́duos diminuiu, então devemos verificar se a
diferença média dos desvios µd aumentou, ou seja, se µd é positiva. Portanto, trata-se de um teste unilateral a
direita, e sua formulação é tal que:

H0 : µd = 0.
H1 : µd > 0.

para o teste unilateral à direita com 14 graus de liberdade (n − 1) é tc = 1, 7613. Esboçando a distribuição t-student
A fim de calcular as estatı́sticas da amostra, consideremos o quadro abaixo com as diferenças di , com 1, 2, ..., 15.
Diferenças entre o peso antes e após a dieta de 90 dias com a ração

Indivı́duos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Peso antes da dieta 79 83 97 66 104 80 89 81 93 77 76 88 83 76 90
Peso depois da dieta 99 72 88 79 93 70 93 109 64 76 70 83 81 80 83
di = Xi(Antes) − Xi(Depois) −20 11 9 −13 11 10 −4 −28 29 1 6 5 2 −4 7
Dessa maneira, os dados amostrais são n = 15, d = 1, 4667 e Sd = 13, 9687. Dessa forma, a estatı́stica to é
d − µd 1, 4667 − 0
to = Sd
= 13,9687 = 0, 4067.
√ √
n 15
Portanto, como to = 0, 4067 e tc = 1, 7613, temos que |to | < |tc | e segue a seguinte decisão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que esta ração não seja eficaz para o emagre-
cimento humano, considerando 5% de significância.

37.4 Exemplo 2: Aplicações em dieta de engorda de frangos
O laboratório de uma grande indústria de avicultura lançou no mercado uma nova ração para dieta de engorda
de frangos. O pesquisador responsável pelo produto afirma que esta ração é eficaz para a engorda dos frangos.
Para verificar a afirmação do pesquisador considerou-se uma amostra aleatória de 12 indivı́duos, pesando-os antes
da dieta e após a dieta de 60 dias a base da ração. Os resultados encontram no quadro abaixo:
Pesos (em quilos) dos frangos antes e após a dieta de 60 dias com a ração
Indivı́duo 1 2 3 4 5 6 7 8 9 10 11 12
Peso antes da dieta 0, 7 1, 1 0, 9 1, 0 1, 0 1, 2 0, 8 0, 8 0, 9 0, 8 1, 0 1, 1
Peso depois da dieta 1, 1 1, 3 1, 1 0, 9 1, 3 1, 3 1, 3 1, 2 1, 1 1, 2 1, 3 1, 3
Considerando 5% de significância, fazer o teste de hipótese adequado para verificar se esta ração é, de fato,
eficaz para engorda dos frangos.
Solução: Como desejamos verificar se o peso médio dos indivı́duos aumentou, então devemos verificar se a
diferença média dos desvios µd diminuiu, ou seja, se µd é negativa. Portanto, trata-se de um teste unilateral à
esquerda, e sua formulação é tal que:

H0 : µd = 0.
H1 : µd < 0.

para o teste unilateral à esquerda com 11 graus de liberdade (n − 1) é tc = −1, 7959. Esboçando a distribuição
Diferenças entre o peso antes e após a dieta de 60 dias com a ração

Indivı́duo 1 2 3 4 5 6 7 8 9 10 11 12
Peso antes da dieta 0, 7 1, 1 0, 9 1, 0 1, 0 1, 2 0, 8 0, 8 0, 9 0, 8 1, 0 1, 1
Peso depois da dieta 1, 1 1, 3 1, 1 0, 9 1, 3 1, 3 1, 3 1, 2 1, 1 1, 2 1, 3 1, 3
di = Xi(Antes) − Xi(Depois) −0, 4 −0, 2 −0, 2 0, 1 −0, 3 −0, 1 −0, 5 −0, 4 −0, 2 −0, 4 −0, 3 −0, 2
Dessa maneira, os dados amostrais são n = 12, d = −0, 2583 e Sd = 0, 1621. Dessa forma, a estatı́stica to é
d − µd −0, 2583 − 0
to = Sd
= 0,1621 = −5, 5199.
√ √
n 12
Portanto, como to = −5, 5199 e tc = 1, 7959, temos que |to | > |tc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que esta ração seja eficaz para a engorda dos
frangos, considerando 5% de significância.

37.5 Exemplo 3: Aplicações em dieta de cães
Um laboratório de pesquisa está testando uma nova ração para filhotes de cães a base de uma combinação
de várias proteı́nas. Porém, há uma suspeita de que essa ração engorde os cães. Para testar essa suposição foram
usados 10 ratos de laboratório (cobaias) e administrou-se a ração por 30 dias. O quadro abaixo apresenta o peso
antes e depois da dieta (peso em gramas).
Pesos (em gramas) dos ratos antes e após a dieta de 30 dias com a ração
Indivı́duo 1 2 3 4 5 6 7 8 9 10
Peso antes da dieta 92 122 121 105 109 105 128 111 97 119
Peso depois da dieta 144 102 135 115 158 132 112 121 133 141
Considerando 5% de significância, verifique se esta ração realmente engorda os animais.
Solução: Como desejamos verificar se o peso médio dos ratos aumentou, então devemos verificar se a diferença
média µd é negativa. Portanto, trata-se de um teste unilateral a esquerda, e sua formulação é tal que:

H0 : µd = 0.
H1 : µd < 0.

para o teste unilateral à esquerda com 9 graus de liberdade (n − 1) é tc = −1, 8331. Esboçando a distribuição
Diferença entre o peso antes e após a dieta de 30 dias com a ração

Indivı́duo 1 2 3 4 5 6 7 8 9 10
di = Xi(Antes) − Xi(Depois) −52 20 −14 −10 −49 −27 16 −10 −36 −22
Dessa maneira, os dados amostrais são n = 10, d = −18, 4 e Sd = 24, 2221. Dessa forma, a estatı́stica to é
dada por
d − µd −18, 4 − 0
to = Sd
= 24,2221 = −2, 4022.
√ √
n 10
Portanto, como to = −2, 4022 e tc = −1, 8331, temos que |to | > |tc | e segue a seguinte decisão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que esta ração esteja engordando os animais,

38 Testes de hipótese para a diferença de duas proporções populacio-

nais
38.1 Objetivo
O objetivo deste teste é verificar se há diferença estatı́stica entre duas proporções populacionais (pA − pB ),
dado um determinado nı́vel de significância α. Consideramos nessa Seção três exemplos genéricos de aplicação
deste teste.
38.2 Construção e formulação do teste
Suponha duas populações: A população A tem caracterı́stica XA tal que
XA ∼ Bernoulli (pA )
e a população B tem a caracterı́stica XB tal que
XB ∼ Bernoulli (pB )
Considere uma amostra aleatória de tamanho m extraı́da da população A e uma amostra aleatória de tamanho
n extraı́da da população B. Definindo pbA e pbB como sendo as proporções amostrais de sucessos da amostra A e B
respectivamente, temos que a distribuição da diferença de proporções é tal que:

pA (1 − pA ) pB (1 − pB )
pbA − pbB ∼ N pA − pB ; + (64)
m n
Padronizando a distribuição dada em (64) temos:
pA − pbB ) − (pA − pB )
(b
Z=q ∼ N (0, 1) . (65)
pA (1−pA ) pB (1−pB )
m + n
Neste contexto, quando tivermos o interesse em testar hipóteses acerca da diferença de duas proporções
populacionais pA − pB , calculamos a estatı́stica teste da amostra, denotada por Zo (Leia-se: “Z observado”) da
seguinte forma:
pA − pbB ) − (pA − pB )
(b
Zo = q : “Z observado” (66)
p
bA (1−b
pA ) p
bB (1−bpB )
m + n
que será comparado com o valor crı́tico Zc (Leia-se: “Z crı́tico”), oriundo da distribuição normal padrão,
considerando um nı́vel de significância α.
A formulação do teste de hipótese para a diferença de duas proporções populacionais pA − pB é dada da

seguinte forma:

H0 : pA = pB .
H1 : pA 6= pB .

valor crı́tico −Zc = −tα/2 , ou equivalentemente se |Zo | > ±tα/2 .

H0 : pA = pB .
H1 : pA > pB .
se |Zo | > |Zα |.

H0 : pA = pB .
H1 : pA < pB .
38.3 Exemplo 1. Aplicação genérica
Considere duas populações independentes A e B. A população A tem caracterı́stica XA tal que XA ∼

Bernoulli (pA ) e a população B tem caracterı́stica XB tal que XB ∼ Bernoulli (pB ). Historicamente assumiu-se
que pA = pB , porém existe uma desconfiança de que o parâmetro pA seja maior do que pB . Para verificar se tal
desconfiança se justifica, considerou-se uma amostra de cada população, conforme quadro abaixo:
Amostra extraı́da Tamanho da Número de Proporção

da população: amostra de sucessos amostral
A m = 122 34 pbA = 0, 2787
B n = 148 21 pbB = 0, 1419
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se pA = pB contra pA > pB .
Solução: Trata-se de um teste de hipótese unilateral a direita e sua formulação é da seguinte forma:

H0 : pA = pB .
H1 : pA > pB .
A estatı́stica crı́tica Zc , que separa as regiões de rejeição e aceitação de H0 , para o teste unilateral a direita
considerando um nı́vel de significância de 5% é Zc = 1, 645. A estatı́stica observada Zo , por sua vez, é dada por:
p − pbB ) − (pA − pB )
(b (0, 2787 − 0, 1419) − (0)
Zo = qA =q = 2, 7523
p
bA (1−b
pA ) p
bB (1−bpB ) 0,2787(1−0,2787) 0,1419(1−0,1419)
m + n 122 + 148
⇒ Zo = 2, 7523.
Como Zo > Zc , temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências de que o parâmetro pA seja maior do que pB , considerando
5% de significância.


que pA = pB , porém existe uma desconfiança de que o parâmetro pA seja diferente de pB . Para verificar se tal

A m = 238 152 pbA = 0, 6387
B n = 194 132 pbB = 0, 6804
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se pA = pB contra pA 6= pB .

Solução: Trata-se de um teste de hipótese bilateral e sua formulação é da seguinte forma:

H0 : pA = pB .
H1 : pA 6= pB .
A estatı́stica crı́tica Zc , que separa as regiões de rejeição e aceitação de H0 , para o teste bilateral considerando
um nı́vel de significância de 5% é Zc = ±1, 96. A estatı́stica observada Zo , por sua vez, é dada por:
p − pbB ) − (pA − pB )
(b (0, 6387 − 0, 6804) − (0)
Zo = qA =q = −0, 9133
p
bA (1−b
pA ) p
bB (1−bpB ) 0,6387(1−0,6387) 0,6804(1−0,6804)
m + n 238 + 194
⇒ Zo = −0, 9133.
Como |Zo | < |Zc |, temos a seguinte conclusão:
Conclusão: Aceita-se H0 , isto é, não há evidências de que o parâmetro pA seja diferente do parâmetro pB ,

que pA = pB , porém existe uma desconfiança de que o parâmetro pA seja maior do que pB . Para verificar se tal

A m = 79 24 pbA = 0, 3038
B n = 93 18 pbB = 0, 1935
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se pA = pB contra pA > pB .
Solução: Trata-se de um teste de hipótese unilateral a direita e sua formulação é da seguinte forma:

H0 : pA = pB .
H1 : pA > pB .
A estatı́stica crı́tica Zc , que separa as regiões de rejeição e aceitação de H0 , para o teste unilateral a direita
considerando um nı́vel de significância de 5% é Zc = 1, 645. A estatı́stica observada Zo , por sua vez, é dada por:
p − pbB ) − (pA − pB )
(b (0, 3038 − 0, 1935) − (0)
Zo = qA =q = 1, 6705
p
bA (1−b
pA ) p
bB (1−bpB ) 0,3038(1−0,3038) 0,1935(1−0,1935)
m + n 79 + 93
⇒ Zo = 1, 6705.
Como |Zo | > |Zc |, temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências de que o parâmetro pA seja maior do que o parâmetro pB ,

39 Testes de hipóteses para duas variâncias populacionais
39.1 Objetivo
O objetivo deste teste de hipótese é verificar se há diferença estatı́stica significativa entre duas variâncias
populacionais.
39.2 Distribuição da estatı́stica F-Snedecor
2

Resultado
1: Considere X e Y duas variáveis aleatórias contı́nuas tal que X ∼ N µX , σX e Y ∼
N µY , σY2 . Sejam X1 , X2 , ..., Xm uma amostra aleatória (a.a) de tamanho m extraı́da de X. Sejam Y1 , Y2 , ..., Yn
amostra aleatória (a.a) de tamanho n extraı́da de Y . Então:
2
(m − 1)SX (n − 1)SY2
2 ∼ χ2m−1 e ∼ χ2n−1 . (67)
σX σY2
Onde χ2m−1 denota uma distribuição Qui-quadrado com (m − 1) graus de liberdade e χ2n−1 denota uma
distribuição Qui-quadrado com (n − 1) graus de liberdade.
Resultado 2: Se X ∼ χ2m−1 e Y ∼ χ2n−1 , então
X/ (m − 1) χ2 / (m − 1)
F = = m−1 ∼ Fm−1,n−1 (68)
Y / (n − 1) χ2n−1 / (n − 1)
Onde Fm−1,n−1 denota a distribuição F-Snedecor com (m − 1) graus de liberdade no numerador e (n − 1)

graus de liberdade no denominador.
Considerando os resultados expressos em (67) e (68) temos que
X/m χ2 / (m − 1)
F = = m−1 ∼ Fm−1,n−1
Y /n χ2n−1 / (n − 1)
(m−1)SX 2
(m−1)
2
σX
⇒F = (n−1)S 2
∼ Fm−1,n−1
Y
(n−1)
2
σY
2
Assumindo, pela hipótese nula H0 que as variâncias populacionais são iguais, isto é, σX = σY2 = σ 2 , temos
que
(m−1)SX2
(m−1)
σ 2
F = (n−1)S 2
∼ Fm−1,n−1
Y
(n−1)
σ 2
2
SX
⇒F = ∼ Fm−1,n−1 .
SY2

Neste contexto, quando tivermos o interesse em testar hipóteses acerca da diferença entre duas variâncias
2
populacionais σX e σY2 , calculamos a estatı́stica teste da amostra, denotada por Fo (Leia-se: “F observado”) da
seguinte forma:
2
SX
Fo = : “F observado”
SY2
que será comparado com o valor crı́tico Fc (Leia-se: “F crı́tico”), oriundo da distribuição F-Snedecor com
(m − 1) graus de liberdade no numerador e (n − 1) graus de liberdade no denominador., e considerando um nı́vel
de significância α.
A formulação do teste de hipótese para a diferença de duas variâncias populacionais é dada da seguinte forma:
2
= σY2 .

H0 : σ X
H1 : σX 6= σY2 .
2
Regra de decisão: Rejeitar H0 se a estatı́stica Fo for maior que o valor crı́tico Fc = F1−α/2 ou menor que
o valor crı́tico Fc = Fα/2 .

2
= σY2 .

H0 : σX
H1 : σX > σY2 .
2
Regra de decisão: Rejeitar H0 se a estatı́stica Fo for maior que o valor crı́tico Fc = F1−α .

2
= σY2 .

H0 : σX
H1 : σX < σY2 .
2
Regra de decisão: Rejeitar H0 se a estatı́stica Fo for menor que o valor crı́tico Fc = Fα .

40 Análise de variância
40.1 Introdução
A análise da variância é uma técnica estatı́stica criada por Sir Ronald Fisher em 1924 que pode ser usada
para testar a hipótese de que as médias de três ou mais populações são iguais. É também chamada de ANOVA,
do inglês Analysis of Variance e basicamente compara simultaneamente amostras de variáveis contı́nuas extraı́das
de populações com distribuições normais cujas variâncias populacionais não diferem entre si. Trata-se de um teste
estatı́stico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferença signi-
ficativa entre as médias populacionais e se os fatores exercem influência em alguma variável dependente, comparando
dois ou mais tratamentos. Existem muitas variações da ANOVA devido aos diferentes tipos de experimentos que
podem ser realizados. A Figura (42) mostra o esquema ilustrativo da análise de variância.
Figura 42: Ilustração da análise de variância.
40.2 Conceitos básicos
Fator: Variável independente.
Tratamento: Um tratamento é uma condição imposta ou objeto que se deseja medir ou avaliar em um expe-
rimento. Normalmente, em um experimento, é utilizado mais de um tratamento. Como exemplos de tratamentos,
podem-se citar: equipamentos de diferentes marcas, diferentes tamanhos de peças, doses de um nutriente em um
meio de cultura, quantidade de lubrificante em uma máquina, temperatura de armazenamento de um alimento.

As premissas ou pressupostos da Análise da Variância são:
As amostras são extraı́das de populações que têm distribuição normal;

As populações tem o mesmo valor de variância σ 2 .
As amostras são aleatórias e independentes.
O objetivo da ANOVA é decidir se as amostras foram retiradas de populações que têm a mesma média.
40.3 Fontes de variabilidade
A variabilidade refere-se às diferenças entre indivı́duos da mesma espécie. Em populações naturais a variabi-
lidade deve-se a fatores básicos como ambientais e genéticos. No caso da análise da variância, ela pode ser dividida
em duas: variabilidade entre e variabilidade dentro.
Variância entre: é a variabilidade entre os grupos (amostras). Quanto maior for a variabilidade entre,
maior a evidência que existem diferenças entre as populações das quais foram retiradas as amostras.
Variância dentro: é a variabilidade dentro de cada amostra. Quanto maior for a variabilidade dentro,
maior será a dificuldade para concluir que as populações sejam ou não diferentes.
40.4 Formulação da hipótese
Suponha k populações normais, cada qual com média µi , com i = 1, 2, ..., k e variância constante σ 2 . A
formulação da análise de variância é a seguinte:

H0 : µ1 = µ2 = µ3 = ... = µk
H1 : ∃µi 6= µj i = 1, 2, ..., k e j 6= i.
Sobre a formulação da hipótese numa análise de variância segue as seguintes considerações:
A hipótese nula (H0 ) afirma que as k populações sob análise tem o mesmo valor de média;
A hipótese alternativa (H1 ) afirma que há pelo menos uma população com média diferente.
A distribuição F ajudará na decisão de aceitar ou rejeitar a hipótese nula H0 . Para isso, vamos comparar
o valor de F crı́tico (Fc ), que vem da distribuição tabelada F-Snedecor com o valor de F observado (Fo ),
calculado por meio dos dados amostrais. A estatı́stica Fo é expresso por:
variâcia entre S2
Fo = = b2 ,
variância dentro Sω
em que
k 2 k
(ni − 1) Si2
P P
ni X i − X
i=1 i=1
Sb2 = e Sω2 = , (69)
k−1 k
P
ni − k
i=1

com
Sb2 : é a variância entre os grupos

Sω2 : é a variância dentro dos grupos
ni : é o tamanho da i-ésima amostra
X i : é a média da i-ésima amostra
Si2 : é a variância da i-ésima amostra
X : é a grande média, isto é, média de todas as observações amostrais.

k : é o número de amostras
k

P
ni = n : quantidade total de observações
i=1
Regra de decisão: Rejeita-se H0 se Fo > Fc , considerando um nı́vel de significância α (100%), conforme

figura abaixo.
40.5 Distribuição da estatı́stica F
2

Resultado
1: Considere X e Y duas variáveis aleatórias contı́nuas tal que X ∼ N µX , σX e Y ∼
N µY , σY2 . Sejam X1 , X2 , ..., Xm uma amostra aleatória (a.a) de tamanho m extraı́da de X. Sejam Y1 , Y2 , ..., Yn
amostra aleatória (a.a) de tamanho n extraı́da de Y . Então:
2
(m − 1)SX (n − 1)SY2
2 ∼ χ2m−1 e ∼ χ2n−1 . (70)
σX σY2
Onde χ2m−1 denota uma distribuição Qui-quadrado com (m − 1) graus de liberdade e χ2n−1 denota uma
2
distribuição Qui-quadrado com (n − 1) graus de liberdade. Pela análise da variância temos que σX = σY2 = σ 2 ,
isto é, possuem variâncias populacionais iguais.

Resultado 2: Se X ∼ χ2m−1 e Y ∼ χ2n−1 , então
X/ (m − 1) χ2 / (m − 1)
F = = m−1 ∼ Fm−1,n−1 (71)
Y / (n − 1) χ2n−1 / (n − 1)
Onde Fm−1,n−1 denota a distribuição F-Snedecor com (m − 1) graus de liberdade no numerador e (n − 1)

graus de liberdade no denominador.
Considerando os resultados expressos em (70) e (71) temos que
X/m χ2 / (m − 1)
F = = m−1 ∼ Fm−1,n−1
Y /n χ2n−1 / (n − 1)
(m−1)SX 2
(m−1)
2
σX
⇒F = (n−1)S 2
∼ Fm−1,n−1
Y
(n−1)
2
σY
2
Considerando que as variâncias populacionais são iguais, isto é, σX = σY2 = σ 2 , temos que
2
(m−1)SX
(m−1)
σ2
F = (n−1)S 2
∼ Fm−1,n−1
Y
(n−1)
σ2
2
SX
⇒F = ∼ Fm−1,n−1 .
SY2
2
Assumindo que SX seja a variância entre, ou seja, Sb2 e assumindo também que SY2 seja a variância dentro,
2
isto é, Sω , ambas expressas em (69), temos que a estatı́stica F observada (Fo ), tem distribuição F-Snedecor com
(k − 1) graus de liberdade no numerador e (n − k) graus de liberdade no denominador, isto é,
Sb2
Fo = ∼ Fk−1 ,n−k ,
Sω2
em que
k: é número de gruposou amostras;
n: é número total de observações;
k − 1: são os graus de liberdade do numerador (refere-se a variância entre);
n − k: são os graus de liberdade do denominador (refere-se a variância dentro),
A estatı́stica F observada (Fo ) obtida por meio do grupo de amostras, será comparada com a estatı́stica F
crı́tico (Fc ) oriunda da distribuição tabelada F-Snedecor com (k − 1) graus de liberdade no numerador e (n − k)
graus de liberdade no denominador, com nı́vel de significância α.
Observação: Graus de liberdade é, em estatı́stica, o número de determinações independentes (dimensão da

amostra) menos o número de parâmetros estatı́sticos a serem avaliados na população.

40.6 Exemplo de aplicação
Uma grande rede de Fast Food está monitorando o tempo de preparo do Burger King Size. Há o interesse em
verificar se o tempo médio de preparo em cinco lojas são iguais. Para isso mediu-se o tempo de preparo de uma
amostra de funcionários de cada loja. Os resultados encontram-se na tabela abaixo (resultados em segundos).
Tempos de preparo do Burger King Size.
Loja 1 Loja 2 Loja 3 Loja 4 Loja 5
119 186 68 72 112
146 39 83 98 85
169 168 94 68 69
97 139 123 41 88
105 45 79 107 145
165 − 109 129 −
103 − 99 − −
− − 124 − −
− − 85 − −
Considerando 5% de significância, faça a análise de variância para testar se o tempo médio de preparo do
Burger King Size das cinco lojas são iguais. Construa a tabela ANOVA. Faça comentários pertinentes.
Resolução: Para fins de fixação do conteúdo, vamos assumir o roteiro a seguir para a realização da análise
de variância.
Passo 1. Formular a hipótese e encontrar a média e variância de cada amostra.

H0 : µ1 = µ2 = µ3 = µ4 = µ5
H1 : ∃µi 6= µj i = 1, 2, ..., 5 e j 6= i.
Os dados amostrais são:
Tamanho da amostra Média Variância

Loja 1 n1 = 7 X 1 = 129, 14 S12 = 926, 81
Loja 2 n2 = 5 X 2 = 115, 40 S22 = 4775, 30
Loja 3 n3 = 9 X 3 = 96, 00 S32 = 382, 25
Loja 4 n4 = 6 X 4 = 85, 83 S42 = 995, 77
Loja 5 n5 = 5 X 5 = 99, 80 S52 = 874, 70
Passo 2. Encontrar a variância dentro (Sω2 )
k
(ni − 1) Si2
P
i=1
Sω2 = k
P
ni − k
i=1
(n1 − 1) S12 + (n2 − 1) S22 + (n3 − 1) S32 + (n4 − 1) S42 + (n5 − 1) S52
=
n1 + n2 + n3 + n4 + n5 − 5
(7 − 1) 926, 81 + (5 − 1) 4775, 30 + (9 − 1) 382, 25 + (6 − 1) 995, 77 + (5 − 1) 874, 70
=
7+5+9+6+5−5
36197, 71
=
27
Sω2 = 1340, 66.

Passo 3. Calcular a variância entre (Sb2 ). Fazendo n = n1 + n2 + n3 + n4 + n5 vamos encontrar primeiramente

a grande média:
n
1X
X = Xi
n i=1
119 + 146 + 169 + ... + 69 + 88 + 145
=
32
3359
=
32
X = 104, 97.
Encontrando a variância entre:
k
P 2
ni X i − X
i=1
Sb2 =
k−1
2 2 2 2 2
n1 X 1 − X + n2 X 2 − X + n3 X 3 − X + n4 X 4 − X + n5 X 5 − X
=
5−1
7 (129, 14 − 104, 97)2 + 5 (115, 40 − 104, 97)2 + 9 (96 − 104, 97)2 + 6 (85, 83 − 104, 97)2 + 5 (99, 8 − 104, 97)2
=
5−1
7689, 08
=
4
Sb2 = 1922, 27.
Passo 4. Calcular o Fo (F observado) e comparar com o Fc (F crı́tico) para concluir o teste.
Sb2
Fo =
Sω2
1922, 27
=
1340, 66
Fo = 1, 4338.
Com relação ao valor de Fc , temos que sua distribuição é
Fc = Fk−1,n−k = F5−1,32−5 = F4,27 .
Ou seja, temos uma distribuição F-Snedecor com 4 graus de liberdade no numerador e 27 graus de liberdade
no denominador. Para encontrar o valor do Fc na tabela F , observa-se o valor dos graus de liberdade do numerador
(k − 1), isto é 4 e o valor dos graus de liberdade do denominador (n − k), que nesse caso é 27. Considerando 5% de
signiificância e cruzando os dados na Tabela em que 4 é o número da coluna e 27 é o número da linha, encontramos
o valor Fc = 2, 73.
A figura abaixo ilustra a distribuição F com 4 graus de liberdade no numerador e 27 graus de liberdade no
denominador e as regiões de aceitação e rejeição da hipótese nula H0 .

Conclusão: Como Fo < Fc , aceita-se H0 , isto é, não há diferença estatı́stica significativa entre as médias
das populações, considerando 5% de significância.
Passo 5. Construir a Tabela ANOVA.
Fonte da Variação g.l Soma dos quadrados Média dos quadrados FO FC
Variabilidade entre (tratamento) 4 7689, 08 1922, 27 1, 4338 2, 73
Variabilidade dentro (resı́duo) 27 36197, 71 1340, 66
Variabilidade Total 31 43886, 79

40.7 Exercı́cio proposto
A diretoria de uma grande rede prestadora de serviços do ramo de TV por assinatura, deseja verificar se o
tempo médio de realização de um determinado serviço de 4 lojas são iguais. Para isto, considerou-se uma amostra
aleatória de técnicos funcionários de cada uma delas e os resultados encontram-se no quadro abaixo (tempos em
minutos):
Tempos de execução do serviço.
Loja 1 Loja 2 Loja 3 Loja 4
16 26 22 20
24 26 24 21
19 41 19 20
27 28 26 22
12 25 15 22
13 31 − 12
25 − − 24
30 − − 18
− − − 21
Assuma que o tempo X de execução de serviço tenha uma distribuição normal para cada loja e que a variância
σ 2 do tempo seja desconhecida porém igual a todas as lojas. Faça a análise de variância para testar se o tempo
médio da realização do serviço das quatro lojas são iguais considerando 5% de significância.
Resposta do exerı́cio
Os dados amostrais são:
Loja Tamanho da amostra Média amostral Variância amostral

1 n1 = 8 X 1 = 20, 75 S12 = 45, 07
2 n2 = 6 X 2 = 29, 50 S22 = 36, 30
3 n3 = 5 X 3 = 21, 20 S32 = 18, 70
4 n4 = 9 X 4 = 20, 00 S42 = 11, 75
A grande média obtida dos dados é X = 22, 46.

A variância obtida dentro dos grupos é Sω2 = 27, 74.
A variância obtida entre os grupos é Sb2 = 127, 72.
Dessa maneira, a tabela ANOVA é:
Fonte de variabilidade g.l Soma dos quadrados Média dos quadrados FO FC
Variabilidade entre (Tratamento) 3 383, 16 127, 72 4, 60 3, 01
Variabilidade dentro (Resı́duo) 24 665, 79 27, 74
Variabilidade Total 27 1048, 95
Como Fo > Fc , temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há pelo menos uma loja com o tempo médio da realização do serviço
diferente das demais, considerando 5% de significância.

41 Exercı́cios sobre testes de hipóteses e análise de variância
EXERCÍCIOS SOBRE TESTES DE HIPÓTESE PARA A MÉDIA POPULACIONAL

Exercı́cio 1. Os empregados de uma determinada empresa deveriam trabalhar, em média, 8h diárias. Para
investigar se os empregados estão trabalhando mais do que as horas previstas, o sindicato registou o número de
horas que n = 150 trabalhadores, escolhidos ao acaso, trabalharam num dia qualquer, tendo obtido os seguintes
150
P 150
P 2
resultados: Xi = 1498 e Xi − X = 600. Teste ao nı́vel de significância de 5%, se a empresa deverá ser
i=1 i=1
punida por exigir que os seus empregados trabalhem mais do que deviam. Ajuda: Trata-se de um teste de hipótese
unilateral a direita tal que H0 : µ = 8 horas contra H1 : µ > 8 horas.
Exercı́cio 2. Uma determinada empresa pretende importar um grande lote de instrumentos de precisão, para
os quais o fabricante garante um peso médio igual a µ = 100 gramas. Como o peso X é uma caracterı́stica
importante para a qualidade do produto, a empresa resolveu testar a veracidade da afirmação do fabricante. Para
isso, o departamento técnico da empresa extraiu uma amostra aleatória de n = 15 instrumentos, por meio da
15 15 2
Xi − X = 1674 gramas2 . Admitindo que
P P
qual se obtiveram os seguintes valores: Xi = 1407 gramas e
i=1 i=1
o peso X segue uma distribuição normal de probabilidades, teste ao nı́vel de significância de 1% a afirmação do
fabricante com relação aos pesos dos instrumentos. Ajuda: Trata-se de um teste de hipótese bilateral tal que
H0 : µ = 100 gramas contra H1 : µ 6= 100 gramas.
Exercı́cio 3. Suponha que um comerciante recebeu uma remessa de ovos com a garantia de serem da classe
A, isto é, ovos cujo peso X segue uma distribuição normal com média igual a µ = 55 gramas e desvio padrão igual
a σ = 8 gramas. Existe uma descofiança de que esses ovos tem um peso médio µ menor que 55 gramas. Como o
fornecedor só lhe concede 2 dias para reclamar, o comerciante resolveu pesar n = 10 ovos para testar se os mesmos
são da classe A, obtendo um peso médio amostral X = 57 gramas. Considerando um nı́vel de significância de
5%, esses ovos são mesmo da classe A? Ajuda: Trata-se de um teste de hipótese unilateral à esquerda tal que
H0 : µ = 55 gramas contra H1 : µ < 55 gramas.
Exercı́cio 4. Uma grande indústria de leite em caixinha afirma que o volume médio de leite por unidade é
de µ = 1 litro. Existe uma desconfiança de que esse volume médio µ seja menor que 1 litro. Em uma amostra
aleatória de n = 16 embalagens retiradas aleatoriamente da linha de produção desta indústria, obteve-se uma média
amostral X = 997 ml. Admitindo que o desvio padrão da população, considerada normal, é igual a σ = 5 ml, teste
ao nı́vel de 5% de significância a afirmação da indústria de que o volume médio das caixas de leite é µ = 1 litro.
Ajuda: Trata-se de um teste de hipótese unilateral à esquerda tal que H0 : µ = 1 litro contra H1 : µ < 1 litro.
Exercı́cio 5. Suponha que, numa determinada produção, o peso X de sacos de café é normalmente distribuı́do
com desvio padrão σ = 10 gramas. Admita, ainda, que a máquina de enchimento está regulada para sacos de
500 gramas. Nestas condições, para aferir o funcionamento da máquina analisou-se uma amostra de n = 9 sacos
aleatoriamente retirados da produção e o peso médio amostral foi X = 510 gramas. A um nı́vel de confiança de
95%, pode-se afirmar que a máquina não está corretamente regulada? Ajuda: Trata-se de um teste de hipótese
bilateral tal que H0 : µ = 500 gramas contra H1 : µ 6= 500 gramas.
Exercı́cio 6. Suponha que o rendimento X de um pé de tomateiro expresso em kg é uma variável aleatória
com distribuição normal com média 1 kg. Numa parte da produção foi utilizado um novo fertilizante. Observada
uma amostra de n = 10 pés de tomateiro da parte da produção em que foi utilizado o novo fertilizante obtiveram-se
os seguintes resultados:
1, 375 1, 223 1, 773 1, 752 0, 779 1, 407 1, 068 1, 633 1, 201 1, 042
O que se pode afirmar sobre o novo fertilizante? Verifique se o fertilizante aumentou o rendimento médio em quilos
do tomateiro a um nı́vel de 5% de significância. Ajuda: Trata-se de um teste de hipótese unilateral à direita tal
que H0 : µ = 1 kg contra H1 : µ > 1 kg.
Exercı́cio 7. O nı́vel de cálcio X apresenta-se no sangue dos mamı́feros em concentrações normalmente

distribuı́das com média µ = 6 mg por 100 ml do total de sangue. O desvio-padrão populacional dessa variável é
σ = 1 mg de cálcio por 100 ml do volume total de sangue. Uma variabilidade maior que essa pode ocasionar graves
transtornos na coagulação do sangue. Uma série de nove provas sobre o paciente revelou uma média amostral de
X = 6, 2 mg de cálcio por 100 ml do volume total de sangue e o desvio padrão amostral de S = 2 mg por 100 ml
de sangue. Existe evidência, para um nı́vel de significância de α = 0, 05, de que o nı́vel médio de cálcio para esse
paciente seja mais alto do que o normal? Ajuda: Trata-se de um teste de hipótese unilateral à direita tal que
H0 : µ = 6 mg por 100 ml contra H1 : µ > 6 mg por 100 ml.

Exercı́cio 8. Sabe-se que o peso médio populacional de mulheres entre 30 a 40 anos é de µ = 53 quilos.
Um estudo realizado em n = 16 mulheres de tal idade, que seguem uma dieta vegetariana, forneceu uma média
amostral X = 50 quilos e um desvio-padrão amostral S = 5 quilos. Considerando um nı́vel de significância de 5%,
a dieta é eficiente para a redução do peso? Ajuda: Trata-se de um teste de hipótese unilateral à esquerda tal que
H0 : µ = 53 kg contra H1 : µ < 53 kg.
Exercı́cio 9. O número X de acidentes mortais em uma cidade é normalmente distribuı́do com média, de
µ = 12 acidentes mensais. Após uma campanha de sinalização e de reparo das vias urbanas, contabilizaram-se, em
seis meses sucessivos: 8, 11, 9, 7, 10, 9 acidentes mortais. Considerando um nı́vel de significância de 1%foi efetiva a
campanha? e para um nı́vel de significância de 5%? Ajuda: Trata-se de um teste de hipótese unilateral à esquerda
tal que H0 : µ = 12 acidentes mortais contra H1 : µ < 12 acidentes mortais.
Exercı́cio 10. O fabricante de um determinado fertilizante afirma que a porcentagem de nitrogênio é normal-
mente distribuı́dos com média µ = 6% e desvio padrão σ = 0, 25%. Da produção diária deste fertilizante extraiu-se
uma amostra aleatória de n = 6 pequenas porções em que analisou-se a porcentagem de nitrogênio. Os resultados
foram os seguintes:
6, 2 5, 7 5, 8 5, 8 6, 1 5, 9
Considerando 5% de significância, teste a afirmação do fabricante de que a porcentagem média de nitrogênio deste
fertilizante seja µ = 6%. Ajuda: Trata-se de um teste de hipótese bilateral tal que H0 : µ = 6% de nitrogênio
contra H1 : µ 6= 6% de nitrogênio.
Exercı́cio 11. Uma grande indústria nacional de produtos de higiene e limpeza produz, dentre vários itens,
sabão em pó em caixas de 500 gramas. O setor de qualidade desta indústria está interessado em verificar se o peso
médio das caixas de sabão em pó é realmente 500 gramas. Para isso, extraiu-se uma amostra de n = 28 unidades
da linha de produção e pesadas cada uma delas. Os resultados encontram-se abaixo (peso em gramas):
488 503 472 497 516 495 517
493 524 513 541 517 516 482
485 475 485 499 540 486 498
481 521 496 501 502 539 474
Considerando 5% de significância, teste se o peso médio das caixas de sabão em pó é realmente 500 gramas. Ajuda:
Trata-se de um teste bilateral tal que H0 : µ = 500 gramas contra H1 : µ 6= 500 gramas.
Exercı́cio 12. A gerência de uma grande empresa afirma que o tempo X de montagem de um determinado
eletrodoméstico na linha de produção deve ser, em média, 60 minutos. Há uma desconfiança do setor de qualidade
que este tempo tem sido maior. Para verificar isso selecionou-se uma amostra aleatória de n = 16 unidades da
linha de produção a tabulou-se o tempo de montagem de cada eletrodoméstico. Os resultados encontram-se abaixo
(tempo em minutos).
68 41 65 75 72 71 48 76
66 39 65 81 49 79 79 54
Considerando 5% de significância, teste se o tempo de montagem é maior do que 60 minutos. Ajuda: Trata-se de
um teste unilateral à direita tal que H0 : µ = 60 minutos contra H1 : µ > 60 minutos.
Exercı́cio 13. Um fabricante de pneus afirma que o tempo médio de vida útil dos seus pneus é de 20.000 km.
Há uma desconfiança de que este tempo seja menor. Para verificar a afirmação do fabricante foi escolhido ao acaso
uma amostra de n = 18 pneus e verificado o tempo de vida de cada um deles. Os resultados encontram-se abaixo
(tempo de vida útil em km):
24800 22400 16100 11800 12700 17300
15900 18400 14400 14600 12000 14500
28000 26700 17900 8300 16200 21200
Considerando 5% de significância, teste a afirmação do fabricante de que o tempo de vida útil dos pneus é de
20.000 km. Ajuda: Trata-se de um teste de hipótese unilateral à esquerda.
Exercı́cio 14. Uma indústria metalúrgica exporta chapas de aço que devem seguir várias recomendações
técnicas, dentre elas que a sua largura deve ser 100 cm. Para verificar se a largura atende a especificação técnica,
extraiu-se uma amostra aleatória de n = 14 chapas de aço e foi medida a largura. Os resultados encontram-se
abaixo (largura em cm):
114 101 102 107 106 113 104 105 93 102 104 103 103 106
Considerando 5% de significância, teste se as chapas de aço produzidas por esta metalúrgica tem uma largura
média de 100 cm. Ajuda: Trata-se de um teste bilateral tal que H0 : µ = 100 cm contra H1 : µ 6= 100 cm.

TESTES DE HIPÓTESE PARA A PROPORÇÃO POPULACIONAL
Exercı́cio 1. Suponha que a direção comercial de uma determinada empresa pretende lançar um novo serviço
de telecomunicações. De acordo com critérios empresariais, o serviço só deverá ser lançado no mercado se houver
mais de 80% de aprovação, isto é, mais de 80% potenciais compradores. Assim, para averiguar a viabilidade
econômica do eventual lançamento do serviço, a empresa decidiu efetuar uma pesquisa de mercado por meio de
uma amostra aleatória de n = 400 grandes clientes, dentre os quais 340 foram favoráveis à aquisição do novo serviço.
Considerando um nı́vel significância de 5%, podemos concluir que a empresa deve optar pelo lançamento do novo
serviço? E considerando um nı́vel de significância de 1%? Ajuda: Trata-se de um teste de hipótese unilateral a
direita.
Exercı́cio 2. Já se sabe que 20% dos indivı́duos tratados cronicamente com digoxina sofrem de uma reação ad-
versa por sua causa. Durante um longo tempo, foi administrado a 40 pacientes digoxina com outros medicamentos,
e 20 desenvolveram a reação adversa. Pode-se afirmar que a associação entre a digoxina e os outros medicamentos
fizeram variar o número de reações adversas? Utilize um nı́vel de significância de 1% e 5%.
Exercı́cio 3. Sabe-se que 70% dos pacientes internados no hospital traumatológico requerem algum tipo de
intervenção cirúrgica. Para determinar se um novo método de fisioterapia reduz a porcentagem de intervenções
cirúrgicas, aplica-se esse método a 30 pacientes dos quais 17 requerem alguma intervenção cirúrgica. Comprove se
existem razões suficientes para afirmar a eficácia do método com um nı́vel de confiança de 95%.
Exercı́cio 4. O dono de uma ervanária produz um chá ao qual afirma que é 90% eficaz para curar dores de
cabeça. Num inquérito feito a 250 pessoas, 198 concordaram que o chá cura as dores de cabeça. Use α = 0, 05 e
responda:
a. Acha que o resultado do inquérito é compatı́vel com a pretensão do produtor?
b. A eficácia do chá para curar dores de cabeça é menor que 90%?
Exercı́cio 5. Uma empresa agrı́cola tem uma estação agronômica experimental onde produz novas variedades
de ervilhas. Uma amostra sobre as caracterı́sticas das ervilhas resultou em 310 ervilhas amarelas de casca macia,
109 ervilhas amarelas de casca dura, 100 ervilhas verdes de casca macia e 37 ervilhas verdes de casca dura. Para
uma experiência semelhante as leis de Mendel prevem que o resultado seja 56, 25% de ervilhas amarelas de casca
macia, 18, 75% de ervilhas amarelas de casca dura, 18, 75% de ervilhas verdes de casca macia e 6, 25% de ervilhas
verdes de casca dura. Serão os resultados da estação agronômica compatı́veis com as leis de Mendel para um nı́vel
de significância de 1%?
Exercı́cio 6. Um conhecido laboratório multinacional comercializa um antibiótico oral para tratamento de

pneumonia, sinusite e faringite. Uma propaganda na The Journal of the american Medical Association (JAMA)
afirma que o percentual de cura em adultos, no caso da pneumonia, é de 90%. Para testar a afirmação do laboratório,
realizou-se uma experiência com 50 pacientes, verificando-se a cura em 42 deles. Elabore um teste de hipótese que
vise avaliar a afirmação do laboratório assumindo um erro tipo I de 5%?
Exercı́cio 7. Dois dados (com cores diferentes) foram lançados 150 vezes tendo-se obtido por 20 vezes, uma
soma de pontos igual a 4. Acha que os dados são perfeitos (não-viciados)? Use um nı́vel de significância 5%.
Exercı́cio 8. Um laboratório lançou no mercado um novo medicamento para o tratamento de uma alergia,
afirmando a sua eficácia, num perı́odo de 8 horas, em pelo menos 90% dos casos. A sua aplicação a uma amostra
de 200 indivı́duos sofrendo de tal alergia, revelou-se eficaz em 160 casos. Use um nı́vel de significância 5% e 1%.
Exercı́cio 9. Um inquérito entre 300 eleitores do distrito A e 200 eleitores do distrito B, indicou que 56% e
48%, respectivamente, eram a favor de determinado candidato. Teste ao nı́vel de significância de 5% se a diferença
entre os distritos é significativa.
Exercı́cio 10. Suponha que determinado canal de televisão deseja saber qual foi a porcentagem de pessoas que
viram um determinado programa. Para isso, a diretoria realizou um estudo por meio de uma amostra aleatória em
que foram entrevistadas n = 220 pessoas, dentre as quais 132 disseram ter visto o referido programa.
a. Determine um intervalo de confiança de nı́vel 95% para porcentagem de pessoas em toda a população que
viu esse programa.
b. Qual deveria ser o número de pessoas entrevistadas para se obter um intervalo de confiança de nı́vel 95%
com metade da amplitude do anterior? (Admita que a proporção das pessoas que viram o programa se mantém.)
c. Considerando 5% de significância, pode-se afirmar que mais de metade das pessoas viram o programa?

TESTES DE HIPÓTESE PARA A VARIÂNCIA POPULACIONAL
Exercı́cio 1.) Determinada marca de óleo para carros afirma que o seu óleo é conhecido por durar, em média,
5.000km com uma variância igual a 250.000km2 . Admitindo que o tempo de duração segue uma distribuição normal,
teste a afirmação quanto à variância, a um nı́vel de significância 5%, com base nos seguintes valores do número de
quilômetros que 6 automóveis fizeram antes do óleo se queimar: 5020 6000 4500 5700 5500 4900
Exercı́cio 2.) Com certo método de ensino para crianças com necessidades especiais, obtém-se um desvio-
padrão de oito nas pontuações dos testes finais. Colocamos à prova um novo método, e se ensaia com 51 crianças.
As qualificações obtidas nos testes finais dão um desvio-padrão de dez. Pode-se assegurar que o novo método
produz diferentes variações nas pontuações? Considere α = 0, 05 e α = 0, 01.
Exercı́cio 3.) Uma máquina de ensacar açúcar está regulada para encher sacos com 16 quilos. Para controlar
o funcionamento escolheram-se ao acaso 15 sacos da produção de determinado perı́odo, tendo-se obtido os pesos
seguintes:
16, 1 15, 8 15, 9 16, 1 15, 8
16, 2 16, 0 15, 9 16, 0 15, 7
15, 8 15, 7 16, 0 16, 0 15, 8
Admitindo que o peso de cada saco possui distribuição Normal
a.) Que conclusão pode tirar sobre a regulagem da máquina? Use um nı́vel de significância de 5%.
b.) Que evidência fornece a concretização de s2 sobre a hipótese H0 : σ 2 = 0, 01? Use um nı́vel de significância
de 5% e 1%.
Exercı́cio 4.) Uma unidade industrial recebe carvão proveniente de duas minas e indicam-se abaixo os
resultados de análises efectuadas para determinar a percentagem de cinzas:
Mina A 5, 6 13, 2 12, 5 4, 6 13, 7 5, 5 13, 5
Mina B 8, 3 7, 6 4, 7 10, 2 9, 1 7, 5
Admitindo a normalidade das duas populações, pretende-se comparar os carvões fornecidos pelas duas minas
quanto à homogeneidade da variabilidade da percentagem de cinzas. Que evidência fornecem os dados sobre esta
hipótese?
TESTES DE HIPÓTESE PARA A DIFERENÇA DE DUAS MÉDIAS POPULACIONAIS
Questão 1. Sejam duas amostras, A e B, extraı́das de duas populações normais independentes, em que X
denota o volume mensal de vendas da fábrica A e Y denota o volume mensal de vendas da fábrica B, tais que:
15
P 15
P 2
Amostra A Xi = 763 e Xi − X = 1253, 73
i=1 i=1
P8 P8 2
Amostra B Yi = 454 e Yi − Y = 283, 50
i=1 i=1
Para os itens abaixo, considere 1% de significância.

a. Teste a hipótese H0 : µX = 50 contra H1 : µX 6= 50. Neste exemplo, o que significa este teste na prática?
b. Teste a hipótese H0 : µY = 50 contra H1 : µY 6= 50. Neste exemplo, o que significa este teste na prática?
c. Teste a hipótese H0 : µX = µY contra H1 : µX < µY . Neste exemplo, o que significa este teste na prática?
Exercı́cio 2. Os ı́ndices de rendimento acadêmico dos alunos do curso de economia e de administração apre-
sentados pela coordenação dos dois cursos estão sendo questionados pelos alunos. Há uma desconfiança de que
o rendimento médio dos alunos de economia seja diferente do rendimento médio dos alunos de administração.
Para averiguar isso, foram analisados as notas de 10 alunos de cada curso, escolhidos aleatoriamente dentre os
regularmente matriculados e os resultados encontram-se abaixo:
Média amostral Desvio-padrão amostral
Economia 7, 3 2, 6
Administração 7, 1 3, 1
Considerando 5% de significância, faça o teste de hipótese adequado para verificar a desconfiança de que o rendi-
mento médio dos alunos de economia seja diferente do rendimento médio dos alunos de administração. Ajuda:
Trata-se de um teste de hipótese bilateral.
Exercı́cio 3. Um estudo pretende avaliar o tempo médio de adaptação a novas funções em um complexo
industrial. Alguns pesquisadores suspeitam que o tempo médio de adaptação dos homens é menor do que o tempo

médio de adaptação das mulheres. Para confirmar isso se coletaram duas amostras aleatórias, uma com 21 homens
e outra com 21 mulheres, que foram acompanhados durante o perı́odo de adaptação, resultando nas seguintes
estatı́sticas para o tempo de adaptação (supostas provenientes de uma distribuição normal):
Média amostral Desvio-padrão amostral
Homens 3, 2 0, 8
Mulheres 3, 7 0, 9
Considerando 1% de significância, faça o teste de hipótese adequado para verificar se o tempo médio de adaptação
dos homens é menor do que o tempo médio de adaptação das mulheres. Ajuda: Trata-se de um teste de hipótese
unilateral à esquerda.
Exercı́cio 4. Deseja-se estudar o efeito da motivação sobre as vendas em uma rede varejista. De 24 novos
vendedores que estão sendo treinados 12 serão pagos por hora e 12 por comissão. Os indivı́duos são designados
aleatoriamente para os dois grupos. Abaixo estão os volumes de vendas (em milhares de dólares) para o primeiro
mês de emprego.
Por hora: Por comissão:
256 228 236 224 237 234
239 241 219 254 277 225
222 212 225 273 261 232
207 216 230 285 228 245
Considerando 1% de significância, há evidências de que incentivos por meio de comissões gerem uma venda média
maior? Ajuda: Trata-se de um teste de hipótese unilateral à direita.
Exercı́cio 5. As pilhas Duramais e Duramuito custam o mesmo preço. Para testar se ambas têm a mesma
duração média, recolheram-se duas amostras de 100 pilhas de cada marca, tendo-se obtido os seguintes resultados:
Marca Tamanho da amostra Média Desvio-padrão
Duramais 100 1180 120
Duramuito 100 1160 40
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se as marcas das pilhas têm a
mesma duração média. Refaça o teste considerando 1% de significância. Ajuda: Trata-se de um teste de hipótese
bilateral.
Exercı́cio 6. Muitos autores afirmam que os pacientes com depressão têm uma função cortical abaixo do normal,
devido a um risco sanguı́neo cerebral abaixo do normal. Em duas amostras de indivı́duos, uns com depressão e
outros sem, mediu-se um ı́ndice que indica o fluxo sanguı́neo na matéria cinza (dado em mg/(100g/min)), obtendo-
se:
Tamanho da amostra Média amostral Desvio-padrão amostral
Depressivos 19 47, 0 7, 8
Normais 22 53, 8 6, 1
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se os pacientes com depressão
têm uma função cortical abaixo do normal. Ajuda: Trata-se de um teste de hipótese unilateral à esquerda.
Exercı́cio 7. Desejou-se provar que a cirrose de fı́gado fazia variar o ı́ndice de atividade da colinesterase no
soro. Escolheram-se duas amostras aleatórias e independentes de indivı́duos. Os resultados foram:
Tamanho da amostra Média amostral Desvio-padrão amostral
Indivı́duos normais 20 1, 8 0, 4
Indivı́duos cirróticos 25 0, 66 0, 2
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se a cirrose de fı́gado faz variar
o ı́ndice de atividade da colinesterase no soro. Ajuda: Trata-se de um teste de hipótese bilateral.
Exercı́cio 8. Para decidir se deveria ou não lançar um novo produto no mercado, uma empresa de bens
alimentares fez um inquérito em 10 supermercados do Sul e 20 do Norte do paı́s, acerca do número de unidades X
do referido produto que estes esperam poder vender semanalmente. Obtiveram-se os seguintes resultados:
10 10
Xi2 = 102550
P P
Sul Xi = 1000
i=1 i=1
20 20
Yi2 = 75950
P P
Norte Yi = 1200
i=1 i=1
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se a venda média da região sul
é igual a venda média da região norte. Ajuda: Trata-se de um teste de hipótese bilateral.

TESTES DE HIPÓTESE PARA DADOS PAREADOS
Questão 1. Um laboratório de pesquisa está testando uma nova ração para filhotes de cães a base de uma
combinação de vários aminoácidos. Porém, há uma suspeita de que a ração engorde os cães. Para testar essa
suposição foram usados 10 ratos de laboratório (cobaias) e foi-lhes dados a ração por 30 dias. A tabela abaixo
apresenta o peso antes e depois da dieta (peso em gramas). Considerando um nı́vel de significância de 5% verifique
se a ração realmente engorda os animais. Ajuda: Trata-se de um teste de hipótese unilateral à esquerda.
Exercı́cio 2. Um grupo de 10 motoristas de táxi de uma companhia foi monitorado durante sua jornada de
trabalho e anotado seu o consumo de gasolina em quilômetros por litro(supõe-se que eles sigam uma distribuição
normal). Foram então submetidos a um curso onde receberam instrução sobre economia na direção e foram
novamente monitorados. Os resultados obtidos são suficientes para afirmar que o curso influenciou positivamente
na economia de combustı́vel?
Motorista 1 2 3 4 5 6 7 8 9 10
Antes 7, 6 7, 9 6, 5 7, 5 8, 9 7, 5 8, 2 7, 8 6, 7 8, 0
Depois 7, 6 8, 2 7, 2 7, 2 8, 5 7, 3 7, 8 7, 9 6, 4 7, 3
Faça um teste de hipóteses adequado para podermos verificar se o curso contribuiu para a economia de combustı́vel,
considerando 10% de significância. Ajuda: Trata-se de um teste de hipótese unilateral à direita.
Exercı́cio 3. Cinco operadores de um certo tipo de máquina são treinados em máquinas de duas marcas
diferentes, A e B. Mediu-se o tempo em segundos que cada um deles gastou na realização da mesma tarefa, e os
resultados estão abaixo:
Operador 1 2 3 4 5
Máquina A 80 72 65 78 85
Máquina B 75 70 60 72 78
Considerando 5% de significância, a máquina B é mais rápida que a máquina A? Ajuda: Trata-se de um teste
de hipótese unilateral à direita.
Exercı́cio 4. Em um programa de Controle de Enfermidades Crônicas (CEC), a hipertensão está incluı́da
como a primeira patologia a ser controlada; 15 pacientes hipertensos são submetidos ao programa e controlados
em sua pressão sistólica, antes e depois de seis meses de tratamento. Os dados são os seguintes:
Inı́cio 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220
Fim 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150
Considerando 5% de significância, o tratamento foi efetivo? Em outras palavras, o tratamento contribuiu para
diminuir a pressão sistólica dos indivı́duos hipertensos? Ajuda: Trata-se de um teste de hipótese unilateral à
direita.
Exercı́cio 5. É desencadeado um programa de controle da poluição de um rio em que são efetuadas medições,
antes de lançar a campanha antipoluição e um ano após. As medições são combinações de vários ı́ndices; quanto
maior for o valor resultante maior é a poluição. Obtiveram-se os seguintes resultados:
Ponto de controle 1 2 3 4 4 6 7 8 9 10
Antes da campanha 68 88 101 82 96 74 65 74 52 99
Um ano após a campanha 67 87 90 76 98 69 68 65 59 70
Considerando 5% de significância, faça o teste de hipótese adequado para verificar se a campanha antipoluição
reduziu de fato a poluição. Ajuda: Trata-se de um teste de hipótese unilateral à direita.
Exercı́cio 6. Em 11 ratos tratados cronicamente com álcool, foi medida a pressão sanguı́nea sistólica antes e
depois de 30 minutos de administrar a todos eles uma quantidade fixa de etanol, obtendo-se os seguintes resultados:
Ratos 1 2 3 4 5 6 7 8 9 10 11
Pressão sanguı́nea antes 126 120 124 122 130 129 114 116 119 112 118
Pressão sanguı́nea depois 119 116 117 122 127 122 110 120 112 110 111
Considerando um nı́vel significância de 5%, existe uma queda significativa da pressão sanguı́nea sistólica após
a ingestão de etanol? Ajuda: Trata-se de um teste de hipótese unilateral à direita.

EXERCÍCIOS SOBRE ANÁLISE DE VARIÂNCIA

Questão 1. Assumindo que as três amostras abaixo atendem às premissas da análise de variância, verifique se
as médias dessas três amostras são iguais, adotando um nı́vel de significância de 5%.
Amostra 1 Amostra 2 Amostra 3
2, 87 3, 23 2, 25
2, 16 3, 45 3, 13
3, 14 2, 78 2, 44
2, 51 3, 77 3, 27
1, 80 2, 97 2, 81
3, 01 3, 53 1, 36
2, 16 3, 01
Exercı́cio 2. Afirma-se que um determinado medicamento tem um tempo para fazer efeito igual para as
quatro faixas etárias para o qual foi desenvolvido. Para testar essa afirmação esse medicamento foi administrado a
8 indivı́duos para cada faixa de idade e foi verificado o tempo para fazer efeito em cada grupo. Teste a afirmação
sobre o medicamento considerando 5% de significância. Os resultados encontram-se abaixo (tempos em minutos):
Tempos (em minutos) para o medicamento fazer efeito
Faixa 1 Faixa 2 Faixa 3 Faixa 4
10 a 14 anos 15 a 19 anos 20 a 24 anos 25 a 29 anos
12 12 10 13
15 11 12 15
14 13 14 14
12 18 12 15
12 13 10 13
14 12 12 14
12 11 13 15
11 10 11 16
Exercı́cio 3. Foram desenvolvidos cinco diferentes tipos de rações para dieta de engorda de frangos. Foram
analisados 6 frangos para cada tipo de ração da seguinte forma: cada grupo de 8 frangos recebeu a ração durante
um mês. No final desse perı́odo foram pesados todos os frangos de todos os grupos e o interesse é saber se há
diferença entre o peso médio de cada grupo, ou seja, se há diferença na eficácia das rações. Os resultados estão
abaixo (pesos em gramas). Faça a análise de variância considerando 5% de significância.
Tipos de rações usadas para dieta de engorda de frangos.
Ração A Ração B Ração C Ração D Ração E
1193 906 1024 1149 1251
1571 920 1293 998 1180
1147 1299 1514 1023 1306
1383 1090 1133 1238 1474
1288 1153 1196 907 1440
1251 1199 1199 1063 938
Exercı́cio 4. Um grupo de 28 ratos de laboratório (cobaias) foi submetido a uma dieta de engorda da seguinte
forma: durante 30 dias um grupo de 6 ratos se alimentou da ração A, um grupo de 8 ratos da ração B, um grupo
de 5 ratos da ração C e um quarto grupo de 9 ratos da ração D. A tabela abaixo apresenta os pesos (em gramas)
de cada grupo, conforme tabela abaixo:
Tipos de rações usadas para dieta de engorda.
Grupo da Grupo da Grupo da Grupo da
ração A ração B ração C ração D
132 90 134 135
118 151 105 89
126 128 91 123
71 124 136 165
130 131 105 124
126 132 121
99 126
136 86
112
A ração mais eficaz é aquela onde seu grupo apresenta maior peso médio. Verifique com 5% de significância se
há diferença entre as populações, isto é, se há diferença na eficácia das rações.

Parte VI
Regressão Linear

42 Correlação
42.1 Introdução
Os estudos de Correlação bem como a teoria de Regressão tiveram origem no século XIX com Galton. Em
um de seus trabalhos ele estudou a relação entre a altura dos pais X e a altura Y dos filhos, procurando saber
como a altura do pai influenciava a altura do filho. Notou que se o pai fosse muito alto ou muito baixo, o filho
teria uma altura tendendo a média. Por isso, ele chamou de regressão, ou seja, existe uma tendência de os dados
regredirem a média. Em pesquisas é muito comum termos o interesse em verificar e estudar a relação entre duas
ou mais variáveis. Alguns exemplos são:
Altura X (em metros) de indivı́duos e o seu peso Y (em quilos).

Investimento X (em reais) em propaganda de uma empresa e o seu lucro bruto Y (em reais).
Profundidade X (em metros) no solo e teor Y de chumbo (em ppm).
Largura X (em metros) de um determinado rio e sua vazão Y (em cm3 /s).
Tempo X de exercı́cios fı́sicos diários e Índice de Massa Corporal Y .
A Análise de Correlação fornece um valor numérico, indicando de que forma duas variáveis variam conjunta-
mente, medindo a intensidade e a direção da relação linear ou não-linear entre duas variáveis9 . É uma medida que
atende à necessidade de se estabelecer a existência ou não de uma relação entre essas variáveis sem que, para isso,
seja preciso o ajuste de uma função matemática.
Além disso, não existe a distinção entre a variável explicativa e a variável resposta, ou seja, o grau de variação
conjunta entre X e Y é igual ao grau de variação entre Y e X. Daı́ o uso do nome correlação.
A Correlação é uma ferramenta importante para as diferentes áreas do conhecimento, não somente como
resultado final, mas como uma das etapas para a utilização de outras técnicas de análise. É fundamental a
importância de conhecer teoricamente e em conjunto os diferentes métodos e as suposições básicas requeridas por
parte de cada um deles, para que não se utilize medida de correlação inadequada.
É muito comum a adoção do Coeficiente de Correlação Linear de Pearson, por ser o mais conhecido, mas
em muitas situações isto se dá sem que se tenha a clareza de que este coeficiente mede a relação linear entre duas
variáveis. Já alguns métodos de uso mais restrito, tais como o Coeficiente de Correlação Bisserial, Ponto Bisserial
e o Tetracórico, são pouco abordados nas literaturas clássicas de Estatı́stica.
42.2 Um breve relato histórico sobre correlação
A teoria da análise de correlação teve inı́cio na segunda metade do século XIX. Francis Galton (1822-1911)
foi quem usou pela primeira vez os termos correlação e regressão. Publicou em 1869 o livro Hereditary Genius,
sobre a teoria da regressão (SCHULTZ e SCHULTZ, 1992).
Galton adotou o termo regressão quando observou que filhos de homens altos não são, em média, tão altos
quanto os pais, mas os filhos de homens baixos são, em média, mais altos do que os pais. Deve-se a Galton a forma
gráfica de representar as propriedades básicas do coeficiente de correlação. O termo “co-relação” foi proposto por
Galton, pela primeira vez, em 1888 (SCHULTZ e SCHULTZ, 1992).
A correlação foi observada analisando-se medidas antropométricas e definida da seguinte forma10 : “Two
organs are said to be co-related or correlated, when variations in the one are generally accompanied by variations in
the other, in the same direction, while the closeness of the relation differs in different pairs of organs”. (GALTON,
1889, p. 238)11 .
Seu aluno, Karl Pearson, desenvolveu a fórmula matemática que usamos até hoje e que tem seu nome em
homenagem. O sı́mbolo do coeficiente de correlação amostral r vem da primeira letra da palavra regressão, em
reconhecimento a Galton (SCHULTZ e SCHULTZ, 1992).
9 Variável é uma caracterı́stica da população, comum a todos os indivı́duos mas que variam de indivı́duo para indivı́duo. São
exemplos de variáveis: peso, altura, renda familiar.

10 Dois órgãos são ditos correlacionados quando a variação de um deles é geralmente acompanhada pela variação do outro, e na mesma
direção, enquanto a proximidade da relação difere em diferentes pares de órgãos.

11 O artigo pode ser obtido no endereço eletrônico: http://www.mugu.com/galton

42.3 Tipos de correlação
Ao se construir um gráfico cartesiano com os pares de informação referente a cada observação obtemos uma
nuvem de pontos definidos pelas coordenadas X e Y de cada ponto. Essa nuvem, por sua vez, definirá um eixo
ou direção que caracterizará o padrão de relacionamento entre X e Y . A regressão será linear se observada uma
tendência ou eixo linear na nuvem de pontos cartesianos.
A relação entre as variáveis será direta ou positiva quando os valores de Y aumentam quando o valores de
X aumentam, isto é, o crescimento de Y está relacionado ao crescimento de X. Por outro lado, será inversa ou
negativa quando os valores de Y diminuem quando os valores de X aumentam, isto é, o decrescimento de Y está
relacionado com o crescimento de X.
É importante ressaltar que correlação não significa causalidade. Um dos equı́vocos de interpretação mais
comuns é assumir que correlações significativas implicam em uma relação de causa e efeito entre duas variáveis.
Esta interpretação ou perspectiva dos dados é incorreta. Além disso, é necessário termos cautela ao assumir que
há correlação somente porque duas variáveis possuem o mesmo padrão de variabilidade, já que a correlação pode
ser devida a uma terceira variável influenciando as duas primeiras.
Há diversos tipos de correlações entre duas variáveis. As três figuras a seguir apresentam três diagramas de
dispersão, representando uma correlação positiva, negativa e nula nesta ordem.
As três figuras a seguir apresentam três diagramas de dispersão representando uma correlação perfeitamente
positiva, perfeitamente negativa e perfeitamente nula nesta ordem.
Em geral, a relação não é perfeita. Na prática os pontos não se situam perfeitamente sobre a função que
relaciona as duas variáveis. Mesmo quando eventualmente existe uma relaçãao exata entre as variáveis como por
exemplo temperatura e pressão, variações em torno da curva aparecerão devido a erros de medidas.
Correlação não linear: As figuras a seguir apresentam seis diagramas de dispersão representando alguns
exemplos de correlações não lineares entre as variáveis Xe Y .

Frequentemente, o tipo de curva a ser ajustada é sugerido por evidência empı́rica ou por argumentos teóricos.
O modelo a ser adotado depende de vários fatores, por exemplo, natureza das variáveis, relação linear ou não,
homogeneidade de variâncias ou não, tipos de erros, independência dos erros etc.
42.4 Coeficiente de Correlação Linear de Pearson
Consideremos n pares de observações (X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ). O coeficiente de correlação linear de
Pearson é um coeficiente definido no intervalo [−1, 1] que mede o grau de correlação entre as variáveis X e Y , sendo
expresso por:
n
P n
P n
P
n Xi Yi − Xi Yi
i=1 i=1 i=1
rXY = s 2 s 2 . (72)
n n n n
Xi2 Yi2
P P P P
n − Xi n − Yi
i=1 i=1 i=1 i=1
Para facilitar sua obtenção, o coeficiente de correlação de Pearson pode ser desmembrado da seguinte forma:
n
X n
X n
X
SXY = n Xi Yi − Xi Yi
i=1 i=1 i=1
n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
n n
!2
X X
SY Y = n Yi2 − Yi
i=1 i=1

Logo, temos que o coeficiente de correlação linear de Pearson rXY expresso em (72) pode ser reescrito como:
SXY
rXY = √ √ , −1 ≤ rXY ≤ 1.
SXX SY Y
O coeficiente de correlação linear de Pearson sempre assume valores numéricos compreendidos no intervalo
[−1 , 1]. Quanto mais próximos do valor numérico 1 ou −1, mais fortemente correlacionados positiva ou negativa-
mente serão. Por outro lado, quanto mais próximo do valor numérico 0, menos correlacionados serão.
É trivial verificar que o numerador em (72) é o núcleo da covariância12 amostral entre X e Y , assim como
o denominador é a raiz do produto das variâncias13 amostrais de X e de Y , isto é, o denominador é o produto
dos desvios-padrão. Isto se dá porque o coeficiente de correlação linear de Pearson (rXY ) nada mais é que um
estimador do coeficiente de correlação populacional ρ (Letra grega minúscula ρ. Lê-se “rô”).
Cov (X, Y )
ρXY = p p .
V ar (X) V ar (Y )
A interpretação do coeficiente de correlação de Pearson de acordo com sua escala de classificação varia de
autor para autor, a depender da natureza das variáveis de estudo e da área de conhecimento de tais variáveis.
Em geral adota-se uma escala em que as correlações observadas são classificadas em forte, fraca ou nula, conforme
abaixo:
Se 0, 95 < rXY < 1 : As observações de Y estão fortemente e positivamente correlacionadas com as observações
de X.
Se 0, 50 < rXY < 0, 95 : As observações de Y estão positivamente correlacionadas com as observações de X.
Se 0, 10 < rXY < 0, 50 : As observações de Y estão fracamente e positivamente correlacionadas com as

observações de X.
Se −0, 10 < rXY < 0, 10 : Correlação nula entre as observações de Y e X.
Se −0, 50 < rXY < −0, 10 : As observações de Y estão fracamente e negativamente correlacionadas com as
Se −0, 95 < rXY < −0, 50 : As observações de Y estão negativamente correlacionadas com as observações de
X.
Se −1 < rXY < −0, 95 : As observações de Y estão fortemente e negativamente correlacionadas com as
É importante ressaltar que diversos autores estabelecem diferentes escalas de classificação para o coeficiente
de correlação linear de Pearson para duas variáveis. A proposição de qualquer escala pelos autores é apenas uma
proposta de direcionamento (escala padrão ou escala “Standard”) e que os pesquisadores da área têm autonomia
para determinar o que é ou não fortemente correlacionado (VIEIRA e HOFFMANN, 1998).
12 A covariância entre X e Y é definida como a diferença entre a esperança do produto e o produto das esperanças, isto é, Cov (X, Y ) =
E (XY ) − E (X) E (Y )
13 A variância de uma variável X é definida como a diferença entre a esperança do segundo momento e o quadrado da esperança do
primeiro momento, isto é, V ar (X) = E X 2 − [E (X)]2


43 Regressão Linear Simples
A utilização de modelos de regressão, pode ter por objetivos:
Predição: Uma vez que se espera que a maior parte da variação de Y seja explicada pelas variável X, então,
pode-se utilizar o modelo para obter valores de Y correspondentes a valores de X que não estavam entre os dados.
Esse processo denomina-se predição e, em geral, são usados valores de X que estão dentro do intervalo de variação
estudado. A utilização de valores fora desse intervalo recebe o nome de extrapolação e, deve ser usada com muito
cuidado, pois o modelo adotado pode não ser correto fora do intervalo estudado. Este, talvez, seja o uso mais
comum dos modelos de regressão.
Seleção de variáveis: Frequentemente, não se tem idéia de quais são as variáveis que afetam significativa-
mente a variação de Y . Para responder a esse tipo de questão, conduzem-se estudos onde está presente um grande
número de variáveis. A análise de regressão pode auxiliar no processo de seleção de variáveis, eliminando aquelas
cuja contribuição não seja importante.
Estimação de parâmetros: Dado um modelo e um conjunto de dados (amostra) referente as variáveis
resposta e preditoras, estimar parâmetros, ou ainda, ajustar o modelo aos dados, significa obter valores (estimativas)
para os parâmetros, por algum processo, tendo por base o modelo e os dados observados. Em alguns casos, o valor
do coeficiente tem valor por si só. Como exemplo, pode-se citar o estudo de estabilidade de variedades. Em outros
casos, o interesse está em uma função dos parâmetros.
Inferência: O ajuste de um modelo de regressão tem, em geral, por objetivos básicos, além de estimar os
parâmetros, realizar inferências sobre eles, tais como testes de hipóteses e intervalos de confiança.
43.1 Modelo Linear Simples
O modelo linear teórico é expresso por:
Yi = β0 + β1 Xi + i , i = 1, 2, ..., n,
em que
Yi : é denominado de variável resposta ou variável dependente.
Xi : é denominado de variável de entrada, variável independente, variável explicativa, variável preditora ou

covariável.
β0 : é o coeficiente linear da reta. Denota o valor médio de Y quando X = 0.
β1 : é o coeficiente angular da reta. Denota o aumento quando β1 > 0 ou redução quando β1 < 0 na média
de Y a cada 1 unidade de X.
i : é o erro aleatório associado ao modelo, que segue o modelo normal de probabilidades tal que i ∼ N 0, σ 2 ,

com i = 1, 2, ..., n.
As pressuposições do modelo são:
A relação entre X e Y é linear.
Os valores de X são fixos (ou controlados).
A média do erro aleatório é nula, isto é, E (i ) = 0, i = 1, 2, ..., n.
A variância do erro aleatório é uma constante σ 2 , isto é, V ar (i ) = σ 2 , i = 1, 2, ..., n. Isto implica em
V ar (Yi ) = σ 2 , i = 1, 2, ..., n.

O erro de uma observação é independente do erro de outra observação, isto é, Cov (i , j ) = 0.
Os erros têm distribuição normal14 .
Os estimadores βb1 e βb0 para os coeficientes de regressão β1 e β0 são dados respectivamente por15 :
SXY
βb1 = e βb0 = Y − βb1 X,
SXX
em que
n n
SXY = n
P P
Xi Yi − Xi Yi .
i=1 i=1
n
n
2
SXX = n Xi2 −
P P
Xi .
i=1 i=1
n
Y = 1
P
n Yi .
i=1
n
X= 1
P
n Xi .
i=1
Dessa maneira, o modelo linear ajustado é expresso por:
Yb = βb0 + βb1 X.
14 A suposição de normalidade é necessária para a elaboração dos testes de hipóteses e para a construção de intervalos de confiança
15 Um estimador é uma função definida a partir dos dados observados com o objetivo de estimar parâmetros populacionais desconhe-
cidos. No caso dos modelos de regressão, os parâmetros são também chamados de coeficientes de regressão.

43.2 Exemplo de aplicação na engenharia agronômica
Os dados apresentados no quadro abaixo referem-se a sete indivı́duos independentes de pé de feijão em que
a variável resposta Y denota a altura do pé de feijão (em centı́metros), e a variável explicativa X representa a sua
idade (em semanas):
Idade do feijão (em semanas) X 1 2 3 4 5 6 7 8 9

Altura do feijão (em cm) Y 5 12 16 22 34 38 41 45 50
a. Construir o gráfico de dispersão X versus Y , isto é, idade em semanas do pé de feijão versus sua altura
em centı́metros.
b. Determinar o coeficiente de correlação de Pearson.
c. Ajustar o modelo linear aos dados.
Solução do item a. O gráfico de dispersão neste exemplo é
Solução do item b. Para determinarmos o coeficiente de correlação linear de Pearson e ajustar o modelo
linear Yb = βb0 + βb1 X, é necessário determinar as seguintes estatı́sticas amostrais a partir das variáveis X e Y :
n
O produto XY de cada par (X, Y ) e a soma do produto dada por
P
Xi Yi .
i=1
n
O quadrado de cada observação X (dado por X 2 ) e a soma dos quadrados dada por Xi2 .
P
i=1
n
O quadrado de cada observação Y (dado por Y 2 ) e a soma dos quadrados dada por Yi2 .
P
i=1
Dessa maneira, segue abaixo a Tabela necessária para os cálculos das estatı́sticas amostrais.

X Y XY X2 Y2
1 5 5 1 25
2 12 24 4 144
3 16 48 9 256
4 22 88 16 484
5 34 170 25 1156
6 38 228 36 1444
7 41 287 49 1681
8 45 360 64 2025
9 50 450 81 2500
45 263 1660 285 9715
Calculando a estatı́stica SXY , isto é, a estatı́stica amostral que envolve as variáveis X e Y :
n
X n
X n
X
i=1 i=1 i=1
= 9 × 1660 − 45 × 263
SXY = 3105
Calculando a estatı́stica SXX, isto é, a estatı́stica amostral que envolve somente a variável X:
n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
2
= 9 × 285 − 45
SXX = 540
Calculando a estatı́stica SY Y , isto é, a estatı́stica amostral que envolve apenas a variável Y :
n n
!2
X X
SY Y = n Yi2 − Yi
i=1 i=1
2
= 9 × 9715 − 263
SY Y = 18266
O coeficiente de correlação linear de Pearson deste exemplo é dado por
SXY
rXY = √ √
SXX SY Y
3105
= √ √
540 18266
rXY = 0, 9887.
Solução do item c. Para ajustarmos o modelo linear, precisamos encontrar os valores numéricos de βb1 e
βb0 .
Estimação dos coeficientes do modelo linear: Cálculo do coeficiente angular βb1 :

SXY 3105
βb1 = =
SXX 540
⇒ βb1 = 5, 75.
Cálculo do coeficiente linear βb0 :
βb0 = Y − βb1 X

263 45
= − 5, 75
9 9
⇒ βb0 = 0, 4722.
Dessa maneira, temos o seguinte modelo linear ajustado:
Yb = 0, 4722 + 5, 75X.
A figura abaixo apresenta o ajuste do modelo. A linha vermelha é a reta ajustada Yb = 0, 4722 + 5, 75X.
43.3 Resı́duos
Em regressão linear definimos o i-ésimo resı́duo ei , i = 1, 2, ..., n, como sendo a diferença entre a i-ésima
observação da variável resposta, Yi , e a i-ésima observação predita Ybi pelo modelo, isto é,
ei = Yi − Ybi , i = 1, 2, ..., n.
Resultado: A soma dos resı́duos de regressão sempre é nula, isto é,
n
X
ei = 0. (73)
i=1

Demonstração de (73).
n
X n
X
ei = Yi − Ybi .
i=1 i=1
Como Ybi = βb0 + βb1 Xi , i = 1, 2, ..., n, então
n
X n h
X i
ei = Yi − βb0 + βb1 Xi
i=1 i=1
n h
X i
= Yi − βb0 − βb1 Xi
i=1
Como βb0 = Y − βb1 X, temos
n
X n h
X i
ei = Yi − Y − βb1 X − βb1 Xi
i=1 i=1
n
X
= Yi − Y + βb1 X − βb1 Xi
i=1
n
X n
X n
X n
X
= Yi − Y + βb1 X − βb1 Xi
i=1 i=1 i=1 i=1
Xn n
X
= Yi − nY + βb1 nX − βb1 Xi
i=1 i=1
n n
nX nX
= Yi − nY + βb1 nX − βb1 Xi
n i=1 n i=1
= nY − nY + βb1 nX − βb1 nX
n
X
ei = 0.
i=1
Em nosso exemplo sobre a altura dos pés de feijão, temos

X Y Yb e = Y − Yb
1 5 6, 2222 −1, 2222
2 12 11, 9722 0, 0278
3 16 17, 7222 −1, 7222
4 22 23, 4722 −1, 4722
5 34 29, 2222 4, 7778
6 38 34, 9722 3, 0278
7 41 40, 7222 0, 2778
8 45 46, 4722 −1, 4722
9 50 52, 2222 −2, 2222
45 263 263 0

43.4 Abordagem matricial do modelo linear simples
Como o modelo linear teórico é expresso por
Yi = β0 + β1 Xi + i , i = 1, 2, ..., n,
então temos que
Y1 = β0 + β1 X1 + 1
Y2 = β0 + β1 X2 + 2
Y3 = β0 + β1 X3 + 3
..
.
Yn = β0 + β1 Xn + n .
Reescrevendo na forma matricial segue que:
Y1 1 X1 1
Y2 1 X2 2
Y3 1 X3 β0 3
= +
.. .. .. β1 ..
. . . .
Yn 1 Xn n
E, dessa maneira, o modelo linear teórico é expresso da seguinte matricial:
Y = Xβ +
Em que:
Y: vetor n × 1 de observações da variável resposta Y .
X: matriz n × 2 de observações da variável explicativa X.
β: vetor 2 × 1 de coeficientes de regressão.
: vetor n × 1 do erro aleatório .
43.5 Obtenção dos estimadores via método dos mı́nimos quadrados
O método dos mı́nimos quadrados tem como objetivo minimizar a soma dos quadrados dos erros aleatórios,
isto é, devemos encontrar β0 e β1 que minimizem
n
X
2i (74)
i=1
Sabemos que o modelo linear é tal que Yi = β0 + β1 Xi + i , com i = 1, 2, . . . , n. Dessa maneira o erro aleatório
é tal que:
i = Yi − (β0 + β1 Xi ) , i = 1, 2, . . . , n. (75)

Aplicando (75) na expressão (74), temos que:
n
X n
X 2
2i = [Yi − (β0 + β1 Xi )]
i=1 i=1
n
X 2
= (Yi − β0 − β1 Xi )
i=1
n
X
= (Yi − β0 − β1 Xi ) (Yi − β0 − β1 Xi )
i=1
Xn
Yi2 − β0 Yi − β1 Xi Yi − β0 Yi + β02 + β0 β1 Xi − β1 Xi Yi + β0 β1 Xi + β12 Xi2

=
i=1
n
X
Yi2 − 2β0 Yi − 2β1 Xi Yi + 2β0 β1 Xi + β02 + β12 Xi2

=
i=1
Dessa forma tem-se
n
X n
X n
X n
X n
X n
X
2i = Yi2 − 2β0 Yi − 2β1 Xi Yi + 2β0 β1 Xi + nβ02 + β12 Xi2 .
i=1 i=1 i=1 i=1 i=1 i=1
n
∂
e2i = 0, temos
P
Derivando a soma do quadrado dos resı́duos em relação a β0 , isto é, fazendo ∂β0
i=1
n
X n
X
−2 Yi + 2β1 Xi + 2nβ0 = 0
i=1 i=1
Dividindo todos os termos por 2 temos
n
X n
X
− Yi + β1 Xi + nβ0 = 0,
i=1 i=1
e
n
X n
X
⇒ nβ0 = Yi − β1 Xi
i=1 i=1
n
P Pn
Yi − β1 Xi
i=1 i=1
⇒ β0 =
n
n
P n
P
Yi Xi
i=1 i=1
⇒ β0 = − β1
n n
e, finalmente, tem-se o estimador βb0 para o coeficiente de regressão β0 , expresso por:
β0 = Y − βb1 X. (76)
n
∂
e2i = 0, temos
P
Derivando a soma do quadrado dos resı́duos em relação a β1 , isto é, fazendo ∂β1
i=1

n
X n
X n
X
−2 Xi Yi + 2β0 Xi + 2β1 Xi2 = 0
i=1 i=1 i=1
Dividindo todos os termos por 2 temos
n
X n
X n
X
− Xi Yi + β0 Xi + β1 Xi2 = 0
i=1 i=1 i=1
e
n
P n
P
Xi Yi − β0 Xi
i=1 i=1
β1 = n (77)
Xi2
P
i=1
Substituindo (76) em (77) temos
n
P n
P
Xi Yi − Y − β1 X Xi
i=1 i=1
⇒ β1 = n
Xi2
P
i=1
n
P n
P n
P
Xi Yi − Y Xi + β1 X Xi
i=1 i=1 i=1
⇒ β1 = n
Xi2
P
i=1
n
X n
X n
X Xn
⇒ β1 Xi2 − β1 X Xi = Xi Yi − Y Xi
i=1 i=1 i=1 i=1
n n
! n n
X X X X
⇒ β1 Xi2 −X Xi = Xi Yi − Y Xi
i=1 i=1 i=1 i=1
e dessa forma segue que
n
P n
P
Xi Yi − Y Xi
β1 = i=1
n
i=1
n
Xi2 − X
P P
Xi
i=1 i=1
Multiplicando por n temos
n
P n
P n
P
n Xi Yi − Xi Yi
i=1 i=1 i=1 SXY
β1 = 2 =
SXX
n
n
Xi2 −
P P
n Xi
i=1 i=1
Dessa forma, os estimadores são:
SXY
βb1 = , e βb0 = Y − βb1 X.
SXX

44 Ajustamento de modelos linearizáveis
Após a abordagem do modelo linear considerado na Seção anterior, é importante destacar a diferença entre
os modelos não lineares nas variáveis e os modelos não lineares nos coeficientes regressoras.
Modelos não lineares nas variáveis regressoras: Tais modelos permitem o ajuste de relações mais
complexas que relações lineares ou linearizáveis entre quantidades de interesse. Em diversas situações estes modelos
tem uma forma funcional especı́fica para o estudo em questão, considerando algum mecanismo da área (biológico,
fı́sico, etc). Alguns exemplos de modelos não lineares nas variáveis regressoras são:
exp (β0 + β1 Xi )
Yi = β0 + β1 Xi + β2 Xi2 + i e Yi = + i, com i = 1, 2, . . . , n.
1 + exp (β0 + β1 Xi )
Ao contrário dos modelos lineares, o ajuste de modelos não lineares não permite que as expressões dos
estimadores dos parâmetros desconhecidos do modelo sejam obtidas analiticamente. Dessa maneira é necessário o
uso de métodos númericos.
Modelos não lineares nos coeficientes de regressão: São modelos lineares nas variáveis regressoras e
não-lineares nos coeficientes de regressão. Entretanto são modelos linearizáveis por meio de uma transformação
simples do tipo logaritmo. Alguns exemplos de modelos linearizáveis são:
Yi = β0 β1Xi i , e Yi = β0 Xi β1 i , com i = 1, 2, . . . , n.
44.1 Modelo exponencial
O modelo exponencial teórico é
Yi = β0 β1Xi i , i = 1, 2, ..., n.
O modelo exponencial ajustado é

Yb = βb0 βb1X .
Linearizando o modelo exponencial temos:

ln Yb = ln βb0 βb1X

ln Yb = ln βb0 + ln βb1 X
Ybt = βb0t + βb1t X.

44.2 Modelo potência
O modelo potência teórico é
Yi = β0 Xi β1 i , i = 1, 2, ..., n.
O modelo potência ajustado é
Yb = βb0 X β1 .
b
Linearizando o modelo exponencial temos:

ln Yb = ln βb0 X β1
b

ln Yb = ln βb0 + βb1 ln (X)
Ybt = βb0t + βb1 Xt .
44.3 Quadro resumo dos modelos ajustados
Quadro resumo dos modelos ajustados.
Modelo Modelo teórico Modelo linearizado Modelos ajustado
Linear Yi = β0 + β1 Xi + i Não se aplica Yb = βb0 + βb1 X
Exponencial Yi = β0 β1Xi i Ybt = βb0t + βb1t X Yb = βb0 βb1X
Potência Yi = β0 Xiβ1 i Ybt = βb0t + βb1 Xt Yb = βb0 X β1

b
em que

Ybt = ln Yb ; βb0t = ln βb0 ; βb1t = ln βb1 ; Xt = ln (X) .
Podemos verificar que, uma vez que aplicamos a operação logaritmo niperiano (ln) para linearizar os modelos
exponencial e potência, então se aplicarmos a operação inversa (base e) nos modelos linearizados, obtemos os
modelos ajustados, isto é
Modelo exponencial =⇒ eYt = eβ0t +β1t X = eβ0t eβ1t X = eln(β0 ) eln(β1 )X = βb0 βb1X = Yb
b b b b b b b
Modelo potência =⇒ eYt = eβ0t +β1 Xt = eβ0t eβ1 Xt = eln(β0 ) eβ1 ln(X) = βb0 X β1 = Yb
b b b b b b b b

44.4 Exemplo de aplicação em empresas
Uma empresa multinacional deseja verificar qual a relação entre o investimento mensal X em propagandas
e o lucro bruto mensal Y . Para isso, anotou-se os diferentes valores mensais de investimentos e seus respectivos
lucro bruto mensais. Os dados encontram-se na Tabela abaixo (Dados em milhares de dólares).
Investimento mensal Lucro bruto

em propagandas mensal
X Y
1 3
2 7
3 14
4 16
5 20
6 21
7 24
8 24
9 27
10 26
item a. Fazer o gráfico de dispersão X versus Y .

item b. Ajustar os modelos linear, exponencial e potência.
item c. Fazer um quadro resumo com os modelos ajustados, coeficientes de correlação linear de Pearson
2
rXY , coeficientes de determinação de ajuste rXY e o lucro bruto previsto considerando um investimento de X = 15
mil.
item d. Apontar qual é o melhor modelo, isto é, qual é o modelo com o melhor ajuste. Fazer comentários
pertinentes sobre qual é a importância de se adotar o melhor modelo no que tange o lucro bruto previsto, bem
como os possı́veis impactos negativos neste exemplo ao se adotar o modelo errado.
Resolução do item a. O gráfico de dispersão X versus Y é da seguinte forma:
Resolução do item b. Para encontrarmos as estatı́sticas SXY , SXX, SY Y , o coeficiente de correlação

linear de Pearson bem como o coeficiente de determinação dos modelos linear, exponencial e potência, temos de
encontrar as funções de variáveis XY , X 2 e Y 2 para cada modelo, conforme mostra a Tabela a seguir.

X Y XY X2 Y2 Yt XYt Yt2 Xt Xt Yt Xt2

1 3 3 1 9 1, 0986 1, 0986 1, 2069 0, 0000 0, 0000 0, 0000
2 7 14 4 49 1, 9459 3, 8918 3, 7866 0, 6931 1, 3488 0, 4805
3 14 42 9 196 2, 6391 7, 9172 6, 9646 1, 0986 2, 8993 1, 2069
4 16 64 16 256 2, 7726 11, 0904 7, 6872 1, 3863 3, 8436 1, 9218
5 20 100 25 400 2, 9957 14, 9787 8, 9744 1, 6094 4, 8214 2, 5903
6 21 126 36 441 3, 0445 18, 2671 9, 2691 1, 7918 5, 4551 3, 2104
7 24 168 49 576 3, 1781 22, 2464 10, 1000 1, 9459 6, 1842 3, 7866
8 24 192 64 576 3, 1781 25, 4244 10, 1000 2, 0794 6, 6086 4, 3241
9 27 243 81 729 3, 2958 29, 6625 10, 8625 2, 1972 7, 2417 4, 8278
10 26 260 100 676 3, 2581 32, 5810 10, 6152 2, 3026 7, 5020 5, 3019
55 182 1212 385 3908 27, 4065 167, 1581 79, 5667 15, 1044 45, 9047 27, 6502
Ajustamento do modelo linear: Primeiramente é necessário o cálculo das estatı́sticas amostrais SXY ,
SXX e SY Y conforme a seguir.
Calculando a estatı́stica SXY que envolve as variáveis X e Y :
n
X n
X n
X
i=1 i=1 i=1
= 10 × 1212 − 55 × 182
SXY = 2110
Calculando a estatı́stica SXX que envolve apenas a variável X:
n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
2
= 10 × 385 − 55
SXX = 825
Calculando a estatı́stica SY Y que envolve apenas a variável Y :
n n
!2
X X
SY Y = n Yi2 − Yi
i=1 i=1
2
= 10 × 3908 − 182
SY Y = 5956
Coeficiente de correlação de Pearson para o modelo linear:
SXY
rXY = √ √
SXX SY Y
2110
= √ √
825 5956
rXY = 0, 9519

Interpretação: 95, 19% das observações de Y estão fortemente e positivamente correlacionadas com as ob-
servações de X.
SXY 2110
βb1 = =
SXX 825
βb1 = 2, 5576.
βb0 = Y − βb1 X
= 18, 2 − 2, 5576 × 5, 5
βb0 = 4, 1332.
Yb = 4, 1332 + 2, 5576X
Ajustando o modelo exponencial. Para ajustar o modelo exponencial Yb = βb0 βb1X temos que linearizar o
modelo por meio do logaritmo (em geral usamos o logaritmo niperiano ln que tem base e) da seguinte forma:
Yb = βb0 βb1X

ln Yb = ln βb0 + X ln βb1
Ybt = βb0t + βb1t X
Podemos observar que apenas a variável Y sofreu transformação, bem como os coeficientes βb0 e βb1 . Dessa
forma precisamos determinar as seguintes estatı́sticas amostrais a partir das variáveis X e Y :
n n
A variável Y transformada, isto é, Yt que é dada por ln (Y ), bem como a soma
P P
Yit = ln (Yi ).
i=1 i=1
n n
O produto XYt transformado de cada par (X, Yt ) e a soma do produto dada por
P P
Xi Yit = Xi ln (Yi ).
i=1 i=1
Observação: como a variável Y foi transformada, então qualquer operação com Y , por exemplo o produto
XY , será transformada.
n
O quadrado de cada observação X (dado por X 2 ) e a soma dos quadrados dada por Xi2 . Observação:
P
i=1
essas estatı́sticas associadas à variável X já foram encontradas para o modelo linear.
n
O quadrado de cada observação de Y transformado (dado por Yt2 ) e a soma dos quadrados dada por Yit2 =
P
i=1
n
P 2
(ln Yi ) .
i=1
Cálculo da estatı́stica SXY que envolve as variáveis X e Y : Como a variável Y sofreu transformação, então
a estatı́stica SXY que envolve a variável Y também será transformada, ou seja, em função de Yt :

n
X n
X n
X
SXY = n Xi Yit − Xi Yit
i=1 i=1 i=1
= 10 × 167, 1583 − 55 × 27, 4065
SXY = 164, 2255
n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
2
= 10 × 385 − 55
SXX = 825
Observação: Como a variável X não sofreu transformação, então a estatı́stica SXX não sofreu transformação
e, portanto, possui o mesmo valor numérico do SXX do modelo linear, já calculado anteriormente.
Cálculo da estatı́stica SY Y que envolve apenas a variável Y : Como a variável Y sofreu transformação, então
a estatı́stica SY Y também será transformada, ou seja, em função de Yt :
n n
!2
X X
SY Y = n Yit2 − Yit
i=1 i=1
= 10 × 79, 5665 − 27, 40652
SY Y = 44, 5488
O coeficiente de correlação de Pearson para o modelo exponencial é dado por:
SXY
rXY = √ √
SXX SY Y
164, 2255
= √ √
825 44, 5488
rXY = 0, 8566.
Interpretação: 85, 66% das observações de Y estão positivamente correlacionadas com as observações de X.
Estimação dos coeficientes do modelo exponencial: Cálculo do coeficiente angular βb1t :
SXY 164, 2255

βb1t = =
SXX 825
βb1t = 0, 1991
Observação: Como o coeficiente βb1 envolve as estatı́sticas SXY , que por sua vez está transformada, então
teremos βb1t .
Cálculo do coeficiente linear βb0t :

βb0t = Y t − βb1t X
= 2, 7407 − 0, 1991 × 5, 5
βb0t = 1, 6456
Observação: Como a estimativa do coeficiente β0 , dado por βb0 , envolve a estimativa transformada βb1t , então
teremos βb0t .
Dessa maneira, o modelo transformado ou linearizado é:


Ybt = 1, 6456 + 0, 1991X
Como foi usada o logaritmo ln (que tem como base e) para a linearização, agora fazemos a operação inversa
para chegarmos ao modelo ajustado.
e Yt = e1,6456+0,1991X
b
ln(Y
b)
e = e1,6456 × e0,1991X
Como βb0 = eβ0t e também βb1 = eβ1t temos que o modelo exponencial ajustado é da seguinte forma:
b b
Yb = 5, 1841 × 1, 2203X
Ajustando o modelo potência: Para ajustar o modelo potência Yb = βb0 X β1 temos que linearizar o modelo
b
por meio do logaritmo da seguinte forma:
Yb = βb0 X β1
b

Ybt = βb0t + βb1 Xt
Podemos observar que as variáveis X e Y sofreram transformação, portanto segue abaixo o cálculo das
estatı́sticas amostrais.
Cálculo da estatı́stica SXY que envolve as variáveis X e Y : Como as variáveis X e Y sofreram transformações,
então a estatı́stica SXY que envolve as variáveis X e Y também serão transformadas, ou seja, em função de Xt e
Yt :
n
X n
X n
X
SXt Yt = n Xit Yit − Xit Yit
i=1 i=1 i=1
= 10 × 45, 9045 − 15, 1043 × 27, 4065
SXt Yt = 45, 0890

Calculando a estatı́stica SXX que envolve apenas a variável Xt :
n n
!2
X X
2
SXXt = n Xit − Xit
i=1 i=1
= 10 × 27, 6499 − 15, 10432
SXX = 48, 3591
n n
!2
X X
SY Yt = n Yit2 − Yit
i=1 i=1
= 10 × 79, 5665 − 27, 40652
SY Yt = 44, 5488
O coeficiente de correlação de Pearson para o modelo potência é
SXY
rXY = √ √
SXX SY Y
45, 0890
= √ √
48, 3591 44, 5488
rXY = 0, 9714.
servações de X.
Estimação dos coeficientes do modelo potência:
SXYt 45, 0890

βb1 = =
SXXt 48, 3591
βb1 = 0, 9324
βb0t = Y t − βb1 X t
= 2, 7407 − 0, 9324 × 1, 5104
βb0t = 1, 3324


Ybt = 1, 3324 + 0, 9324Xt

e Yt = e1,3324+0,9324Xt
b
ln(Y
b)
e = e1,3324 × e0,9324 ln(X)
Como βb0 = eβ0t e também X = eXt temos que o modelo potência ajustado é da seguinte forma:
b
Yb = 3, 7901 × X 0,9324
Resolução do item c. quadro resumo com os modelos ajustados, coeficientes de correlação linear de Pearson
2
mil.
Quadro resumo dos modelos ajustados

2
Modelo ajustado rXY rXY Previsão para X = 15
Linear Yb = 4, 1332 + 2, 5576X 0, 9519 0, 9061 Yb = 42, 50
Exponencial Yb = 5, 1841 × 1, 2203X 0, 8566 0, 7338 Yb = 102, 72
Potência Yb = 3, 7901 × X 0,9324 0, 9714 0, 9436 Yb = 47, 34
Resolução do item d. Ao investir 15 mil dólares em propaganda, a empresa esperaria obter cerca de 103 mil
dólares em lucro bruto mensal, usando o modelo exponencial. Observamos que o modelo linear subestima o lucro
bruto mensal esperado e o modelo exponencial superestima o lucro bruto mensal esperado. Usando um modelo
errado, por exemplo o modelo exponencial, a empresa esperaria um lucro bruto mensal de aproximadamente 103
mil dólares ao investir 15 mil em propagandas, quando na verdade teria um lucro bruto mensal de aproximadamente
47 mi dólares, por meio do melhor modelo ajustado.

44.5 Exemplo de aplicação em engenharia florestal
Os dados abaixo referem-se a medidas de diâmetro na altura do peito - D.A.P (em polegadas) de árvores
da espécie black cherry denotado pela variável explicativa X e o volume de madeira destas árvores derrubadas
(em m3 ), denotado pela variável resposta Y . O objetivo desse tipo de experimento é verificar de que forma essas
variáveis estão relacionadas para, por meio de medidas nas árvores em pé, poder se predizer o volume de madeira
em uma área de floresta.
Medidas de D.A.P e volume de madeira de 31 árvores da espécie black cherry.

Amostra X (D.A.P) Y (Volume em madeira)
1 8,3 10,3
2 8,6 10,3
3 8,8 10,2
4 10,5 16,4
5 10,7 18,8
6 10,8 19,7
7 11,0 15,6
8 11,0 18,2
9 11,1 22,6
10 11,2 19,9
11 11,3 24,2
12 11,4 21,0
13 11,4 21,4
14 11,7 21,3
15 12,0 19,1
16 12,9 22,2
17 12,9 33,8
18 13,3 27,4
19 13,7 25,7
20 13,8 24,9
21 14,0 34,5
22 14,2 31,7
23 14,5 36,3
24 16,0 38,3
25 16,3 42,6
26 17,3 55,4
27 17,5 55,7
28 17,9 58,3
29 18,0 51,5
30 18,0 51,0
31 20,6 77,0
Item a. Fazer o gráfico de dispersão X versus Y .
Item b. Ajustar os modelos linear, exponencial e potência.
Item c. Fazer um quadro resumo com os modelos ajustados, coeficientes de correlação linear de Pearson
2
rXY , coeficientes de determinação de ajuste rXY e o volume previsto de madeira (em m3 ) para X = 22 polegadas
de D.A.P, nos três modelos ajustados.
Item d. Apontar qual é o melhor modelo, isto é, qual é o modelo com o melhor ajuste. Fazer comentários
pertinentes sobre qual é a importância de se adotar o melhor modelo no que tange o volume previsto de madeira,
bem como os possı́veis impactos negativos neste exemplo ao se adotar o modelo errado.

Resolução do item a. O gráfico de dispersão X versus Y é da seguinte forma:
Resolução do item b. Para encontrarmos as estatı́sticas SXY , SXX, SY Y , o coeficiente de correlação

linear de Pearson bem como o coeficiente de determinação dos modelos linear, exponencial e potência, temos de
encontrar as funções de variáveis XY , X 2 e Y 2 para cada modelo, conforme mostra a Tabela a seguir.
X Y XY X2 Y2 Yt XYt Yt2 Xt Xt Yt Xt2

8, 3 10, 3 85, 49 68, 89 106, 09 2, 3321 19, 3568 5, 4389 2, 1163 4, 9354 4, 4785
8, 6 10, 3 88, 58 73, 96 106, 09 2, 3321 20, 0564 5, 4389 2, 1518 5, 0182 4, 6301
8, 8 10, 2 89, 76 77, 44 104, 04 2, 3224 20, 4370 5, 3935 2, 1748 5, 0506 4, 7295
10, 5 16, 4 172, 20 110, 25 268, 96 2, 7973 29, 3715 7, 8248 2, 3514 6, 5775 5, 5290
10, 7 18, 8 201, 16 114, 49 353, 44 2, 9339 31, 3923 8, 6075 2, 3702 6, 9540 5, 6181
10, 8 19, 7 212, 76 116, 64 388, 09 2, 9806 32, 1907 8, 8841 2, 3795 7, 0925 5, 6622
11, 0 15, 6 171, 60 121, 00 243, 36 2, 7473 30, 2200 7, 5475 2, 3979 6, 5877 5, 7499
11, 0 18, 2 200, 20 121, 00 331, 24 2, 9014 31, 9156 8, 4182 2, 3979 6, 9573 5, 7499
11, 1 22, 6 250, 86 123, 21 510, 76 3, 1179 34, 6092 9, 7216 2, 4069 7, 5047 5, 7934
11, 2 19, 9 222, 88 125, 44 396, 01 2, 9907 33, 4961 8, 9444 2, 4159 7, 2253 5, 8366
11, 3 24, 2 273, 46 127, 69 585, 64 3, 1864 36, 0058 10, 1528 2, 4248 7, 7263 5, 8797
11, 4 21, 0 239, 40 129, 96 441, 00 3, 0445 34, 7076 9, 2691 2, 4336 7, 4092 5, 9225
11, 4 21, 4 243, 96 129, 96 457, 96 3, 0634 34, 9227 9, 3844 2, 4336 7, 4551 5, 9225
11, 7 21, 3 249, 21 136, 89 453, 69 3, 0587 35, 7869 9, 3557 2, 4596 7, 5232 6, 0496
12, 0 19, 1 229, 20 144, 00 364, 81 2, 9497 35, 3963 8, 7007 2, 4849 7, 3297 6, 1748
12, 9 22, 2 286, 38 166, 41 492, 84 3, 1001 39, 9912 9, 6106 2, 5572 7, 9276 6, 5394
12, 9 33, 8 436, 02 166, 41 1142, 44 3, 5205 45, 4139 12, 3936 2, 5572 9, 0026 6, 5394
13, 3 27, 4 364, 42 176, 89 750, 76 3, 3105 44, 0302 10, 9597 2, 5878 8, 5669 6, 6965
13, 7 25, 7 352, 09 187, 69 660, 49 3, 2465 44, 4769 10, 5397 2, 6174 8, 4974 6, 8508
13, 8 24, 9 343, 62 190, 44 620, 01 3, 2149 44, 3652 10, 3354 2, 6247 8, 4380 6, 8889
14, 0 34, 5 483, 00 196, 00 1190, 25 3, 5410 49, 5734 12, 5384 2, 6391 9, 3448 6, 9646
14, 2 31, 7 450, 14 201, 64 1004, 89 3, 4563 49, 0797 11, 9461 2, 6532 9, 1704 7, 0397
14, 5 36, 3 526, 35 210, 25 1317, 69 3, 5918 52, 0814 12, 9012 2, 6741 9, 6051 7, 1511
16, 0 38, 3 612, 80 256, 00 1466, 89 3, 6454 58, 3272 13, 2893 2, 7726 10, 1073 7, 6872
16, 3 42, 6 694, 38 265, 69 1814, 76 3, 7519 61, 1552 14, 0764 2, 7912 10, 4720 7, 7906
17, 3 55, 4 958, 42 299, 29 3069, 16 4, 0146 69, 4522 16, 1168 2, 8507 11, 4444 8, 1265
17, 5 55, 7 974, 75 306, 25 3102, 49 4, 0200 70, 3497 16, 1602 2, 8622 11, 5060 8, 1922
17, 9 58, 3 1043, 57 320, 41 3398, 89 4, 0656 72, 7743 16, 5291 2, 8848 11, 7285 8, 3221
18, 0 51, 5 927, 00 324, 00 2652, 25 3, 9416 70, 9485 15, 5361 2, 8904 11, 3926 8, 3542
18, 0 51, 0 918, 00 324, 00 2601, 00 3, 9318 70, 7729 15, 4593 2, 8904 11, 3644 8, 3542
20, 6 77, 0 1586, 20 424, 36 5929, 00 4, 3438 89, 4824 18, 8686 3, 0253 13, 1413 9, 1524
410, 7 935, 3 13887, 86 5736, 55 36324, 99 101, 4547 1392, 1389 340, 3427 79, 2773 263, 0560 204, 3761

Ajustamento do modelo linear: Primeiramente é necessário o cálculo das estatı́sticas amostrais SXY ,
SXX e SY Y conforme a seguir.
Calculando a estatı́stica SXY que envolve as variáveis X e Y :
n
X n
X n
X
i=1 i=1 i=1
= 31 × 13887, 86 − 410, 7 × 935, 3
SXY = 46395, 95
n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
= 31 × 5736, 55 − 410, 72
SXX = 9158, 56
Calculando a estatı́stica SY Y que envolve apenas a variável Y :
n n
!2
X X
SY Y = n Yi2 − Yi
i=1 i=1
= 31 × 36324, 99 − 935, 32
SY Y = 251288, 60
Calculando o coeficiente de correlação de Pearson para o modelo linear:
SXY
rXY = √ √
SXX SY Y
46395, 95
= √ √
9158, 56 251288, 60
rXY = 0, 9671
servações de X.
SXY 46395, 95
βb1 = =
SXX 9158, 56
βb1 = 5, 0659.

βb0 = Y − βb1 X

935, 3 410, 7
= − 5, 0659
31 31
βb0 = −36, 9435.
Yb = −36, 9435 + 5, 0659X
Ajustando o modelo exponencial. Para ajustar o modelo exponencial Yb = βb0 βb1X temos que linearizar o
modelo por meio do logaritmo (em geral usamos o logaritmo niperiano ln que tem base e) da seguinte forma:
Yb = βb0 βb1X

Podemos observar que apenas a variável Y sofreu transformação, bem como os coeficientes βb0 e βb1 . Dessa
forma precisamos determinar as seguintes estatı́sticas amostrais a partir das variáveis X e Y :
n n
A variável Y transformada, isto é, Yt que é dada por ln (Y ), bem como a soma
P P
Yit = ln (Yi ).
i=1 i=1
n n
O produto XYt transformado de cada par (X, Yt ) e a soma do produto dada por
P P
Xi Yit = Xi ln (Yi ).
i=1 i=1
Observação: como a variável Y foi transformada, então qualquer operação com Y , por exemplo o produto
XY , será transformada.
n
O quadrado de cada observação X (dado por X 2 ) e a soma dos quadrados dada por Xi2 . Observação:
P
i=1
essas estatı́sticas associadas à variável X já foram encontradas para o modelo linear.
n
O quadrado de cada observação de Y transformado (dado por Yt2 ) e a soma dos quadrados dada por Yit2 =
P
i=1
n
P 2
(ln Yi ) .
i=1
Cálculo da estatı́stica SXY que envolve as variáveis X e Y : Como a variável Y sofreu transformação, então
a estatı́stica SXY que envolve a variável Y também será transformada, ou seja, em função de Yt :
n
X n
X n
X
SXY = n Xi Yit − Xi Yit
i=1 i=1 i=1
= 31 × 1392, 1389 − 410, 7 × 101, 4547
SXY = 1488, 87.

n n
!2
X X
SXX = n Xi2 − Xi
i=1 i=1
= 31 × 5736, 55 − 410, 72
SXX = 9158, 56
Observação: Como a variável X não sofreu transformação, então a estatı́stica SXX não sofreu transformação
e, portanto, possui o mesmo valor numérico do SXX do modelo linear, já calculado anteriormente.
n n
!2
X X
i=1 i=1
= 31 × 340, 3427 − 101, 45472
SY Y = 257, 57.
O coeficiente de correlação de Pearson para o modelo exponencial é dado por:
SXY
rXY = √ √
SXX SY Y
1488, 87
= √ √
9158, 56 257, 57
rXY = 0, 9694.
Interpretação: 96, 94% das observações de Y estão positivamente correlacionadas com as observações de X.
Estimação dos coeficientes do modelo exponencial: Cálculo do coeficiente angular βb1t :
SXY 1488, 87
βb1t = =
SXX 9158, 56
βb1t = 0, 1626.
Observação: Como o coeficiente βb1 envolve as estatı́sticas SXY , que por sua vez está transformada, então
teremos βb1t .
Cálculo do coeficiente linear βb0t :
βb0t = Y t − βb1t X

101, 4547 410, 7
= − 0, 1626 ×
31 31
βb0t = 1, 1185.
Observação: Como a estimativa do coeficiente β0 , dado por βb0 , envolve a estimativa transformada βb1t , então
teremos βb0t .



Ybt = 1, 1185 + 0, 1626X
e Yt = e1,1185+0,1626X
b
ln(Y
b)
e = e1,1185 × e0,1626X
Como βb0 = eβ0t e também βb1 = eβ1t temos que o modelo exponencial ajustado é da seguinte forma:
b b
Yb = 3, 0603 × 1, 1766X
Ajustando o modelo potência: Para ajustar o modelo potência Yb = βb0 X β1 temos que linearizar o modelo
b
por meio do logaritmo da seguinte forma:
Yb = βb0 X β1
b

Podemos observar que as variáveis X e Y sofreram transformação, portanto segue abaixo o cálculo das
estatı́sticas amostrais.
Cálculo da estatı́stica SXY que envolve as variáveis X e Y : Como as variáveis X e Y sofreram transformações,
então a estatı́stica SXY que envolve as variáveis X e Y também serão transformadas, ou seja, em função de Xt e
Yt :
n
X n
X n
X
SXt Yt = n Xit Yit − Xit Yit
i=1 i=1 i=1
= 31 × 263, 0560 − 79, 2773 × 101, 4547
SXt Yt = 111, 68.
Calculando a estatı́stica SXX que envolve apenas a variável Xt :
n n
!2
X X
2
SXXt = n Xit − Xit
i=1 i=1
= 31 × 204, 3761 − 79, 27732
SXX = 50, 76.

n n
!2
X X
i=1 i=1
= 31 × 340, 3427 − 101, 45472
SY Y = 257, 57.
O coeficiente de correlação de Pearson para o modelo potência é
SXY
rXY = √ √
SXX SY Y
111, 68
= √ √
50, 76 257, 57
rXY = 0, 9767.
servações de X.
Estimação dos coeficientes do modelo potência:
SXYt 111, 68
βb1 = =
SXXt 50, 76
βb1 = 2, 2002.
βb0t = Y t − βb1 X t
= 3, 2727 − 2, 2002 × 2, 5573
βb0t = −2, 3533.


Ybt = −2, 3533 + 2, 2002Xt
e Yt = e−2,3533+2,2002Xt
b
ln(Y
b)
e = e−2,3533 × e2,2002 ln(X)
Como βb0 = eβ0t e também X = eXt temos que o modelo potência ajustado é da seguinte forma:
b

Yb = 0, 0951 × X 2,2002
Resolução do item c. quadro resumo com os modelos ajustados, coeficientes de correlação linear de Pearson
2
mil.
Quadro resumo dos modelos ajustados

2
Modelo ajustado rXY rXY Previsão Yb para X = 22
Linear Yb = −36, 9435 + 5, 0659X 0, 9671 0, 9353 Yb = 74, 51
Exponencial Yb = 3, 0603 × 1, 1766X 0, 9694 0, 9397 Yb = 109, 45
Potência Yb = 0, 0951 × X 2,2002 0, 9767 0, 9539 Yb = 85, 36
Resolução do item d. O modelo com o melhor ajuste é o modelo potência, pois possui o maior coeficiente
2
de determinação (rXY = 0, 9539). Dessa maneira se faz extramamente importante adotar o melhor modelo para
prever o volume de madeira, a fim de evitar os possı́veis impactos negativos caso se adote os modelos errados.

45 Regressão Linear Múltipla
Como o modelo linear teórico é expresso por
Yi = β0 + β1 Xi1 + β2 Xi2 + β3 Xi3 + ... + βk Xik + i , i = 1, 2, ..., n,
então temos que
Y1 = β0 + β1 X11 + β2 X12 + β3 X13 + ... + βk X1k + 1

Y2 = β0 + β1 X21 + β2 X22 + β3 X23 + ... + βk X2k + 2
Y3 = β0 + β1 X31 + β2 X32 + β3 X33 + ... + βk X3k + 3
..
.
Yn = β0 + β1 Xn1 + β2 Xn2 + β3 Xn3 + ... + βk Xnk + n .
Reescrevendo na forma matricial segue que:
..
1 X11 X12 X13 . X1k
Y1 .. β0 1
Y2 1 X21 X22 X23 . X2k β1 2
Y3 = .. × β2 + 3
.. 1 X31 X32 X33 . X3k .. ..
. .. .. .. .. .. .. . .
. . . . . .
Yn βk n
..
1 Xn1 Xn2 Xn3 . Xnk
e, dessa maneira, o modelo linear teórico é expresso da seguinte forma matricial:
Y = Xβ +
em que:
Y: vetor n × 1 de observações da variável resposta Y .

X: matriz n × (k + 1) de observações das variáveis explicativas X.
β: vetor (k + 1) × 1 de coeficientes de regressão.
: vetor n × 1 do erro aleatório .
As suposições do modelo são:
1. Os erros 1 , 2 , ..., n têm média igual a zero e variância constante igual a σ 2 .
2. Os erros 1 , 2 , ..., n não são correlacionados, o que implica que as observações Y1 , Y2 , ..., Yn não são correla-
cionadas.
3. Os erros 1 , 2 , ..., n têm distribuição normal, o que implica que as observações Y1 , Y2 , ..., Yn têm distribuição
normal.
Dessa forma, como a distribuição de probabilidades de = 1 , 2 , ..., n é da forma

∼ N 0, σ 2 I ,

em que
..
1 0 0 . 0
1 0 ..
2 0 0 1 0 . 0
= 3 ; 0= 0 ; 2
σ I=σ × 2 ..
.. .. 0 0 1 . 0 ,
. . .. .. .. .. ..
. . . . .
n 0
..
0 0 0 . 1
então segue que a distribuição de probabilidades de Y1 , Y2 , ..., Yn é tal que
Y ∼ N Xβ, σ 2 I

em que
..
1 X11 X12 X13 . X1k
Y1 .. β0
Y2 1 X21 X22 X23 . X2k β1
Y= Y3 e Xβ = .. × β2 ,
.. 1 X31 X32 X33 . X3k ..
. .. .. .. .. .. .. .
. . . . . .
Yn βk
..
1 Xn1 Xn2 Xn3 . Xnk
45.1 Estimação de β pelo método dos mı́nimos quadrados
O objetivo é encontrar os valores do vetor β = β0 , β1 , β2 , ..., βk que minimizem a soma dos quadrados dos
erros, ou seja, que minimizem
1
n 2
3
X
2i = 21 + 22 + ... + 2n = 1 2 3 ... n × = T
i=1
..
.
n
= Y − Xβ.
T
T
O vetor de estimadores βb = βb0 , βb1 , ..., βbk para o vetor de coeficientes de regressão βb = (β0 , β1 , ..., βk ) ,
obtido pelo método dos mı́nimos quadrados, é expresso por:
−1
βb = XT X XT Y.

46 Exercı́cios sobre regressão linear simples
Questão 1. Há o interesse em estabelecer uma relação entre a altura (X) em metros e o peso (Y ) em quilos de
indivı́duos do sexo masculino acima dos 21 anos. Para isso analisou-se uma amostra de 15 indivı́duos, ordenando-os
pela altura, conforme tabela abaixo:
Altura Peso Altura Peso

Indivı́duo (em metros) X (em quilos) Y Indivı́duo (em metros) X (em quilos) Y
1 1, 45 63 9 1, 79 77
2 1, 52 63 10 1, 80 77
3 1, 58 64 11 1, 80 81
4 1, 60 65 12 1, 81 84
5 1, 62 65 13 1, 83 85
6 1, 65 68 14 1, 83 87
7 1, 70 69 15 1, 92 90
8 1, 76 71
a. Determine o coeficiente de correlação de Pearson rXY .

b. Ajuste o modelo linear Yb = βb0 + βb1 X.
c. Interprete o coeficiente linear βb0 (intercepto da reta).
d. Interprete o coeficiente angular βb1 (inclinação da reta).
2
e. Determine o coeficiente de determinação rXY e faça a interpretação.
f. Qual o peso esperado para o indivı́duo que tem uma altura igual a 1, 75m?
g. Qual o peso esperado para o indivı́duo que tem uma altura igual a 1, 85m?
h. Qual o peso esperado para o indivı́duo que tem uma altura igual a 1, 98m?
Exercı́cio 2. Seja o seguinte conjunto de dados:
X 9 9 10 11 11 12 14 15
Y 6 8 23 65 70 160 172 3274
2
a. Ajuste Y em função de X nos três modelos abaixo e encontre o coeficiente de determinação rXY para cada
modelo ajustado.
Modelo linear: Yb = βb0 + βb1 X.
Modelo exponencial: Yb = βb0 βb1X .
Modelo potência: Yb = βb0 X β1
b
b. Qual o modelo ajustado é mais eficaz para esse conjunto de dados?

c. Usando o modelo melhor ajustado, qual seria o valor esperado de Y se X = 20?
Exercı́cio 3. Médicos pesquisadores estão interessados em saber se o tempo de gestação interfere no peso (ao
nascer) de bebês. Para isso foi tomada uma amostra de 12 bebês recém-nascidos obtendo-se os pesos (em gramas)
de cada um deles. Os resultados encontram-se na tabela abaixo onde os bebês estão ordenados pelo tempo de
gestação (em semanas).
Indivı́duos (bebês recém-nascidos) 1 2 3 4 5 6

Tempo de gestação (em semanas) X 27 29 30 33 34 34
Peso do recém-nascido (em gramas) Y 1360 1590 1900 2280 2360 2490
Indivı́duos (bebês recém-nascidos) 7 8 9 10 11 12
Tempo de gestação (em semanas) X 35 35 36 36 38 39
Peso do recém-nascido (em gramas) Y 2610 2960 3550 3620 3990 4400
a. Determine o coeficiente de correlação rXY e faça a interpretação.

2
f. Qual o peso esperado para o bebê que teve 32 semanas de gestação?
g. Qual o peso esperado para o bebê que teve 40 semanas de gestação?

Exercı́cio 4. Continuando o exercı́cio anterior, ajuste Y em função de X nos modelos exponencial e potência
conforme abaixo.
Modelo exponencial: Yb = βb0 βb1X .
Modelo potência: Yb = βb0 X β1 .
b
2
a. Encontre o coeficiente de determinação rXY para cada modelo ajustado.
b. Considerando o modelo linear do exercı́cio anterior e os modelos ajustados exponencial e potência, qual o
modelo ajustado mais eficaz para esse conjunto de dados?
c. Usando o modelo melhor ajustado, qual seria o peso esperado de um bebê com 38 semanas de gestação?
Exercı́cio 5. O Instituto Brasileiro de Geografia e Estatı́stica (IBGE) está interessado em saber qual a relação
entre o número de filhos por famı́lia (Y ) e a renda familiar mensal (X). Para isso, coletou-se uma amostra de 30
famı́lias onde verificou-se o número de filhos e a renda familiar mensal (em salários mı́nimos) de cada uma delas.
Os resultados encontram-se na tabela abaixo.
Famı́lia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Renda Mensal X 1 2 2 2 2 2 2 2 3 3 3 4 4 4 4
Número de filhos Y 5 4 4 4 3 3 3 3 2 2 2 2 2 2 2
Famı́lia 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Renda Mensal X 4 4 5 5 5 5 5 5 6 6 6 7 7 8 8
Número de filhos Y 2 2 2 1 1 1 1 1 1 1 0 0 0 0 0
a. Determine o coeficiente de correlação rXY e faça a interpretação.

2
Exercı́cio 6. Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência.
Encontre o coeficiente de determinação de cada um deles para verificar qual o melhor modelo ajustado.
X 1 2 3 4 5 6 7 8 9 10
Y 2 5 7 19 31 48 96 164 289 515
Exercı́cio 7. Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência.
Encontre o coeficiente de determinação de cada um deles para verificar qual o melhor modelo ajustado.
X 10 12 14 16 18 20 22 24 26 28 30 32
Y 52 41 34 32 28 25 22 21 18 18 15 13
Exercı́cio 8. Os dados que se seguem referem-se a medidas de alturas de feijão (Y ), durante 7 semanas
(amostras aleatórias independentes), conforme tabela abaixo:
Idade do feijão (em semanas) X 1 2 3 4 5 6 7

Altura do feijão (em cm) Y 5 13 16 23 33 38 40
Fonte: SNEDECOR, G.W & COCHRAN, W.G. (1967). Statistical Methods. The Iowa State Press University.
pag. 139.
Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência. Encontre
o coeficiente de determinação de cada um deles para verificar qual o melhor modelo ajustado. Considerando o
melhor modelo ajustado, qual a altura esperada de um pé de feijão após 8 semanas?
Exercı́cio 9. Os dados que se seguem referem-se a um experimento, em que 9 amostras de solos foram
preparadas, variando-se os nı́veis de fósforo orgânico (X). Nessas amostras foi plantado milho e, após 38 dias, as
plantas foram colhidas e o conteúdo de fósforo foi determinado. A seguir, determinou-se, por uma expressão o
fósforo disponı́vel (Y ) para a planta no solo, conforme tabela abaixo:
X (ppm) 1 4 5 9 13 11 23 23 28
Y (ppm) 64 71 54 81 93 76 77 95 109

Fonte: SNEDECOR, G.W & COCHRAN, W.G. (1967). Statistical Methods. The Iowa State Press University.
p ag. 139.
Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência. Encontre
o coeficiente de determinação de cada um deles para verificar qual o melhor modelo ajustado. Considerando o
melhor modelo ajustado, qual o valor esperado de Y quando X = 18?
Exercı́cio 10. Os dados que se seguem referem-se ao peso médio (X) de 50 galinhas e consumo de alimentos
(Y ), para 10 linhagens White Leghorn.
Amostra 1 2 3 4 5 6 7 8 9 10
X 4, 6 5, 1 4, 8 4, 4 5, 9 4, 7 5, 1 5, 2 4, 9 5, 1
Y 87, 1 93, 1 89, 8 91, 4 99, 5 92, 1 95, 5 99, 3 93, 4 94, 4
Fonte: STEEL, R.G.D. & TORRIE, J.H. (1980). Principles and Procedures of Statistics. A Biometrical
Approach. MacGraw-Hill. p ag. 240.
Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência. Encontre o
coeficiente de determinação de cada um deles para verificar qual o melhor modelo ajustado.
Exercı́cio 11. Os dados que se seguem referem-se a concentrações de CO2 (X) aplicadas sobre folhas de trigo
a uma temperatura de 35o C e a quantidades de CO2 (Y ; cm3 /dm2 / hora) absorvido pelas folhas.
Amostra 1 2 3 4 5 6 7 8 9 10 11
X 75 100 100 120 130 130 160 190 200 240 250
Y 0, 00 0, 65 0, 50 1, 00 0, 95 1, 30 1, 80 2, 80 2, 50 4, 30 4, 50
Fonte: MEAD, R. & CURNOW, R.N. (1980). Statistical Methods in Agriculture and Experimental Biology.
Chapman & Hall. p ag. 134.
Exercı́cio 12. Os dados que se seguem referem-se a números de ovos postos por 14 galinhas e números de
folı́culos ovulados.
Número de ovos X 39 29 46 28 31 25 49 57 51 21 42 38 34 47
Número de folı́culos Y 37 34 52 26 32 25 55 65 44 25 45 26 29 30
Fonte: STEEL, R.G.D. & TORRIE, J.H. (1980). Principles and Procedures of Statistics. A Biometrical Approach.
MacGraw-Hill. p ag. 277.
Exercı́cio 13. Os dados a seguir mostram as despesas com propaganda (expressas em porcentagem das
despesas totais) e o lucro lı́quido operacional (expresso em porcentagem do total de vendas) em uma amostra de
seis drogarias:
Drogaria 1 2 3 4 5 6
despesas com propaganda X 1, 5 1, 0 2, 8 0, 4 1, 3 2, 0
lucro lı́quido operacional Y 3, 6 2, 8 5, 4 1, 9 2, 9 4, 3
Exercı́cio 14. Uma determinada pizzaria deseja saber qual a relação entre o preço da pizza (em reais) com
a sua venda mensal (em unidades). Para isso variou-se o preço da unidade e verificou-se a quantidade mensal
vendida. Os dados são os seguintes:
Preço da pizza (em reais) 18, 00 22, 00 17, 50 23, 50 27, 00 25, 00 20, 50 24, 00
Quantidade mensal vendida 277 123 295 91 48 69 166 81
a. Ajuste o conjunto de dados abaixo nos três modelos propostos: Linear, exponencial e potência. Encontre o
b. Suponha que o gerente da pizzaria faça uma promoção em um certo mês cobrando o preço único de 19 reais
a pizza, quantas unidades espera-se vender nesse mês?
c. e se o preço for 16 reais?

RESPOSTAS DOS EXERCÍCIOS SOBRE SOMATÓRIO PROPOSTOS NA PARTE I
Exercı́cio 1.
a. X14 + X24 + X34 + X44 + X54 + X64 + X74 + X84
2 2 2
b. (3X1 + 5) + (3X2 + 5) + ... + (3Xn + 5)
Y1 +10 Y2 +10 Y3 +10 Y4 +10 Y5 +10

c. (X1 − 2) + (X2 − 2) + (X3 − 2) + (X4 − 2) + (X5 − 2)
d. abX1 +Y1 + abX2 +Y2 + ... + abXn +Yn

Y Y Y Y Y Y Y
X1 1 X2 2 X3 3 X4 4 X5 5 X6 6 X7 7
e. Z1 + Z2 + Z3 + Z4 + Z5 + Z6 + Z7
λ0 λ1 λ2 λ3
f. 0! + 1! + 2! + 3! + ...
g. (aX1 + b) + (aX2 + b) + ... + (aXn + b)

h. aX12 + bX1 + c + aX22 + bX2 + c + ... + aXn2 + bXn + c
i. ea+bX1 +cY1 +dZ1 + ea+bX2 +cY2 +dZ2 + ... + ea+bXn +cYn +dZn
j. X12 Y10 + X23 Y21 + X34 Y32 + ... + Xnn+1 Ynn−1
k. 12 X1 + 22 X2 + 32 X3 + 42 X4 + 52 X5 + 62 X6 + 72 X7 + 82 X8 + 92 X9 + 102 X10
ln(X1 ) ln(X2 ) ln(Xn )

l. Y1 !+ln(Z1 ) + Y2 !+ln(Z2 ) + ... + Yn !+ln(Zn )
Exercı́cio 2.
n n
6Xi −3Yi
P P
a) (8Xi − 5Yi ) = 0 b) 15 =4
i=1 i=1
n n
Xi −Yi +Zi
P P
c) 35 =1 d) (10Xi − 5Yi − Zi ) = 35
i=1 i=1
n n
2Yi +6Zi
P P
e) 50 = 11 f) (3Xi + 8Yi − 12Zi ) = 10.
i=1 i=1
Exercı́cio 3.
5 5
P 2 P
a) (Xi − 3) = 10 b) (Xi + 5) (Xi − 2) = 50
i=1 i=1
5 5
Xi2 + 1 (Xi + 4) = 480 Xi2 − 11 = 0
P P
c) d)
i=1 i=1
5 3 5
Xi −2Xi2 −7Xi

Xi2 (Xi − 4) = 5.
P P
e) 10 =1 f)
i=1 i=1
Exercı́cio 4. Resolução:
8 8
1 Xh 2 i 1 X
3Xi + 5Xi2 − Xi 3Xi + 25Xi4 − 10Xi3 + Xi2

=
80 i=1 80 i=1
8
1 X
3Xi + 25Xi4 − 10Xi3 + Xi2

=
80 i=1
" 8 8 8 8
#
1 X X
4
X
3
X
2
= 3 Xi + 25 Xi − 10 Xi + Xi
80 i=1 i=1 i=1 i=1

8 8 8 8
Xi2 = 34, Xi3 = 108 e Xi4 = 370, basta substituir os valores numéricos na
P P P P
Como Xi = 12,
i=1 i=1 i=1 i=1
expressão:
8
1 Xh 2 i 1 8240
3Xi + 5Xi2 − Xi = [3 × 12 + 25 × 370 − 10 × 108 + 34] = = 103.
80 i=1 80 80
Portanto, o valor numérico da expressão é 103, isto é,

8
1 Xh 2 i
3Xi + 5Xi2 − Xi = 103.
80 i=1
Exercı́cio 5. Se ai > 0, i = 1, 2, ..., n, então a1 > 0, a2 > 0, ..., an > 0, e segue que
n
! n
!2
X X
a2i < ai
i=1 i=1
n
! n
!
X X
a21 + a22 + ... + a2n < ai ai
i=1 i=1
a21 + a22 + ... + a2n < (a1 + a2 + ... + an ) (a1 + a2 + ... + an )
| {z }
n
P
ai
i=1
n
X n
X n
X
a21 + a22 + ... + a2n < a1 ai + a2 ai + ... + an ai
i=1 i=1 i=1
Como ai > 0, i = 1, 2, ..., n, então segue imediatamente que qualquer termo é menor que a soma, isto é,
n
! n
! n
!
X X X
a1 < ai , a2 < ai , ..., an < ai .
i=1 i=1 i=1
n
P
Como ai < ai , então
i=1
n
X n
X n
X
a21 + a22 + ... + a2n ≤ a1 ai + a2 ai + ... + an ai
i=1 i=1 i=1
| {z } | {z } | {z }
(>a1 ) (>a2 ) (>an )
Então vale a desigualdade
n
! n
!2
X X
a2i < ai , ∀a > 0.
i=1 i=1

RESPOSTAS DOS EXERCÍCIOS SOBRE ESTATÍSTICA DESCRITIVA PROPOSTOS NA

PARTE II
Exercı́cio 1: Aplicações em indústrias siderúrgicas.

a. A largura mediana e a largura modal das chapas de aço de cada uma das três máquinas encontram-se no
quadro abaixo:
Máquina Largura Mediana Largura Modal
I 33 cm 33 cm
II 54 cm 61 cm
III 44 cm 39 cm
b. Para a obtenção do Coeficiente de Variação Amostral de cada uma das três máquinas, é necessário encontrar
as médias e os desvios-padrão, conforme quadro abaixo:
Máquina Largura Média (X) Desvio-padrão (S) Coeficiente de Variação CV
I 32, 2 cm 7, 26 cm 22, 55%
II 54, 8 cm 8, 91 cm 16, 25%
III 44, 6 cm 11, 38 cm 25, 51%
Dessa maneira, a máquina que apresentou a maior variabilidade na largura das chapas é a máquina III.
Exercı́cio 2: Aplicações em Controle da Qualidade da Água. As medidas estatı́sticas necessárias

para a resolução da questão são:
Estatı́stica descritiva (em mg/l) das três ETA’s.
Média Desvio-padrão Coeficiente de variação
ETA do municı́pio 1 0, 11 0, 0298 27, 09%
ETA do municı́pio 2 0, 08 0, 0334 41, 75%
ETA do municı́pio 3 0, 12 0, 0214 17, 83%
Podemos observar que a ETA do municı́pio 2 apresentou a maior variabilidade na concentração de mercúrio,
enquanto que a ETA do municı́pio 3 apresentou a menor variabilidade.
Exercı́cio 3: Aplicações na agroindústria. Com relação aos nı́veis de Potássio temos: n = 50, X =
2
79, 90 mg/m3 , M o = 82 mg/m3 , M e = 80 mg/m3 , A = 86 mg/m3 , dm = 11, 14 mg/m3 , S 2 = 253, 64 mg/m3 ,
S = 15, 93 mg/m3 e CV = 19, 94%.
Com relação ao teor de P h temos: n = 50, X = 5, 03, M o = 5, 10, M e = 5, 00, A = 1, 60, dm = 0, 28,
S 2 = 0, 1343, S = 0, 37 e CV = 7, 4%.
Exercı́cio 4: Aplicações em controle da qualidade da água. O valor do teor de chumbo para cada
uma das estações de tratamento de água é X1 = 26 ppm, X2 = 35 ppm, X3 = 35 ppm e X4 = 44 ppm.
Exercı́cio 5: Aplicações em dados educacionais. As medidas resumo necessárias para analisar as

amostras são:
A X = 19, 20 S = 8, 52 CV = 44, 38%
B X = 17, 20 S = 9, 95 CV = 57, 87%
C X = 18, 60 S = 10, 91 CV = 58, 63%
a. A escola B possui o menor número médio de alunos evadidos.
b. Analisando os desvios, podemos notar que estão próximos para as três escolas. Portanto, apenas com
o desvio-padrão sendo analisado, teremos dificuldade de tomar uma decisão a respeito dos dados quanto à sua
variação ocorrida em cada escola. Necessitamos do coeficiente para analisar melhor esses dados.
c. Dispondo dos coeficientes, percebemos que a escola A teve uma variação menor do que as outras duas
escolas. Isso quer dizer que a variação nos valores dessa escola foi menor do que a das outras duas escolas. Mas
mesmo assim, 44, 38% de variação pode ser considerado um valor alto.
Exercı́cio 6: Aplicações em biologia. Os pesos dos quatros ratos são:

X(1) = 75 gramas.
X(3) = 167 gramas.
X(5) = 185 gramas.
X(7) = 223 gramas.

Exercı́cio 7: Aplicações em pesquisas de aprendizagem.
Grupo 1 X = 36, 91 S = 24, 86 CV = 67, 35%

Grupo 2 X = 31, 55 S = 19, 54 CV = 61, 93%
Grupo 3 X = 25, 00 S = 9, 57 CV = 38, 28%
Grupo 4 X = 32, 36 S = 20, 21 CV = 62, 43%
Grupo 5 X = 28, 09 S = 14, 83 CV = 52, 79%
a. O grupo 3.
b. O grupo 1, com 67, 35%. Isso indica que os dados desse grupo estão mais dispersos, isto é, são mais
heterogêneos do que os dados dos outros grupos. Contrariamente aos outros grupos, o grupo 3 apresentou a menor
média, o menor desvio e o menor coeficiente. Seus dados são mais homogêneos em relação aos outros grupos.
Exercı́cio 8: Aplicações da indústria. As medidas resumo necessárias para analisar os três lotes são:
X S CV
Lote 1 20, 250 1, 98 9, 78%
Lote 2 21, 125 4, 79 22, 67%
Lote 3 21, 872 4, 26 19, 47%
Logo, o Lote 2 foi o lote que mais variou o peso em gramas.
Exercı́cio 9: Aplicações nas empresas. Como A = 3420 dólares, M e = 1850 dólares, M o = 2230 dólares
9
P
e Xi = 17930 dólares, temos que X(1) = 750 dólares, X(3) = 1670 dólares, X(5) = 1850 dólares e X(7) = 2230
i=1
dólares. Dessa forma a média amostral é X = 1992, 22 dólares e o desvio-padrão amostral é S = 969, 73 dólares.
Logo, o coeficiente de variação é CV = 48, 68%.
Exercı́cio 10: Aplicações gerais. X5 = 45.
Exercı́cio 11: Aplicações em biologia. O peso médio dos indivı́duos desta amostra é X = 512, 27 gramas.
Quanto ao valor modal, trata-se de um conjunto de dados amodal. O peso mediano encontrado é M e = 517 gramas.
A amplitude desta amostra vale A = 383 gramas. O desvio-padrão amostral vale S = 88, 25 gramas e o coeficiente
de variação vale CV = 17, 23%.
Exercı́cio 12: Aplicações gerais. Temos que a média amostral é dada por X = 4, o desvio-padrão amostral
é dado por S = 2, 1602 e, por consequência, o coeficiente de variação é dado por CV = 54, 01%.
Exercı́cio 13: Aplicações sanitárias e em saúde pública. Sabemos que a variância populacional é
expressa por
N N
2
Xi 2
P P
(Xi − µ)
i=1 i=1
σ2 = = − µ2
N N
N
P
Xi
i=1
Como µ = N , podemos reescrever como
N
N 2
2
P P
Xi Xi
i=1 i=1
σ2 = − .
N N2
Substituindo os valores jé conhecidos no enunciado temos que
140 302
− 2. 5=
N N
Portanto, trata-se de uma equação do segundo grau, cuja solução tem duas raı́zes: N = 18 ou N = 10. Desta
forma há dois possı́veis números de restaurantes auditados em Barreiras, N = 18 ou N = 10 restaurantes.
Exercı́cio 14: Aplicações em pesquisas socioeconômicas. Encontrando primeiramente o valor da média

amostral X:

n
P 12
P
Xi Xi
i=1 30
i=1
X = = = = 2, 5.
n 12 12
X = 2, 5 filhos por famı́lia.
Para encontrar o desvio-padrão amostral S, vamos encontrar a variância amostral S 2 :

n 2 n 2

Xi2 − 2Xi X + X
P P
Xi − X
i=1 i=1
S2 = = ,
n−1 n−1
que, pelas propriedades do somatório, segue que
n n n 2
Xi2
P P P
Xi X
i=1
S2 = − 2X i=1 + i=1 .
n−1 n−1 n−1
Substituindo os valores numéricos do enunciado, temos
98 30 12 × 2, 52
S2 = − 2 × 2, 5 × +
12 − 1 12 − 1 12 − 1
S2 = 2, 0909.
Portanto, o valor da variância amostral é S 2 = 2, 0909, e o desvio-padrão amostral S é a raı́z quadrada da

variância amostral, isto é,
√ p
S = S 2 = 2, 0909 = 1, 4460.
O coeficiente de variação é expresso por
s 1, 4460
CV = × 100% = × 100% = 57, 84%.
X 2, 5
CV = 57, 84%.
Exercı́cio 15: Aplicações gerais. Encontrando primeiramente o valor da média amostral X:

n
P 6
P
Xi Xi
i=1 i=1 21
X= = = = 3, 5.
n 6 6
Para encontrar o desvio-padrão amostral S, vamos encontrar a variância amostral S 2 :
n 2 n 2

Xi2 − 2Xi X + X
P P
Xi − X
S 2 = i=1 = i=1 ,
n−1 n−1
que, pelas propriedades do somatório, segue que
n n n 2
Xi2
P P P
Xi X
i=1
S2 = − 2X i=1 + i=1 .
n−1 n−1 n−1
Substituindo os valores numéricos do enunciado, temos
91 21 6 × 3, 52
S2 = − 2 × 3, 5 × +
6−1 6−1 6−1
S2 = 3, 5.
Portanto, o valor da variância amostral é exatamente igual ao valor da média amostral, ou seja, S 2 = 3, 5. O
desvio-padrão amostral, por sua vez, é a raı́z quadrada da variância amostral S 2 :
√ p
S = S 2 = 3, 5 = 1, 87.

O coeficiente de variação é expresso pelo quociente percentual entre o desvio-padrão e a média, isto é,
s 1, 87
CV = × 100% = × 100% = 53, 43%.
X 3, 5
CV = 53, 43%.
n
1
P
Exercı́cio 16. Por definição temos que a média da variável Y é dada por Y = n Yi . Como Yi = Xi X,
i=1
i = 1, 2, ..., n, segue imediatamente que:
n n n
1X 1X XX 2
Y = Yi = Xi X = Xi = X × X = X .
n i=1 n i=1 n i=1
2
Y = X .
Logo, a média da variável Y é o quadrado da média da variável X.
n
1
P Xi
Exercı́cio 17. Por definição temos que a média da variável Y é dada por Y = n Yi . Como Yi = X
,
i=1
i = 1, 2, ..., n, segue imediatamente que:
n n n
1X 1 X Xi 1 X X
Y = Yi = = Xi = = 1.
n i=1 n i=1 X nX i=1 X
Y = 1.
Logo, a média da variável Y é a constante 1, independentemente dos valores da variável X.
Exercı́cio 18. Sabemos que se Yi > Xi , então Yi − Xi = bi > 0, i = 1, 2, ..., n, o que implica em Yi = Xi + bi ,
i = 1, 2, ..., n. Portanto temos
n n n n
1X 1X 1X 1X
Y = Yi = (Xi + bi ) = Yi + bi = X + b.
n i=1 n i=1 n i=1 n i=1
Y = X + b.
Como bi > 0, i = 1, 2, ..., n, então a média b > 0. Logo, a média da variável Y é maior que a média da variável
X, isto é, Y > X.
Exercı́cio 19. Se a < Xi < b, i = 1, 2, ..., n, então
n
X n
X n
X
a< Xi < b
i=1 i=1 i=1
Dividindo todos os termos por n temos

n
P n
P n
P
a Xi b
i=1 i=1 i=1
⇒ < <
n n n
na nb
⇒ <X<
n b
⇒ a < X < b.
Logo, a média da variável X também está entre as constantes a e b, isto é, a < X < b.
Exercı́cio 20. Desenvolvendo a expressão, temos:
N
X N
X N
X N
X N
X
(Xi − µ) = Xi − µ= Xi − N × µ = Xi − N × µ
i=1 i=1 i=1 i=1 i=1
N N N N
X 1 X X X
= Xi − N × Xi = Xi − Xi = 0.
i=1
N i=1 i=1 i=1
N
X
(Xi − µ) = 0.
i=1
Logo, a soma de todos os desvios de um conjunto quantitativo de dados é sempre nula, isto é, mostre que
N
P
(Xi − µ) = 0.
i=1
N
1
P
Exercı́cio 21. Por definição temos que a média populacional da variável Z é dada por µZ = N Zi . Como
i=1
Zi = Xiσ−µ
X
X
, para i = 1, 2, ..., N , então segue imediatamente que:
N N N
1 X 1 X Xi − µX 1 X
µZ = Zi = = (Xi − µX ) .
N i=1 N i=1 σX N σX i=1
Conforme vimos na questão anterior, a soma de todos os desvios de um conjunto de dados quantitativos é
N
P
sempre nula, isto é, (Xi − µX ) = 0. Dessa forma temos que:
i=1
1
µZ = × 0 = 0.
N σX
Logo, a média populacional da variável Z é zero, isto é, µZ = 0.
No caso da variância da variável Z temos, por definição, que:
N
2 1 X 2
σZ = (Zi − µZ ) .
N i=1

Xi −µX
Como Zi = σX , para i = 1, 2, ..., N , e µZ = 0, então segue imediatamente que:

N N 2 N 2
2 1 X 2 1 X Xi − µX 1 X Xi − µX
σZ = (Zi − µZ ) = −0 =
N i=1 N i=1 σX N i=1 σX
N 2 N 2
1 X (Xi − µX ) 1 X (Xi − µX ) 1 2
= 2 = 2 = 2 × σX = 1.
N i=1 σX σX i=1 N σX
2
σZ = 1.
2
Logo, a variância populacional da variável Z vale um, isto é, σZ = 1.
Exercı́cio 22. Temos que a variância populacional é expressa por
N
2 1 X 2
σ = (Xi − µ)
N i=1
N
1 X
Xi2 − 2Xi µ + µ2

=
N i=1
N N N
Xi2 µ2
P P P
2Xi µ
i=1 i=1 i=1
= − +
N N N
N N
Xi2
P P
Xi
i=1 i=1 N µ2
= − 2µ +
N N N
N
Xi2
P
i=1
= − 2µ2 + µ2
N
N
Xi2
P
i=1
σ2 = − µ2 .
N
Exercı́cio 23. Se Zi = Xi +Yi , i = 1, 2, ..., n, então pelas propriedades da média sabemos que µZ = µX +µY .
Por definição a variância populacional de Z é expressa por
N
2 1 X 2
σZ = (Zi − µz )
N i=1
N
1 X 2
= [(Xi + Yi ) − (µX + µY )]
N i=1
Desenvolvendo o quadrado da diferença temos

N
2 1 Xh 2 2
i
σZ = (Xi + Yi ) − 2 (Xi + Yi ) (µX + µY ) + (µX + µY )
N i=1
N
1 X 2
Xi + 2Xi Yi + Yi2 − 2 (Xi µX + Xi µY + Yi µX + Yi µY ) + µ2X + 2µX µY + µ2Y

=
N i=1
N
1 X 2
Xi + 2Xi Yi + Yi2 − 2Xi µX − 2Xi µY − 2Yi µX − 2Yi µY + µ2X + 2µX µY + µ2Y

=
N i=1
Rearranjando os termos temos

N
2 1 X 2
Xi + 2Xi Yi + Yi2 − 2Xi µX − 2Xi µY − 2Yi µX − 2Yi µY + µ2X + 2µX µY + µ2Y

σZ =
N i=1
 
N
1 X 2 2 2 2
= Xi − 2Xi µX + µX + Yi − 2Yi µY + µY + 2Xi Yi − 2Xi µY − 2Yi µX + 2µX µY 

N |
i=1
{z } | {z }
(Xi −µX )2 (Xi −µY )2
N
1 Xh 2 2
i
= (Xi − µX ) + (Xi − µY ) + 2 (Xi Yi − Xi µY − Yi µX + µX µY )
N i=1
N N N N N N
2 1 X 2 1 X 2 2 X 2µY X 2µX X 2 X
σZ = (Xi − µX ) + (Xi − µY ) + (Xi Yi ) − Xi − Yi + µX µY
N i=1 N i=1 N i=1 N i=1 N i=1 N i=1
| {z } | {z }
N
2 2 X
= σX + σY2 + (Xi Yi ) − 2µY µX − 2µX µY + 2µX µY
N i=1
" N
#
2 1 X
= σX + σY2 + 2 (Xi Yi ) − µY µX
N i=1
Exercı́cio 24. Por definição, a média de Yi , i = 1, 2, ..., n, é dada por:
n
1X
Y = Yi
n i=1
Como Yi = a + bXi , para i = 1, 2, ..., n, então segue que
n n n n
1X 1X 1X na bX
Y = (a + bXi ) = a+ bXi = + Xi = a + bX
n i=1 n i=1 n i=1 n n i=1
Y = a + bX.

RESPOSTAS DOS EXERCÍCIOS SOBRE DADOS AGRUPADOS EM CLASSES PROPOSTOS

NA PARTE II
Exercı́cio 1.
a.) X = 38, 51 b.) M o = 37, 35 c.) M e = 37, 99

d.) s2 = 95, 6 e.) s = 9, 78 f.) CV = 25, 40%
g.) Q1 = 31, 82 h.) Q3 = 45, 07 i.) D1 = 25, 76
j.) D6 = 40, 02 k.) D9 = 52, 03 l.) P33 = 34, 32
m.) P84 = 48, 75 n.) P99 = 61, 73 o.) CS1 = 0, 1186
p.) CS2 = 0, 1595 q.) CSM = 0, 1516 r.) CKp = 0, 2522
s.) CKM = 2, 6939
Exercı́cio 2.
a.) X = 36, 86 b.) M o = 39, 06 c.) M e = 37, 92

d.) s2 = 83, 91 e.) s = 9, 16 f.) CV = 24, 85%
g.) Q1 = 31, 27 h.) Q3 = 42, 56 i.) D1 = 23, 10
j.) D6 = 39, 62 k.) D9 = 47, 01 l.) P33 = 35, 01
m.) P84 = 44, 36 n.) P99 = 61, 13 o.) CS1 = −0, 2402
p.) CS2 = −0, 3472 q.) CSM = −0, 1191 r.) CKp = 0, 2361
s.) CKM = 3, 2062
Exercı́cio 3.
a.) X = 780, 61 b.) M o = 642, 86 c.) M e = 729, 63

d.) s2 = 42083, 73 e.) s = 205, 14 f.) CV = 26, 28%
g.) Q1 = 608, 89 h.) Q3 = 916, 22 i.) D1 = 543, 56
j.) D6 = 802, 22 k.) D9 = 1075, 14 l.) P33 = 643, 73
m.) P84 = 1011, 57 n.) P99 = 1402, 00 o.) CS1 = 0, 6715
p.) CS2 = 0, 7455 q.) CSM = 0, 959 r.) CKp = 0, 2891
s.) CKM = 3, 1992
Exercı́cio 4.
a.) X = 703, 41 b.) M o = 539, 82 c.) M e = 640, 00

d.) s2 = 54616, 88 e.) s = 233, 70 f.) CV = 33, 22%
g.) Q1 = 511, 39 h.) Q3 = 851, 61 i.) D1 = 444, 56
j.) D6 = 718, 22 k.) D9 = 1056, 67 l.) P33 = 547, 04
m.) P84 = 953, 81 n.) P99 = 1360, 89 o.) CS1 = 0, 7000
p.) CS2 = 0, 8140 q.) CSM = 0, 9928 r.) CKp = 0, 2779
s.) CKM = 3, 0828
Exercı́cio 5.
a.) X = 317, 57 b.) M o = 339, 42 c.) M e = 325, 59

d.) s2 = 11113, 64 e.) s = 105, 42 f.) CV = 33, 20%
g.) Q1 = 240, 99 h.) Q3 = 391, 14 i.) D1 = 165, 00
j.) D6 = 351, 81 k.) D9 = 460, 47 l.) P33 = 271, 97
m.) P84 = 429, 25 n.) P99 = 558, 38 o.) CS1 = −0, 2073
p.) CS2 = −0, 2282 q.) CSM = −0, 2196 r.) CKp = 0, 2541
s.) CKM = 2, 6462
Exercı́cio 6.

a.) X = 87, 04 b.) M o = 76, 47 c.) M e = 80, 36

d.) s2 = 2446, 72 e.) s = 49, 46 f.) CV = 56.82%
g.) Q1 = 56, 25 h.) Q3 = 110, 42 i.) D1 = 27
j.) D6 = 90 k.) D9 = 144, 17 l.) P33 = 63, 96
m.) P84 = 130, 67 n.) P99 = 273 o.) CS1 = 0, 2137
p.) CS2 = 0, 4052 q.) CSM = 1, 3537 r.) CKp = 0, 2834
s.) CKM = 5, 8891
Exercı́cio 7.
a.) X = 217, 8 b.) M o = 267, 44 c.) M e = 229, 00

d.) s2 = 5148, 76 e.) s = 71, 75 f.) CV = 32, 94%
g.) Q1 = 164, 36 h.) Q3 = 275, 94 i.) D1 = 112, 50
j.) D6 = 252, 50 k.) D9 = 299, 38 l.) P33 = 185, 64
m.) P84 = 290, 00 n.) P99 = 344, 79 o.) CS1 = −0, 6918
p.) CS2 = −0, 4683 q.) CSM = −0, 4625 r.) CKp = 0, 2985
s.) CKM = 2, 3475
Exercı́cio 8.
a.) X = 29567, 9 b.) M o = 31600 c.) M e = 30161, 29

d.) s2 = 87623457 e.) s = 9360, 74 f.) CV = 31, 66%
g.) Q1 = 22685, 19 h.) Q3 = 36693, 55 i.) D1 = 15916, 67
j.) D6 = 32774, 19 k.) D9 = 41900 l.) P33 = 25085, 19
m.) P84 = 39045, 16 n.) P99 = 49190 o.) CS1 = −0, 2171
p.) CS2 = −0, 1902 q.) CSM = −0, 1924 r.) CKp = 0, 2696
s.) CKM = 2, 4291
Exercı́cio 9.
a.) X = 5, 7 b.) M o = 6, 45 c.) M e = 5, 95

d.) s2 = 4, 25 e.) s = 2, 06 f.) CV = 36, 14%
g.) Q1 = 4, 18 h.) Q3 = 7, 29 i.) D1 = 2, 63
j.) D6 = 6, 46 k.) D9 = 8, 27 l.) P33 = 4, 83
m.) P84 = 7, 87 n.) P99 = 9, 77 o.) CS1 = −0, 3641
p.) CS2 = −0, 3641 q.) CSM = −0, 3135 r.) CKp = 0, 2757
s.) CKM = 2, 2627
Exercı́cio 10.
a.) X = 38, 51 b.) M o = 37, 35 c.) M e = 37, 99

d.) s2 = 95, 6 e.) s = 9, 78 f.) CV = 25, 4%
g.) Q1 = 32, 68 h.) Q3 = 45, 07 i.) D1 = 25, 76
j.) D6 = 40, 02 k.) D9 = 52, 03 l.) P33 = 34, 32
m.) P84 = 48, 75 n.) P99 = 61, 73 o.) CS1 = 0, 1186
p.) CS2 = 0, 1595 q.) CSM = 0, 1516 r.) CKp = 0, 2358
s.) CKM = 2, 6939
Exercı́cio 11.
a.) X = 12, 70 b.) M o = 13, 58 c.) M e = 13, 02

d.) s2 = 17, 78 e.) s = 4, 22 f.) CV = 33.23%
g.) Q1 = 9, 64 h.) Q3 = 15, 65 i.) D1 = 6, 6
j.) D6 = 14, 07 k.) D9 = 18, 42 l.) P33 = 10, 88
m.) P84 = 17, 17 n.) P99 = 22, 34 o.) CS1 = −0, 2085
p.) CS2 = −0, 2275 q.) CSM = −0, 2176 r.) CKp = 0, 2542
s.) CKM = 2, 6461

RESPOSTAS DOS EXERCÍCIOS SOBRE CONJUNTOS
Exercı́cio 1.
a.) A ∪ B = {1, 2, 3, 4, 5, 6} b.) A − B = {1, 2}
c.) A ∩ B = {3, 4} d.) AC = {5, 6, 7, ...}
Exercı́cio 2. Todos são iguais, a ordem dos elementos não muda o conjunto.
Exercı́cio 3.
a.) A ∪ B = {a, b, d, e} f.) A ∪ B C = {a, b, c, d}

b.) B ∩ A = {b, d} g.) AC ∩ B C = {c}
c.) B C = {a, c} h.) B C | AC = {a}
C
d.) B | A = {e} i.) (A ∩ B) = {a, c, e}
C
e.) AC ∩ B = {e} j.) (A ∪ B) = {c}
Exercı́cio 4.
a.) A ∩ B = {2, 3} b.) A ∩ C = {4}

c.) B∩C =∅ d.) A∩B∩C =∅
Exercı́cio 5. A cargo do aluno.
Exercı́cio 9.
a.) Dos 500 alunos do colégio, 126 ficaram de recuperação.
b.) 42 alunos fizeram recuperação apenas de Fı́sica.
c.) 106 alunos ficaram de recuperação em apenas uma matéria.
Exercı́cio 11. Temos 23 alunos que se matricularam no curso de inglês.
Exercı́cio 12. Temos 162 alunos matriculados nesta Universidade.
Exercı́cio 13. O número de filiados simultaneamente às duas empresas A e B é de 50 pessoas.
Exercı́cio 14.
a.) AC = {5, 6, 7, 8, 9} b.) A ∩ C = {3, 4}
C
c.) (A ∩ C) = {1, 2, 5, 6, 7, 8, 9} d.) A ∪ B = {1, 2, 3, 4, 6, 8}
e.) B − C = {2, 8}

RESPOSTAS DOS EXERCÍCIOS SOBRE PROBABILIDADE
Exercı́cio 1. 0, 375 ou 37, 5%.

Exercı́cio 2. 0, 58 ou 58%.
Exercı́cio 4. 1/12 ou 0, 0833 ou 8, 33%.
Exercı́cio 6. 27/64 ou 0, 4219 ou 42, 19%.
Exercı́cio 7. 162 alunos.
Exercı́cio 8. 42 alunos.
37 21
Exercı́cio 10. a.) 124 b.) 124
Exercı́cio 11. a.) 0, 19 b.) 0, 49 c.) 0, 32
Exercı́cio 12. a.) 0, 65 b.) 0, 02 c.) 1
80 98 58 64
Exercı́cio 14. a.) 300 b.) 300 c.) 138 d.) 300
1
Exercı́cio 15. 6.
2
Exercı́cio 16. 3.
Exercı́cio 17. 0, 3 ≤ P (A ∩ B) ≤ 0, 6.
Exercı́cio 18. a.) p = P (B) = 0, 3 b.) p = P (B) = 0, 5
7
Exercı́cio 19. 10 .
Exercı́cio 20. a.) 0, 80 b.) 0, 68 c.) 0, 24 d.) 0, 75
Exercı́cio 21. 0, 0842.
1−p
Exercı́cio 22. np+1−p .
Exercı́cio 23. P (A ∩ B) = p2 .
Exercı́cio 24. 0, 8696.
Exercı́cio 25. a.) 0, 3480 b.) 0, 0480 c.) 0, 6520 d.) 0, 1667
Exercı́cio 26. 0, 3333.

RESPOSTAS DOS EXERCÍCIOS SOBRE VARIÁVEIS ALEATÓRIAS DISCRETAS
Exercı́cio 1.
Item a. A função distribuição é dada por:
a2 + a
F (a) = P (X ≤ a) = , a = 1, 2, ..., 10.
110
Note que 0 ≤ F (a) ≤ 1.
Item b. E (X) = 7 e V ar (X) = 6.
Exercı́cio 2: Aplicações em seguradoras de veı́culos.
a. Temos que E (X) = 1, 25 sinistro.

b. Como E X 2 = 2, 6864, então V ar (X) = 1, 12 sinistro2 e σ (X) = 1, 06 sinistro.
Exercı́cio 3: Aplicações em ecologia. (1, 5 pontos) O valor da constante c é 1/465. O valor da esperança
matemática é E (X) = 10, 67 ovos. O valor da esperança do segundo momento é E X 2 = 165, 33 e, portanto, o
valor da variância é V ar (X) = 51, 56 ovos2 e do desvio-padrão é σ (X) = 7, 18 ovos. A função distribuição avaliada
no ponto a, (a ≤ 30) é F (a) = P (X ≤ a) = 30+29+...+a
465 .
Exercı́cio 4: Aplicações em administração. (2, 0 pontos)
a. A esperança do número X de bônus a receber no final do mês é 1, 69 bônus.
b. A variância encontrada é V ar (X) = 1, 81 bonûs2 e o desvio-padrão é de σ (X) = 1, 35 bônus.
Exercı́cio 5. Aplicações gerais.
N +1 N 2 −1 c
a) E(W ) = 2 b) V AR(W ) = 12 c) P (W ≤ c) = N, c ≤ N.

Exercı́cio 6: Aplicações gerais. Temos que E (X) = 3, E X 2 = 11 e, por consequência, temos V ar (X) =
2.
Exercı́cio 7. Aplicações em biologia.
2 2N +1 N 2 +N −2
a. c= N (N +1) b. E (X) = 3 c. V AR (X) = 18
Exercı́cio 8: Aplicações gerais.
a. A cargo do aluno.
P (X=k+1) k+1
P (X=k+1)
b. P (X=k) = k q. Portanto, lim = q.
k→∞ P (X=k)
2
c. P (X ≥ 2) = 1 − (1 − q) .
1+q
d. E (X) = 1−q . Portanto, lim E (X) = 1.
q→0

RESPOSTAS DOS EXERCÍCIOS SOBRE VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Exercı́cio 1.
a. Para que f (x) seja de fato uma f.d.p temos a = 1.
b. P (X ≤ 1/3) = F (1/3) = 5/9.
Exercı́cio 2.
θ2
b. E (X) = 23 θ e V ar (X) = 18 .
x2 √θ .
c. F (x) = θ2 , 0 ≤ x ≤ θ. A mediana de X é M e = 2
Exercı́cio 3.
b. P (X ≤ 1/2) = F (1/2) = 15/28.
c. P (X ≥ 1/3) = 40/63.
d. P (1/4 ≤ X ≤ 3/4) = 1/2.
2
e. F (x) = 8x−x
7 .
f. F (7/8) = P (X ≤ 7/8) = 57/64.
Exercı́cio 4.
a. A cargo do aluno. b. P (X ≤ 1/2) = 1/4.
Exercı́cio 5.
a. A cargo do aluno. b. P (X ≥ 10) ∼
= 0.
Exercı́cio 6.
a. c = 3/256.
b. P (0 ≤ X ≤ 1) = 53/512.
c. F (2) = P (X ≤ 2) = 148/512.
d. F (3) = P (X ≤ 3) = 297/512.
3 2
e. F (x) = 2x +15x
512
+36x
.
f. P (X ≥ 7/2) = 791/1024.
Exercı́cio 7.
a. P (−a/2 < X < a/2) = 1/8. b. E (X) = 0 c. V ar (X) = 53 a2 .
Exercı́cio 8.
a. a cargo do aluno.
b. P (X < 1) = 1/125 e P (X > 3) = 98/125.
c. E (X) = 3, 75 e V ar (X) = 0, 9375.
d. M e = 3, 97.
e. F (x) = P (X ≤ x) = x3 /125.
Exercı́cio 9.
a. a cargo do aluno.
b. a cargo do aluno.
c. V ar (X) = 15 e σ (X) = 3, 8730.
Exercı́cio 10: Aplicações em engenharia.

a. Para que f (x) seja uma função densidade de probabilidade (f.d.p), o valor da constante deve ser c = 3/325.
Dessa forma encontramos P (4 ≤ X ≤ 7) = 0, 6369 ou 63, 69%.
b. Temos que M o = 4 minutos, M e = 5, 1139 minutos e E (X) = 5, 2115 minutos.
c. Como E X 2 = 29 minutos2 , então V ar (X) = 1, 84 minutos2 . A função distribuição F (x) = P (X ≤ x)
é expressa por:
−2x3 + 24x2 + 60x − 342
F (x) = , para 3 ≤ x ≤ 8.
650
Exercı́cio 11: Aplicações em engenharia. O valor da constante c afim de que f (x) seja, de fato, uma
f.d.p é c = 1/48. O valor numérico da esperança matemática é E (X) = 4, 36 minutos. O valor numérico do tempo
mediano é de M e = 4, 30 minutos. O valor numérico do tempo modal é de M o = 3 minutos.

RESPOSTAS DOS EXERCÍCIOS SOBRE A DISTRIBUIÇÃO BINOMIAL

Exercı́cio 1. Temos que o tamanho da amostra é n = 14 e a probabilidade de sucesso é p = 0, 28.
a. P (X ≥ 2) = 0, 9351 ou 93, 51%.
b. P (X = 7) = 0, 0464 ou 4, 64%.
c. P (X ≤ 12) = 0, 9999 ou 99, 99%.
Exercı́cio 2.
a. P (X = 0) = 0, 5997 ou 59, 97% d. P (X = 5) = 0, 4018 ou 40, 18%
b. P (X = 9) = 0, 0016 ou 0, 16% e. P (X = 9) = 0, 3874 ou 38, 74%
c. P (X = 8) = 0, 0439 ou 4, 39%
Exercı́cio 3.
a. E (X) = 4 e V ar (X) = 3, 6
b. E (X) = 16 e V ar (X) = 9, 6
c. E (X) = 40 e V ar (X) = 8
d. E (X) = 15 e V ar (X) = 7, 5
e. E (X) = 5 e V ar (X) = 3, 75
Exercı́cio 4. P (X ≥ 8) = 0, 6778 ou 67, 78%.
Exercı́cio 5. P (X = 8) = 0, 1201 ou 12, 01%.
Exercı́cio 6. Os valores numéricos dos parâmetros n e p são: n = 18 e p = 0, 40.
5
Exercı́cio 7. p = n+1 .
Exercı́cio 8. Os valores numéricos dos parâmetros n e p são: n = 20 e p = 0, 25.
Exercı́cio 9. Como E (X) = 1, 25V AR (X), temos que np = 1, 25np (1 − p), o que implica em 1 =
1, 25 (1 − p). Resolvendo esta equação temos que a probabilidade de sucesso é p = 0, 20 e, portanto, a proba-
bilidade de haver pelo menos uma lâmpada defeituosa num lote de n = 12 lâmpadas é P (X ≥ 1) = 0, 9313 ou
93, 13%.
Exercı́cio 10: Aplicações em geociências. Como E (X) = 2V ar (X), então p = 0, 50. Dessa forma, a
probabilidade de que, em uma amostra de n = 22 sondagens, pelo menos uma sondagem apresente petróleo é:
P (X ≥ 1) = 0, 9999999 aproximadamente 1 ou 100%.
RESPOSTAS DOS EXERCÍCIOS SOBRE A DISTRIBUIÇÃO DE POISSON
a. P (X ≥ 2) = 0, 5940 ou 59, 40% d. P (X ≥ 1) = 0, 9817 ou 98, 17%
b. P (X ≥ 3) = 0, 9863 ou 98, 63% e. P (X ≤ 3) = 0, 2650 ou 26, 50%
c. P (X ≤ 1) = 0, 6065 ou 60, 65%
Exercı́cio 2: Aplicações na saúde pública.
a. P (X = 10) = 0, 1048 ou 10, 48%.
b. P (X ≥ 2) = 0, 9999 ou 99, 99%.
c. P (X ≤ 2) = 0, 00008 ou 0, 008%.
Exercı́cio 3: Aplicações em estudos de rodovias.
a.) P (X ≥ 3) = 0, 8753 ou 87, 53% b.) P (X = 5) = 0, 1606 ou 16, 06%.
Exercı́cio 4: Aplicações em indústrias.
a.) P (X ≥ 3) = 0, 5768 ou 57, 68% b.) P (X = 8) = 0, 0463 ou 4, 63%
Exercı́cio 5: Aplicações em linha de montagem de automóveis.
a.) P (X ≤ 1) = 0, 1991 ou 19, 91% b.) P (X = 0) = 0, 2231 ou 22, 31%
Exercı́cio 6: Aplicações no setor bancário.
a.) P (X = 0) = 0, 000045 ou 0, 0045% b.) P (X ≤ 2) = 0, 1247 ou 12, 47%
Exercı́cio 7: Aplicações em biologia. E (X) = 1.
Exercı́cio 8: Aplicações gerais. λ = 0, 5.
Exercı́cio 9: Aplicações em biologia. E (X) = 4 e P (X = 6) = 0, 1042 ou 10, 42%.
Exercı́cio 10: Aplicações na ensino superior.
a. E (X) = λ = 3 alunos jubilados anualmente.
b. P (X = 2) = 0, 2240 ou 22, 40%.
Exercı́cio 11: Aplicações na aviação civil. A probabilidade de que, num intervalo de meia hora, exata-
mente 25 aviões pousem na pista é de P (X = 25) = 0, 0511 ou 5, 11%.

RESPOSTAS DOS EXERCÍCIOS SOBRE A DISTRIBUIÇÃO NORMAL
Exercı́cio 1: Aplicações na garantia de produtos. O fabricante espera trocar 20 baterias por mês.
Exercı́cio 2: Aplicações no tempo de vida de pneus.

a. P (X ≤ 170.000) ∼
=1
b. P (140.000 ≤ X ≤ 165.000) = 0, 9759 ou 97, 59%.
Exercı́cio 3: Aplicações em estudos antropométricos.

a. P (157 ≤ X ≤ 187) = 0, 9974 ou 99, 74%.
b. P (X ≥ 190) = 0, 0002 ou 0, 02%.
Exercı́cio 4: Aplicações no tempo de chegada.

a. P (28 < X < 40) = 0, 4564 ou 45, 64%.
b. P (12 < X < 28) = 0, 4890 ou 48, 90%.
c. P (10 < X < 40) = 0, 9513 ou 95, 13%.
d. P (X > 45) = 0, 0075 ou 0, 75%.
e. P (X < 8) = 0, 0021 ou 0, 21%.
f. P (15 < X < 20) = 0, 0957 ou 9, 57%.
g. Considerando os intervalos obtidos:
Considerando o item a.) Cerca de 548 alunos gastam entre 28 e 40 minutos para chegar a universidade.
Considerando o item b.) Cerca de 587 alunos gastam entre 12 e 28 minutos para chegar a universidade.
Considerando o item c.) Cerca de 1142 alunos gastam entre 10 e 40 minutos para chegar a universidade.
Considerando o item d.) Cerca de 9 alunos gastam mais de 45 minutos para chegar a universidade.
Considerando o item e.) Cerca de 3 alunos gastam menos de 8 minutos para chegar a universidade.
Considerando o item f.) Cerca de 115 alunos gastam entre 15 e 20 minutos para chegar a universidade.
Exercı́cio 5: Aplicações em indústrias.

a. Aproximadamente 1, 35 lâmpadas.
b. Aproximadamente 841, 34 lâmpadas.
c. Aproximadamente 121 lâmpadas.
Exercı́cio 6: Aplicações em indústrias. Espera-se trocar 1, 5 máquinas por mês.
Exercı́cio 7: Aplicações em meteorologia. P (35 ≤ X ≤ 40) = 0, 3479 ou 34, 79%.
Exercı́cio 8: Aplicações no estudo de salários.

a. P (1.000 ≤ X ≤ 2.000) = 0, 6589 ou 65, 89%.
b. P (X > 2.500) = 0, 0314 ou 3, 14%.
c. P (X < 900) = 0, 0034 ou 0, 34%.
Exercı́cio 9: Aplicações em estudos de vazão. A vazão diária Xα tal que P (X ≤ Xα ) = 0, 95 é de

1975, 75m3 /s.
Exercı́cio 10: Aplicações no estudo de salários.

a. Temos que Xα = P85 = R$3.036, 40, isto é, P (X ≤ 3.036, 40) = 0, 85. Interpretação: 85% dos funcionários
desta grande indústria metalúrgica ganham abaixo de 3.036, 40 reais, ou equivalentemente, 15% dos funcionários
ganham acima de 3.036, 40 reais.
b. Temos que Xα = P20 = R$2.030, 60, isto é, P (X ≤ 2.030, 60) = 0, 20. Interpretação: 20% dos funcionários
desta grande indústria metalúrgica ganham abaixo de 2.030, 60 reais, ou equivalentemente, 80% dos funcionários
ganham acima de 2.030, 60 reais.
c. Primeiramente temos que P (X ≤ 1000) = 0, 0028 ou 28%. Multiplicando pelo número de funcionários
desta indústria, 2500, temos que 7 funcionários ganham menos de 1000 reais.
d. Primeiramente temos que P (X > 678) = 0, 9996 ou 99, 96%. Multiplicando pelo número de funcionários
desta indústria, 2500, temos que 2499 funcionários ganham mais de 678 reais.
e. Primeiramente temos que P (800 < X < 3800) = 0, 9924 ou 99, 24%. Multiplicando pelo número de
funcionários desta indústria, 2500, temos que 2481 funcionários ganham entre 800 e 3800 reais.
Exercı́cio 11: Aplicações em variáveis ambientais.

a. P (X > 100) = 0, 9999 ou 99, 99%.
b. P (X < 380) = 0, 9979 ou 99, 79%.
c. Temos que a vazão encontrada Xα é de 288, 3 m3 /s, pois P (X ≤ 288, 35) = 0, 75.
d. Temos que a vazão encontrada Xα é de 216, 53 m3 /s, pois P (X ≥ 216, 53) = 0, 85.

RESPOSTAS DOS EXERCÍCIOS SOBRE COMBINAÇÃO LINEAR DE DISTRIBUIÇÕES

NORMAIS

a. P (Y ≤ 1150) = 0, 0537 ou 5, 37%.
b. P [Y ≥ E (Y )] = 0, 5 ou 50%.
c. P (1155 ≤ X ≤ 1265) = 0, 9086 ou 90, 86%.

a. P (Y ≥ 420) = 0, 0384 ou 3, 84%.
b. P (Y ≤ 436) = 0, 9934 ou 99, 34%.
c. P (300 ≤ Y ≤ 480) = 0, 9998 ou 99, 98%.
Exercı́cio 3: Aplicações em transporte de cargas.

a. P (7.893 ≤ Y ≤ 7.910) = 0, 0110 ou 1, 10%.
b. P (Y ≥ 7.722) = 0, 9625 ou 96, 25%.
Exercı́cio 4: Aplicações em sistema de segurança. P (bloqueio) = P (Y ≥ 450kg) = 0, 2061 ou 20, 61%.
Exercı́cio 5: Aplicações na pecuária.

a. P (Y ≥ 15.110) = 0, 0009 ou 0, 09%.
b. P (14.910 ≤ Y ≤ 14.960) = 0, 1239 ou 12, 39%.
Exercı́cio 6: Aplicações na indústria metalúrgica.

a. P (Y ≥ 660) = 0, 9744 ou 97, 44%.
b. P (896 ≤ Y ≤ 915) = 0, 0158 ou 1, 58%.

a. P (260 ≤ S ≤ 460) = 0, 7540 ou 75, 40%.
b. P (S ≥ 500) = 0, 0526 ou 5, 26%.
c. P (S ≤ 220) = 0, 0526 ou 5, 26%.
d. P (D ≤ −300) = 0, 0003 ou 0, 03%.
e. P (D ≥ 150) = 0, 0418 ou 4, 18%.
f. P (−235 ≤ D ≤ 180) = 0, 9779 ou 97, 79%.
Exercı́cio 8: Aplicações em linha de montagem de automóveis. O tempo total de montagem do

automóvel KAPPA tem distribuição normal com média µT = 165 minutos e variância σ 2 = 225 minutos2 , isto é:
T ∼ N (165, 225)
A probabilidade de um automóvel qualquer ter um tempo total de montagem entre 170 minutos e 200 minutos
é de 0, 3608 ou 36, 08%. Sabendo que esta empresa monta 5.000 automóveis por ano, então cerca de 1804 automóveis
tem um tempo total de montagem entre 170 minutos e 200 minutos.
Exercı́cio 9: Aplicações em linha de produção. A distribuição de probabilidades do tempo total T de

montagem é
T ∼ N 900seg , 11100seg 2 ou ainda T ∼ N 15min , 185min2 .

Dessa maneira, a probabilidade do tempo total de montagem do equipamento eletro eletrônico ser maior do
que 20 minutos é P (T > 20) = 0, 3557 ou 35, 57%.

RESPOSTAS DOS EXERCÍCIOS SOBRE AMOSTRAGEM PARA POPULAÇÃO FINITA
Exercı́cio 1.
a. k = 6 amostras em um processo sem reposição.
b. A cargo do aluno.
c. µ = 2, 50 e X = 2, 50.
Exercı́cio 2.
a. k = 10 amostras em um processo sem reposição.
b. A cargo do aluno.
c. µ = 24 e X = 24.
Podemos observar que a média das médias mostrais X coincide com a média populacional µ e que a dispersão
da população é maior que a dispersão das médias amostrais.
Exercı́cio 3.
a. k = 3.160 amostras possı́veis b. k = 82.160 amostras possı́veis
c. k = 1.581.580 amostras possı́veis d. k = 24.040.016 amostras possı́veis
e. k = 6.400 amostras possı́veis f. k = 512.000 amostras possı́veis
g. k = 40.960.000 amostras possı́veis h. k = 3.276.800.000 amostras possı́veis
Exercı́cio 4.
a. k = 12.650 amostras possı́veis b. k = 53.130 amostras possı́veis
c. k = 390.625 amostras possı́veis d. k = 9.765.625 amostras possı́veis
Exercı́cio 5.
a. k = 10 amostras possı́veis b. k = 45 amostras possı́veis
c. k = 120 amostras possı́veis d. k = 210 amostras possı́veis
e. k = 252 amostras possı́veis f. k = 210 amostras possı́veis
g. k = 120 amostras possı́veis h. k = 45 amostras possı́veis
i. k = 10 amostras possı́veis j. k = 1 amostras possı́veis
RESPOSTAS DOS EXERCÍCIOS SOBRE ESTIMAÇÃO PONTUAL
Exercı́cio 1.
b ∼ N 32 µ, 45 σ 2 .

a. µ
b. O estimador µ µ) 6= µ.
b é viciado para o parâmetro µ, pois E (b
Exercı́cio 2.
a. Ambos estimadores são não-viciados pois E λ b1 = E λ b2 = λ.
b. Para n > 2 o estimador λ b1 é mais eficiente que λ
b2 .
2
Exercı́cio 3. Ambos os estimadores são não-viciados. Temos que V ar (b µ1 ) = σ10 < V AR (b
µ2 ) = 1, 5σ 2 .
Então µ
b1 é o estimador mais eficiente para µ pois possui a menor variância dentre os estimadores propostos.
Exercı́cio 4.
a. µ
b1 = 65, µb2 = 65, µ b3 = 65, µ
b4 = 66, 5, µb5 = 65, 33, µ
b6 = 63.
b. Temos que µ b1 é o melhor estimador para a média populacional µ pois é não-viciado e de variância mı́nima.
Note que µb1 é a média amostral e, portanto, sempreterá a menor variância.
θ+1 θ+1
Exercı́cio
5. Temos queE (X) = 2 e E X = 2 .
a. E θb1 = θ + 1, E θb2 = θ e E θb3 = θ. Logo, θb2 e θb3 são estimadores não-viciados para o parâmetro θ.
2
2

−1 −1
b. V ar θb1 = θ12n , V ar θb2 = θ12n 7

e V ar θb3 = 24 θ2 − 1 . Logo, θb2 é um estimador mais eficiente
para o parâmetro θ, pois dentre os estimadores não-viciados θb2 é o que possui a menor variância.
Exercı́cio 6.
a. Ambos os estimadores são não-viciados, pois E λ b1 = E λ b2 = λ.

b. Temos que V ar λ b1 = λ < V AR λ b2 = 3λ . Então temos que λ b1 é o estimador mais eficiente para λ,
4 10
pois possui a menor variância.
Exercı́cio 7. Temos que

E θb1 = θ ; E θb2 = θ ; E θb3 = θ.
Verificamos que os três estimadores são não-viciados para o parâmetro θ. Quanto a variância temos que

V ar θb1 = 0, 018σ 2 ; V ar θb2 = 1, 49σ 2 ; V ar θb3 = 0, 0211σ 2 .
Logo, o estimador mais eficiente ou mais preciso é o estimador θb1 pois possui a menor variância.

RESPOSTAS DOS EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA POPULACIONAL

CONSIDERANDO VARIÂNCIA CONHECIDA
Exercı́cio 1.
a. Temos µ = 81 ± 1, 97 e, portanto, o IC (90%) para o parâmetro µ é [79, 03; 82, 97]. Interpretação: Temos
90% de confiança de que o intervalo [79, 03; 82, 97] contenha o parâmetro populacional µ.
b. Temos µ = 81 ± 2, 35 e, portanto, o IC (95%) para o parâmetro µ é [78, 65; 83, 35]. Interpretação: Temos
95% de confiança de que o intervalo [78, 65; 83, 35] contenha o parâmetro populacional µ.
c. Temos µ = 81 ± 3, 09 e, portanto, o IC (99%) para o parâmetro µ é [77, 91; 84, 09]. Interpretação: Temos
99% de confiança de que o intervalo [77, 91; 84, 09] contenha o verdadeiro parâmetro populacional µ.
Exercı́cio 2. n = 1537.
Exercı́cio 3. n = 96.
Exercı́cio 4.
a. Não, pois temos o IC(95%) para µ: [1, 18 anos ; 1, 42 anos]. Interpretação: Temos 95% de confiança
de que o intervalo [1, 18 anos ; 1, 42 anos] contenha o tempo de vida útil médio populacional µ, em anos.
b. Sim, pois temos o IC(95%) para µ: [1, 48 anos ; 1, 72 anos]. Interpretação: Temos 95% de confiança
de que o intervalo [1, 48 anos ; 1, 72 anos] contenha o tempo de vida útil médio populacional µ, em anos.
Exercı́cio 5. Temos que µb = X = 27.350 horas e o IC (99%) para µ é [25.355, 41 horas ; 29.344, 59 horas].
Interpretação: Temos 99% de confiança de que o intervalo µ é [25.355, 41 horas ; 29.344, 59 horas] contenha o
tempo médio populacional µ de vida dos discos rı́gidos.
Exercı́cio 6. O IC (95%) para µ é [136, 08 mm ; 143, 92 mm]. Interpretação: Temos 95% de confiança
de que o intervalo [136, 08 mm ; 143, 92 mm] contenha o verdadeiro comprimento médio populacional µ das peças
produzidas por essa máquina.
Questão 7: Aplicação em estudos demográficos.
a. O IC (95%) para a altura média µX dos alunos é: [168, 92 cm ; 179, 08 cm]. Interpretação: Temos 95%
de confiança de que o intervalo [168, 92 cm ; 179, 08 cm] contém a altura média µX dos alunos.
b. O IC (95%) para a altura média µY das alunas é: [159, 54 cm ; 166, 46 cm]. Interpretação: Temos 95%
de confiança de que o intervalo [159, 54 cm ; 166, 46 cm] contém a altura média µY das alunas.
c. A distribuição de probabilidades da diferença amostral X − Y é dada por:
σ2 σ2

X − Y ∼ N µX − µY ; X + Y

m n
d. O IC (95%) para a diferença populacional µX − µY é:
r
2
σX σ2
+ Y,

X − Y ± Zα/2
m n
Ou seja,
11 cm ± 6, 15cm.
Logo, o IC (95%) para a diferença populacional µX − µY é: [4, 85 cm ; 17, 15 cm]. Numa situação hipotética
em que o valor numérico zero estivesse dentro do IC, então significa que não há diferença entre a altura média dos
alunos e a altura média das alunas.

RESPOSTAS DOS EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA POPULACIONAL

CONSIDERANDO VARIÂNCIA DESCONHECIDA
Exercı́cio 1: Aplicações em estudos ambientais.

Temos que os dados amostrais são n = 26, X = 123, 85 mmHg/l de mercúrio e S = 27, 70 mmHg/l de
mercúrio.
a. Para um nı́vel de confiança de 90% em uma amostra de tamanho n = 26 temos o valor de tα/2 = 1, 7081.
Portanto, o intervalo de confiança IC (90%) para o nı́vel médio µ de contaminação do rio por mercúrio é dado por:
[114, 57 mmHg/l ; 133, 13 mmHg/l] .
Interpretação: Temos 90% de confiança de que o intervalo [114, 57 mmHg/l ; 133, 13 mmHg/l] contém
o nı́vel médio µ de contaminação do rio por mercúrio.
Para um nı́vel de confiança de 95% em uma amostra de tamanho n = 26 temos o valor de tα/2 = 2, 0595. O
intervalo de confiança IC (95%) para o nı́vel médio µ de contaminação do rio por mercúrio é dado por:
[112, 66 mmHg/l ; 135, 04 mmHg/l] .
Para um nı́vel de confiança de 99% em uma amostra de tamanho n = 26 temos o valor de tα/2 = 2, 7874. O
intervalo de confiança IC (99%) para o nı́vel médio µ de contaminação do rio por mercúrio é dado por:
[108, 71 mmHg/l ; 138, 99 mmHg/l] .

b. Caso quiséssemos um erro de estimativa de 10 mmHg/l e considerando um nı́vel de confiança de 95%,
deverı́amos medir n = 33 pontos no rio, ou seja, a amostra piloto não foi suficiente. Caso quiséssemos um erro de
estimativa de 25 mmHg/l deverı́amos medir n = 5 pontos no rio, isto é, a amostra piloto foi suficiente.
Exercı́cio 2: Aplicações em controle da qualidade.
Item a. Temos os seguintes dados amostrais: n = 9, X = 1759 dias e s = 545, 40 dias. Com um nı́vel de
confiança de 98% temos tα/2 = 2, 8965. Desta forma, o IC (98%) para o tempo médio µ de vida desse componente
eletrônico é [1232, 42 dias ; 2285, 58 dias].
Interpretação: Temos 98% de confiança de que o intervalo [1232, 42 dias ; 2285, 58 dias] contém o tempo
médio populacional µ de vida desse componente eletrônico.
Item b. Considerando o mesmo nı́vel de confiança e um erro de estimativa de 100 dias, o tamanho da
amostra deveria ser:
2 2
tα/2 × S

2, 8965 × 545, 40
n= = = 249, 56 ∼
= 250 dias.
e 100
Item c. Considerando um erro de estimativa de 550 temos:
2 2
tα/2 × S

2, 8965 × 545, 40
n= = = 8, 25 ∼
= 9 dias.
e 550
Exercı́cio 3: Aplicações no setor bancário.
a. Com tα/2 = 2, 1604 temos R$914, 64 ± R$179, 31, isto é, o IC (95%) para µ é
[R$735, 33 ; R$1093, 95].
Interpretação: Temos 95% de confiança de que o intervalo [R$735, 33 ; R$1093, 95] contenha o verdadeiro
saldo médio populacional das contas corrente desse banco.
b. Com tα/2 = 2, 6503 temos R$914, 64 ± R$219, 97, isto é, o IC (98%) para µ é
[R$694, 67 ; R$1134, 61].
interpretação: Temos 98% de confiança de que o intervalo [R$694, 67 ; R$1134, 61] contenha o verdadeiro
saldo médio populacional µ das contas corrente desse banco.

c. Considerando um nı́vel de confiança de 95%, o tamanho da amostra caso o gerente quisesse admitir um
erro de estimativa de no máximo 50 reais no saldo médio é de n = 180.
d. Admitindo um erro de estimativa de no máximo 300 reais temos que n = 5, isto é, a amostra retirada foi
suficiente para a estimação.
a. Com tα/2 = 2, 0301 temos µ = 28, 35 ± 2, 54, isto é, o IC (95%) para µ é [25, 81 ; 30, 89].
Interpretação: Temos 95% de confiança de que o intervalo [25, 81 ; 30, 89] contenha o verdadeiro parâmetro
populacional µ.
b. Com tα/2 = 1, 6896 temos µ = 28, 35 ± 2, 11, isto é, o IC (90%) para µ é [26, 24 ; 30, 46].
Interpretação: Temos 95% de confiança de que o intervalo [26, 24 ; 30, 46] contenha o verdadeiro parâmetro
populacional µ.
a. Temos µ = 1400 ± 95, 95, isto é, o IC (95%) para µ é [1304, 05 ; 1495, 95].
Interpretação: Temos 95% de confiança de que o intervalo [1304, 05 ; 1495, 95] contenha o verdadeiro saldo
médio populacional µ.
b. Temos µ = 1400 ± 128, 45, isto é, o IC (99%) para µ é [1271, 55 ; 1528, 45].
Interpretação: Temos 99% de confiança de que o intervalo [1271, 55 ; 1528, 45] contenha o verdadeiro saldo
médio populacional µ.
Exercı́cio 6: Aplicações no setor de serviços.

a. O IC (95%) para µ é [190, 2 segundos ; 199, 8 segundos].
Interpretação: Temos 95% de confiança de que o intervalo [190, 2 segundos ; 199, 8 segundos] contenha o
verdadeiro tempo médio de atendimento dessa agencia lotérica.
b. Sim, pois temos n = 0, 26.
Exercı́cio 7: Aplicações em medicina.

Temos µ = 2, 1 ± 0, 03, isto é, o IC (90%) para µ é [2, 07 minutos ; 2, 13 minutos].
Interpretação: Temos 90% de confiança de que o intervalo [2, 07 minutos ; 2, 13 minutos] contenha o tempo
médio µ de reação desta injeção intravenosa.
Exercı́cio 8: Aplicações em pesquisas antropométricas. Temos µ b = X = 70, 65kg, isto é, o IC (95%)
para µ é [67, 99 kg ; 73, 31 kg].
Interpretação: Temos 95% de confiança de que o intervalo [67, 99 kg ; 73, 31 kg] contenha o verdadeiro
peso médio populacional µ dos funcionários dessa grande empresa multinacional.
Exercı́cio 9: Aplicações em farmacologia.

a. Temos µ = 12 ± 1, 14, isto é, o IC (95%) para µ é [10, 82 min ; 13, 18 min].
Interpretação: Temos 95% de confiança de que o intervalo [10, 82 min ; 13, 18 min] contenha o verdadeiro
tempo médio populacional µ para o medicamento fazer efeito.
b. n = 202.
Exercı́cio 10: Aplicações na indústria automobilı́stica.

a. Temos µ = 14, 8 ± 1, 07, isto é, o IC (95%) para µ é [13, 73 ; 15, 87].
Interpretação: Temos 95% de confiança de que o intervalo [13, 73 ; 15, 87] contenha o verdadeiro consumo
médio em quilômetros por litro deste novo modelo de carro desta montadora.
b. Temos µ = 14, 8 ± 0, 88, isto é, o IC (90%) para µ é [13, 92 ; 15, 68].
Interpretação: Temos 90% de confiança de que o intervalo [13, 92 ; 15, 68] contenha o verdadeiro consumo
médio em quilômetros por litro deste novo modelo de carro desta montadora.
Exercı́cio 11: Aplicações na pediatria.

a. O IC (95%) para µ é [5853, 26 gramas ; 5946, 74 gramas].
Interpretação: Temos 95% de confiança de que o intervalo [5853, 26 gramas ; 5946, 74 gramas] contenha o
verdadeiro peso médio populacional µ dos bebês do sexo masculino com 12 semanas de vida.
b. Temos que n = 175 crianças devem ser pesadas.

Exercı́cio 12: Aplicações em pesquisas antropométricas.

Temos µb = X = 174, 87cm e o IC (95%) para µ é [169, 54 cm ; 180, 20 cm].
Interpretação: Temos 95% de confiança de que o intervalo [169, 54 cm ; 180, 20 cm] contenha a verdadeira
altura média populacional µ, ou seja, a altura média de todos os alunos dessa escola.
Exercı́cio 13: Aplicações em biologia.

a. O IC (90%) para µ é [1.560, 36 quilos ; 2.247, 64 quilos].
Interpretação: Temos 90% de confiança de que o intervalo [1.560, 36 quilos ; 2.247, 64 quilos] contem o
verdadeiro peso médio µ dos filhotes de baleia da espécie Jubarte.
O IC (95%) para µ é [1.471, 29 quilos ; 2.336, 71 quilos].
b. A amostra dever ter um tamanho de n = 33 filhotes.
Exercı́cio 14: Aplicação em estudos da vazão de rios.

a. Temos que o intervalo
IC (95%) para a vazão média µ do rio considerando os dois perı́odos é
3, 88 m3 /s ; 5, 01 m3 /s . Interpretação: Temos 95% de confiança de que o intervalo 3, 88 m3 /s ; 5, 01 m3 /s
contenha a vazão média µ do rio considerando os dois perı́odos.
b. Temos que o intervalo IC (95%) para a vazão média µ referente ao perı́odo seco
é 2, 61 m3 /s ; 3, 95 m3 /s .
Interpretação: Temos 95% de confiança de que o intervalo 2, 61 m3 /s ; 3, 95 m3 /s contenha a vazão média µ do
rio referente ao perı́odo seco.
c. Temos que o intervalo IC (95%) para a vazão média µ referente ao perı́odo chuvoso
é 4, 92 m3 /s ; 6, 29 m3 /s .
Interpretação: Temos 95% de confiança de que o intervalo 4, 92 m3 /s ; 6, 29 m3 /s contenha a vazão média µ do
rio referente ao perı́odo chuvoso.
d. Analisando os intervalos obtidos podemos observar que há diferença na vazão média do perı́odo chuvoso
é maior que a vazão média do perı́odo seco.
e. Considerando um erro de estimativa de 0, 30m3 /s, seriam necessárias n = 129 medições de vazão para
estimar a vazão média do perı́odo seco. Quanto ao perı́odo chuvoso seriam necessárias n = 135 medições.
f. Considerando um erro de estimativa de 0, 20m3 /s, seriam necessárias n = 290 medições de vazão para
estimar a vazão média do perı́odo seco. Quanto ao perı́odo chuvoso seriam necessárias n = 303 medições.
Exercı́cio 15: Aplicação em estudos de preservação.

a. O valor numérico do desvio-padrão obtido nessa amostra é S = 87, 95.
b. Deverı́amos medir n = 40 pontos considerando um erro de estimativa e = 35 ppm.
Exercı́cio 16. Aplicações à engenharia ambiental:

Como temos o IC (98%) para o nı́vel médio µ de contaminação do solo por chumbo igual a
[135, 80 ppm ; 247, 80 ppm], então o erro de estimativa é e = 56 ppm. Como a expressão para o erro de estimativa
é dada por:
S
e = tα/2 √ ,
n
e o tamanho da amostra é n = 17 e tα/2 = 2, 5835, segue direto que S = 89, 37.
Utilizando a expressão para determinar o tamanho da amostra considerando um erro de estimativa e = 25 ppm
temos
tα/2 × S 2
2
2, 5835 × 89, 37
n = = = 85, 29
e 25
⇒ n = 85 pontos de sondagem

RESPOSTAS DOS EXERCÍCIOS SOBRE ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL
Exercı́cio 1: Aplicação em pesquisa de satisfação.
a. O intervalo de confiança IC (95%) para a proporção p de clientes insatisfeitos com o prazo de entrega do
imóvel é [0, 3962 ; 0, 5150]. Interpretação: Temos 95% de confiança de que o intervalo [0, 3962 ; 0, 5150] contém
a proporção p de clientes insatisfeitos com o prazo de entrega do imóvel.
b. Considerando 95% de confiança o tamanho da amostra, considerando um erro de estimativa de 3%, deveria
ser n = 1059 clientes. Supondo que ainda não foi consultado nenhum cliente, o tamanho da amostra, para esse
nı́vel de confiança, considerando um erro de estimativa de 3% deveria ser n = 1067 clientes.
Exercı́cio 2.
26
Item a. Temos que pb = 192 = 0, 1354.
Para 90% de confiança, temos que Zα/2 = 1, 645 e o IC (90%) para a proporção de produtos defeituosos p é
[0, 0948; 0, 1760].
Interpretação: Temos 90% de confiança de que o intervalo [0, 0948; 0, 1760] contém a verdadeira proporção de
produtos defeituosos p.
[0, 0870; 0, 1838].
[0, 0718; 0, 1990].
Item b. Se ainda não foi colhida nenhuma amostra temos que o tamanho da amostra deve ser:
Para um erro de estimativa de 2, 5% temos n = 1.537.
Para um erro de estimativa de 6% temos n = 267.
Para um erro de estimativa de 12% temos n = 67.
Exercı́cio 3.
a. Temos que pb = 0, 5850 e o IC (95%) para p é [0, 5545 ; 0, 6155]. Interpretação: Temos 95% de confiança
de que o intervalo [0, 5545 ; 0, 6155] contem a verdadeira proporção populacional p de habitantes insatisfeitos com
a administração estadual.
b. n = 1492.
c. Redirecionar o plano, pois o IC mostra que este valor é superior a 50%.
Exercı́cio 4.
a. Temos que o IC (95%) para p é [0, 2800 ; 0, 3867]. Interpretação: Temos 95% de confiança de que o
intervalo [0, 2800 ; 0, 3867] contem a verdadeira proporção populacional p de pessoas que consomem o produto.
b. Não, pois n = 2358.
c. Sim, pois o IC mostra que 40% está dentro do IC (99%). O IC (99%) para p é [0, 2632 ; 0, 4034].
Interpretação: Temos 99% de confiança de que o intervalo [0, 2632 ; 0, 4034] contem a verdadeira proporção
populacional p de pessoas que consomem o produto.
Exercı́cio 5.
a. pb = 0, 2901.
b. O IC (95%) para p é [0, 2763 ; 0, 3036]. Interpretação: Temos 95% de confiança de que o intervalo
[0, 2763 ; 0, 3036] contem a verdadeira proporção populacional p de pinheiros afetados pela doença.
Exercı́cio 6. Temos que pb = 0, 6406 e o IC (95%) para p é [0, 5230 ; 0, 7582]. Interpretação: Temos 95%
de confiança de que o intervalo [0, 5230 ; 0, 7582] contem a verdadeira proporção populacional p de pacientes que
sofrem desta sı́ndrome neurológica que são curados. Na continuação do exercı́cio temos que n = 354 doentes teriam
que ser observados.

Exercı́cio 7.
a. n = 787 grávidas. b. n = 2401 grávidas.
Exercı́cio 8.
a. n = 43. b. n = 96. c. n = 384.
Exercı́cio 9.
a. n = 30. b. n = 68. c. n = 271.
Exercı́cio 10.
a. O IC (95%) para p é [68, 16%; 75, 84%]. Interpretação: Temos 95% de confiança de que o intervalo
[68, 16%; 75, 84%] contem a verdadeira proporção populacional p de indivı́duos obesos com hipertensão arterial.
b. O IC (99%) para p é [66, 95%; 77, 05%]. Interpretação: Temos 99% de confiança de que o intervalo
[66, 95%; 77, 05%] contem a verdadeira proporção populacional p de indivı́duos obesos com hipertensão arterial.
c. n = 310.
d. n = 861.
e. n = 4.268.
Exercı́cio 11.
a. O IC (95%) para p é [54, 93%; 70, 41%]. Sim, o diretor da TV por assinatura tem razão em afirmar que
mais de 50% dos assinantes estão satisfeitos com o conteúdo do canal A, pois temos 95% de confiança de que o
intervalo [54, 93%; 70, 41%] contem a verdadeira proporção populacional p de assinantes satisfeitos com o conteúdo
do canal A.
b. O IC (95%) para p é [45, 78%; 70, 35%]. Sim, o diretor da TV por assinatura tem razão em afirmar que
metade das assinantes do sexo feminino estão insatisfeitas com o conteúdo do canal A, pois temos 95% de confiança
de que o intervalo [45, 78%; 70, 35%] contem a verdadeira proporção populacional p de assinantes do sexo feminino
que estão insatisfeitos com o conteúdo do canal A.
c. O IC (95%) para p é [68, 52%; 86, 03%]. Interpretação: Temos 95% de confiança de que o intervalo
[68, 52%; 86, 03%] contem a verdadeira proporção populacional p de assinantes do sexo masculino que estão satis-
feitos com o conteúdo do canal A.
d. O IC (95%) para p é [29, 62%; 54, 22%]. Interpretação: Temos 95% de confiança de que o intervalo
[29, 62%; 54, 22%] contem a verdadeira proporção populacional p de assinantes do sexo feminino que estão satisfeitos
com o conteúdo do canal A.
e. Podemos observar que, a partir dos intervalos de confiança obtidos em c e d, a proporção de homens
satisfeitos para o conteúdo do canal A é maior que a proporção de mulheres satisfeitas.
f. Sim, a amostra é suficiente, pois, para um erro de no máximo 10% bastaria n = 90 assinantes.
g. A amostra dever ter um tamanho de n = 96 assinantes.
Exercı́cio 12. Aplicações em estudos imobiliários:
Item a. O intervalo de confiança IC (95%) para a proporção p de clientes insatisfeitos com o prazo de entrega
do imóvel é [0, 4949 ; 0, 6145] ou [49, 49% ; 61, 45%].
Interpretação: Temos 95% de confiança de que o intervalo [0, 4949 ; 0, 6145] contem a proporção p de clientes
insatisfeitos com o prazo de entrega do imóvel.
Item b. Considerando um erro de estimativa de 5% o tamanho da amostra deveria ser n = 380 clientes.
Supondo que ainda não foi consultado nenhum cliente, e considerando o mesmo erro de estimativa de 5% o tamanho
da amostra deveria ser n = 384 clientes.

RESPOSTAS DOS EXERCÍCIOS SOBRE TESTES DE HIPÓTESE PARA A MÉDIA

POPULACIONAL
Exercı́cio 1. Trata-se de um teste unilateral a direita. Dados amostrais: X = 9, 99 horas, S = 2, 01 horas.

Como o tamanho da amostra é grande, isto é, n = 150, e considerando um nı́vel de significância de 5%, verificamos
na tabela t-student que o valor do t crı́tico é tc = 1, 645. O valor da estatı́stica observada é to = 12, 13. Portanto
temos:
Método da estatı́stica teste: |to | > |tc |.
Método do intervalo de confiança:
Como o teste é unilateral, temos que o IC (90%) para µ é [9, 72 horas ; 10, 26horas].
Conclusão: Rejeita-se H0 , isto é, existe evidências estatı́sticas de que a carga horária está muito acima de 8
horas diárias, considerando 5% de significância.
Exercı́cio 2. Trata-se de um teste bilateral. Dados amostrais: X = 93, 8 gramas, S = 10, 93 gramas. Como o
tamanho da amostra é n = 15, e considerando um nı́vel de significância de 1%, verificamos na tabela t-student que
o valor do t crı́tico é tc = 2, 9768. O valor da estatı́stica observada é to = −2, 20. Portanto temos:
Método da estatı́stica teste: |to | < |tc |.
Como o teste é bilateral, temos que o IC (99%) para µ é [85, 40 gramas ; 102, 20gramas].
Conclusão: Aceita-se H0 , isto é, existe evidências estatı́sticas de que o peso médio µ do instrumento de precisão
é de 100g, considerando um nı́vel de significância de 1%.
Exercı́cio 3. Trata-se de um teste unilateral a esquerda. Temos que X = 57 gramas e o desvio padrão
populacional é conhecido, σ = 8 gramas. Desta forma devemos usar a distribuição normal padrão Z. Considerando
5% de significância, verificamos na tabela Z que o valor do Z crı́tico é Zc = 1, 645. O valor da estatı́stica observada
é Zo = 0, 79. Portanto temos:
Método da estatı́stica teste: |Zo | < |Zc |.
Como o teste é unilateral, temos que o IC (90%) para µ é [52, 84 gramas ; 61, 16gramas].
Conclusão: O comerciante está falando a verdade com relação ao peso dos ovos. Aceita-se H0 , isto é, existe
evidências estatı́sticas de que o peso médio µ dos ovos é de 55 gramas, considerando um nı́vel de significância de
5%.
v Exercı́cio 4. Trata-se de um teste unilateral a esquerda. Dados amostrais: X = 0, 997 litros e o desvio
padrão populacional é conhecido, σ = 0, 005 litros. Desta forma devemos usar a distribuição normal padrão Z.
Considerando um nı́vel de significância de 5%, verificamos na tabela Z que o valor do Z crı́tico é Zc = 1, 645. O
valor da estatı́stica observada é Zo = −2, 4. Portanto temos:
Método da estatı́stica: |Zo | = |−2, 4| > |Zc | = |1, 645|.
O IC (95%) para µ é [0, 995 litros; 0, 999 litros].
Método do p-value: p − value = 0, 0164 < α = 0, 05.
Conclusão: Rejeita-se H0 , isto é, há evidências de que o volume médio µ de todos os pacotes de leite seja
menor que 1 litro, considerando um nı́vel de confiança de 95%.
Exercı́cio 5. Trata-se de um teste bilateral. Dados amostrais: X = 510 gramas e o desvio padrão populacional
é conhecido, σ = 10 gramas. Desta forma devemos usar a distribuição normal padrão Z. Considerando um nı́vel de
significância de 5%, verificamos na tabela Z que o valor do Z crı́tico é Zc = 1, 96. O valor da estatı́stica observada
é Zo = 3. Portanto temos:
Método da estatı́stica teste: |Zo | > |Zc |.
Como o teste é bilateral, temos que o IC (95%) para µ é [503, 47 gramas ; 516, 53 gramas].
Conclusão: Rejeita-se H0 , isto é, existe evidências estatı́sticas de que o peso médio µ do saco de café não seja
de 500 gramas, considerando um nı́vel de significância de 5%. Em outras palavras, a máquina não está corretamente
regulada.
Exercı́cio 6. Trata-se de um teste unilateral a direita.

Método da estatı́stica: |to | = |3, 15| > |tc | = |1, 833|.
O IC (95%) para µ é [1, 1363 ; 1, 5143].
Conclusão: Rejeita-se H0 , isto é, há evidências de que o fertilizante aumenta o rendimento médio do tomateiro,
considerando um nı́vel de significância de 5%.

Exercı́cio 7. Trata-se de um teste unilateral a direita.

Método da estatı́stica: |to | = |0, 3| < |tc | = |1, 860|.
O IC (95%) para µ é [4, 66 ; 7, 74].
Método do p-value: p − value = 0, 6141 > α = 0, 05.
Conclusão: Aceita-se H0 , isto é, não há evidências de que o nı́vel médio de cálcio para esse paciente seja mais
alto que o normal, considerando um nı́vel de significância de 5%
Exercı́cio 8. Trata-se de um teste unilateral a esquerda.

Método da estatı́stica: to = −2, 40 < tc = 1, 753.
O IC (95%) para µ é [47, 34 ; 52, 66].
Conclusão: Rejeita-se H0 , isto é, há evidências de que a dieta realmente reduziu o peso médio µ das mulheres,
considerando um nı́vel de significância de 5%
Exercı́cio 9. Trata-se de um teste unilateral a esquerda.

Considerando α = 0, 01:
Método da estatı́stica: |to | = |−5, 20| > |tc | = |3, 365|.
O IC (99%) para µ é [6, 67 ; 11, 33].
Método do p-value: p − value ∼ = 0 < α = 0, 01.
Conclusão: Rejeita-se H0 , isto é, há evidências de que a campanha de sinalização foi efetiva, considerando um
nı́vel de significância de 1%
Método da estatı́stica: |to | = |−5, 20| > |tc | = |2, 015|.
O IC (95%) para µ é [7, 52 ; 10, 48].
Conclusão: Rejeita-se H0 , isto é, há evidências de que a campanha de sinalização foi efetiva, considerando um
nı́vel de significância de 5%
Exercı́cio 10. Trata-se de um teste bilateral.
Método da estatı́stica: |to | = |−1, 03| < |tc | = |2, 571|.
O IC (95%) para µ é [5, 72; 6, 12].
Conclusão: Aceita-se H0 , isto é, há evidências de que a porcentagem de nitrogênio é de 6%, considerando um
nı́vel de significância de 5%.
Temos que n = 28, X = 502 gramas e S = 19, 86 gramas. Como |to = 0, 5329| < |tc = 2, 0518| temos a seguinte
conclusão:
Conclusão: Aceita-se H0 , isto é, não há evidências de que o peso médio das caixas de sabão em pó não seja
500 gramas, considerando 5% de significância.
Exercı́cio 12. Trata-se de um teste unilateral à direita.

Temos que n = 16, X = 64, 25 minutos e S = 13, 84 minutos. Como |to = 1, 2283| < |tc = 1, 7531| temos a
seguinte conclusão:
Conclusão: Aceita-se H0 , isto é, não há evidências de que o tempo médio de montagem deste eletrodoméstico
seja maior do que 60 minutos, considerando 5% de significância.
Exercı́cio 13. Trata-se de um teste unilateral à esquerda.
Temos que n = 18, X = 17400 e S = 5370, 73. Como |to = −2, 0539| < |tc = −1, 7396| temos a seguinte
conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências de que o tempo médio de vida útil dos pneus fabricados seja
menor que 20.000 km, considerando 5% de significância.
Temos que n = 14, X = 104, 5 e S = 5, 08. Como |tO = 3, 3145| > |tC = 2, 1604|, temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências de que a largura média da chapa de aço não seja 100 cm

RESPOSTAS DOS EXERCÍCIOS SOBRE TESTES DE HIPÓTESE PARA A PROPORÇÃO

POPULACIONAL
Exercı́cio 1.
Método da estatı́stica: |Zo | = |2, 8005| > |Zc | = |1, 645|
Método do IC: O IC (95%) para p é [0, 8108; 0, 8892].
Rejeita-se a hipótese nula H0 , isto é, a empresa deve optar pelo lançamento do serviço, a um nı́vel de confiança
de 95%.
Método da estatı́stica: |Zo | = |2, 5| > |Zc | = |2, 33|.
Rejeita-se a hipótese nula H0 , isto é, a empresa deve optar pelo lançamento do serviço, a um nı́vel de confiança
de 99%.
Exercı́cio 2.
Rejeita-se a hipótese nula H0 , isto é, A associação entre a digoxina e os outros medicamentos fizeram variar o
número de reações adversas, a um nı́vel de confiança de 95%.
Rejeita-se a hipótese nula H0 , isto é, a associação entre a digoxina e os outros medicamentos fizeram variar o
número de reações adversas, considerando um nı́vel de confiança de 95%.
Exercı́cio 3.
Método da estatı́stica: |Zo | = |−1, 47| < |Zc | = |1, 645|
Aceita-se a hipótese nula H0 , isto é, não há razões para afirmar a eficácia do método a um nı́vel de confiança
de 95%.
Exercı́cio 4.
a.) Considerando α = 0, 05:

Método da estatı́stica: |Zo | = |−4, 20| > |Zc | = |1, 96|
Rejeita-se H0 , isto é, não é compatı́vel com a pretensão do produtor de que é 90% eficaz a um nı́vel de confiança
de 95%.
b.) Método da estatı́stica: |Zo | = |−4, 20| > |Zc | = |1, 645|

Rejeita-se H0 , isto é, a eficácia do chá para curar dores de cabeça é menor que 90% a um nı́vel de confiança de
95%. Exercı́cio 5.
a.) Testando ervilhas amarelas de casca macia:

Aceita-se H0 , isto é, os resultados da estação agronômica são compatı́veis com as leis de Mendel a um nı́vel de
confiança de 99%.
b.) Testando ervilhas amarelas de casca dura:

Método da estatı́stica: |Zo | = |0, 51| < |Zc | = |2, 575|
confiança de 99%.
c.) Testando ervilhas verdes de casca macia:

confiança de 99%.
d.) Testando ervilhas verdes de casca dura:
confiança de 99%.
Exercı́cio 6.
Rejeita-se H0 , isto é, há evidências de que o percentual de cura em adultos no caso de pneumonia é de 90% a
um nı́vel de confiança de 95%.
Exercı́cio 7.
Aceita-se a hipótese nula, isto é, os dados são não-viciados a um nı́vel de confiança de 95%.
Exercı́cio 8.

Rejeita-se a hipótese nula, isto é, o novo medicamento não tem sua eficácia em 90% dos casos a um nı́vel de
confiança de 95%.
Rejeita-se a hipótese nula, isto é, o novo medicamento não tem sua eficácia em 90% dos casos a um nı́vel de
confiança de 99%.
Exercı́cio 9.
Método do IC: O IC (95%) para (pA − pB ) é [−0, 0092; 0, 1692].
Aceita-se a hipótese nula, isto é, não há diferenças significativas entre a intenção de voto dos eleitores do distrito
A e B a um nı́vel de confiança de 95%.
Exercı́cio 10.
a.) O IC (95%) para p é [0, 5353; 0, 6647].
b.) n = 881.
c.) Método da estatı́stica: |Zo | = |3, 03| > |Zc | = |1, 645|
Portanto, rejeita-se a hipótese nula H0 = 0, 5, isto é, mais da metade das viram o programa, a um nı́vel de
confiança de 95%.
RESPOSTAS DOS EXERCÍCIOS TESTES DE HIPÓTESE PARA A VARIÂNCIA

POPULACIONAL
Exercı́cio 1.)
(n−1)s2
σ2 = 6, 252, considerando α = 0, 05 temos 0, 8312 < 6, 252 < 12, 833.
E o IC (95%) para σ 2 é [121.795, 37; 1.880.413, 86]
Conclusão: Aceitamos a hipótese nula de que σ 2 = 250.000.
Exercı́cio 2.)
(n−1)s2
σ2 = 78, 125, considerando α = 0, 05 temos 78, 125 ∈/ [32, 357; 71, 420].
E o IC (95%) para σ 2 é [70, 01; 154, 53]
Conclusão: Rejeitamos a hipótese nula de que σ 2 = 64.
(n−1)s2
σ2 = 78, 125, considerando α = 0, 01 temos 78, 125 ∈ [27, 991; 79, 490].
E o IC (99%) para σ 2 é [62, 90; 178, 63]
Conclusão: Aceitamos a hipótese nula de que σ 2 = 64.
Exercı́cio 3.)
a.) Temos σ c2 = s2 = 0, 0231 e o IC (95%) para σ 2 é [0, 0124; 0, 0575].
b.) Considerando α = 0, 05 rejeitamos H0 , isto é σ 2 6= 0, 01.
O IC (99%) para σ 2 é [0, 0103; 0, 0794].
Considerando α = 0, 01 rejeitamos H0 , isto é σ 2 6= 0, 01.
Exercı́cio 4.)
2 2
a.) Considerando α = 0, 05 rejeitamos H0 , isto é σA 6= σB .
Fo = 5, 32 > Fc = 4, 95 e p − value = 0, 0434 < α = 0, 05.
2 2
b.) Considerando α = 0, 01 aceitamos H0 , isto é σA = σB .
Fo = 5, 32 < Fc = 10, 67 e p − value = 0, 0434 > α = 0, 01.

RESPOSTAS DOS EXERCÍCIOS TESTES DE HIPÓTESE PARA A DIFERENÇA DE DUAS

MÉDIAS POPULACIONAIS
Exercı́cio 1. Temos que os dados amostrais são: X = 50, 87, SX = 9, 46, Y = 56, 75 e SY = 6, 36.
Item a. Teste de hipótese bilateral para µX :

H0 : µX = 50
H1 : µX 6= 50
Como tO = 0, 3562 e tC = 2, 9768, temos a seguinte conclusão:

Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que o volume médio mensal de vendas da fábrica
A é 50, considerando 1% de significância.
Item b. Teste de hipótese bilateral para µY :

H0 : µY = 50
H1 : µY 6= 50

Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que o volume médio mensal de vendas da fábrica
B é 50, considerando 1% de significância.
Item c. Teste de hipótese unilateral para a diferença populacional µX − µY :

H0 : µX = µY
H1 : µX ≤ µY
Como tO = −1, 5705 e tC = 2, 5177, temos a seguinte conclusão:

Conclusão: Aceita-se H0 , isto é, não há diferenças significativas entreo volume médio mensal de vendas da
fábrica A e o volume de vendas da fábrica B, considerando 1% de significância.
Exercı́cio 2.
2
Trata-se de um teste de hipótese bilateral. Temos que X = 7, 3, SX = 2, 6, Y = 7, 1, SY = 3, 1 e S = 8, 125.
Conclusão: Aceita-se H0 , isto é, não há evidências estatı́sticas de que o rendimento médio dos alunos de
economia seja diferente do rendimento médio dos alunos de administração, considerando 5% de significância.
Exercı́cio 3.
Trata-se de um teste de hipótese unilateral à esquerda. Temos que X = 3, 2, SX = 0, 80, Y = 3, 7, SY = 0, 9 e
2
S = 0, 725.
Como tO = −2, 5039 e tC = −2, 4233, temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que o tempo médio de adaptação dos homens é
menor do que o tempo médio de adaptação das mulheres, considerando 1% de significância.
Exercı́cio 4.
Trata-se de um teste de hipótese unilateral à direita. Temos que X = 227, 58, SX = 13, 84, Y = 247, 92,
2
SY = 21, 59 e S = 328, 84.
Como tO = −2, 6305 e tC = 2, 5083, temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que incentivos por meio de comissões gerem
uma venda média maior, considerando 1% de significância.
Exercı́cio 5.
Trata-se de um teste de hipótese bilateral. Temos que X = 1180, SX = 120, Y = 1160, SY = 40.
Como ZO = 1, 5811 e ZC = 1, 96, temos a seguinte conclusão:
Conclusão: Aceita-se H0 , isto é, há evidências estatı́sticas de que as marcas das pilhas têm a mesma duração
média, considerando 5% de significância.
Exercı́cio 6.
Trata-se de um teste de hipótese unilateral à esquerda. Temos que X = 47, 0, SX = 7, 8, Y = 53, 8, SY = 6, 1 e
2
S = 48, 12.
Como tO = −3, 1300 e tC = −1, 6849, temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que os pacientes com depressão têm uma função
cortical abaixo do normal, considerando 5% de significância.

Exercı́cio 7.
2
Trata-se de um teste de hipótese bilateral. Temos que X = 1, 8, SX = 0, 40, Y = 0, 66, SY = 0, 20 e S = 0, 0930.
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que a cirrose de fı́gado faz variar o ı́ndice de
atividade da colinesterase no soro, considerando 5% de significância.
Exercı́cio 8.
2
Trata-se de um teste de hipótese bilateral. Temos que X = 100, SX = 283, 33, Y = 60, SY2 = 207, 89 e
2
S = 232, 14.
Conclusão: Rejeita-se H0 , isto é, não há evidências estatı́sticas de que a venda média da região sul é igual a
venda média da região norte, considerando 5% de significância.
RESPOSTAS DOS EXERCÍCIOS SOBRE TESTES DE HIPÓTESE PARA DADOS PAREADOS
Exercı́cio 1. Trata-se de um teste de hipótese unilateral à esquerda para µd (dados pareados). Como tO =
−2, 4024 e tC = 1, 8331 temos a seguinte conclusão:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que a ração engorda os animais, considerando
1% de significância.
Exercı́cio 2. Trata-se de um teste de hipótese unilateral à direita para µd (dados pareados). Temos que
d = 0, 12 e Sd = 0, 4050
Método da estatı́stica teste: tO = 0, 9370 e tC = 1, 3830.
Método do p-value: p − value = 0, 3742.
Método do IC: O intervalo de confiança para µd é [−0, 1697 ; 0, 4097].
Conclusão: Aceita-se H0 , isto é, não há evidências de que o curso contribuiu para a economia de combustı́vel,
Exercı́cio 3. Trata-se de um teste de hipótese unilateral à direita para µd (dados pareados). Temos que d = 5
e Sd = 1, 8708
Método do IC: O intervalo de confiança para µd é [2, 6771 ; 7, 3229].
Conclusão: Rejeita-se H0 , isto é, há evidências de que a máquina B é mais rápida que a máquina A, conside-
rando 5% de significância.
Exercı́cio 4. Trata-se de um teste de hipótese unilateral à direita para µd (dados pareados). Temos que
d = 32, 6667 e Sd = 21, 8654
Conclusão: Rejeita-se H0 , isto é, há evidências de que o tratamento contribuiu para diminuir a pressão sistólica
dos indivı́duos hipertensos, considerando 5% de significância.
e Sd = 10, 0995
Método do IC: O intervalo de confiança para µd é [−2, 2248 ; 12, 2248].
Conclusão: Aceita-se H0 , isto é, não há evidências de que a campanha antipoluição reduziu de fato a poluição,
e Sd = 3, 6056
Conclusão: Rejeita-se H0 , isto é, há evidências de que existe uma queda significativa da pressão sanguı́nea
sistólica após a ingestão de etanol, considerando 5% de significância.

RESPOSTAS DOS EXERCÍCIOS SOBRE ANÁLISE DE VARIÂNCIA
Exercı́cio 1. Os dados amostrais neste exercı́cio são os seguintes:
Grupos Tamanho da amostra Média Amostral Variância Amostral

Grupo 1 7 2,52 0,2541
Grupo 2 7 3,25 0,1243
Grupo 3 6 2,54 0,4881
Grande Média: X = 2, 78.

Variância Entre: Sb2 = 1, 1704.
2
Variância Dentro: Sw = 0, 2771.
Dessa forma, temos o valor da estatı́stica observada Fo = 4, 2235 e o valor crı́tico Fc = 3, 59. Como Fo > Fc ,
conclui-se:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que pelo menos um grupo tenha o valor médio
diferente dos demais grupos, considerando 5% de significância.
Tabela ANOVA
Fonte de Graus de Soma dos Média dos Valor F Valor F
Variabilidade Liberdade Quadrados Quadrados Observado Crı́tico
Variabilidade
Entre 2 2, 3409 1, 1704 4, 2235 3, 59
Variabilidade
Dentro 17 4, 7111 0, 2771
Variabilidade
Total 19 7, 0520

Grupo 1 8 12,75 1,9286
Grupo 2 8 12,50 6,0000
Grupo 3 8 11,75 1,9286
Grupo 4 8 14,38 1,1250

2
Dessa forma, temos o valor da estatı́stica observada Fo = 3, 5626 e o valor crı́tico Fc = 2, 95. Como Fo > Fc ,
conclui-se:
Conclusão: Rejeita-se H0 , isto é, há evidências estatı́sticas de que pelo menos um grupo tenha o valor médio
diferente dos demais grupos, considerando 5% de significância.
Tabela ANOVA
Variabilidade
Entre 3 29, 3438 9, 7813 3, 5626 2, 95
Variabilidade
Dentro 28 76, 8750 2, 7455
Variabilidade
Total 31 106, 2188


Grupo 1 6 1305,50 23510,30
Grupo 2 6 1094,50 24433,10
Grupo 3 6 1226,50 27702,70
Grupo 4 6 1063,00 13636,40
Grupo 5 6 1264,83 38067,37

2
Dessa forma, temos o valor da estatı́stica observada Fo = 2, 6807 e o valor crı́tico Fc = 2, 76. Como Fo < Fc ,
conclui-se:
Conclusão: Aceita-se H0 , isto é, não há evidências estatı́sticas de que um grupo tenha o valor médio diferente
dos demais grupos, considerando 5% de significância.
Tabela ANOVA
Variabilidade
Entre 4 273108, 13 68277, 03 2, 6807 2, 76
Variabilidade
Dentro 25 636749, 33 25469, 97
Variabilidade
Total 29 909857, 47

Grupo 1 6 117,17 534,5667
Grupo 2 8 123,88 397,5536
Grupo 3 5 114,20 393,7000
Grupo 4 9 120,11 561,6111

2
Dessa forma, temos o valor da estatı́stica observada Fo = 0, 2288 e o valor crı́tico Fc = 3, 01. Como Fo < Fc ,
conclui-se:
Conclusão: Aceita-se H0 , isto é, não há evidências estatı́sticas de que um grupo tenha o valor médio diferente
dos demais grupos, considerando 5% de significância.
Tabela ANOVA
Variabilidade
Entre 3 329, 6028 109, 8676 0, 2288 3, 01
Variabilidade
Dentro 24 11523, 3972 480, 1416
Variabilidade
Total 27 11853, 0000

RESPOSTAS DOS EXERCÍCIOS SOBRE REGRESSÃO LINEAR SIMPLES
Exercı́cio 1.
a. rXY = 0, 9259. Interpretação de rXY : 92, 59% das observações de Y estão correlacionadas positivamente
com as observações de X.
b. Yb = −39, 15 + 66, 1X.
c. βb0 nesse caso não há interpretação prática, pois não há altura zero.
d. βb1 = 66, 1 : Para cada unidade de X aumentamos 66, 1 unidades em Y .
2
e. rXY = 0, 8573. Então 85, 73% das observações de Y são explicadas por X.
f. Se X = 1, 75m então Yb = 76, 5kg.
g. Se X = 1, 85m então Yb = 83, 1kg.
h. Se X = 1, 98m então Yb = 91, 7kg.
Exercı́cio 2.)
2
a.) Modelo linear: Yb = −3659, 4354 + 363, 2251X e rXY = 0, 4966
Modelo exponencial: Yb = 0, 0036 × 2, 3791X e 2
rXY = 0, 9006
Modelo potência: Yb = 2E − 09X 10,1189 e 2
rXY = 0, 9025
b.) Logo, o modelo potência é o melhor modelo ajustado.
c.) Se X = 20 então Yb = 29251, 8.
Exercı́cio 3.)
a.) rXY = 0, 9499
Interpretação: 94, 99% das observações de Y estão correlacionadas positivamente com as observações de X.
b.) Yb = −5847, 6 + 254, 39X.

c.) βb0 nesse caso não há interpretação prática, pois não há zero semanas de gestação.
d.) βb1 = 254, 39 : Para cada unidade de X aumentamos 254, 39 unidades em Y .
2
e.) rXY = 0, 9023. Então 90, 23% das observações de Y são explicadas por X.
f.) Se X = 32 semanas, então Yb = 2293 gramas.
g.) Se X = 40 semanas, então Yb = 4328 gramas.
Exercı́cio 4.)
2
a.) Modelo linear: Yb = −5847, 6 + 254, 39X. e rXY = 0, 9023.
rXY = 0, 9592.
3,2393 2
Modelo potência: Y = 0, 0294X
b e rXY = 0, 9489.
b.) Logo, o modelo exponencial é o melhor modelo ajustado.
c.) Se X = 38 então Yb = 3936 gramas.
Exercı́cio 5.)
a.) rXY = −0, 9334
Interpretação: 93, 34% das observações de Y estão correlacionadas negativamente com as observações de X.
Em outras palavras, quanto maior a renda familiar, menor o número de filhos por famı́lia.
b.) Yb = 4, 588 − 0, 6479X.

c.) βb0 = 4, 588. Numa hipótese pouco provável de não haver renda alguma
esperamos que a famı́lia tenha aproximadamente 5 filhos.
d.) βb1 = 0, 6479 : Para cada unidade de X diminuı́mos 0, 6479 unidades em Y .
2
e.) rXY = 0, 8712. Então 87, 12% das observações de Y são explicadas por X.

Exercı́cio 6.)
2
Modelo linear: Yb = −137 + 46, 291X. e rXY = 0, 7064.
X 2
Modelo exponencial: Y = 1, 3406 × 1, 8268
b e rXY = 0, 9945.
Modelo potência: Yb = 0, 9760X 2,4043 e 2
rXY = 0, 9281.
Logo, o modelo exponencial é o melhor modelo ajustado.
Exercı́cio 7.)
2
Modelo linear: Yb = 58, 487 − 1, 5192X. e rXY = 0, 9037.
X 2
b e rXY = 0, 9810.
Modelo potência: Yb = 657, 99X −1,1022 e 2
rXY = 0, 9852.
Logo, o modelo potência é o melhor modelo ajustado.
Exercı́cio 8.)
2
Modelo linear: Yb = −0, 5714 + 6, 1429X e rXY = 0, 9783.
rXY = 0, 8925.
rXY = 0, 9853.
Considerando o melhor modelo ajustado, que é o modelo potência, a altura esperada de um pé de feijão após
X = 8 semanas é de Yb = 50, 17.
Exercı́cio 9.)
2
Modelo linear: Yb = 61, 5804 + 1, 4169X e rXY = 0, 6480.
X 2
Modelo exponencial: Yb = 62, 3653 × 1, 0178 e rXY = 0, 6201.
0,1479 2
b e rXY = 0, 5397.
Considerando o melhor modelo ajustado, que é o modelo linear, o valor esperado para X = 18 é de Yb = 87, 08.
Exercı́cio 10.)
2
rXY = 0, 6619.
0,4181 2
b e rXY = 0, 6653.
2
O melhor modelo ajustado é o modelo linear, pois possui o maior rXY .
Exercı́cio 11.) A cargo do aluno.
Exercı́cio 12.)
2
rXY = 0, 6859.
rXY = 0, 64440.
2
O melhor modelo ajustado é o modelo potência, pois possui o maior rXY .
Exercı́cio 13.)
2
rXY = 0, 9624.
0,5322 2
b e rXY = 0, 9537.
2
O melhor modelo ajustado é o modelo linear, pois possui o maior rXY .
Exercı́cio 14.)
2
a.) Modelo linear: Yb = 752, 98 − 27, 46X. e rXY = 0, 9386.
X 2
b e rXY = 0, 9990.
Modelo potência: Yb = 54128090X −4,2166 e 2
rXY = 0, 9974.
Logo, o modelo exponencial é o melhor modelo ajustado.
b.) Se X = 19 reais, então Yb = 222 pizzas.
c.) Se X = 16 reais, então Yb = 399 pizzas.

Tabela da distribuição normal padrão

Tabela da distribuição normal padrão Z: A Tabela abaixo fornece a área sombreada associada ao valor
Z encontrado na padronização, ou seja, a probabilidade de Z estar entre os valores 0 e Z tabulado, conforme figura
abaixo. Linhas: referem-se à unidade e a primeira casa decimal. Colunas: referem-se à segunda casa decimal.
0.0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
4.0 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

Tabela da distribuição T-Student
Nı́vel de significância Nı́vel de significância

g.l 10% 5% 2, 5% 1% 0, 5% g.l 10% 5% 2, 5% 1% 0, 5%
1 3, 0777 6, 3138 12, 7062 31, 8207 63, 6574 46 1, 3002 1, 6787 2, 0129 2, 4102 2, 6870
2 1, 8856 2, 9200 4, 3027 6, 9646 9, 9248 47 1, 2998 1, 6779 2, 0117 2, 4083 2, 6846
3 1, 6377 2, 3534 3, 1824 4, 5407 5, 8409 48 1, 2994 1, 6772 2, 0106 2, 4066 2, 6822
4 1, 5332 2, 1318 2, 7764 3, 7469 4, 6041 49 1, 2991 1, 6766 2, 0096 2, 4049 2, 6800
5 1, 4759 2, 0150 2, 5706 3, 3649 4, 0322 50 1, 2987 1, 6759 2, 0086 2, 4033 2, 6778
6 1, 4398 1, 9432 2, 4469 3, 1427 3, 7074 51 1, 2984 1, 6753 2, 0076 2, 4017 2, 6757
7 1, 4149 1, 8946 2, 3646 2, 9980 3, 4995 52 1, 2980 1, 6747 2, 0066 2, 4002 2, 6737
8 1, 3968 1, 8595 2, 3060 2, 8965 3, 3554 53 1, 2977 1, 6741 2, 0057 2, 3988 2, 6718
9 1, 3830 1, 8331 2, 2622 2, 8214 3, 2498 54 1, 2974 1, 6736 2, 0049 2, 3974 2, 6700
10 1, 3722 1, 8125 2, 2281 2, 7638 3, 1693 55 1, 2971 1, 6730 2, 0040 2, 3961 2, 6682
11 1, 3634 1, 7959 2, 2010 2, 7181 3, 1058 56 1, 2969 1, 6725 2, 0032 2, 3948 2, 6665
12 1, 3562 1, 7823 2, 1788 2, 6810 3, 0545 57 1, 2966 1, 6720 2, 0025 2, 3936 2, 6649
13 1, 3502 1, 7709 2, 1604 2, 6503 3, 0123 58 1, 2963 1, 6716 2, 0017 2, 3924 2, 6633
14 1, 3450 1, 7613 2, 1448 2, 6245 2, 9768 59 1, 2961 1, 6711 2, 0010 2, 3912 2, 6618
15 1, 3406 1, 7531 2, 1315 2, 6025 2, 9467 60 1, 2958 1, 6706 2, 0003 2, 3901 2, 6603
16 1, 3368 1, 7459 2, 1199 2, 5835 2, 9208 61 1, 2956 1, 6702 1, 9996 2, 3890 2, 6589
17 1, 3334 1, 7396 2, 1098 2, 5669 2, 8982 62 1, 2954 1, 6698 1, 9990 2, 3880 2, 6575
18 1, 3304 1, 7341 2, 1009 2, 5524 2, 8784 63 1, 2951 1, 6694 1, 9983 2, 3870 2, 6561
19 1, 3277 1, 7291 2, 0930 2, 5395 2, 8609 64 1, 2949 1, 6690 1, 9977 2, 3860 2, 6549
20 1, 3253 1, 7247 2, 0860 2, 5280 2, 8453 65 1, 2947 1, 6686 1, 9971 2, 3851 2, 6536
21 1, 3232 1, 7207 2, 0796 2, 5177 2, 8314 66 1, 2945 1, 6683 1, 9966 2, 3842 2, 6524
22 1, 3212 1, 7171 2, 0739 2, 5083 2, 8188 67 1, 2943 1, 6679 1, 9960 2, 3833 2, 6512
23 1, 3195 1, 7139 2, 0687 2, 4999 2, 8073 68 1, 2941 1, 6676 1, 9955 2, 3824 2, 6501
24 1, 3178 1, 7109 2, 0639 2, 4922 2, 7969 69 1, 2939 1, 6672 1, 9949 2, 3816 2, 6490
25 1, 3163 1, 7081 2, 0595 2, 4851 2, 7874 70 1, 2938 1, 6669 1, 9944 2, 3808 2, 6479
26 1, 3150 1, 7056 2, 0555 2, 4786 2, 7787 71 1, 2936 1, 6666 1, 9939 2, 3800 2, 6469
27 1, 3137 1, 7033 2, 0518 2, 4727 2, 7707 72 1, 2934 1, 6663 1, 9935 2, 3793 2, 6459
28 1, 3125 1, 7011 2, 0484 2, 4671 2, 7633 73 1, 2933 1, 6660 1, 9930 2, 3785 2, 6449
29 1, 3114 1, 6991 2, 0452 2, 4620 2, 7564 74 1, 2931 1, 6657 1, 9925 2, 3778 2, 6439
30 1, 3104 1, 6973 2, 0423 2, 4573 2, 7500 75 1, 2929 1, 6654 1, 9921 2, 3771 2, 6430
31 1, 3095 1, 6955 2, 0395 2, 4528 2, 7440 76 1, 2928 1, 6652 1, 9917 2, 3764 2, 6421
32 1, 3086 1, 6939 2, 0369 2, 4487 2, 7385 77 1, 2926 1, 6649 1, 9913 2, 3758 2, 6412
33 1, 3077 1, 6924 2, 0345 2, 4448 2, 7333 78 1, 2925 1, 6646 1, 9908 2, 3751 2, 6403
34 1, 3070 1, 6909 2, 0322 2, 4411 2, 7284 79 1, 2924 1, 6644 1, 9905 2, 3745 2, 6395
35 1, 3062 1, 6896 2, 0301 2, 4377 2, 7238 80 1, 2922 1, 6641 1, 9901 2, 3739 2, 6387
36 1, 3055 1, 6883 2, 0281 2, 4345 2, 7195 81 1, 2921 1, 6639 1, 9897 2, 3733 2, 6379
37 1, 3049 1, 6871 2, 0262 2, 4314 2, 7154 82 1, 2920 1, 6636 1, 9893 2, 3727 2, 6371
38 1, 3042 1, 6860 2, 0244 2, 4286 2, 7116 83 1, 2918 1, 6634 1, 9890 2, 3721 2, 6364
39 1, 3036 1, 6849 2, 0227 2, 4258 2, 7079 84 1, 2917 1, 6632 1, 9886 2, 3716 2, 6356
40 1, 3031 1, 6839 2, 0211 2, 4233 2, 7045 85 1, 2916 1, 6630 1, 9883 2, 3710 2, 6349
41 1, 3025 1, 6829 2, 0195 2, 4208 2, 7012 86 1, 2915 1, 6628 1, 9879 2, 3705 2, 6342
42 1, 3020 1, 6820 2, 0181 2, 4185 2, 6981 87 1, 2914 1, 6626 1, 9876 2, 3700 2, 6335
43 1, 3016 1, 6811 2, 0167 2, 4163 2, 6951 88 1, 2912 1, 6624 1, 9873 2, 3695 2, 6329
44 1, 3011 1, 6802 2, 0154 2, 4141 2, 6923 89 1, 2911 1, 6622 1, 9870 2, 3690 2, 6322
45 1, 3006 1, 6794 2, 0141 2, 4121 2, 6896 90 1, 2910 1, 6620 1, 9867 2, 3685 2, 6316

Tabela da distribuição F de Snedecor

5% de significância (α = 0, 05)
g.l Graus de liberdade no numerador

denom. 1 2 3 4 5 6 7 8 9 10
1 161, 45 199, 50 215, 71 224, 58 230, 16 233, 99 236, 77 238, 88 240, 54 241, 88
2 18, 51 19, 00 19, 16 19, 25 19, 30 19, 33 19, 35 19, 37 19, 38 19, 40
3 10, 13 9, 55 9, 28 9, 12 9, 01 8, 94 8, 89 8, 85 8, 81 8, 79
4 7, 71 6, 94 6, 59 6, 39 6, 26 6, 16 6, 09 6, 04 6, 00 5, 96
5 6, 61 5, 79 5, 41 5, 19 5, 05 4, 95 4, 88 4, 82 4, 77 4, 74
6 5, 99 5, 14 4, 76 4, 53 4, 39 4, 28 4, 21 4, 15 4, 10 4, 06
7 5, 59 4, 74 4, 35 4, 12 3, 97 3, 87 3, 79 3, 73 3, 68 3, 64
8 5, 32 4, 46 4, 07 3, 84 3, 69 3, 58 3, 50 3, 44 3, 39 3, 35
9 5, 12 4, 26 3, 86 3, 63 3, 48 3, 37 3, 29 3, 23 3, 18 3, 14
10 4, 96 4, 10 3, 71 3, 48 3, 33 3, 22 3, 14 3, 07 3, 02 2, 98
11 4, 84 3, 98 3, 59 3, 36 3, 20 3, 09 3, 01 2, 95 2, 90 2, 85
12 4, 75 3, 89 3, 49 3, 26 3, 11 3, 00 2, 91 2, 85 2, 80 2, 75
13 4, 67 3, 81 3, 41 3, 18 3, 03 2, 92 2, 83 2, 77 2, 71 2, 67
14 4, 60 3, 74 3, 34 3, 11 2, 96 2, 85 2, 76 2, 70 2, 65 2, 60
15 4, 54 3, 68 3, 29 3, 06 2, 90 2, 79 2, 71 2, 64 2, 59 2, 54
16 4, 49 3, 63 3, 24 3, 01 2, 85 2, 74 2, 66 2, 59 2, 54 2, 49
17 4, 45 3, 59 3, 20 2, 96 2, 81 2, 70 2, 61 2, 55 2, 49 2, 45
18 4, 41 3, 55 3, 16 2, 93 2, 77 2, 66 2, 58 2, 51 2, 46 2, 41
19 4, 38 3, 52 3, 13 2, 90 2, 74 2, 63 2, 54 2, 48 2, 42 2, 38
20 4, 35 3, 49 3, 10 2, 87 2, 71 2, 60 2, 51 2, 45 2, 39 2, 35
21 4, 32 3, 47 3, 07 2, 84 2, 68 2, 57 2, 49 2, 42 2, 37 2, 32
22 4, 30 3, 44 3, 05 2, 82 2, 66 2, 55 2, 46 2, 40 2, 34 2, 30
23 4, 28 3, 42 3, 03 2, 80 2, 64 2, 53 2, 44 2, 37 2, 32 2, 27
24 4, 26 3, 40 3, 01 2, 78 2, 62 2, 51 2, 42 2, 36 2, 30 2, 25
25 4, 24 3, 39 2, 99 2, 76 2, 60 2, 49 2, 40 2, 34 2, 28 2, 24
26 4, 23 3, 37 2, 98 2, 74 2, 59 2, 47 2, 39 2, 32 2, 27 2, 22
27 4, 21 3, 35 2, 96 2, 73 2, 57 2, 46 2, 37 2, 31 2, 25 2, 20
28 4, 20 3, 34 2, 95 2, 71 2, 56 2, 45 2, 36 2, 29 2, 24 2, 19
29 4, 18 3, 33 2, 93 2, 70 2, 55 2, 43 2, 35 2, 28 2, 22 2, 18
30 4, 17 3, 32 2, 92 2, 69 2, 53 2, 42 2, 33 2, 27 2, 21 2, 16
35 4, 12 3, 27 2, 87 2, 64 2, 49 2, 37 2, 29 2, 22 2, 16 2, 11
40 4, 08 3, 23 2, 84 2, 61 2, 45 2, 34 2, 25 2, 18 2, 12 2, 08
45 4, 06 3, 20 2, 81 2, 58 2, 42 2, 31 2, 22 2, 15 2, 10 2, 05
50 4, 03 3, 18 2, 79 2, 56 2, 40 2, 29 2, 20 2, 13 2, 07 2, 03
100 3, 94 3, 09 2, 70 2, 46 2, 31 2, 19 2, 10 2, 03 1, 97 1, 93

Referências
[1] ANDERSON, D.R., SWEENEY, D.J., WILLIAMS, T.A. Estatı́stica Aplicada à Administração e Economia.
3ªed. São Paulo: Pioneira Thomson Learning, 2013.
[2] BUSSAB, Wilton O., MORETTIN, Pedro A. Estatı́stica Básica. São Paulo: Editora Saraiva, 8ªed, 2013.
[3] CORDEIRO, G. M. Modelos Lineares Generalizados. VII Simpósio Brasileiro de Probabilidade e Estatı́stica.
UNICAMP. Campinas, São Paulo, 1986.
[4] DEMÉTRIO, C. G. B. Modelos Lineares Generalizados em Experimentação Agronômica. 46 Reunião Anual
da Região Brasileira da Sociedade Internacional de Biometria (RBRAS) e 9 Simpósio de Estatı́stica Aplicada
à Experimentação Agronômica (SEAGRO), ESALQ/USP. Piracicaba, São Paulo, 2001.
[5] DEVORE, J. L. Probabilidade e estatı́stica para engenharia e ciências. Editora: Thompson, 8ªed, 2014.
[6] DOBSON, A.J.; BARNETT, A.G. Introduction to Generalized Linear Models. 3rd ed, Boca Raton, FL: Chap-
man and Hall CRC, 2008.
[7] FREUND John E. SIMON, Gary A. Estatı́stica Aplicada. 9. ed. Porto Alegre: Bookman, 11 ed, 2006.
[8] HOSMER, D. W., LEMESHOW, S. Applied Logistic Regression. John Wiley, New York, 2005.
[9] JAMES, B. Probabilidade: um curso em nı́vel intermediário. IMPA, 3 ed, 2006.
[10] KLEINBAUM, D. G., KLEIN, M. Logistic Regression: a self-learning text. New York: Springer-Verlac, 3 ed,
2010.
[11] LAPPONI, J. C. Estatı́stica usando Excel. Elsevier, Editora Campus, 4 ed, 2005.
[12] McCULLAGH, P., NELDER, J.A. Generalized Linear Models. Chapman and Hall: London, 2 ed, 1989.
[13] MEYER, P.L. Probabilidade, aplicações a estatı́stica. Editora: LTC, 2 ed, 1984.
[14] MONTGOMERY, D. C. Introduction to Statistical Quality Control. John Wiley & Sons, New York, 17 ed,
2018.
[15] MORETTIN, L. G. Estatı́stica Básica: Inferência - Volume 2 – Makron Books ,2000.
[16] MORETTIN, P. A. TOLOI, C. M. Análise de Séries Temporais. Edgard Blucher, 2 ed, 2006.
[17] MURRAY, R. S. Probabilidade e estatı́stica. Editora: Makron Books, 1993.
[18] MURTEIRA, B. J. F. Probabilidade e Estatı́stica. Vol. I, McGraw-Hill de Portugal, 1980.
[19] NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. Journal of the Royal Statistical
Society A, 135, 3, p.370 − 84, 1972.
[20] PAULA, G. A. Modelos de Regressão com Apoio Computacional. São Paulo: IME/USP. 2002.
[21] RONCHETTI, E., HERITIER, S., MORABIA, A. Robust Binary Regression with Continuous Outcomes.
Genève: Cahiers du Département d’Econométrie, Université de Genève, 21p, 1997.
[22] SCHULTZ, Duane P.; SCHULTZ, Sydney Ellen. História da psicologia moderna. 16. ed. São Paulo: Cultrix,
439 p. 1992.
[23] SPIEGEL, M. R. Estatı́stica. São Paulo, Makron Books, 3 ed, 1999.
[24] SIDNEY S. Estatı́stica não-paramétrica para ciências do comportamento. Editora: Artmed, 2006.
[25] STEVENSON, W.J. Estatı́stica aplicada à administração. Tradução de Alfredo Alves de Farias. Harbra, SP,
2001.
[26] THOMPSON, R., BAKER, R. J. Composite link functions in generalized linear models. Applied Statistics,
30, 125 − 131. 1981.
[27] TOLEDO, Geraldo Luciano, OVALLE, Ivo Izidoro. Estatı́stica Básica. São Paulo: Editora Atlas, 2 ed, 1994.
[28] TRIOLA, M. F. Introdução e estatı́stica. Editora LTC, 10 ed, 2008.
[29] VIEIRA, S., HOFFMANN, R. Análise de Regressão. Editora: Hucitec, 1998.

Livro Curso Basico de Estatistica - Prof. Marcelo de Paula - V6

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Livro Curso Basico de Estatistica - Prof. Marcelo de Paula - V6

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DO OESTE DA BAHIA

CENTRO DAS CIÊNCIAS EXATAS E DAS TECNOLOGIAS

CURSO BÁSICO DE ESTATÍSTICA

Sexta Versão - Junho de 2021

Palavras-chave: Estatı́stica descritiva, modelos probabilı́sticos, teoria da amostragem, inferência estatı́stica,

I Introdução e Conceitos Básicos 8

2 Natureza das variáveis e representações gráficas 12

4 Exercı́cios propostos sobre somatório 27

7 Análise descritiva para dados agrupados em classes 43

8 Exercı́cios propostos sobre estatı́stica descritiva 64

III Probabilidade e Variáveis Aleatórias 71

11 Variáveis aleatórias discretas 82

12 Variáveis aleatórias contı́nuas 106

13 Modelo ou Distribuição de Bernoulli 116

14 Modelo ou Distribuição Binomial 118

15 Distribuição ou modelo de Poisson 121

16 Distribuição da soma de distribuições de Poisson 127

17 Distribuição Normal 130

18 Combinação Linear de Distribuições Normais 146

19 Exercı́cios sobre probabilidade e variáveis aleatórias 150

IV Inferência Estatı́stica: Técnicas de Estimação de Parâmetros 162

21 Estimação pontual de parâmetros 171

22 Estimação intervalar da média populacional considerando variância populacional conhecida 175

23 Estimação intervalar da média populacional considerando variância populacional desconhecida188

24 Estimação intervalar da proporção populacional 196

25 Estimação intervalar da variância populacional 206

26 Estimação da diferença de duas médias populacionais assumindo variâncias conhecidas 207

27 Estimação da diferença de duas médias populacionais assumindo variâncias desconhecidas 209

28 Estimação intervalar da diferença de duas proporções populacionais 210

29 Exercı́cios sobre inferência estatı́stica via técnicas de estimação 213

V Inferência Estatı́stica: Testes de hipótese 221

31 Testes de hipótese para a média populacional assumindo variância conhecida 225

32 Testes de hipótese para a média populacional assumindo variância desconhecida 226

33 Testes de hipótese para a proporção populacional 230

34 Testes de hipótese para a variância populacional 234

37 Testes de hipótese para dados pareados 244

38 Testes de hipótese para a diferença de duas proporções populacionais 248

39 Testes de hipóteses para duas variâncias populacionais 251

40 Análise de variância 253

41 Exercı́cios sobre testes de hipóteses e análise de variância 261

VI Regressão Linear 268

43 Regressão Linear Simples 273

44 Ajustamento de modelos linearizáveis 282

45 Regressão Linear Múltipla 299

46 Exercı́cios sobre regressão linear simples 301

Curso Básico de Estatı́stica 7

Curso Básico de Estatı́stica 8

1.1 Um breve relato histórico

Curso Básico de Estatı́stica 9

1.2 Alguns conceitos básicos em estatı́stica

 População: Corresponde ao conjunto de todos os indivı́duos de um sistema ou conjunto que queremos

 Indivı́duo: É um elemento qualquer da população.

A Figura 1 apresenta o esquema estatı́stico simplificado entre população e amostra.

Figura 1: Esquema estatı́stico simplificado entre população e amostra

Curso Básico de Estatı́stica 10

1.3 Algumas aplicações da estatı́stica

Curso Básico de Estatı́stica 11

2 Natureza das variáveis e representações gráficas

2.1 Variáveis qualitativas nominais

Curso Básico de Estatı́stica 12

Curso Básico de Estatı́stica 13

Tabela 3: Naturalidade dos estudantes de graduação da UFOB, por ano de entrada.

Curso Básico de Estatı́stica 14

2.2 Variáveis qualitativas ordinais

População: Corresponde ao conjunto de todos os indivı́duos de um sistema ou conjunto que queremos

Indivı́duo: É um elemento qualquer da população.

Número de filhos por famı́lia em uma determinada região brasileira;

Altura e peso dos estudantes do ensino médio da cidade de Barreiras-BA;

Idade dos consumidores de uma grande rede atacadista;

Renda per capita das famı́lias moradoras de um determinado bairro;

Salário dos funcionários em uma empresa prestadora de serviços;

Índice de massa corporal dos frequentadores de uma academia de ginástica;

Vazão de um rio em um determinado ponto;

Temperatura diária de um municı́pio brasileiro;

Tempo de gestação de uma espécie de mamı́fero;

Pressão arterial sistólica e diastólica dos pacientes de um hospital;

Tempo de espera para o atendimento ao cliente em uma empresa;

Volume diário de chuva em uma região brasileira durante a época chuvosa;

Área total degradada em uma grande área de proteção permanente, etc.

Observação: Esta propriedade também vale para 3 ou mais variáveis quantitativas.