02 Estatisticaeprobabilidade 140614153429 Phpapp02 PDF

E STATÍSTICA
E
P ROBABILIDADE
1a Edição - 2.007
SOMESB
S OCIEDADE M ANTENEDORA DE E DUCAÇÃO S UPERIOR DA B AHIA S/C LTDA .
G ERVÁSIO M ENESES DE O LIVEIRA

P RESIDENTE
W ILLIAM O LIVEIRA
V ICE -P RESIDENTE
S AMUEL S OARES
S UPERINTENDENTE A DMINISTRATIVO E F INANCEIRO
G ERMANO TABACOF
S UPERINTENDENTE DE E NSINO, P ESQUISA E E XTENSÃO
P EDRO DALTRO G USMÃO DA S ILVA
S UPERINTENDENTE DE D ESENVOLVIMENTO E P LANEJAMENTO ACADÊMICO
FTC-E A D
FACULDADE DE T ECNOLOGIA E C IÊNCIAS – E NSINO A D ISTÂNCIA
R EINALDO DE O LIVEIRA B ORBA

D IRETOR G ERAL
R OBERTO F REDERICO M ERHY
D IRETOR ACADÊMICO
J EAN C ARLO N ERONE
D IRETOR DE T ECNOLOGIA
A NDRÉ P ORTNOI
D IRETOR A DMINISTRATIVO E F INANCEIRO
R ONALDO C OSTA
G ERENTE ACADÊMICO
J ANE F REIRE
G ERENTE DE E NSINO
L UÍS C ARLOS N OGUEIRA A BBEHUSEN
G ERENTE DE S UPORTE T ECNOLÓGICO
R OMULO AUGUSTO M ERHY
C OORD. DE S OFTWARES E S ISTEMAS
O SMANE C HAVES
C OORD. DE T ELECOMUNICAÇÕES E H ARDWARE
J OÃO J ACOMEL
C OORD. DE P RODUÇÃO DE M ATERIAL D IDÁTICO
M ATERIAL D IDÁTICO
P RODUÇÃO ACADÊMICA P RODUÇÃO T ÉCNICA
J ANE F REIRE J OÃO J ACOMEL
G ERENTE DE E NSINO C OORDENAÇÃO
A NA PAULA A MORIM C ARLOS M AGNO B RITO A LMEIDA S ANTOS
S UPERVISÃO R EVISÃO DE T EXTO
G ECIARA DA S ILVA C ARVALHO J ONES G ARCIA DA M ATA

C OORDENADOR DE C URSO R EVISÃO DE C ONTEÚDO
A DRIANO P EDREIRA C ATTAI
PAULO H ENRIQUE R IBEIRO DO N ASCIMENTO PAULO H ENRIQUE R IBEIRO DO N ASCIMENTO
AUTOR ( A ) E DIÇÃO EM LATEX 2ε
E QUIPE
A LEXANDRE R IBEIRO, A NGÉLICA J ORGE , C EFAS G OMES, C LAUDER F ILHO, D ELMARA B RITO, D IEGO D ORIA A RAGÃO, FÁBIO
G ONÇALVES , F RANCISCO F RANÇA J ÚNIOR , H ERMÍNIO F ILHO, I SRAEL DANTAS, LUCAS DO VALE , MARCIO S ERAFIM , MARIUCHA
P ONTE , RUBERVAL F ONSECA E TATIANA C OUTINHO.
c 2.007 FTC-E A D
Copyright
Todos os direitos reservados e protegidos pela lei 9.610 de 19/02/98.

É proibida a reprodução total ou parcial, por quaisquer meios, sem autorização prévia, por escrito, da
FTC-E A D - Faculdade de Tecnologia e Ciências - Ensino a distância.
www.ead.ftc.br
Sumário
Bloco 1: Estatística Descritiva 8
Tema 1: Séries Estatísticas, Medidas de Tendência Central e Moda 8

1.1 Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Fases do Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Divisões da Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Variáveis Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Séries Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Dados Brutos e Rol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Classificação das Séries Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Apresentação de uma Série Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.1 Apresentação Tabular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Apresentação do Tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Arredondamento de Dados Numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.2 Exercício Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6.3 Exemplos de Tabelas de Algumas Séries Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6.4 Exercícios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.7 Distribuição de Freqüências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7.1 Tipos de Freqüências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.7.2 1a - Variáveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.7.3 2a - Variáveis Quantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7.4 3a - Variáveis Quantitativas CFontínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.7.5 Determinação do Número de Classes e Amplitude do Intervalo de Classes . . . . . . . . . . . . . . . . . 25
1.7.6 A Regra de Sturges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.7 A Regra do Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7.8 Amplitude do Intervalo de Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7.9 Ponto Médio da Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8 Apresentação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.8.1 Cuidados na Representação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.9 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.9.1 Média Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Propriedades da Média Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Média Aritmética para Valores Agrupados em Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.9.3 Média Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Média Geométrica Ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Propriedades da Média Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.9.4 Média Harmônica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Média Harmônica Ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Propriedades da Média Harmônica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.9.5 Média Quadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.9.6 Relação entre as Médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
ESTATÍSTICA E PROBABILIDADE 3
1.9.8 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Mediana em um Conjunto com Valores Não-Tabuláveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Mediana em um Conjunto com Valores Tabuláveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.9.9 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Método de King . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Método de Czuber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Fórmula de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Relação entre a Média Aritmética, a Moda e a Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Tema 2: Medidas 53
2.1 Medidas de Posição II. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.1 Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.2 Quartis, Decis e Centis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.4 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.5 Desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Propriedades do Desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.6 Desvio Quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.1.7 Desvio Médio Absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.1.8 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Propriedades da Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.1.9 Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Propriedades do Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.1.10 Relações Importantes para o Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.1.12 Variância Relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.1.13 Coeficiente de Variação de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2 Medidas de Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.1 Coeficientes de Assimetria de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.3 Medidas de Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.4 Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bloco 2: Probabilidade, Regressão e Correlação. 63
Tema 3: Probabilidade 63
3.1 Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3 Operações com Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.4 Um Pouco de História . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5 Cálculos Probabilísticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.1 A Probabilidade de um Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Exercícios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4 FTC EaD | LICENCIATURA EM MATEMÁTICA

3.5.2 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.4 Probabilidade da Ocorrência Simultânea de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5.5 Independência de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5.6 O Teorema da Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.5.7 O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.6 Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Tema 4: Principais Modelos Probabilísticos, Regressão e Correlação Linear 81

4.1 Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.1.1 Tipos de Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2 Funções de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.1 Distribuição de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.2 Densidade de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.3 Função de Repartição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.4 Variáveis Aleatórias Bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.5 Distribuição de Probabilidade Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.6 Função de Repartição Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.7 Funções de Probabilidade Marginais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.8 Distribuição de Probabilidade Marginal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.9 Variáveis Aleatórias Discretas Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.10 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11 Esperança de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11.1 Esperança de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11.2 Esperança de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.11.3 Propriedades da Esperança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.12 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.13 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.14 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.14.1 Variância de uma Variável Aleatória Discreta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.14.2 Variância de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.14.3 Propriedades da Variância de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.15 Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.16 Covariância entre duas Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.17 Exercícios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Alguns Modelos Probabilísticos para Variáveis Aleatórias 96

4.18 Modelos Probabilísticos para Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.18.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Probabilidade numa Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
A Esperança e a Variância numa Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.18.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Esperança e Variância em uma Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.18.3 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
A Probabilidade numa Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
A Esperança e a Variância numa Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.18.4 Distribuição Binomial × Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.19 Modelos Probabilísticos para Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.19.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.19.2 A Esperança e a Variância de uma Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.19.4 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.19.5 Principais Características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
O Cálculo da Probabilidade pela Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
A Curva Normal Padrão ou Reduzida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Regressão e Correlação 113

4.20 Ajustamento de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.21 Equações Normais (Método dos Mínimos Quadrados) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.21.1 Processo Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.22 Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.22.1 O Coeficiente de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.22.2 Interpretação Gráfica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.23 Erro Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.24 Limites de Confiança para Coeficientes de Regressão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.25 Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Referências Bibliográficas 123
Atividade Orientada 1
5.1 Etapa 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
5.2 Etapa 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
5.3 Etapa 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
A PRESENTAÇÃO DA D ISCIPLINA
Caro aluno,
Este material foi produzido com o objetivo de dar suporte aos graduandos do curso de Licen-
ciatura em Matemática na disciplina Estatística e Probabilidades.
Dois grandes blocos são apresentados: a Estatística Descritiva e a Teoria de Probabilidades. A

primeira utiliza-se de métodos para organizar, resumir e descrever os aspectos importantes de um
conjunto de características observadas ou comparar tais características entre dois ou mais conjun-
tos. Os blocos são divididos em quatro temas.
No Tema 1, apresentamos alguns conceitos introdutórios. As séries estatísticas e as represen-

tações tabular e gráfica. Além disso, abordaremos o cálculo das médias, da moda e da mediana de
uma distribuição de freqüências.
No Tema 2, trabalharemos as separatrizes e as medidas de dispersão, assimetria e curtose.
No Tema 3, veremos os principais resultados na teoria de probabilidades.
No Tema 4, expande-se o conceito de probabilidade com a inserção do conceito de variável

aleatória. Os eventos que possuem determinadas características são associadas a determinadas
funções de probabilidade. O grau de dependência entre duas variáveis aleatórias é inserido e tam-
bém é apresentado o conceito de Regressão Linear.
Aqui, observar-se-á como a Estatística é essencial para a compreensão dos resultados de uma
pesquisa.
Prof. Paulo Henrique Ribeiro do Nascimento

BLOCO 01
Estatística Descritiva
Séries Estatísticas, Medidas de

TEMA 01
Tendência Central e Moda
Apresentação
Desde remota antigüidade, os governos têm se interessado por informações sobre suas populações e
riquezas, tendo em vista, principalmente, fins militares e tributários. Confúcio relatou levantamentos feitos
na China, há mais de 2.000 anos antes da era cristã. No antigo Egito, os faraós fizeram uso sistemático de
informações de caráter estatístico, conforme evidenciaram pesquisas arqueológicas. Desses registros também
se utilizaram as civilizações pré-colombianas dos maias, astecas e incas. É conhecido de todos os cristãos o
recenseamento dos judeus, ordenado pelo Imperador Augusto.
Os balancetes do império romano, o inventário das posses de Carlos Magno, o Doomsday Book, registro que
Guilherme, o Conquistador, invasor normando da Inglaterra, no século XI, mandou levantar das propriedades
rurais dos conquistados anglo-saxões para se inteirar de suas riquezas, são alguns exemplos anteriores à
emergência da estatística descritiva no século XVI, na Itália. Essa prática tem sido continuada nos tempos
modernos, por meio dos recenseamentos, dos quais temos um exemplo naquele que se efetua a cada decênio,
em nosso País, pela Fundação IBGE, órgão responsável por nossas estatísticas (dados estatísticos) oficiais.
Com o Renascimento, foi despertado o interesse pela coleta de dados estatísticos, principalmente por suas
aplicações na administração pública.
A palavra estatística, derivada do termo latino status (estado), parece ter sido introduzida na Alemanha, em
1.748, por Achenwall. A Estatística é encarada, atualmente, como uma ciência capaz de obter, sintetizar, prever
e tirar inferências sobre dados. Porém, no século XVII, na Inglaterra, a estatística era a Aritmética do Estado
(Political Arithmetic), consistindo, basicamente, na análise dos registros de nascimentos e mortes, originando,
mais tarde, as primeiras tábuas de mortalidade. Ao longo da Idade Média e até ao século XVIII, a estatística
foi puramente descritiva, coexistindo duas escolas: a escola descritiva alemã, cujo representante mais con-
hecido é o economista G. Achenwall (1.719-1.772), professor na Universidade de Gottingen, considerado pelos
alemães como o pai da estatística, e a escola dos matemáticos sociais, que procuravam traduzir por leis a regu-
laridade observada de certos fenômenos, de caráter econômico e sociológico. Embora esta escola procurasse
fundamentar a formulação de previsões com base em leis sugeridas pela experiência, a estatística confundia-
se, praticamente, com a demografia à qual fornecia métodos sistemáticos de enumeração e organização. Na
realidade, a necessidade sentida, em todas as épocas, de conhecer, numérica e quantitativamente, a realidade
política e social tornou a análise demográfica uma preocupação constante.
John Graunt (1620-1674), juntamente com William Petty (1.623-1.687), autor de Political Arithmetic, e o
astrônomo Edmond Halley (1.656-1.742) são os principais representantes da escola inglesa, que dá um novo
impulso à estatística, fazendo-a ultrapassar um estado puramente descritivo: analisam-se os dados na procura
de certas regularidades, permitindo enunciar leis e fazer previsões. No entanto, a estatística, para adquirir o
estatuto de disciplina científica, e não puramente ideográfica ou descritiva, teve que esperar pelo desenvolvi-
mento do cálculo das probabilidades, que lhe viria a fornecer a linguagem e o aparelho conceptual permitindo
a formulação de conclusões com base em regras indutivas.
Data do século XVII o início do estudo sistemático dos problemas ligados aos fenômenos aleatórios, começando

a ser manifestada a necessidade de instrumentos matemáticos, aptos a analisar este tipo de fenômenos, em
todas as ciências que põem o problema do tratamento e interpretação de um grande número de dados. Pode-
se datar dos fins do século XIX, o desenvolvimento da estatística matemática e suas aplicações, com F. Galton
(1.822-1.911), K. Pearson (1.857-1.936) e métodos estatísticos na investigação experimental se fica a dever,
fundamentalmente, aos trabalhos de K. Pearson e R. A. Fisher (1.890-1.962). A partir de Pearson e Fisher o
desenvolvimento da estatística matemática, por um lado, e dos métodos estatísticos aplicados, por outro, têm
sido tal que é praticamente impossível referir nomes.
Em todas as áreas da ciência, a coleta de dados se faz necessária e com isso a Estatística tem crescido
muito nos últimos anos, especialmente com o advento dos computadores e surgimento de softwares cada
vez mais sofisticados. Observar uma extensa listagem de dados coletados não nos permite chegar a uma
conclusão concisa. Este fato se agrava se esse conjunto de dados, possui muitas características que devam
ser investigadas.
Os métodos descritivos são utilizados, portanto, para organizar, resumir e descrever aspectos importantes
de um conjunto de características observadas ou comparar tais características entre dois ou mais conjuntos.
Ao se resumir ou condensar um conjunto de dados, informações são perdidas, visto que, não estamos mais
trabalhando com as observações originais. Entretanto, esta perda de informação é pequena se compararmos
ao ganho que se tem com a clareza da interpretação proporcionada.
A descrição dos dados também tem como objetivo identificar anomalias, até mesmo resultante do registro
incorreto de valores, e dados dispersos, aqueles que não seguem a tendência geral do restante do conjunto.
Não só nos artigos técnicos direcionados para pesquisadores, mas também, nos artigos de jornais e re-
vistas escritos para o público leigo, é cada vez mais freqüente a utilização dos recursos de descrição para
complementar a apresentação de um fato, justificar ou referendar um argumento.
As ferramentas descritivas são os muitos tipos de gráficos e tabelas e as medidas de síntese, como os
índices e as médias.
1.1 Método Estatístico
A Estatística originou-se da coleta e construção de tabelas de dados para o governo. A situação foi evoluindo
e esta coleta de dados representa somente um dos aspectos da Estatística. Hoje em dia podemos adotar a
seguinte definição para a Estatística: Ciência que se baseia na Teoria das Probabilidades e cujo objetivo
principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações
numéricas.
1.1 Definição. Método é um conjunto de meios dispostos convenientemente para se chegar a um determinado
objetivo.
Dos métodos científicos podemos destacar os métodos:
Experimental - consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da
Física e da Química.
Estatístico - diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes
variando-as, registrando essas variações e procurando determinar, no resultado final, que influências
cabem a cada uma delas. Como exemplo, podemos citar a determinação das causas que definem o
preço de uma mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse
alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos
salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível
geral dos preços das outras necessidades e etc. Mas, isso tudo é impossível. Daí a necessidade de
utilização do método estatístico.
1.1.1 Fases do Método Estatístico
1. DEFINIÇÃO DO PROBLEMA: Consiste em uma apreciação ou formulação correta do problema a ser

estudado, e levando em consideração os valores: o que, onde, como e quando.
2. PLANEJAMENTO: Nesta fase temos a considerar o procedimento necessário para o desenvolvimento

dos trabalhos ou seja: como levantar informações, que dados deverão seus obtidos, qual será a maneira
mais correta para formular as perguntas, construir o cronograma das atividades, determinar os custos
operacionais e determinar o tamanho da pesquisa.
3. COLETA DE DADOS: É a fase que consiste em adquirir as informações necessárias e é feita através de
um questionário ou boletim.
A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de reg-
istro obrigatório (nascimentos, casamentos e óbitos, importação e exportação) elementos pertinentes aos
prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio pesquisador
através de inquéritos e questionários, a exemplo de notas de verificação e de exames, do censo demográ-
fico, etc. A coleta direta pode ser classificada relativamente ao fator tempo em
— permanente: aquelas onde as informações são sempre atualizadas e são comunicadas por terceiros,
por exemplo o registro civil;
— contínua: feita continuamente, por exemplo, a freqüência dos alunos às aulas;
— periódica: feita em intervalos constantes de tempo, é realizada em época certa e em tempo determi-
nado, por exemplo, censo (a cada ano);
— ocasional: aquela que é feita em dado momento com a finalidade de atingir um objetivo imediato, por
exemplo, uma pesquisa do IBOPE.
A coleta é indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de
outros fenômenos relacionados com o fenômeno estudado. Ex.: Pesquisa sobre a mortalidade infantil,
feita a partir de dados colhidos por uma coleta direta.
A coleta pode ser adquirida de duas maneiras:
— Por vias internas: são aquelas obtidas dentro da organização;
— Por vias externas: são aquelas que podem ser obtidas por via primária (informação obtida diretamente
pela pessoa), ou por via secundária(obtida através de publicações).
4. CRÍTICA DOS DADOS - Pode ser externa, quando visa às causas dos erros por parte do informante; ou
interna quando visa observar os elementos originais dos dados da coleta.
5. APURAÇÃO DOS DADOS: É a soma e o processamento dos dados obtidos e a disposição mediante
critérios de classificação. Pode ser manual, eletromecânica ou eletrônica e os cálculos.
6. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: É a maneira de mostrar as informações a terceiros,

podendo ser: a) Expositiva (descrição ou narração); b) Aritmética (apresentada através de tabelas); c)
Geométrica (através de gráficos); d) Pictórica (o fenômeno é ilustrado através de figuras representativas).
7. ANÁLISE DOS RESULTADOS: Concluídas as fases anteriores (Estatística Descritiva), fazemos uma
análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, e tiramos
desses resultados conclusões e previsões. É a etapa mais delicada e importante, pois ai temos que
tirar as conclusões que servirão para auxiliar o pesquisador a resolver o seu problema. Atualmente a em-
presa é uma das vigas mestras da Economia dos povos. A direção de qualquer tipo de empresa, exige de

seu administrador a importante tarefa de tomar decisões, e o conhecimento e uso da Estatística facilitará
seu tríplice trabalho de organizar, dirigir e controlar a empresa.
1.2 Divisões da Estatística
A Teoria Estatística moderna se divide em dois grandes campos:
Estatística Descritiva ou Dedutiva - consiste num conjunto de métodos que ensinam a reduzir uma quan-
tidade de dados bastante numerosa por um número pequeno de medidas (dados numéricos, tabelas, gráficos
ou curvas), substitutas e representantes daquela massa de dados.
A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revig-
orou a área da Estatística denominada “Estatística Descritiva”.
Estatística Inferencial ou Indutiva - consiste em deduzir ou tirar conclusões (inferir) a respeito das pro-
priedades de um universo a partir de uma amostra. O processo de generalização, que é característico do
método indutivo, está associado a uma margem de incerteza. A medida da incerteza é tratada mediante técni-
cas e métodos que se fundamentam na Teoria das Probabilidades.
A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. Con-
sidere o exemplo abaixo para ilustrar as definições dadas.
1.3 População e Amostra
1.2 Definição. [População, Censo ou Universo Estatístico] Conjunto de indivíduos, objetos ou informações
que apresentam pelo menos uma característica comum, cujo comportamento interessa analisar. Ou, em outras
palavras, conjunto de todas as medidas, observações relativas ao estudo de determinado fenômeno.
Seja χ = {xi } uma população, onde i representa a ordem do elemento populacional e ‫{ = ג‬Yk } um conjunto
de características da população χ as quais no interessa estudar. Então, a cada elemento de χ podemos
associar a uma característica Yk ∈ ‫ג‬.
Exemplo 1.1.
i) O Ministério da Saúde pretende estudar o nível da glucose no sangue das crianças brasileiras com 7 anos
de idade em 2.001.
População: χ = {o conjunto formado por todas as crianças portuguesas com 7 anos}.
Característica: ‫{ = ג‬nível de glucose no sangue}.
ii) Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle
ambiental.
População: χ = {indústrias situadas no Estado da Bahia em 1997}.
Característica: ‫{ = ג‬existência ou não de algum tipo de controle ambiental na indústria}.
iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997.
População ou universo: χ = {área referente à Região Nordeste}.
Característica: ‫{ = ג‬precipitação pluviométrica}.
iv) Deseja-se conhecer o patrimônio líquido, faturamento, número de empregados, tempo de existência, das
empresas situadas no Pólo Petroquímico de Camaçari neste ano.
População ou universo: χ = {empresas existentes no Pólo Petroquímico de Camaçari no ano em
estudo}.
Características: ‫{ = ג‬patrimônio líquido, faturamento, número de empregados, tempo de existência}.
v) Deseja-se conhecer a idade, o peso, a estatura, a classe social e o tipo de dieta alimentar das crianças até
dois anos de idade residentes no bairro Cabula, Salvador, em 2000.
População ou universo: χ = {crianças até dois anos de idade residentes no Cabula em 2000}.
Característica: ‫{ = ג‬idade, peso, estatura, classe social, tipo de dieta alimentar}.
vi) O Serviço de Meteorologia pretende estudar a temperatura ambiente na cidade de Salvador às 8h de hoje.
População ou universo: χ = {Salvador}.
Característica: ‫{ = ג‬a temperatura ambiente às 8h de hoje}.
Devemos considerar ainda que as populações podem ser homogêneas (cujas partes todas são da mesma
natureza) ou heterogêneas (pelo menos uma das partes possui natureza distinta)
Em geral, como os universos são grandes, investigar todos os elementos populacionais para determinarmos
a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de investigação leva a destru-
ição do elemento observado, ou, como no caso de populações infinitas, é impossível observar a totalidade da
população. Assim, para minimizar a influência dessas dificuldades, estudar parte da população constitui-se um
aspecto fundamental da Estatística.
1.3 Definição. [Amostra] Chamamos de amostra um subconjunto próprio e finito da população.
A seleção da amostra é baseada em características da população.
População Técnicas de amostragem

−−−−−−−−−−−−−−−−−−−→ Amostra
característica
x Análise ?
? ?
? y
descritiva
Conclusões sobre Inferência Estatística Informações

←−−−−−−−−−−−−−−−−−−
as características da população contidas nos dados
Figura 1.1: Notas de Aula da Disciplina MAT116 - USP
A estatística, portanto, muito se baseia em fatos deduzidos pela teoria da amostragem. Por exemplo: Seja
µ a razão que expressa a intenção de voto a cada 10 eleitores indagados que o candidato a Prefeito Alberto
Magalhães receberia se fosse analisada toda a população de uma cidade que está para realizar eleições
brevemente. Como é um resultado difícil de se obter, vamos trabalhar com amostras.
Seja x̄1 , x̄2 , . . . , x̄k , as razões que expressam a intenção de voto a cada 10 eleitores indagados, obtidas
das amostras de tamanho n de determinadas regiões da cidade. Sabemos que estas medidas só terão algum
significado se um número razoável destas estiverem suficientemente próximas da medida µ. Cada erro absoluto
é calculado por
|x̄i − µ| = εi .
Se torna interessante para a Estatística analisar o comportamento dos erros nas diversas amostras referidas.
Como o tamanho da amostra influencia na magnitude do erro, quanto maior for a amostra, mais provável será
que se tenha uma melhor estimativa.

Desta forma, analisaremos quais εi são menores que um valor fixo “aceitável” ε para o erro. Claro que,
quanto maior a quantidade de valores εi menores ou iguais que ε, mais confiável será a estimativa, ou seja,
quando trabalhamos com amostras, visando conhecer a população, é necessário conhecer a probabilidade α
de que o erro obtido não seja maior do que ε:
P (|x̄i − µ| ≤ ε) = 1 − α.
Assim, dizemos que cada amostra é representativa da população e que a medida x̄i , de uma amostra
previamente selecionada, pode ser utilizada como estimativa para a medida µ.
Uma medida, obtida com cálculos baseados em informações de uma amostra, é chamada de estatística
enquanto que a medida, obtida com cálculos baseados em informações de uma população, é chamada de
parâmetro. A parte da Estatística responsável pela determinação do tamanho da amostra e da forma de
seleção dos seus elementos é chamada Amostragem.
1.4 Variáveis Estatísticas
A Estatística ocupa-se, fundamentalmente, das propriedades das populações cujas características são
passíveis de representação numérica como resultado de medições e contagens. Essas características da pop-
ulação são comumente chamadas de variáveis. As variáveis podem ser divididas em dois grupos: qualitativas
e quantitativas.
¨
NOMINAL (sexo, estado civil, cor dos olhos, etc.)
QUALITATIVA
ORDINAL (classe social, grau de instrução, etc.)
¨
CONTÍNUA (peso, altura, salário mensal, etc.)
QUANTITATIVA
DISCRETA (número de filhos, número de carros, idade, etc.)
Variáveis qualitativas - quando o resultado da observação é apresentado na forma de qualidade ou atributo.

Exemplos: setor de atividade econômica; estado civil; porte da empresa; etc.
- Variável qualitativa nominal - quando não existe qualquer ordenação para os resultados obtidos do
processo de observação. Como exemplo, temos, entre as variáveis acima citadas: setor de atividade
econômica (industrial, comercial, serviços, etc.); estado civil (solteiro, casado, viúvo, etc.).
- Variável qualitativa ordinal - quando existe uma certa ordenação nos possíveis resultados das ob-
servações efetuadas. Exemplo: porte de uma empresa (micro, pequena, média e grande). Outro exemplo
seria a classe social (alta, média e baixa); ou, ainda, o grau de escolaridade do empregado (1 grau; 2
grau; e 3 grau).
Variáveis quantitativas - quando o resultado da observação é um número, decorrente de um processo de

mensuração ou contagem. Exemplos: número de empregados; salário mensal; faturamento anual; idade;
tamanho da família; etc.
- Variável quantitativa discreta - quando os resultados possíveis da observação formam um conjunto
finito ou enumerável de números e que resultam, freqüentemente, de uma contagem. Exemplos: número
de empregados; tamanho da família.
- Variável quantitativa contínua - quando os possíveis valores formam um intervalo ou uma união
de intervalos de números reais e que resultam, normalmente, de uma mensuração. Exemplos: salário
mensal; faturamento anual, altura; peso.
Para resumir as informações levantadas durante uma pesquisa usaremos a técnica e a representação mais
apropriada, a depender do tipo de variável que estamos analisando.
1.5 Séries Estatísticas
Uma série estatística é toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de
classificação quantitativa. Genericamente podemos dizer que é uma sucessão de números que se relacionam
com qualquer variável do fenômeno em estudo. A palavra série é usada normalmente para designar um con-
junto de dados dispostos de acordo com um caráter variável. Assim, ao realizarmos um levantamento de dados
sobre um fenômeno ou variável, o que obtemos é uma série estatística.
Dados Brutos e Rol
Quando fazemos um levantamento de dados, se faz necessário o registro das informações coletadas (ques-
tionários, formulários, etc.). Estas informações, apresentadas de forma desorganizada são chamados de dados
brutos. Por exemplo,
4, 3, 4, 5, 7, 4, 6, 6, 7, 7, 4, 6, 5, 6, 6, 7, 5, 8, 5, 6, 2, 3, 6.
Quando os valores para cada variável investigada estão dispostos em uma determinada ordem, crescente ou
decrescente, chamamos cada listagem de rol. Por exemplo,
2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8.
Podemos também caracterizar os dados estatísticos à sua espécie ou tipo característico: discretos (pode-
mos contar os ítens); contínuos (não podemos contar); nominais ou categóricos; por postos.
Classificação das Séries Estatísticas
As séries estatísticas são diferenciadas umas das outras pelos seguintes fatores dos elementos que a
compõe:
- A época (fator temporal ou cronológico) a que se refere o fenômeno observado;
- O local (fator espacial ou geográfico) onde o fenômeno acontece;
- O fenômeno (espécie do fato ou fator especificativo) que é descrito.
O fator de diferenciação das séries estatísticas podem ser divididos em dois grandes grupos:
Série Homógrada: a variável apresenta variação descontínua:
1a . Série temporal, cronológica, histórica ou marchas- quando os resultados da observação do

fenômeno são registrados ao longo do tempo.
2a . Série geográfica ou espacial - o local varia, permanecendo fixos o tempo e o fenômeno.
3a . Série especificativa, específica ou categórica - quando o fenômeno é observado segundo algu-

mas categorias, permanecendo fixos o tempo e o local.
Série Heterógrada: o fenômeno apresenta subdivisões. Embora fixo, o fenômeno varia em intensidade.
4a . Distribuição de freqüências - neste tipo de série estatística o tempo, o local e o fenômeno per-
manecem fixos. O fenômeno considerado é uma variável quantitativa (discreta ou contínua) e seus valores
observados são descritos considerando o número de vezes que ocorreram na série (freqüência).

1.6 Apresentação de uma Série Estatística
O modo de condensação ou apresentação das informações são dadas por tabelas ou gráficos que facilitam
a visualização do fenômeno, permitem a comparação com outros elementos ou, ainda, fazer previsões. Os
principais tipos de gráficos serão apresentados, porém, antecedendo-os, serão apresentadas as normas de
apresentação tabular e as tabelas das séries estatísticas que deram origem aos gráficos.
1.6.1 Apresentação Tabular
A representação tabular (tabela) é uma das modalidades mais utilizadas para a apresentação dos dados
estatísticos coleta dos na amostragem.
N ORMAS DE A PRESENTAÇÃO TABULAR DE DADOS

As normas a seguir foram retiradas do documento: Normas de apresentação tabular do Centro de Documen-
tação e Disseminação de Informação 3a edição IBGE, Rio de Janeiro, 1.993. Têm como objetivo fixar conceitos
e procedimentos aplicáveis a elaboração de tabelas de dados numéricos, de modo a garantir a clareza das
informações apresentadas.
Apresentemos o esboço de uma tabela onde a seguir conceituaremos os elementos que a compõe.
Topo : Espaço superior de uma tabela destinado ao seu título; TOPO

Título: Conjunto de termos indicadores do conteúdo de uma tabela. Cabeçalho das colunas
Toda tabela deve ter título, inscrito no topo, para indicar a Coluna ↓
natureza e as abrangências geográfica e temporal dos dados
numéricos. As indicações da natureza e da abrangência geográ- Linha → Célula
fica dos dados numéricos devem ser feitas sem abreviações, por
extenso, de forma clara e concisa; RODAPÉ
Centro : Espaço central de uma tabela destinado a moldura, aos dados numéricos e aos termos necessários
a sua compressão. No centro identificam-se quatro espaços menores: o espaço do cabeçalho, a coluna,
a linha e a célula.
Espaço do cabeçalho: espaço superior do centro de uma tabela destinado a indicação do conteúdo
das colunas. Toda tabela deve ter cabeçalho, escrito no espaço do cabeçalho, para indicar, complemen-
tarmente ao título, o conteúdo das colunas. O conteúdo das colunas deve ser feito com palavras ou com
notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso,
sem abreviações;
Coluna: Espaço vertical do centro de uma tabela destinado aos dados numéricos (coluna de dados
numéricos) ou aos indicadores de linha (colunas indicadoras);
Linha: Espaço horizontal do centro de uma tabela destinado aos dados numéricos. Toda tabela deve
ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao título, o
conteúdo as linhas. O conteúdo das linhas deve ser feito com palavras ou com notações, de forma clara
e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações;
Dado numérico : Quantificador de um fato especifico observado. A estrutura dos dados numéricos e dos
termos necessários a compreensão de uma tabela deve ser feita com, no mínimo, três traços horizontais
paralelos. O primeiro para separar o topo, o segundo para separar o espaço do cabeçalho. O terceiro
para separar o rodapé;
Célula : espaço mínimo do centro de uma tabela, resultante do cruzamento de uma linha com uma coluna,
destinado ao dado numérico ou ao sinal convencional.
Sinal convencional: Representação gráfica que substitui um dado numérico. A substituição de um
dado numérico deve ser feita por um dos sinais abaixo, conforme o caso:
− zero não resultante de arredondamento;
·· Não se aplica a um dado numérico;
··· Dado numérico não disponível;
x Dado omitido ;
9
0 >
>
0, 0 =
zero aproximado de um dado numérico originalmente positivo. Quando uma tabela
0, 00 > >
;
etc .
9
−0 >
>
−0, 0 =
zero aproximado de um dado numérico originalmente negativo.
−0, 00 > >
;
etc .
contiver sinais convencionais, estes deverão ser apresentados em nota geral com seus respectivos sig-
nificados. No caso de publicação que contenha tabelas com sinais convencionais, na qual a apresentação
dos sinais e de seus significados figure em destaque, e dispensável a nota geral em cada tabela.
Rodapé : Espaço inferior de uma tabela destinado a fonte, a nota geral e a nota especifica.
Fonte: Identificador do responsável (pessoa física ou jurídica) ou responsáveis pelos dados numéri-
cos. Toda tabela deve ter fonte, inscrita a partir da primeira linha de seu rodapé. A identificação do
responsável ou responsáveis pelos dados numéricos deve ser feita com palavras, por extenso, e prece-
dida da palavra Fonte ou Fontes. Quando os dados sao extraídos de algum documento, recomenda-se
a indicação da referencia bibliográfica do documento e quando a tabela contiver dados numéricos resul-
tantes de transformação dos dados numéricos obtidos na fonte, o responsável pela operação deve ser
identificado em nota geral ou nota especifica.
Nota geral: Texto esclarecedor do conteúdo geral de uma tabela, quando necessário. Deve ser
inscrito logo após o rodapé da tabela e ser precedido do termo Nota ou Notas.
Nota específica: Texto esclarecedor de algum elemento especifico de uma tabela, quando necessário.
Deve ser inscrito no rodapé, logo após a nota geral (quando esta existir). Quando uma tabela contiver
mais de uma nota especifica, estas devem ser distribuídas obedecendo a ordem de numeração das
chamadas, separando-se uma das outras por um ponto.
Chamada : Símbolo remissivo atribuído a algum elemento de uma tabela que necessita uma nota específica.
A remissiva atribuída a algum elemento deve ser feita em algarismos arábicos em destaque: entre parên-
teses, entre colchetes, exponencial. Quando uma tabela contiver mais de uma chamada, estas devem
ser distribuídas sucessivamente, de cima para baixo e da esquerda para a direita, em ordem crescente
de numeração.
Unidade de medida : Termo indicador da expressão quantitativa ou metrológica dos dados numéricos. Uma
tabela deve ter unidade de medida, inscrita no espaço do cabeçalho ou nas colunas indicadoras, sem-
pre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou
metrológica dos dados numéricos. A unidade de medida deve ser feita com símbolos ou palavras entre
parênteses.
Apresentação do Tempo
1o . Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final,
ligados por hífen (-).

Exemplo 1.2.
2001-2004: apresenta dados numéricos para os anos de 2001, 2002, 2003 e 2004.
SET 2000-FEV 2001: apresenta dados numéricos para os meses de Setembro, Outubro, Novembro,
Dezembro de 20001 e Janeiro, Fevereiro e Março de 2001.
30.05.2001-06.06.2001: dados referentes aos dias 30 e 31 de Maio de 2001 e 1, 2, 3, 4, 5, e 6 de Junho de
2001.
2o . Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final,
ligados por barra (/).
Exemplo 1.3.
2001/2004: apresenta dados numéricos para os anos de 2001 e 2004, não sendo apresentados dados
numéricos de pelo menos um dos anos desta serie temporal.
OUT 2001/MAR 2002: dados referentes aos meses de Outubro de 2001 e Março de 2002, não sendo
apresentados dados numéricos de pelo menos um dos meses desta serie temporal.
30.05.2001/06.06.2001: dados referentes aos dias 30 de Maio de 2001 e 6 de junho de 2001, não sendo
apresentados dados numéricos de pelo menos um dos dias desta serie temporal.
3o . No caso de uma serie temporal não consecutiva que contenha um numero reduzido de pontos, a serie tem-
poral pode ser apresentada por todos os seus pontos, separados por vírgula, dispensando-se proceder
conforme o item (ii).
4o . Quando uma tabela contiver dados numéricos de uma safra, abrangendo dois anos, a apresentação do
ponto no tempo deve ser feita com os dois últimos algarismos de cada um dos anos ligados por barra (/)
e precedida da palavra Safra.
Exemplo 1.4. Safra 01/02: apresenta dados numéricos de uma safra iniciada em 2001 e terminada em
2002.
5o . Quando uma tabela contiver dados numéricos de um período anual diferente do ano civil, isto deve ser
indicado no título, em nota geral ou nota específica
Arredondamento de Dados Numéricos
Os dados numéricos em uma tabela devem ser arredondados sempre que houver necessidade de apresentá-
los com um número menor de algarismos. Isto deve ser indicado em nota geral ou nota específica.
1o . O arredondamento dos dados numéricos deve respeitar as diferenças significativas (absolutas e relativas)
existentes entre eles.
2o . No arredondamento do dado numérico, quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4,

deve ficar inalterado o ultimo algarismo a permanecer.
Exemplo 1.5. Arredondar o número 9, 2317 para um número com duas casas decimais. O valor
arredondado será 9, 23.
3o . No arredondamento de dado numérico, quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9,

deve-se aumentar de uma unidade o último algarismo a permanecer.
Exemplo 1.6. Arredondar o número 9, 2317 para um número com três casas decimais. O valor
arredondado será 9, 232.
1.6.2 Exercício Proposto
EP 1.1. Arredondar cada um dos seguintes valores para a aproximação pedida:
(a) 48, 6 para o inteiro mais próximo (g) 5, 781 para décimos
(b) 2, 484 para centésimos (h) 23, 350 para uma casa decimal
(c) 0, 0045 para milésimos (i) 4, 99 para décimos
(d) 22, 250 para décimos (j) 25, 351 para décimos
(e) 1.001, 39 para o inteiro mais próximo (k) 324 para a dezena mais próxima
(f) 6.498 para a centena mais próxima (l) 5.872 para o milhar mais próximo
1.6.3 Exemplos de Tabelas de Algumas Séries Estatísticas
A seguir, exemplificaremos, através de tabelas, algumas séries estatísticas.
Exemplo 1.7. Série temporal Exemplo 1.8. Série geográfica
Índice de Produto Industrial População residente segundo os municípios

Brasil - 1979 da região metropolitana de salvador − 1991
Meses IPI População
Municípios
Janeiro 18.633 (em 1.000 habitantes)
Fevereiro 17.497 Camaçari 114
Março 19.470 Candeias 68
Abril 18.884 Dias D’Avila 31
Maio 20.308 Itaparica 15
Junho 20.146 Lauro de Freitas 69
Julho 20.258 Madre de Deus 9
Agosto 21.614 Salvador 2.075
Setembro 19.717 São Francisco do Conde 20
Outubro 22.133 Simões Filho 73
Novembro 20.503 Vera Cruz 22
Dezempbro 12.721 Total 2.496
Tabela 1.1: FONTE: IBGE Tabela 1.2: FONTE: IBGE, Censo Demográfico, Bahia. 1991.
Exemplo 1.9. Série específica Exemplo 1.10. Série conjugada
Rebanhos brasileiros − 1992 Terminais telefônicos em serviço1991 − 1993

Rebanho Quantidade Região 1991 1992 1993
Bovinos 154.441 Sudeste 6.234.501 6.729.467 7.231.634
Eqüinos 550 Sul 1.497.315 1.608.989 1.746.232
Ovinos 19.956 Nordeste 1.287.813 1.379.101 1.486.649
Suínos 34.532 Centro-Oeste 713.357 778.925 884.822
Caprinos 12.160 Norte 342.938 375.658 403.494
FONTE: Revista Isto É. FONTE: Revista Isto É.
1.6.4 Exercícios Propostos
EP 1.2. Assinale a alternativa correta. População ou universo é um:
(a) conjunto de pessoas;

(b) conjunto de indivíduos apresentando uma característica especial;
(c) conjunto de todos os indivíduos apresentando uma característica comum objeto de estudo.
(d) conjunto de objetos;
(e) n.d.a.
EP 1.3. Estabelecer quais dados são discretos e quais são contínuos:
(a) número de ações vendidas diariamente na Bolsa de Valores;
(b) temperaturas registradas em um posto de meteorologia;
(c) vida média das válvulas de televisão produzidas por uma determinada companhia;
(d) salários anuais de professores do colégio;
(e) comprimentos de 1000 parafusos produzidos por uma fábrica.
EP 1.4. Entre as alternativas seguintes, assinale aquela que contiver uma afirmação verdadeira.
(a) Dados Brutos são aqueles que estiverem numericamente organizados;
(b) Rol é um arranjo de dados numéricos brutos;
(c) O conjunto das alturas de 100 estudantes, do sexo masculino, de uma universidade, arranjados em ordem
crescente ou decrescente de grandeza, é um exemplo de rol de dados.
EP 1.5. Entre as alternativas seguintes, assinale aquela que corresponder a uma afirmação falsa.
(a) Faz-se um levantamento por censo quando todos os elementos da população são pesquisados.
(b) Faz-se levantamento por amostragem quando se pesquisa parte dessa população e, com base no sub-
conjunto pesquisado, pode-se tirar conclusão acerca da população.
(c) A decisão entre os tipos de levantamento a serem realizados, censo e amostragem, depende de prazo
para a realização da pesquisa e recursos financeiros disponíveis, entre outras variáveis que possam
implicar em vantagens ou desvantagens do censo e da amostragem.
(d) As afirmações contidas nas alternativas “a” e “c” são falsas.
(e) n.d.a.
EP 1.6. As fases principais do método estatístico são:
(a) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema;
(b) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema;
(c) amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento;
(d) definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e
interpretação dos dados;
(e) coleta de dados; apuração dos dados, análise e interpretação dos dados, apresentação dos dados.
EP 1.7. [TCU-94] Assinale a opção correta.
(a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos.
(b) O processo utilizado para se medir as características de todos os membros de uma dada população
recebe o nome de censo.
(c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma
população com base na observação de uma amostra.
(d) Uma população pode ser caracterizada se forem observados todos os seus componentes.
(e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória.
EP 1.8. [TTN-94] Marque a opção correta.
(a) Um evento tem, no mínimo, dois elementos do espaço-amostra de um experimento aleatório.
(b) Em um experimento aleatório uniforme todos os elementos do espaço-amostra são iguais.
(c) Dois experimentos aleatórios distintos têm, necessariamente, espaços-amostra distintos.
(d) Uma parte não-nula do espaço-amostra de um experimento aleatório define um evento.
(e) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais.
EP 1.9. [AFC-94] A tabela ao lado apresenta a distribuição de um

Homem Mulher
grupo de 200 estudantes segundo o curso que fazem (Estatística ou
Estatística 40 20
Matemática) e o sexo (homem ou mulher). A única afirmação errada é:
Matemática 80 60
(a) 40% dos homens estudam Matemática.
(b) 75% das mulheres fazem o curso de Matemática.
(c) Dois em cada três estudantes de Estatística são homens.
(d) Um em cada três homens faz o curso de Estatística.
(e) 60% dos estudantes são homens.
EP 1.10. [AFC-94] A tabela abaixo apresenta a esperança de vida ao nascer para o Brasil (média nacional)
e a Região Nordeste (média regional) no período de 1940 a 1980.
Esperança de vida ao nascer (em anos)

Anos Brasil Região Nordeste
1940 41, 5 38, 7
1950 45, 5 38, 9
1960 51, 6 41, 0
1970 53, 5 45, 5
1980 60, 0 51, 0
Tabela 1.3: Fonte: IBGE, Perfil estatístico de crianças e mães no Brasil, 1984.
Da análise da tabela podemos concluir que a única afirmação errada é:
(a) a esperança de vida do cidadão brasileiro cresceu no período 1940/1980.
(b) a esperança de vida de um cidadão do nordeste brasileiro cresceu no período 1940/1980.
(c) a tabela aponta uma diminuição na diferença entre a esperança de vida na Região Nordeste e a média
nacional;

(d) a tabela indica uma defasagem de 20 anos entre os valores observados na Região Nordeste e a média
nacional;
(e) no período 1940/1980, a esperança de vida de um cidadão do Nordeste brasileiro cresceu a uma taxa
inferior à taxa média no Brasil.
EP 1.11. [TCDF-95] Assinale a opção correta.
(a) Em Estatística, entende-se por população um conjunto de pessoas.
(b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo.
(c) Freqüência relativa de uma variável aleatória é o número de repetições dessa variável.
(d) A série estatística é cronológica quando o elemento variável é o tempo.
(e) Amplitude total é a diferença entre dois valores quaisquer do atributo.
EP 1.12. [TTN] Assinale a opção correta:
(a) Uma amostra aleatória extraída de uma população deve ser superior, no tamanho, a 5% do número de
elementos populacionais.
(b) Em um experimento aleatório, cada elemento do espaço amostral tem a mesma probabilidade de ser
selecionado, em uma realização do experimento.
(c) Em um experimento aleatório é impossível garantir a ocorrência de um evento em uma particular realização
do experimento, se ele não for um evento certo.
(d) Um plano de amostragem corretamente elaborado garante a fidedignidade dos dados da população.
(e) A opção pela amostragem em relação ao censo, garante a redução de tempo, mas conduz sempre ao
incremento de custo e à perda de precisão.
EP 1.13. [TTN] Marque a opção correta:
(a) Dois experimentos aleatórios distintos têm, necessariamente, espaço-amostra distintos.
(b) Uma parte não nula de um experimento aleatório define um evento.
(c) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais.
(d) Um evento, tem, no mínimo, dois elementos do espaço-amostra de um experimento aleatório.
(e) Em um experimento aleatório uniforme, todos os elementos do espaço-amostra são iguais.
1.7 Distribuição de Freqüências
Após a coleta de informações relativamente a uma variável dispomos dos dados de uma forma desarru-
mada e, naturalmente, devemos organizá-los. Essa organização facilita a interpretação dos dados e condensa
o número de informações. Não é rara as situações onde existem vários valores repetidos. Denominamos
freqüência absoluta, ou simplesmente freqüência, o número de vezes que um determinado valor da variável
aparece. Somos capazes de observar muito mais facilmente estes valores ordenados se os dispusermos em
uma coluna e, ao lado de cada valor, a sua respectiva freqüência. Esta tabela, portanto, é denominada dis-
tribuição de freqüência ou dados agrupados.
1.7.1 Tipos de Freqüências
8 ¨
> Absoluta
>
> Simples
>
>
Relativa
>
>
< 8 ¨
Freqüência > Absoluta
>
> >
< crescente
>
> Relativa
> Acumulada ¨
>
> > Absoluta
: >
: decrescente
Relativa
A freqüência simples se divide em
— freqüência simples absoluta (fi ): número de ocorrências ou repetições de um valor individual ou um in-
tervalo de valores.
— freqüência simples relativa (f ri ): razão entre a freqüência simples absoluta e o número total de dados
(soma de todas as freqüências simples absolutas).
fi
f ri = X .
fi
i
X
Claro que f ri = 1.
i
As freqüências simples absoluta e relativa são simplesmente chamadas de freqüência absoluta e freqüência
relativa. A freqüência relativa pode também ser apresentada na forma de percentagem, bastando para isso
multiplicá-la por 100 - freqüência simples relativa percentual. As freqüências relativas e relativas percentuais
são úteis quando necessitamos comparar dois conjuntos de dados com o total de observação diferentes.
A freqüência acumulada, absoluta ou relativa, se divide em
— freqüência acumulada crescente ou “abaixo de”: corresponde à soma das freqüências simples (absolu-
tas ou relativas) das classes ou dos valores anteriores.
Notação: F ci freqüência absoluta crescente e F r ci freqüência relativa crescente.
A expressão “abaixo de” refere-se ao fato de que as freqüências a serem acumuladas correspondem
aos valores menores ou anteriores ao valor ou à classe cuja freqüência acumulada se deseja obter, ou
seja, as observações existentes até uma determinada classe ou valor individual.
— freqüência acumulada decrescente ou “acima de”: corresponde à soma das freqüências a partir de uma
determinada classe ou valor individual.
Notação: F di freqüência absoluta decrescente e F r di freqüência relativa decrescente.
Agora exemplificaremos as distribuições de freqüências e suas respectivas tabelas para cada tipo de var-
iável.
1.7.2 1a - Variáveis Qualitativas
As variáveis qualitativas obtidas em uma pesquisa podem ser organizadas em formas de tabelas para
facilitar a visualização e análise dos dados. Por exemplo, considere as respostas de 30 pessoas que foram
entrevistadas sobre as bebidas preferidas durante a refeição. Os resultados foram os seguintes:

· Água · Suco · Refrigerante · Suco · Suco · Cerveja
· Suco · Refrigerante · Suco · Água · Refrigerante · Água
· Água · Refrigerante · Outras · Suco · Suco · Suco
· Suco · Outras · Refrigerante · Suco · Refrigerante · Outras
· Refrigerante · Suco · Refrigerante · Cerveja · Refrigerante · Suco
TABELA DE FREQÜÊNCIAS
Bebida Freqüência Freqüência Freqüência Freqüência
preferida simples acumulada simples acumulada
absoluta absoluta relativa relativa
Água 4 4 0, 13 0, 13
Cerveja 2 6 0, 07 0, 20
Refrigerante 9 15 0, 30 0, 50
Suco 12 27 0, 40 0, 90
Outras 3 30 0, 10 1, 00
Total 30 − 1, 00
Fonte: Dados fictícios
1.7.3 2a - Variáveis Quantitativas Discretas
No exemplo a seguir, as informações foram obtidas através de um processo de contagem. Portanto, trata-se
de uma variável discreta.
Um outro exemplo envolve o número de defeitos apresentados por uma máquina industrial durante o período
de 30 dias. Os resultados foram os seguintes:
·1 ·1 ·1 ·0 ·1 ·1 ·0 ·2 ·1 ·3 ·1 ·0 ·2 ·2 ·1
·1 ·1 ·1 ·2 ·0 ·1 ·1 ·1 ·4 ·1 ·0 ·3 ·1 ·0 ·1
Número Freqüência Freqüência Freqüência Freqüência
de simples acumulada simples acumulada
defeitos absoluta absoluta relativa relativa
0 6 6 0, 20 0, 20
1 17 23 0, 57 0, 77
2 4 27 0, 13 0, 90
3 2 29 0, 07 0, 97
4 1 30 0, 03 1, 00
Total 30 − 1, 0
Nota 1. A tabela de freqüências para uma variável qualitativa ou uma variável quantitativa discreta é
também chamada de distribuição de freqüências para dados não-agrupados em classes.
ER 1. Preencher a tabela que indica o número de salários mínimos dos alunos da turma de estatística com
os valores de freqüências correspondentes a cada uma das colunas.
Valor fi f ri F ci F di F cri F dri

3 1
4 3
5 4
6 7
7 4
8 1
P
(a) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que possui vencimentos igual a 7 salários
mínimos?
(b) Qual a probabilidade de sortearmos, nesta sala, uma pessoa que recebe no máximo 7 salários mínimos?
(c) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que recebe no mínimo 5 salários mínimos?
Solução:
Valor fi f ri F ci F di F cri F dri
3 1 0, 05 1 20 0, 05 1, 00
4 3 0, 15 4 17 0, 20 0, 95
5 4 0, 20 8 13 0, 40 0, 80
6 7 0, 35 15 6 0, 75 0, 60
7 4 0, 20 19 2 0, 95 0, 25
8 1 0, 05 20 1 1, 00 0, 05
P
20
(a) 0, 20, pois, é justamente a freqüência relativa correspondente à freqüência absoluta de sete salários
mínimos
(b) Quando se diz no máximo sete salários mínimos, deve-se considerar o conjunto de pessoas que ganham
até sete salários. Assim, a probabilidade é 0, 95 que é a freqüência acumulada crescente correspon-
dente.
(c) Quando se diz no mínimo cinco salários mínimos, deve-se considerar o conjunto de pessoas que ganham
cinco salários ou mais. Assim, a probabilidade é 0, 80 que é a freqüência acumulada decrescente
correspondente.
1.7.4 3a - Variáveis Quantitativas CFontínuas
No caso em que a série estatística apresenta variáveis quantitativas contínuas, existe a necessidade de
organizar os dados originais em uma distribuição de freqüências na qual os valores observados são agrupados
em classes de valores. Portanto, adotemos a seguinte nomenclatura:
1. Máximo (max): maior valor pertencente ao conjunto.
2. Mínimo (min): menor valor pertencente ao conjunto.
3. Amplitude total (AT): é a diferença entre o valor máximo e mínimo
AT = max − min .

4. Classe: é cada um dos intervalos em que se subdivide a amplitude total.
5. O número de classes (k ): Quantidade de classes existentes.
6. Limite superior (ls ): é a cota superior para os valores da classe.
7. Limite inferior (li ): é a cota inferior para os valores da classe.
8. Tipos de intervalos:
li − ls : Aberto à esquerda e à direita;
li ⊢ ls : Fechado à esquerda e aberto à direita;
li ⊣ ls : Aberto à esquerda e fechado à direita;
li ⊢
⊣ ls : Fechado à esquerda e à direita;
9. Amplitude do intervalo de classe (h): é o comprimento da classe, definida como a diferença entre o limite
superior e inferior.
1.7.5 Determinação do Número de Classes e Amplitude do Intervalo de Classes
Não existem regras gerais para a determinação do número de classes em uma distribuição. No entanto,
algumas regras são propostas por autores que nos dão uma idéia aproximada do número de classes em
função do número de dados.
A determinação do tamanho e da quantidade de classes deve observar as seguintes normas:
1. As classes devem abranger todos os dados;
2. Não deve existir classe com freqüência nula;
3. Cada dado deve enquadrar-se em apenas uma classe;
4. Para variáveis contínuas, o limite superior de uma classe é o limite inferior da classe subseqüente.
Em geral, na definição das classes, o limite inferior é incluído e o superior excluído.
5. A quantidade de classes, de um modo geral, não deve inferior a 5 ou superior a 25.
6. Quando não for um sério inconveniente, a amplitude dos intervalos de classe deve ser constante.
1.7.6 A Regra de Sturges
Um dos métodos mais utilizados é o chamado de regra de Sturges ou regra do logaritmo. Ele estabelece
que o número de classes k será o inteiro imediatamente superior ou igual a log2 (2n), em que n é o número de
dados, isto é,
log2 (2n) ≤ k < log2 (2n) + 1, k ∈ Z.
Aplicando-se as propriedades concernes aos logaritmos
1
log2 (2) + log(n) ≤ k ⇒ k ≈ 1 + 3, 32 · log(n),
log(2)
Nota 2. Podemos encontrar o valor de k sem, necessariamente, ter que utilizar uma calculadora ou uma
tábua de logaritmos. Para isso, considere as seguintes potências de base dois
21 22 23 24 25 26 27 28 29 210 211 212

q q q q q q q q q q q q
2 4 8 16 32 64 128 256 512 1024 2048 4096.
Seja n um valor que representa a quantidade de dados. Como k é o inteiro imediatamente superior ou
igual a log2 (2n), podemos escrever que k − 1 < log2 (2n) ≤ k . Logo, 2k −1 < 2n ≤ 2k e, em seqüência,
2k −2 < n ≤ 2k −1 .
1.7.7 A Regra do Quadrado
Outra maneira para se obter o número de classes é

√
k≈ n, k ∈ Z.
A prática recomenda 5 ≤ k ≤ 16.
Mesmo conhecendo alguns métodos para a determinação do k , deve-se saber que a escolha dependerá
antes da natureza dos dados, da unidade de medida e da experiência e do bom senso de quem fará a organi-
zação dos dados da pesquisa.
1.7.8 Amplitude do Intervalo de Classes
Sendo k o número de classes, determina-se a amplitude do intervalo de classes h, como sendo um valor
AT
ligeiramente superior a , pois, desta forma, haverá uma pequena folga na última classe. Com este proced-
k
imento aumentamos a amplitude total que os dados nos permitiram obter, mas, é claro que quanto menor for
este aumento, mais expressivos serão os resultados obtidos.
Para montar a tabela (distribuição de freqüências) devemos definir as classes: a partir do valor mínimo da
amostra e a amplitude de classe h temos a primeira classe. O primeiro elemento das classes seguintes sempre
serão formadas pelo último elemento da classe anterior.
ER 2. Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da empresa
produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho através de uma medida
específica, obtendo os seguintes resultados:
·154 ·165 ·175 ·180 ·190 ·195 ·202 ·211 ·155 ·170 ·176 ·180 ·190 ·198 ·205 ·212
·156 ·172 ·178 ·180 ·190 ·200 ·205 ·215 ·164 ·175 ·178 ·184 ·192 ·200 ·210 ·218
Construir uma tabela de distribuição de freqüências com intervalos de classes.
Solução: Neste caso, n = 32 e pela regra de Sturges
24 < 32 ≤ 25 ⇒ k − 1 = 5 ⇒ k = 6.
A amplitude total será dada por AT = 218 − 154 = 64. Assim, a amplitude de cada intervalo de classe será:
AT 64
h= = ≈ 10, 67.
k 6

Aproximando para o inteiro mais próximo, temos que h = 11. Dessa forma, a tabela de distribuição de
freqüências para dados agrupados em classes fica da seguinte maneira:
Tabela de Freqüências
Freqüência Freqüência Freqüência
Medida simples simples simples
absoluta acumulada relativa
154 ⊢ 165 4 4 0, 13
165 ⊢ 176 5 9 0, 16
176 ⊢ 187 7 16 0, 22
187 ⊢ 198 5 21 0, 16
198 ⊢ 209 6 27 0, 19
209 ⊢ 220 5 32 0, 16
Total 32 − 1, 00
1.7.9 Ponto Médio da Classe
Informações relativas aos verdadeiros valores das séries estatísticas são perdidas ao efetuarmos uma dis-
tribuição de freqüências por classes já que uma uma simplificação da realidade ocorre. Além disso, esse
processo de classificação dos dados não nos permite um tratamento estatístico adequado para a descrição
dos dados. Contornarmos esse problema se adotarmos a hipótese de que todos os valores de uma classe são
iguais ao valor que se encontra no centro da classe. chamamos esse valor representativo de uma classe de
ponto médio ou ponto central.
No caso da variável contínua o ponto médio da classe, que representaremos por xm , é definido por:
1
xm = lm + hm ; m = 1, 2, . . . , k ,
2
onde,
xm : é o ponto médio da classe m

lm : é o limite inferior da classe i;
hm : é a amplitude do intervalo da classe i;
k : é o número de classe da distribuição de freqüências.
ER 3. Para a tabela de distribuição de freqüências do exercício 2, determine o ponto médio da 3a classe.
1
Solução: Pela definição de ponto médio de classe, temos x3 = 176 + × 11 = 181, 5.
2
EP 1.14. A tabela abaixo mostra a distribuição de freqüência dos salários anuais, em reais, de 65 empregados
de uma firma. Determine:
(a) o limite inferior da sexta classe;
Salários Empregados
(b) o limite superior da quarta classe;
5.000 − 5.999 8
(c) o ponto médio da terceira classe; 6.000 − 6.999 10
(d) os limites reais da quinta classe; 7.000 − 7.999 16
(e) a amplitude do quinto intervalo de classe; 8.000 − 8.999 14
9.000 − 9.999 10
(f) a freqüência da terceira classe;
10.000 − 10.999 5
(g) a freqüência relativa da terceira classe; 11.000 − 11.999 2
(h) o intervalo de classe que tem maior freqüência; Total 65
(i) a porcentagem de empregados que ganham menos de R $8.000, 00 por ano;
(j) a porcentagem de empregados que ganham menos que R $10.000, 00 e pelo menos R $6.000, 00 por ano.
EP 1.15. Considerando as notas de 40 alunos de uma turma do Colégio Ajax, listadas abaixo, apresente a
distribuição de freqüência, sendo 30 o limite inferior da primeira classe e 10 para o intervalo de classe:
74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60
67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54
EP 1.16. Os números abaixo foram obtidos com o lançamento de um dado 50 vezes. Obtenha a distribuição
de freqüência sem intervalos de classe:
6 5 2 6 4 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6
3 6 2 6 5 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3
EP 1.17. Forme a distribuição de freqüência em intervalos de classes, a partir das seguintes notas de um
teste de inteligência:
·64 ·78 ·66 ·82 ·74 ·65 ·78 ·86 ·83 ·87 ·73 ·95 ·82 ·89 ·73 ·92 ·85 ·80 ·81 ·90
·78 ·86 ·78 ·61 ·85 ·98 ·75 ·73 ·90 ·86 ·86 ·84 ·86 ·76 ·76 ·83 ·73 ·86 ·84 ·85
·76 ·80 ·92 ·62 ·73 ·87 ·70 ·85 ·79 ·93 ·82 ·90 ·83 ·81 ·85 ·72 ·81 ·96 ·81 ·85
·68 ·96 ·86 ·70 ·72 ·74 ·84 ·99 ·81 ·89 ·71 ·73 ·63 ·55 ·74 ·98 ·78 ·78 ·83 ·96
·95 ·94 ·88 ·62 ·91 ·83 ·98 ·93 ·83 ·76 ·94 ·75 ·67 ·95 ·80 ·98 ·71 ·92 ·72 ·73
EP 1.18. Obtenha a distribuição de freqüência dos dados abaixo, que representam a quantidade vendida de
automóveis no decorrer de um mês:
14 12 11 13 14 13 12 14 13 14 11 12
12 14 10 13 15 11 15 13 16 17 14 14
EP 1.19. [TTN] Considere a distribuição de freqüências abaixo e identifique a afirmativa correta:
(a) 65% das observações têm peso não inferior a 4 kg e inferior a 10kg . Peso (kg) fi
(b) Mais de 65% das observações têm peso maior ou igual a 4kg . 2 ⊢ 4 9
4 ⊢ 6 12
(c) Menos de 20 observações têm peso igual ou superior a 4kg .
6 ⊢ 8 6
(d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho 8 ⊢ 10 2
da população. 10 ⊢ 12 1
(e) 8% das observações têm peso no intervalo de classe 8 ⊢ 10. Total
EP 1.20. A tabela abaixo representa os salários pagos a 100 operários de uma empresa. Pede-se:

Salários Operários
(a) no de operários que ganham até dois salários mínimos; mínimos
(b) no de operários que ganham até seis salários mínimos; 0 ⊣ 2 40
(c) porcentagem de operários com salário entre 6 e 8 salários mínimos; 2 ⊣ 4 30
4 ⊣ 6 10
(d) porcentagem de operários com salário igual ou inferior a 4 salários míni-
6 ⊣ 8 15
mos.
8 ⊣ 10 5
Total
EP 1.21. Assinale, entre as alternativas, aquela que contiver uma afirmação verdadeira.
(a) Reunindo-se dados brutos em classes pode-se obter o número de indivíduos pertencentes a cada uma
das classes, que é denominado “freqüência da classe”.
(b) Os intervalos de classe precisam ser necessariamente iguais, na elaboração de uma tabela que apresente
uma distribuição de freqüência.
(c) O limite superior real da classe 150 − 155 é 155.
(d) O limite inferior real da classe 150 − 155 é 150.
(e) n.d.a.
EP 1.22. Assinale, entre as alternativas, aquela que contiver uma afirmação verdadeira.
(a) A amplitude do intervalo de classe é calculada pela soma entre os limites reais inferior e superior de uma
classe.
(b) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e superior reais de uma
classe.
(c) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos.
(d) Intervalos de classe fechados têm seus limites superior e inferior reais excluídos dos números que os
compõem.
(e) n.d.a.
EP 1.23. [TTN] Os intervalos de classe podem ser apresentados de várias maneiras. Dentre as situações
abaixo a correta é:
(a) 2 − 6 compreende todos os valores entre 2 e 6, inclusive os extremos;
(b) 2 ⊢
⊣ 6 compreende todos os valores entre 2 e 6, exclusive os extremos;
(c) 2 ⊢ 6 compreende todos os valores entre 2 e 6, exclusive 2 e inclusive 6;
(d) 2 ⊣ 6 compreende todos os valores entre 2 e 6, inclusive 2 e exclusive 6;
(e) 2 − 6 compreende todos os valores entre 2 e 6, exclusive os extremos.
EP 1.24. Considere a distribuição de freqüências abaixo, da du- DURAÇÃO NÚMERO
ração de 400 válvulas de rádio, ensaiadas pela Companhia Ótima (HORAS) VÁLVULAS
S/A. Os limites superiores reais da quinta e oitava classes e a am- 300 − 399 14
plitude do intervalo de classe são, respectivamente: 400 − 499 46
500 − 599 58
(a) 799, 5; 1.199, 5 e 100 horas; 600 − 699 76
(b) 799; 1.099 e 99 horas; 700 − 799 68
800 − 899 62
(c) 799, 5; 1.099, 5 e 100 horas; 900 − 999 48
1.000 − 1.099 22
(d) 799; 1.199 e 99 horas;
1.100 − 1.199 6
(e) 799; 1.099, 5 e 100 horas; Total 400
EP 1.25. Com respeito a questão 1.24, a porcentagem das válvulas, cuja duração é de 500 horas, no mínimo,
mas inferior a 1.000 horas:
(a) 78% (b) 77% (c) 79% (d) 80% (e) 85%
EP 1.26. Ouvindo-se 300 pessoas sobre o tema “reforma da previdência, contra ou a favor?”, foram obtidas
123 respostas a favor, 72 contra, 51 pessoas não quiseram opinar, e o restante não tinha opinião formada sobre
o assunto. Distribuindo-se esses dados numa tabela, obtém-se:
OPINIÃO fi fr
Na coluna freqüência relativa, os valores de x e y são, respectivamente:
Favorável 123 x
(a) 0, 41 e 0, 24; (d) 0, 35 e 0, 30;
Contra 72 y
(b) 0, 38 e 0, 27; (e) 0, 30 e 0, 35;
Omissos 51 0, 17
Sem Opinião 54 0, 18 (c) 0, 37 e 0, 28;
Total 400 1, 00
(FT/MG) responda às questões 1.27 e 1.28 com base na seguinte situação: a distribuição a seguir indica o
número de acidentes ocorridos com 40 motoristas de uma empresa de ônibus.
Acidentes 0 1 2 3 4 5 6
Motoristas 13 7 10 4 3 2 1
EP 1.27. O número de motoristas que sofreram pelo menos 4 acidentes é:
(a) 3 (b) 6 (c) 10 (d) 27 (e) 304
EP 1.28. A porcentagem de motoristas que sofreram no máximo 2 acidentes é:
(a) 25% (b) 32, 5% (c) 42, 5% (d) 57, 5% (e) 75%
EP 1.29. [TTN] Assinale a alternativa correta dada a distribuição de freqüências:
(a) Mais de 85% das observações têm diâmetro não inferior a 6cm.
Diâmetro(cm) fi
(b) 75% das observações estão no intervalo de 2 ⊢ 12. 4 ⊢ 6 6
(c) 28% das observações estão no quarto intervalo de classe. 6 ⊢ 8 8
(d) Menos de 25 das observações têm diâmetro abaixo de 10cm. 8 ⊢ 10 12
10 ⊢ 12 10
(e) A soma dos pontos médios dos intervalos de classe é inferior à soma das
12 ⊢ 14 4
freqüências absolutas simples.

1.8 Apresentação Gráfica
A representação gráfica de séries estatísticas constitui-se num fator importante em apresentações de tra-
balhos. Esta representação pode ser dividida em três grandes grupos: os diagramas; os cartogramas; e os
estereogramas.
◦ Diagramas - são figuras geométricas dispostas em duas dimensões. São os mais usados na
representação de séries estatísticas.
◦ Cartogramas - as séries estatísticas são representadas em cartas geográficas.
◦ Estereogramas - representam volumes e são apresentados em três dimensões sendo, portanto,

necessário algum conhecimento de perspectiva.
Apresentaremos, aqui, apenas os principais diagramas, que podem ser utilizados para qualquer represen-
tação de uma série estatística. São eles: o gráfico em barras; o gráfico em colunas; o gráfico em curvas; o
gráfico em setores; e os Histogramas.
Recomenda-se a seguinte utilização de correspondência entre as séries estatísticas e a sua representação

gráfica.
TIPO DE SÉRIE
FATOR VARIANTE GRÁFICO MAIS INDICADO
ESTATÍSTICA
Temporal Época Curvas, excepcionalmente Colunas
Especificativas Fenômeno Barras, Colunas ou Setores
Geográficas Local Cartogramas, Colunas, Barras ou Setores
Histograma (contínua),
Distribuição Intensidade
Bastão (discreta),
de freqüências do fenômeno
Barras, Colunas ou Setores (qualitativa)
1o . Gráfico em Colunas
Exemplo 1.11. Série Geográfica
É o gráfico que corresponde ao Histograma, porém, é utilizado na representação de dados nominais (ou
categorias) ou em séries temporais. Pode-se, também, usar barras horizontais.
Número de crianças de baixa renda, segundo o bairro

Número de crianças de baixa renda, segundo de residência, que participaram do ensino de música
na escola XYZ, Salvador - 1998
o bairro de residência, que participaram do
50
ensino de música na Escola XYZ, Salvador-1998
Bairro Número de crianças 40
Paripe 11
30
Periperi 39
Plataforma 45 20
Praia Grande 25
10
Total 120
Fonte: Escola de Música XYZ, Salvador.
Paripe Periperi Plataforma Praia
Grande
Exemplo 1.12. Série Especificativa-Temporal
Ingressantes da Universidade XYZ

Ingressantes da Universidade XYZ segundo área de estudo e ano
200
segundo área de estudo e ano Exatas
Área / Ano 1.998 1.999 2.000 150 Humanas
Exatas 120 156 68 Biológicas
100
Humanas 72 85 112
Biológicas 169 145 73 50
Fonte: Dados Fictícios
0
1.998 1.999 2.000
2o . Gráfico em Barras
Exemplo 1.13. Série Especificativa
Tipo de fraude nos cartões

Tipo de fraude nos cartões de crédito da
de crédito da Mastercard Mastercard Internacional do Brasil - 2000
Internacional no Brasil - 2.000
Tipo de fraude Quantidade Outros
Cartão roubado 243 Pedido por

correio/telefone
Cartão falsificado 85 Cartão Falsificado
Pedido por correio/telefone 52 Cartão Roubado
Outros 46 0 50 100 150 200 250 300
Fonte: Triola, Mario F. Quantidade
3o . Gráfico de Pareto
O gráfico de Pareto é composto por barras verticais e por uma curva representado a percentagem acu-
mulada. As barras estão disponíveis em ordem decrescente, tornando evidente a priorização de temas. Este
gráfico é muito utilizado na área de Controle de Qualidade.
Exemplo 1.14 (Werkema, volume 2). Uma indústria fabricante de lentes tem como objetivo resolver o seguinte
problema: aumento do número de lentes defeituosas produzidas pela empresa a partir de fevereiro de 1995. A
empresa classificou uma amostra de lentes fabricadas durante uma semana de produção de acordo com os
tipos de defeitos detectados. O resultado está na tabela abaixo:
DEFEITOS ENCONTRADOS EM UMA AMOSTRA DE LENTES FABRICADAS

DURANTE UMA SEMANA DE PRODUÇÃO DE UMA INDÚSTRIA
Tipo de defeito Quantidade
Arranhão 12
Trinca 41
Revestimento inadequado 55
Muito fina ou muito grossa 11
Não acabada 05
Outros 03
Total 127
Número total de lentes inspecionadas: 1.200

Uma maneira de representarmos graficamente estes dados é através do gráfico de Pareto. Para constru-
irmos o gráfico de Pareto é necessário obtermos a planilha de dados mostrada na tabela a seguir.
PLANILHA DE DADOS PARA CONSTRUÇÃO DO GRÁFICO DE PARETOS

Tipo Quantidade Total Percentagem do Percentagem
de defeito de defeito Acumulado Total Geral(%) Acumulada
Revest. Inadeq. 55 55 43, 3 43, 3
Trinca 41 96 32, 3 75, 6
Arranhão 12 108 9, 4 85, 0
Fina ou Grossa 11 119 8, 7 93, 7
Não-Acabada 5 124 3, 9 97, 6
Outros 3 127 2, 4 100, 0
Total 127 − 100, 0 −
Nesta tabela, os tipos de defeitos foram listados em ordem decrescente de quantidade na coluna 1, a
quantidade de defeitos aparece na coluna 2 e o total acumulado está na coluna 3. Nas colunas 4 e 5 estão
as percentagens totais e as percentagens acumuladas respectivamente. As barras do gráfico de Pareto foram
construídas a partir dos dados da coluna 2 e a curva acumulada conhecida como curva de Pareto, foi traçada
a partir dos números da coluna 5.
Gráfico de Pareto para defeito das lentes

100
100 80
60
50 40
20
0
0 Revestimento Fina ou
Trinca Arranhão Não acabada Outros
Inadequado Grossa
Defeitos
Observando o gráfico acima, foi imediato para indústria perceber que os dois tipos de defeitos mais fre-
qüentes, “Revestimento inadequado” e “trinca ”, representavam 75, 6% dos defeitos detectados nas lentes pro-
duzidas pela empresa. Portanto, “Revestimento inadequado” e “Trinca” foram considerados os defeitos mais
importantes, que devem ser eliminados em primeira lugar esse tipo de defeito é chamado de poucos defeitos
vitais, enquanto que os outros representam apenas os muitos defeitos triviais, pois, representam a minoria das
observações.
4o . Gráfico em Linhas ou Curvas
É muito utilizado na representação gráfica de dados não agrupados em classes, ao lado do gráfico de hastes
ou bastões e também para a representação de séries temporais (cotação de ações, vendas, etc).
Exemplo 1.15. Série Temporal
IPI, BRASIL-1979
Meses IPI
JAN 18.633
FEV 17.497
ÍNDICE DE PRODUTO INDUSTRIAL - BRASIL - 1.979
MAR 19.470
ABR 18.884 25.000 l
l l l l l l
MAI 20.308 20.000 l l l l
JUN 20.146 15.000
JUL 20.258 10.000
5.000
AGO 21.614
0
SET 19.717 JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV
OUT 22.133
NOV 20.503
Fonte: IBGE
5o . Gráfico em Setores
Exemplo 1.16. Série Geográfica
Percentual de funcionários dos coletivos 39, 1%

de Salvador segundo área de residência 17, 2%
Área de residência Percentual
Centro 17, 2
Subúrbio 39, 1
Periferia 43, 7 Centro
Fonte: Dados Fictícios 43, 7% Subúrbio
Periferia
6o . Gráficos de Hastes, Bastões ou Diagrama de Traços
É muito utilizado na representação gráfica de dados não agrupados em classes, o que ocorre normalmente
com dados discretos. Nestes casos não há perda de informação, pois, os valores da variável aparecem indi-
vidualmente, como constam da amostra.
Exemplo 1.17.
fi
xi fi 40
0 10
30
1 20
2 30 20
3 25 10
4 10
5 5 0 1 2 3 4 5 xi
7o . Histograma
É muito utilizado na representação gráfica de dados agrupados em intervalos de classes, o que ocorre
normalmente com dados contínuos e, conseqüentemente, há perda de informação. O seu uso é recomendado
quando
- existem valores não inteiros para a variável;
- a quantidade de valores da variável é grande, no caso de valores inteiros (discretos);
- não é importante a perda de informação ocasionada pelos dados apresentados.

No caso de classes com a mesma amplitude, é construído um retângulo para cada classe com base igual à
amplitude do intervalo de classe e altura proporcional a freqüência da classe. Quando temos classes com am-
plitudes diferentes, devemos construir um retângulo para cada classe, com base igual à amplitude do intervalo
de classe e altura dada por:
freqüência
h= ( 1.1)
amplitude
Note que a área do retângulo é igual a freqüência da classe. A altura h em ( 1.1) é chamada de densidade de
freqüência.
Exemplo 1.18. Histograma para a distribuição de freqüência do exemplo 2.
TABELA DE FREQÜÊNCIAS Medida específica de um aparelho elétrico

Medida fi F ci f ri 8
154 ⊢ 165 4 4 0, 13
165 ⊢ 176 5 9 0, 16 6
176 ⊢ 187 7 16 0, 22
187 ⊢ 198 5 21 0, 16 fi 4
198 ⊢ 209 6 27 0, 19
2
209 ⊢ 220 5 32 0, 16
Total 32 1, 00
0
154⊢165 165⊢176 176⊢187 187⊢198 198⊢209 209⊢220
Medida
Exemplo 1.19. Histograma para a distribuição de freqüências com amplitudes diferentes.
Medida fi F ci f ri
150 ⊢ 155 3 3 0, 09375
155 ⊢ 161 4 7 0, 125
161 ⊢ 173 5 12 0, 15625
173 ⊢ 177 3 15 0, 09375
177 ⊢ 184 10 25 0, 3125
184 ⊢ 198 1 26 0, 03125
198 ⊢ 206 3 29 0, 09375
206 ⊢ 220 3 32 0, 09375 5 1 3 7 4 8 6 0
15 16 17 17 18 19 20 22
Total 32 1, 00000 0 ⊢ 55 ⊢ 1⊢ 3 ⊢ 77 ⊢ 4⊢ 8⊢ 6⊢
15 1 16 17 1 18 19 20
8o . Polígono de Freqüências
É a representação gráfica de uma distribuição por meio de um polígono e é obtido ao se unir por um
segmento de reta dois pontos médios consecutivos das bases superiores dos retângulos de um histograma.
fi
Idade fi F ci 10
2 ⊢ 4 4
7
4 ⊢ 6 6
6
6 ⊢ 8 10
4
8 ⊢ 10 7 3
10 ⊢ 12 3
Total 0 2 4 6 8 10 12 Limites das classes
9o . Polígono de Freqüências Acumuladas
É construído a partir das freqüências acumuladas. Os segmentos possuem extremidades de abscissas

nos limites inferior e superior referente a cada classe. A abscissa que representa o limite inferior da classe se
relaciona com a freqüência acumulada da classe anterior. Já a abscissa que representa o limite superior da
classe se relaciona com a freqüência acumulada da mesma.
Exemplo 1.20. A representação através de um gráfico de polígono de freqüências da distribuição
fi
Notas fi 16
0 ⊢ 2 2 14
12
2 ⊢ 4 7
10
4 ⊢ 6 3 é 8
6 ⊢ 8 1 6
4
8 ⊢ 10 3
2
Total
0 2 4 6 8 10 Notas
1.8.1 Cuidados na Representação Gráfica
Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia utilizada do que pela infor-
mação que passa para o leitor. Os dados não são tridimensionais. As grades do fundo mais o efeito tridimen-
sional distraem a visão e dificultam comparações entre trimestre e regiões. Uma forma de melhorar o gráfico
é dar-lhe a dimensão correta. Pode-se eliminar as linhas de grade. Não utilize faixas horizontais, verticais ou
similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar um que seja informativo,
claro, e que não possua objetos desnecessários.
Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a informação poderá ser transmitida
textualmente, com uma simples frase: “80% das respostas foram positivas e 20% negativas”.
O gráfico abaixo tem alguns problemas. Primeiro, o efeito 3-D dificulta o julgamento das porcentagens
relativas de cada categoria da variável. A retirada do efeito 3-D ajudará o leitor a julgar melhor as proporções
relativas observadas em cada amostra.
EP 1.30. [TCU] Gráficos são instrumentos úteis na análise estatística. Assinale a afirmação incorreta.
(a) Um histograma representa uma distribuição de freqüências para variáveis do tipo contínuo.
(b) O gráfico de barras representa, por meio de uma série de barras, quantidades ou freqüências para var-
iáveis categóricas.
(c) O gráfico de setores é apropriado, quando se quer representar as divisões de um montante total.
(d) Um histograma pode ser construído utilizando-se, indistintamente, as freqüências absolutas ou relativas
de um intervalo de classe.
(e) Uma ogiva pode ser obtida ligando-se os pontos médios dos topos dos retângulos de um histograma.
EP 1.31. [AFTN] Analise a opção correta.
(a) A utilização de gráficos da barra ou de colunas exige amplitude de classe constante na distribuição de
freqüência.
(b) O histograma é um gráfico construído com freqüências de uma distribuição de freqüências ou de uma
série temporal.
(c) O polígono de freqüência é um indicador gráfico da distribuição de probabilidade que se ajusta à dis-
tribuição empírica a que ele se refere.
(d) O histograma pode ser construído para a distribuição de uma variável discreta ou contínua.

(e) O polígono de freqüência é construído unido-se os pontos correspondentes aos limites inferiores dos
intervalos de classe da distribuição de freqüência.
EP 1.32. [TCDF] Em relação aos tipos de gráficos, assinale a opção correta.
(a) Uma série categórica é representada por um gráfico de linha.
(b) Uma série cronológica é melhor representada por um gráfico de setores.
(c) Se uma distribuição de freqüências apresenta intervalos de tamanhos desiguais, o melhor gráfico para
representá-la é um polígono de freqüências.
(d) O gráfico de barras é usado somente para séries geográficas.
(e) O gráfico de setores é usado para comparar proporções.
EP 1.33. O gráfico formado por um conjunto de retângulos justapostos, de forma que a área de cada retângulo
seja proporcional à freqüência da classe que ele representa é chamado de:
(a) Polígono de Freqüências (c) Gráfico de Colunas (e) Ogivograma
(b) Gráfico de Barras (d) Histograma
EP 1.34. [AFE] Indique a alternativa correta:
(a) A freqüência relativa nos fornece o número de observações dentro de cada intervalo de classe.
(b) Ao falarmos em distribuição de freqüências estamos nos referindo a uma população. Quando tratamos
com amostra, nos referimos a distribuição de probabilidade.
(c) Curvas de freqüências simétricas são aquelas em que as observações equidistantes do ponto central têm
a mesma freqüência.
(d) Um polígono de freqüências é um conjunto de retângulos, cujas áreas são proporcionais às freqüências
das classes.
(e) A amplitude de um intervalo de classe é a diferença entre o limite superior e o ponto médio do intervalo.
A Estatística Descritiva consiste em um conjunto de métodos que ensinam a reduzir uma quantidade de
dados, bastante numerosa, em um número pequeno de medidas que substituem e representam aquela massa
de dados.
Quatro tipos fundamentais de medidas descritivas são estudadas:
(i) medidas de posição (ou de locação ou de localização); (iii) medidas de assimetria;

(ii) medidas de dispersão (ou de variabilidade); (iv) medidas de curtose.
Entre as medidas de posição, aquelas que tendem a estar no centro da distribuição são chamadas de
medidas de tendência central. Veremos também algumas idéias gerais sobre assimetria e análise exploratória
de dados.
1.9 Medidas de Posição
∗ Média Aritmética Tem por objetivo descrever um conjunto

Representativas ∗ Média Geométrica de dados de forma organizada e compacta
∗ Média Harmônica que possibilita a visualização do conjunto
Medidas de Posição
∗ Mediana estudado por meio de suas estatísticas, o

∗ Quartis que não significa que estes cálculos e con-
Separatrizes
∗ Decis clusões possam ser levados para a popu-
∗ Centis ou Percentis lação.
∗ Moda de Czuber Podemos classificar as medidas de
Dominantes ∗ Moda de King posição conforme a tabela ao lado:
∗ Moda de Pearson
1.9.1 Média Aritmética
Considere um conjunto de dados numéricos X = {xi ; i = 1, 2, . . . , n}. Uma média para X é um valor que
pode substituir todos os valores da lista sem alterar uma determinada característica da lista.
Se a característica a ser mantida é a soma dos elementos de X , obtemos a média aritmética. Ou seja, a
média aritmética dos números do conjunto X é um valor x̄ tal que
x1 + x2 + . . . + xk = x̄ + x̄ + . . . + x̄ = k · x̄ .
Logo,
X
k
xi
x1 + x2 + . . . + xk i =1
x̄ = = ( 1.2)
k k
ER 4. Um estudante obteve, durante o ano letivo, as seguintes médias para os quatro bimestres: 4.5, 6.5, 7,
6. Sabendo que a média final nessa instituição de ensino é 5, determine se o aluno foi aprovado.
4.5 + 6.5 + 7 + 6
Solução: A média do aluno é x̄ = = 6. Portanto, o aluno foi aprovado.
4
Se o conjunto de dados numéricos for X = {xi ; i = 1, 2, . . . , k }, em que cada elemento xi possui freqüência
fi , a média aritmética para o conjunto X é definida por:
X
k
xi · fi
i =1
X
k
x̄ = ,n = fi . ( 1.3)
n
i =1
ER 5. Em um determinado dia de campanha de vacinação contra hepatite 100 crianças se vacinaram num
posto de saúde. Destas 25 crianças tinham 12 anos, 35 crianças tinham 14 anos e, o restante, 15 anos.
Determine a média das idades das crianças.
X
n
xi · fi
i =1 12 · 25 + 14 · 35 + 15 · 40
Solução: A média é x̄ = = .
n 100
Pode-se entender, em diversas situações, as freqüências com que os dados numéricos de X , os quais quer-
emos sintetizar, como diferentes graus de importância para cada xi . A média aritmética é chamada, portanto,
média aritmética ponderada em que as respectivas freqüências dos elementos de X são uma espécie de “peso”
(ou ponderação) aos valores possíveis da variável xi .

ER 6. Um estudante obteve médias 8, 0, 7, 0 e 6, 0 nos três primeiros bimestres do ano letivo. Sabendo-se que
em seu colégio é adotado o sistema de pesos 1, 2, 3 e 4 para os quatro bimestres, respectivamente, calcule a
média que ele deve obter no quarto bimestre para que ele consiga a média anual 7, 0, necessária para passar
direto na disciplina.
8·1+7·2+6·3+n·4 40 + 4n
Solução: Temos que 7 = = , donde n = 7, 5.
1+2+3+4 10
Quando os valores das freqüências (pesos) de cada xi são iguais, a média aritmética é dita simples e ganha
esta palavra um cunho facultativo.
Nota 3. A média aritmética é a principal medida de tendência central. Algumas das razões que fazem
com que seja a medida de posição mais recomendada são:
— É definida rigorosamente e pode ser interpretada sem ambigüidades;
— Leva em consideração todas as observações efetuadas;
— Calcula-se com facilidade.
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a valores
extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação às demais
observações do conjunto de dados. Por exemplo: Se estivermos interessados em conhecer o salário
médio de certa empresa com cinco funcionários e obtivermos o seguinte conjunto de dados, em reais:
123 − 145 − 210 − 225 − 2.500;
podemos observar que quatro dos cinco salários apresentam valores entre 123 e 225 reais, porém a média
salarial de 640, 6 reais é bastante distinta desse conjunto pela influência do salário de 2.500 que puxou o
valor médio para cima.
Propriedades da Média Aritmética
1. Somando-se um valor constante e arbitrário a cada um dos elementos de um conjunto de dados, a média
aritmética fica adicionada dessa constante.
2. Multiplicando-se um valor constante e arbitrário a cada um dos elementos de um conjunto de dados, a

média aritmética fica multiplicada por essa constante.
Média Aritmética para Valores Agrupados em Classes
Podemos observar que a relação da equação ( 1.2) é válida para dados tabulados não agrupados em
classes. Para dados tabulados agrupados em classes devemos, inicialmente, obter os pontos médios de cada
classe e, em seguida, calcularmos a média aritmética utilizando a equação 1.4
X
n
xi · fi
i =1
x̄ = , ( 1.4)
Xn
fi
i =1
onde xi são os pontos médios das classes e fi é a freqüência absoluta de cada classe.
Nota 4. Calculamos, aqui, a média aritmética ponderada para valores agrupados discretamente, pois, as
classes são substituídas pelo seus respectivos pontos médios.
ER 7. Calcule a média arit-

Solução:
mética para os dados agrupados
em classes. Classes fi xi xi · fi Portanto, a média aritmética é
2 ⊢ 4 3 3 9
Classes fi
4 ⊢ 6 5 5 25 X
5
2 ⊢ 4 3 xi · fi
6 ⊢ 8 10 7 70 i =1 182
4 ⊢ 6 5 x̄ = = = 7.
8 ⊢ 10 5 9 45 X5 26
6 ⊢ 8 10 fi
10 ⊢ 12 3 11 33
8 ⊢ 10 5 i =1
Total 26 182
10 ⊢ 12 3
EP 1.35. Um aluno da turma de estatística da Faculdade XY obteve notas 5, 0 e 7, 0 em duas provas real-
izadas. Se adicionarmos a cada nota o valor 10 a média aritmética
(a) fica adicionada do mesmo valor. (c) fica multiplicada do mesmo valor. (e) n.d.a.
(b) é a mesma. (d) é igual a 12.
EP 1.36. Um aluno da turma de estatística da Faculdade XY obteve notas 5, 0 e 7, 0 em duas provas real-
izadas. Se multiplicamos cada nota pelo valor 10 a média aritmética
(a) fica adicionada do mesmo valor. (c) fica multiplicada do mesmo valor. (e) n.d.a.
(b) é a mesma. (d) é igual a 35.
EP 1.37. Dados os conjuntos de números: A = {100, 101, 102, 103, 104, 105} e B = {0, 1, 2, 3, 4, 5}, podemos
afirmar que:
(a) a média de A é igual à de B multiplicada por 100;
(b) a média de A é igual à média de B ;
(c) a média de A é igual à média de B dividida por 100;
(d) a média de A é igual à média de B mais a constante 100;
(e) n.r.a.
EP 1.38. [TCDF] Em uma empresa, o salário médio dos empregados é de R $500, 00. Os salários médios
pagos aos empregados dos sexos masculino e feminino são de R $520, 00 e R $420, 00, respectivamente. Então,
nessa empresa, o número de
(a) homens é o dobro do de mulheres; (d) mulheres é o triplo do de homens;
(b) homens é o triplo do de mulheres; (e) mulheres é o quádruplo do de homens.
(c) homens é o quádruplo do de mulheres;
EP 1.39. [Fiscal de Tributos de Minas de Gerais] A estatura média dos sócios de um clube é 165cm, sendo a
dos homens 172cm e a das mulheres 162cm. A porcentagem de mulheres no clube é de:
(a) 62% (b) 65% (c) 68% (d) 70% (e) 72%

EP 1.40. Um aluno recebeu as seguintes notas finais: 82 em Matemática, 90 em Estatística, 65 em História
e 70 em Geografia. Atribuindo-se a essas matérias, respectivamente, os pesos 3, 3, 2, 1, calcular a média
aritmética das notas recebidas pelo aluno.
EP 1.41. Se tornarmos x0 = 10 como a média arbitrária de um conjunto de números, chegaremos aos

seguintes desvios, calculados em relação a x0 = {−4, −1, 2, 0, 3, −3, 5, 1}. Calcular a média verdadeira do
conjunto.
xi 4 5 6 7 8
EP 1.42. Calcule a média aritmética para a seguinte tabela de dados ao lado.
fi 1 5 6 5 3
EP 1.43. Os desvios tomados em relação à média arbitrária x0 = 9 de um conjunto de números são:

{−5, −2, 3, 0, 4, −3, 5, 2}. A média aritmética do conjunto será:
(a) 9, 0 (b) 9, 5 (c) 9, 3 (d) 9, 8 (e) 10, 2
EP 1.44. Calcular a média aritmética para as seguintes tabelas de dados:
Classes fi
Valor 3 4 5 6 7 8 5 ⊢ 25 4
(a) fi 1 3 4 7 4 1 25 ⊢ 45 6
Fonte: Dados Fictícios 45 ⊢ 65 14
Peso (kg ) 2⊢4 4⊢6 6⊢8 8 ⊢ 10 10 ⊢ 12 65 ⊢ 85 26
(b) fi 9 12 6 2 1 (d) 85 ⊢ 105 14
Fonte: Dados Fictícios 105 ⊢ 125 8
Diâmetro (cm) 4⊢6 6⊢8 8 ⊢ 10 10 ⊢ 12 12 ⊢ 14 125 ⊢ 145 6
(c) fi 6 8 12 10 4 145 ⊢ 165 2
Fonte: Dados Fictícios Total
1.9.3 Média Geométrica
Se o produto dos elementos de X é a característica a ser mantida, obtemos a média geométrica. Ou seja,
a média geométrica dos números positivos e não nulos do conjunto X é um valor positivo ḡ tal que
x1 · x2 · . . . · xn = ḡ · ḡ · . . . · ḡ = ḡ n .
Logo,
Ì
√ Y
n
ḡ = n
x1 · x2 · . . . · xn = n
xi ( 1.5)
i =1
√
3
Exemplo 1.21. A média geométrica dos números 3, 36 e 54 é ḡ = 3 · 36 · 54 = 18.
Média Geométrica Ponderada
Se quisermos sintetizar a média geométrica e cada elemento da série possuem diferentes graus de im-
portância, utilizaremos a média geométrica ponderada que é calculada ao atribuirmos pesos (ou ponderações)
aos valores possíveis da variável. Quando os dados aparecem na forma de uma distribuição de freqüências,
os ponderadores serão as freqüências absolutas.
Seja fi o peso atribuído ao respectivo valor que a variável xi ∈ X assume. A média geométrica ponderada
dos n números positivos do conjunto X é um valor positivo ḡp tal que
X
k
x1f1 · x2f2 · . . . · xkfk = ḡp · ḡp · . . . · ḡp = ḡpn , onde n = fi .
i
Logo, Ì
È Y
k
x1f1 · x2f2 · . . . · xkfk = xifi
n
ḡp = n
( 1.6)
i =1
xi fi
1 2
ER 8. Determine a média geométrica para a distribuição dada ao lado. 3 4
√
10
5 3
Solução: ḡp = 12 · 34 · 53 · 71 ≈ 3, 0553.
7 1
X
10
Propriedades da Média Geométrica
1. O produto dos quocientes de cada valor de um conjunto de números pela média geométrica do conjunto
é igual a 1. Por exemplo,
√ 4 9
X = {4, 9}, ḡ = 4 · 9 = 6 e · = 1.
6 6
2. Séries que possuem o mesmo número de elementos com a mesma soma apresentam a mesma média
aritmética e as séries que possuem o mesmo número de elementos com o mesmo produto têm a mesma
média geométrica. Por exemplo,
X = {2, 5, 8}, x̄ = 5; X ′ = {2, 4, 9}, x̄ = 5; Y = {2, 4, 7}, ḡ = 3, 8259; Y ′ = {1, 2, 28}, ḡ = 3, 8259.
3. Se houver, pelo menos, um zero entre os valores da distribuição, a média geométrica será nula.
4. A média geométrica é também influenciada pelos valores extremos da distribuição.
1.9.4 Média Harmônica
Se a soma dos inversos dos elementos de X é a característica a ser observada, obteremos a média har-
mônica. Ou seja, a média harmônica dos números positivos e não nulos do conjunto X é um valor positivo h̄
tal que
1 1 1 1 1 1 n n n
+ + ...+ = + + . . . + = ⇒ h̄ = = n .
x1 x2 xn h̄ h̄ h̄ h̄ 1 1 1 X 1
+ + ...+
x1 x2 xn x
i =1 i
Podemos, facilmente, concluir que a média harmônica é o inverso da média aritmética dos inversos dos
números.
ER 9. Determine a média harmônica dos números 3, 36 e 54.
3
Solução: h̄ = ≈ 7, 9.
1 1 1
+ +
3 36 54
Nota 5. Evitamos a possibilidade de não existirem as médias geométrica e harmônica uma vez que estas
só foram definidas para números positivos.

Média Harmônica Ponderada
Utilizaremos a média harmônica ponderada quando os valores da variável em conjunto X possuírem de-
terminada importância (peso). Quando os dados aparecem na forma de uma distribuição de freqüências, os
ponderadores serão as freqüências absolutas.
Seja fi o peso atribuído ao respectivo valor que a variável xi ∈ X assume. A média harmônica ponderada
dos k números positivos do conjunto X é um valor positivo h̄p tal que
f1 f2 fk 1 1 1 k
+ + ...+ = + + ...+ = .
x1 x2 xk h̄p h̄p h̄p h̄p
Logo,
n k
h̄p = = . ( 1.7)
f1 f2 fk X
k
fi
+ + ... +
x1 x2 xk xi
i =1
ER 10. Determine a média har- Solução:

mônica da distribuição xi fi xifi
xi fi 1 2 1
√
1 2 3 4 81 h̄p = 10
1 · 81 · 125 · 7 ≈ 3, 05526797.
3 4 5 3 125
5 3 7 1 7
X
7 1 10
Propriedades da Média Harmônica
1. Valores próximos possuem médias próximas e valores afastados, médias afastadas.
2. Quando os valores das variáveis não forem muito afastados, verifica-se que
x̄ + h̄
ḡ ≈ .
2
3. A presença de pelo menos um valor igual a zero inviabiliza o cálculo da média harmônica.
4. Valores extremos também influenciam a média harmônica.
1.9.5 Média Quadrática
Se a soma dos quadrados dos elementos de X é a característica a ser conservada, obteremos a média
quadrática. Ou seja, a média quadrática dos números do conjunto X é um valor positivo q̄ tal que
x12 + x22 + . . . + xn2 = q̄ 2 + q̄ 2 + . . . + q̄ 2 = n · q̄ 2 .
Logo, Î
X
n
r xi2
x12 + x22 + ... + xn2 i =1
q̄ = = ( 1.8)
n n
isto é, a média quadrática é a raiz quadrada da média aritmética dos quadrados dos números. Este tipo de
média é bastante usado em Estatística no cálculo do desvio-padrão.
r
22 + 32 + 52
Exemplo 1.22. A média quadrática dos números 2, 3 e 5 é q̄ = ≈ 2, 4495.
3
Vejamos agora alguns exemplos para ilustrar a utilização dos diferentes tipos de médias.
ER 11. Uma empresa produziu durante o 1◦ trimestre do ano passado 500, 200 e 200 unidades em janeiro,
fevereiro e março, respectivamente. Qual foi a produção média mensal?
Solução: Que média devemos usar?

Queremos a produção média M , tal que se a produção mensal fosse sempre igual a M , a produção
trimestral seria a mesma. Uma vez que a produção trimestral é
500 + 200 + 200 = 900 = M + M + M .
Então, 3M = 900 e M = 300 (média aritmética).
ER 12. Uma empresa aumentou sua produção durante o primeiro bimestre do ano passado. Em janeiro e em
fevereiro as taxas de aumento foram de 21% e 8%, respectivamente. Qual a taxa média de aumento mensal
neste bimestre?
(21% + 8%)
Solução: Cuidado! Não devemos fazer = 14, 5%. Vamos pensar na solução correta.
2
Que tipo de média devemos usar? Queremos uma taxa média i , tal que se em cada mês a taxa de
aumento fosse igual a i , o aumento bimestral seria o mesmo. E qual foi o aumento bimestral?
Sem perda de generalidade suponha que a produção em dezembro tenha sido de 100 unidades. Então,
a produção em janeiro e em fevereiro são, respectivamente,
100 + (0, 21)100 = 100 · 1, 21 = 121

121 · 1, 08 = 100 · 1, 21 · 1, 08 = 130, 68
Portanto, a taxa de aumento bimestral foi de 30, 68%.

Se em todos os meses tivéssemos a mesma taxa de aumento i , qual seria o valor de i para obtermos o
mesmo aumento bimestral?
Produção em janeiro: 100 · (1 + i );
Produção em fevereiro: 100 · (1 + i )2 .
Então,
(1 + i )2 = 1, 21 · 1, 08
√
(1 + i ) = 1, 21 · 1, 08 = 1, 1432 (média geométrica)
Logo, a taxa média de aumento mensal i = 14, 32%.
Observe que a taxa média aumentada de uma unidade é a média geométrica das taxas mensais aumen-
tadas de uma unidade.
ER 13. Um carro percorre metade de um percurso retilíneo AB de extensão d com velocidade v1 e a outra
metade com velocidade v2 . Qual a sua velocidade média?
Solução: Lembrando que velocidade é a razão entre distância e tempo, então o primeiro trecho foi
d d
percorrido em t1 = e o segundo trecho em t2 = sendo o tempo total dado por t = t1 + t2 .
2v1 2v2
A velocidade média (constante) v que nos faria percorrer a distância d no tempo t é
d d d 2
v= = = = ,
t d d d 1 1 1 1
+ + +
2v1 2v2 2 v1 v2 v1 v2

ou seja,
2
v= .
1 1
+
v1 v2
Observe, portanto, que a velocidade média é a média harmônica das velocidades em cada trecho.
1.9.6 Relação entre as Médias
Se x1 , x2 , . . . , xn são n números positivos e h̄, ḡ , x̄ e q̄ são suas médias harmônica, geométrica, aritmética e
quadrática, respectivamente, então
h̄ ≤ ḡ ≤ x̄ ≤ q̄ .
Além disso, duas quaisquer dessas médias serão iguais se, e somente se, x1 = x2 = . . . = xn .
fi
1.9.7 Exercícios Propostos Classes fi xi
1 ⊢ 3 2
EP 1.45. Calcular a média harmônica da distribuição ao lado.
3 ⊢ 5 4
EP 1.46. Considere a amostra {6, 2, 7, 5, 4}. A soma dos desvios 5 ⊢ 7 12
em relação à média é igual a: 7 ⊢ 9 4
9 ⊢ 11 2
(a) −4 (b) 8 (c) 0 (d) 25 (e) 4 Total
EP 1.47. A relação x̄ = x̄h = x̄g ocorre quando:
(a) todos os xi forem negativos. (c) todos os xi forem iguais. (e) n. d. a.

(b) a distribuição for simétrica. (d) a variável for contínua.
EP 1.48. Indique a relação correta quanto às médias aritmética, geométrica e harmônica:
(a) x̄h ≤ x̄ ≤ x̄g (b) x̄g ≤ x̄ ≤ x̄h (c) x̄g ≤ x̄h ≤ x̄ (d) x̄h ≤ x̄g ≤ x̄ (e) n.d.a.
EP 1.49. É propriedade comum entre média aritmética e média geométrica:

(a) ser influenciada pelos valores extremos da série. (d) a soma dos quadrados dos desvios é um mínimo.
(b) a soma dos desvios é iguala zero. (e) n. d. a.
(c) seu uso é vantajoso na análise dos números índices.
EP 1.50. Determine, aproximadamente, as médias aritmética, geométrica, harmônica e quadrática para a

distribuição:
xi 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
fi 5 2 4 6 3 4 5 9 5 1 2 5 3 3 2 1
EP 1.51. Transforme a distribuição da questão ?? em uma distribuição de freqüências em intervalos de

classes e, em seguida, com base nesta, determine as médias aritmética, geométrica, harmônica e quadrática.
1.9.8 Mediana
Chamamos de Mediana (Md ) o elemento que ocupa a posição central na distribuição ordenada (crescente
ou decrescente), isto é, divide um rol em duas partes iguais de modo que 50% dos valores observados são
inferiores ao valor mediano e 50% superiores a esse valor.
Devemos considerar dois casos para calcular o elemento Mediana: o cálculo da mediana para um conjunto
com valores não tabuláveis e o outro conjunto com valores tabuláveis. Devemos ainda considerar se os dados
deste conjunto são discretos ou agrupados em classes.
Mediana em um Conjunto com Valores Não-Tabuláveis
A Mediana em um conjunto com valores discretos é determinada por

x n2 + x n2 +1
Md = , n é par, ( 1.9) Md = x n+1 , n é ímpar. ( 1.10)
2 2
ER 14. Determine a mediana para os conjuntos:
a) X = {1, 3, 5, 7, 9, 11}. b) Y = {1, 3, 5, 7, 9, 11, 12, 13, 14}
5+7
Solução: Como nX = 6, MdX = = 6. Já nY = 9, e MdY = 9.
2
Mediana em um Conjunto com Valores Tabuláveis
Para o cálculo da mediana de um conjunto com valores tabuláveis devemos considerar ainda o tipo de
variável.
1 - Mediana em conjuntos com Valores Discretos Agrupados
Neste caso temos que trabalhar com a freqüência acumulada a fim de identificarmos a posição central.
ER 15. Determine o elemento mediano para a distribuição
xi 2 4 6 8 10 12
fi 5 10 15 12 5 3
x25 + x26 6+6

Solução: Md = = = 6.
2 2
2 - Mediana em um Conjunto com Valores Agrupados em Classes
Neste caso a mediana é obtida respeitando a seguinte relação

P − F ci −1
Md = li + hi · , ( 1.11)
fi
n
⋄P = é a posição do elemento mediano; ⋄ hi é amplitude de classe mediana;
2
⋄ li é o limite inferior da classe mediana; ⋄ fi é a freqüência absoluta da classe mediana.
⋄ F ci −1 é freqüência acumulada anterior à classe mediana;
As seguintes etapas para o cálculo da mediana em dados agrupados em classes devem ser consideradas:
1. Cálculo da posição do elemento mediano;
2. Identificação da classe mediana;
3. Calcular a mediana.
ER 16. Determine a mediana do conjunto representado pela tabela

Classes fi F ci
2 ⊢ 4 3 3 P
Fci 20
4 ⊢ 6 5 8 Solução: Como P = = = 10, temos que Md ∈ 6 ⊢ 8. Logo,
2 2
6 ⊢ 8 7 15
P − F ci −1 10 − 8
8 ⊢ 10 4 19 Md = li + hi · =6+2· ≈ 6, 57
fi 7
10 ⊢ 12 1 20
Total
A mediana é uma medida de posição resistente, pois é pouco afetada por mudanças de pequena porção
dos dados, ao contrário da média aritmética que é sensível a valores atípicos. Por exemplo, se
X = {200, 250, 250, 300, 450, 460, 510}, x̄X = 345, 7 e MdX = 300.
Y = {200, 250, 250, 300, 450, 460, 2.300}, x̄Y = 601, 0 e MdY = 300.
Podemos observar que, no caso do conjunto Y , a média não sintetiza adequadamente o conjunto de dados,
pois, apenas um valor é superior a ela.
Devemos empregar a mediana se: desejamos obter o ponto que divide a distribuição em duas partes iguais
(“abaixo de” ou “acima de”); existem valores extremos que afetam de uma maneira acentuada a média ou; a
variável em estudo é o salário.
ER 17. Considere os seguintes dados que representam o número de mortes depois das erupções vulcânicas
que ficaram célebres:
Data Nome vulcão N mortes Data Nome vulcão N mortes

79a.c . Mt. Vesuvius, Italy 16.000 1.902 Santa Maria, Guatemala 1.000
1.169 Mt. Etna, Sicily 15.000 1.902 Mt. Pelée, Martinique 30.000
1.631 Mt. Vesuvius, Italy 4.000 1.911 Mt. Taal, Philippines 1.400
1.669 Mt. Etna, Sicily 20.000 1.919 Mt. Kelud, Java 5.000
1772 Mt. Papandayan, Java 3.000 1.951 Mt. Lamington, New Guinea 3.000
1792 Mt. Unzen-Dake,Japan 10.400 1.966 Mt. Kelud, Java 1.000
1815 Tamboro, Java 12.000 1.980 Mt. St. Helens, U.S. 60
1.883 Krakatau, Indonesia 35.000 1.985 Nevado del Ruiz, Colombia 22.940
Fonte: World Almanac, 1.993
(a) Calcule a média e a mediana do número de mortes.
(b) Suponha que ao digitar os valores anteriores o valor que diz respeito à erupção vulcânica de 1.883 apare-
ceu 335.000, em vez de 35.000. Calcule novamente a média e a mediana;
(c) Admita agora que o engano se deu ao digitar o 60, que apareceu substituído por 600. Calcule novamente
a média e a mediana;
(d) Apresente os valores obtidos nas alíneas anteriores no seguinte quadro e comente-o:
Dados originais Dados com o valor 335000 Dados com o valor 600
Média
Mediana
Solução: Primeiramente, reescrevendo a tabela acima de modo que o número de mortes seja crescente,
temos:
Data Nome vulcão N mortes Data Nome vulcão N mortes

1.980 Mt. St. Helens, U.S. 60 1792 Mt. Unzen-Dake,Japan 10.400
1.902 Santa Maria, Guatemala 1.000 1.815 Tamboro, Java 12.000
1.966 Mt. Kelud, Java 1.000 1.169 Mt. Etna, Sicily 15.000
1.911 Mt. Taal, Philippines 1.400 79a.c . Mt. Vesuvius, Italy 16.000
1.772 Mt. Papandayan, Java 3.000 1.669 Mt. Etna, Sicily 20.000
1.951 Mt. Lamington, New Guinea 3.000 1.985 Nevado del Ruiz, Colombia 22.940
1.631 Mt. Vesuvius, Italy 4.000 1.902 Mt. Pelée, Martinique 30.000
1.919 Mt. Kelud, Java 5.000 1.883 Krakatau, Indonesia 35.000
Fonte: World Almanac, 1.993
179.800
(a) A soma do número de mortes é 179.800. Assim, a média x̄ é 16 = 11.237, 5. Como temos um número
par de classes, 16 no total, então a mediana Md é
x8 = x9 15.400
Md = = = 7.700.
2 2
479.800
(b) Agora a soma do número de mortes é 479.800, daí a nova média é x̄ = = 29.987, 5. A mediana
16
é a mesma, pois não alterou a ordem das classes.
180.340
(c) Neste caso a soma do número de mortes é 480.340, donde a nova média é x̄ = = 11.271, 25. A
16
mediana é a mesma, pois não alterou a ordem das classes.
(d)
Dados originais Dados com o valor 335000 Dados com o valor 600
Média 11.237, 5 29.987, 5 11.271, 25
Mediana 7.700 7.700 7.700
A mediana ficou a mesma, pois a ordem das classes ficou a mesma, para cada alínea. Já a média sofre
alterações, uma vez que seu cálculo depende diretamente do somatório do número de mortes.
1.9.9 Moda
A moda é outra importante medida de locação, mas, diferentemente das médias, não se utiliza todos os val-
ores do conjunto analisado em seu cálculo. A Moda Mo é o valor que ocorre com maior freqüência no conjunto
e em distribuições simples (sem agrupamento em classes) sua determinação é facilitada pela observação do
elemento que apresenta maior freqüência. Por exemplo:
a) X = {2, 3, 3, 5, 5, 5, 6, 7}, Mo = 5;
b) Y = {10, 12, 17, 21, 32}, não existe moda, a distribuição é amodal;
c) Z = {2, 2, 5, 5, 7, 7}, distribuição é amodal;
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21}, distribuição apresentando dois valores modais, Mo1 = 12 e
Mo2 = 18 (distribuição bimodal).
e) Na tabela abaixo, observe que a determinação da moda (Mo = 3) é imediata
xi 1 2 3 4 5
fi 2 2 5 4 1

Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuição plurimodal .
A moda é uma medida mais adequada ao caso de dados agrupados. No caso de dados não agrupados, a
moda nem sempre tem utilidade com elemento representativo ou sintetizador do conjunto.
Quando a distribuição de freqüências está organizada por classes de valores, devemos identificar a classe
modal (classe em que observamos a maior freqüência). O ponto médio da classe modal será o valor estimado
para a moda que é denominada Moda Bruta . Consideremos, por exemplo, o seguinte conjunto de dados:
Valores 7 11 15 17 19 21 25
fi 2 3 1 4 5 2 7
De acordo com a definição, a Moda é 25, entretanto, este valor não é representativo do conjunto de dados
e, portanto, a moda não é uma boa medida de locação neste caso. Podemos obter a moda por outro métodos:
Método de King
A moda pelo Método de King baseia-se na influência das freqüências das classes adjacentes sobre a classe
modal.

fi +1
Mo = li + hi · ,
fi −1 + fi +1
⋄ li é o limite inferior da classe modal;
⋄ hi é a amplitude do intervalo da classe modal;
⋄ fi −1 é a freqüência absoluta da classe anterior à classe modal.
⋄ fi +1 é a freqüência absoluta da classe posterior à classe modal;
Método de Czuber
A moda pelo Método de Czuber considera não apenas as freqüências das classes adjacentes à classes
modal, mas também a freqüência da classe modal.

fi − fi −1
Mo = li + hi · .
2fi − (fi −1 + fi +1 )
Se fizermos ∆1 = fi − fi −1 e ∆2 = fi − fi +1 , então

∆1
Mo = li + hi · .
∆1 + ∆2
Importante: Quando a questão não informar que moda obter, então o que se pede é a moda pelo Método
de Czuber, por ser o valor mais preciso.
Fórmula de Pearson
A moda Pearson é dada, aproximadamente, pela diferença entre o triplo da mediana e o dobro da média,
ou seja,
Mo = 3 · Md − 2 · x̄ . ( 1.12)
Nota 6. Esta fórmula apresenta uma boa aproximação quando existe uma razoável simetria.
EP 1.52. Calcular as modas para os seguintes casos:
Notas fi Estaturas(cm) fi Consumo(kW h) fi

0 ⊢ 2 5 150 ⊢ 154 4 5 ⊢ 25 4
2 ⊢ 4 8 154 ⊢ 158 9 25 ⊢ 45 10
(a) 4 ⊢ 6 14 158 ⊢ 162 11 45 ⊢ 65 24
(b)
6 ⊢ 8 10 162 ⊢ 166 8 65 ⊢ 85 50
(c)
8 ⊢ 10 7 166 ⊢ 170 5 85 ⊢ 105 64
Total 170 ⊢ 174 3 105 ⊢ 125 72
Total 125 ⊢ 145 78
145 ⊢ 165 80
Total
Nota 7.
Notas fi Notas fi Notas fi

0 ⊢ 2 5 0 ⊢ 2 3 0 ⊢ 2 3
2 ⊢ 4 8 2 ⊢ 4 8 2 ⊢ 4 12
4 ⊢ 6 14 4 ⊢ 6 14 4 ⊢ 6 14
6 ⊢ 8 8 6 ⊢ 8 8 6 ⊢ 8 8
8 ⊢ 10 7 8 ⊢ 10 3 8 ⊢ 10 7
Total Total Total
1. Quando as freqüências das classes adjacentes (anterior e posterior) à classes modal
forem iguais, teremos:
2. Quando a distribuição for Simétrica, teremos:
3. Quando o somatório das freqüências simples acima da classe mediana for igual ao so-
matório das freqüências simples abaixo, a mediana será obtida através do ponto médio
da classe mediana.
Relação entre a Média Aritmética, a Moda e a Mediana
Três tipos de relações podem ser efetuadas entre as três principais medidas de tendência central em uma
distribuição.
Distribuição simétrica : Quando a média aritmética, a mediana e a moda são iguais.
x̄ = Md = Mo .
Distribuição assimétrica : Quando existe diferença entre a média aritmética, a mediana e a moda.
- positiva (à direita): A média aritmética é o maior dos valores e a mediana está entre a média
aritmética e a moda.
x̄ > Md > Mo .
- negativa (à esquerda): A média aritmética é o menor dos valores e a mediana está entre a média
aritmética e a moda.
x̄ < Md < Mo .
Nota 8. Para observamos o aspecto da assimetria através das medidas de tendência central bastaríamos
comparar a média aritmética e a moda, visto que a mediana, em geral, situa-se entre estas duas medidas,
porém, devemos ter cuidado, pois, em alguns casos isto pode não ocorrer.

Nota 9. Quando usamos qualquer programa estatístico, os dados não são agrupados em classes. Desta
forma a mediana é calculada como se os dados estivessem organizados de acordo com um rol.
Resumo Comparativo entre as Médias
Definição Vantagens Limitações

Reflete cada valor;
X
n
Sempre calculada;
xi
i =1 Possui boas propriedades Influenciada por valores ex-
Média x̄ =
n matemáticas; tremos.
Única;
Uso de calculadora.
Metade dos
Menos sensível a valores ex-
valores são
tremos do que a média;
Mediana maiores, Necessita de ordenação.
Difícil de determinar para
metade
grandes quantidades de dados.
menores.
Não se presta a análise
Valor de Valor “típico”; matemática;
Moda maior ocor- Maior quantidade de valores Pode não haver moda para cer-
rência. concentrados neste ponto. tos conjuntos de dados, como
pode haver uma infinidade.
EP 1.53. Calcule a mediana nos seguintes casos:
(a) X = {2, 3, 5, 6, 9, 10, 13, 15} (c) X = {4, 6, 2, 7, 3, 8}

(b) X = {1, 3, 4, 6, 8, 9, 11, 13, 14} (d) X = {5, 6, 2, 8, 4, 9, 14, 12, 10}
xi fi F ci xi fi F ci xi fi F ci
3 2 12 2 2 2
4 6 13 6 3 8
5 10 14 12 4 12
(e) f) g)
6 8 15 10 5 10
7 5 16 6 6 5
8 4 17 4 7 3
Total Total Total
Notas fi F ci Estaturas (cm) fi F ci Consumo (kwh) fi F ci

0 ⊢ 2 5 150 ⊢ 154 4 5 ⊢ 25 4
2 ⊢ 4 8 154 ⊢ 158 9 25 ⊢ 45 6
(h) 4 ⊢ 6 10 158 ⊢ 162 11 45 ⊢ 65 14
i)
6 ⊢ 8 14 162 ⊢ 166 8 65 ⊢ 85 26
j)
8 ⊢ 10 7 166 ⊢ 170 5 85 ⊢ 105 14
Total 170 ⊢ 174 3 105 ⊢ 125 8
Total 125 ⊢ 145 6
145 ⊢ 165 2
Total
EP 1.54. Das afirmações abaixo:
I - Quando se ordenam valores não agrupados segundo sua grandeza, a mediana é o ponto médio desta
série.
II - Quando os valores de uma série contínua estão agrupados em uma distribuição de freqüência, a mediana
é, por definição, o ponto que corresponde a 50% da distribuição.
III - Quando desejamos o ponto médio exato de uma distribuição de freqüência, basta calcular a mediana.
IV - Quando existem valores extremos que afetam muito o cálculo da média, para representá-la devemos dar
preferência à mediana.
(a) todas estão erradas. (d) apenas a IV está errada.

(b) todas estão corretas. (e) apenas a II está correta.
(c) apenas a I está errada.
EP 1.55. Os salários mensais de quatro pessoas são: 15.000, 00, 18.000, 00, 19.000, 00 e 90.000, 00.
(a) Determinar a média aritmética de seus salários;
(b) Podemos dizer que a média obtida é típica dos salários?
EP 1.56. A tabela abaixo representa os salários pagos a 100 operários de uma firma.
Salários Mínimos Operários

Determinar:
0 ⊢ 2 40
(a) o salário médio; 2 ⊢ 4 30
4 ⊢ 6 10
(b) o salário modal (Czuber); 6 ⊢ 8 15
(c) o salário mediano. 8 ⊢ 10 5
Total
EP 1.57. Considere a distribuição das estaturas de 100 alunos de uma turma.
Estaturas (cm) Operários

Determinar:
140 ⊢ 150 5
(a) a estatura média; 150 ⊢ 160 10
160 ⊢ 170 30
(b) a estatura modal (Czuber);
170 ⊢ 180 40
(c) a estatura modal (King); 180 ⊢ 190 10
190 ⊢ 200 5
(d) a estatura mediana.
Total
Gabarito
1.1 (a) 49 (b) 2, 48 (c) 0, 005 (d) 22, 3 (e) 1.001 (f) 6.500 (g) 5, 8 (h) 23, 4 (i) 5, 0 (j) 25, 4 (k) 320 (l) 6.000 1.2 (c). 1.3 discretos:
(a); contínuos (b), (c), (d) e (e). 1.4 (c). 1.5 (d). 1.6 (d). 1.7 (b). 1.8 (e). 1.9 (a). 1.10 (c). 1.11 (d). 1.12
(d). 1.13 (c). 1.14 (a) 10.000 (Aparente) (b) 8.999 (Aparente) (c) 7.499, 5 (d) 8.999, 5 e 9.999, 5 (e) 1.000 (f) 16 (g) 24, 61% (h)
7.000 − 7.999 (i) 52, 3% (j) 76, 9% 1.15 1.16 1.17 1.18 1.19 (b). 1.20 (a) 40 (b) 80 (c) 15% excluindo o 6 (d) 70%. 1.21 (a)
1.22 (b) 1.23 (e) 1.24 (c) 1.25 (a) 1.26 (a) 1.27 (b) 1.28 (e) 1.29 (b) 1.30 (e). 1.31 (c). 1.32 (e). 1.33 (d). 1.34
(c). 1.35 (a) 1.36 (c) 1.37 (d) 1.38 (c) 1.39 (d) 1.40 79, 6. 1.41 10, 375. 1.42 6, 2. 1.43 (b) 1.44 (a) 5, 65; (b) 5, 27 . . .;
(c) 8, 9; (d) 79, 5. 1.45 5, 1. 1.46 (c) 1.47 (c) 1.48 (d) 1.49 (a) ?? x̄ = 26, 58; ḡ = 26, 27; h̄ = 25, 96; q̄ = 26, 90 1.51
1.52 (a) Moda Bruta: 5, 0; Moda de King: 5, 1; Moda de Czuber: 5, 2. (b) Moda Bruta: 160; Moda de King: 159, 9; Moda de Czuber:
159, 6. (c) Moda Bruta 75; Moda de King: 75; Moda de Czuber: 75. 1.53 (a) Md = 7, 5; (b) Md = 8; (c) Md = 5; (d) Md = 8; (e)
Md = 5; (f) Md = 14, 5; (g) Md = 4; (h) Md = 5, 23; (i) Md = 160, 55; (j) Md = 77, 31. 1.54 (b) 1.55 $35.625, 00. 1.56 1.57

TEMA 02 Medidas
2.1 Medidas de Posição II
2.1.1 Separatrizes
As separatrizes valores que ocupam determinados lugares em uma série ordenada e nos permite separar
a distribuição em partes iguais. Temos quatro tipos de separatrizes, também chamadas de quantis:
• a mediana, que também é uma medida de tendência central; • os decis;
• os quartis; • os percentis ou centis.
2.1.2 Quartis, Decis e Centis
As medidas de posição denominadas quartis, decis e centis (ou percentis) têm construção análoga a da
mediana. Enquanto a mediana separa a distribuição em duas partes iguais, esses, dividem a distribuição em
quatro partes, em dez partes e, em cem partes, respectivamente.
Variáveis Discretas
O quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuição com variáveis discretas é determinado
por:
8
>
<
x[P ]+1 , P 6∈ Z
( 2.13)
>
: xP + xP +1 , P ∈ Z,
2
onde n é a freqüência total da distribuição, [P ] representa a parte inteira de P ∈ R e P pode assumir os valores
i ·n i ·n i ·n
4 , 10 ou 100 a depender de qual das separatrizes desejamos calcular.
ER 18. Dada a distribuição de freqüências ao lado, calcule: xi 1 2 3 4 5 6 7 8

(a) Q1 ; (b) D8 ; (c) C40 . fi 4 5 3 2 1 6 7 2
Podemos escrever a seguinte tabela ao lado.

Solução: (a) Para o cálculo do Q1 devemos, inicialmente, calcular: i ·4n para i = 1 e n = 30.
Portanto, i 4·n = 1·30
4 = 7, 5. Sendo assim, Q1 = x[7,5]+1 = x8 = 2. Observe aqui que
xi fi F ci
o elemento de ordem 8 está entre os elementos de ordem 4 e 9, que é, facilmente
1 4 4
localizado na tabela considerando-se a coluna das freqüências acumuladas.
2 5 9 ·n
(b) Para o cálculo do D8 devemos, inicialmente, calcular: i10 para i = 8 e n = 30.
3 3 12 x 24 + x25 7 +7
·n
Portanto, i10 = 8·30
10 = 24. Sendo assim, D8 = = = 7. Observe
4 2 14 2 2
aqui que os elementos de ordem 24 e 25 estão entre os elementos de ordem
5 1 15
21 e 28, que são, facilmente localizados na tabela considerando-se a coluna das
6 6 21
freqüências acumuladas.
7 7 28 i ·n
(c) Para o cálculo do C40 devemos, inicialmente, calcular: 100 para i = 40 e n = 30.
8 2 30 x + x 3+4
i ·n 40·30 12 13
Portanto, 100 = 100 = 12. Sendo assim, C40 = = = 3, 5.
2 2
Variáveis Contínuas
O Quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuição com variáveis contínuas agrupadas em
classes é determinado por:

P − F ci −1
l i + hi · ( 2.14)
fi
⋄ P é a posição do quantil de ordem i o qual desejamos calcular e é determinado por
i ·n i ·n i ·n
, ou ,
4 10 100
respectivamente, posição do Quartil, do Decil ou do Centil, sendo n a freqüência total da distribuição;
⋄ li é o limite inferior da classe quantílica;
⋄ hi é amplitude de classe quantílica;
⋄ F ci −1 é freqüência acumulada absoluta anterior à classe quantílica;
⋄ f ri é a freqüência absoluta da classe quantílica.
Atenção! Observe que C50 = D5 = Q2 = Md .
Podemos reformular a equação ( 2.14) utilizando freqüências relativas, ou seja

P − F r ci −1
l i + hi · ( 2.15)
f ri
⋄ P = 4i , P = 10
i i
ou P = 100 é a posição do quantil de ordem i o qual desejamos calcular, sendo n a freqüência
total da distribuição;
⋄ li é o limite inferior da classe quantílica;
⋄ hi é amplitude de classe quantílica;
⋄ F r ci −1 é freqüência relativa acumulada anterior à classe quantílica;
⋄ f ri é a freqüência relativa da classe quantílica.
Intervalo Interquartil
Classes fi F ci
Definimos o intervalo interquartil ou interquartílico o intervalo (Q1 ; Q3 ) que con-
5 ⊢ 25 4
tém 50% do total de observações localizadas mais ao centro da distribuição.
25 ⊢ 45 6
45 ⊢ 65 14
2.1.3 Exercícios Propostos 65 ⊢ 85 26
EP 2.1. Dada a distribuição de freqüências abaixo, calcule: 85 ⊢ 105 14
105 ⊢ 125 8
(a) Q1 ; 125 ⊢ 145 6
(b) D8 ; 145 ⊢ 165 2
(c) C70 . Total

Notas fi F ci
EP 2.2. Ao aplicar uma prova de Estatística a uma turma de 120 alunos, 30 ⊢ 40 1
encontrou-se o resultado expresso na tabela abaixo. Calcule: 40 ⊢ 50 3
50 ⊢ 60 11
(a) o grau mais alto que poderia ser obtido pelos 50% piores alunos da turma;
60 ⊢ 70 21
(b) o grau mais baixo que poderia ser obtido pelos 25% melhores alunos da turma; 70 ⊢ 80 43
80 ⊢ 90 32
(c) o grau mais alto que é possível ser obtido pelos 20% piores alunos da turma.
90 ⊢ 100 9
Total
EP 2.3. Considere os conjuntos Y = {6, 12, 15, 7, 10} e Z = {10, 5; 11, 8; 15, 4; 16, 5; 20, 0; 13, 6} e calcule:
(a) a Média Aritmética; (d) o valor do Primeiro Quartil;
(b) a Mediana; (e) o valor do Oitavo Decil;
(c) a Moda (identifique o conjunto); (f) o valor do Septuagésimo Sexto Centil.
EP 2.4. Dada a distribuição abaixo calcule:
(a) a média aritmética x̄ ;
Estatura (cm) fi
(b) a mediana Md ; 140 ⊢ 145 9
(c) as modas: bruta MoB ; de Czuber MoC ; de King MoK e de Pearson MoP . 145 ⊢ 150 15
150 ⊢ 155 40
(d) o valor do: primeiro quartil Q1 ; terceiro quartil Q3 ; 155 ⊢ 160 22
(e) o valor do: quinto decil D5 ; sétimo decil D7 ; 160 ⊢ 165 10
165 ⊢ 170 4
(f) o valor do: sexagésimo centil C60 ; octogésimo oitavo centil C88 .
Medidas de Dispersão
A análise de um conjunto de observações com base numa medida de tendência central não nos fornece
informações suficientes para o conjunto de valores. Em outras palavras, as medidas de tendência central
(médias, moda, mediana) são úteis para identificar um valor típico numa distribuição de freqüência, porém,
estes não apresentam as disparidades existentes numa distribuição.
Portanto, as medidas de dispersão são utilizadas para avaliar o grau de variabilidade ou dispersão dos
valores de uma distribuição em torno da média. Estas medidas permitem estabelecer comparações entre
fenômenos de mesma natureza ou de naturezas distintas e, em geral, essa variabilidade é observada em torno
de uma medida de tendência central.
Entre duas amostras com a mesma média, será mais representativa aquela que apresentar menor disper-
são.
Dentre as medidas de dispersão destacamos a Amplitude Total, o Desvio Médio e o Quartil, a Variância, o
Desvio Padrão e os coeficientes de Variação e de Pearson.
Medidas de Dispersão
Absolutas Relativas
Amplitude Total Coeficiente de Variação de Pearson
Desvio Quartil ou Amplitude Semi-interqualítica Variável reduzida
Desvio Médio
Variância
Desvio padrão
As absolutas vêm expressas na mesma unidade de medida da variável em estudo. As relativas são as me-
didas que independem da unidade de medida de variável observada. Servem para estudar comparativamente
duas ou mais distribuições com natureza distinta ou com unidades de medida diferentes.
2.1.4 Amplitude Total
A Amplitude Total (AT ) é a diferença entre os valores extremos do conjunto.
AT = xmax − xmin ( 2.16)
A amplitude total é a mais simples das medidas de dispersão. Apresenta uma desvan-
Altura fi
tagem em relação as outras medidas de dispersão por levar em conta apenas os valores
150 ⊢ 154 4
mínimo e máximo do conjunto, ou seja, se ocorre qualquer variação no interior do con-
154 ⊢ 158 9
junto de dados esta medida não se modifica. Além disso, geralmente sofre a influência de
158 ⊢ 162 11
um valor “atípico” (valores elevados o pequenos em relação ao conjunto) na distribuição.
162 ⊢ 166 8
Exemplo 2.1. Para os valores 30, 35, 38, 45, 48, 50, 56, 60, 65 temos AT = 65 − 30 = 35. 166 ⊢ 170 5
170 ⊢ 174 3
Exemplo 2.2. Para a tabela ao lado, temos AT = 174 − 150 = 24
Total 40
2.1.5 Desvio
A diferença entre um determinado valor xi de uma amostra e a sua média x̄ é chamada de desvio di , ou
seja, di = xi − x̄ .
ER 19. Determine os desvios das seguintes amostras
(a) X = {1, 3, 5, 7, 9}; (b) Y = {1, 1, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 7, 7, 7, 7, 9, 9, 9}.
1+3+5+7+9
Solução: (a) A média de X é x̄ = = 5. Portanto, os desvios são: d1 = 1 − 5 = −4,
5
d2 = 3 − 5 = −2, d3 = 5 − 5 = 0, d4 = 7 − 5 = 2 e d5 = 9 − 5 = 4.
1·2+3·4+5·7+7·4+9·3 104
(b) A média de X é x̄ = = = 5, 2. Portanto, os desvios são: d1 =
20 20
1 − 5, 2 = −4, 2, d2 = 3 − 5, 2 = −2, 2, d3 = 5 − 5, 2 = −0, 2, d4 = 7 − 5, 2 = 1, 8 e d5 = 9 − 5, 2 = 3, 8.
Propriedades do Desvio
I. A soma algébrica dos desvios tomados em relação à média aritmética é igual a zero, ou seja,
X
n X
n
di = (xi − x̄ ) = 0.
xi di = xi − x̄ di2
i =1 i =1
1 −4 16
II A soma dos quadrados dos desvios tomados em relação à média aritmética
3 −2 4
é mínima. Em outras palavras, a soma dos quadrados dos desvios, toma-
5 0 0
dos em relação à média aritmética é menor que a soma dos quadrados dos
7 2 4
desvios, tomados em relação a qualquer outro elemento diferente da média
9 4 16
aritmética. Esta propriedade também é válida para dados tabulados agrupa-
Soma 0 40
dos em classes.
Exemplo 2.3. Considere X = {1, 3, 5, 7, 9} e observe a tabela acima.

2.1.6 Desvio Quartil
O Desvio Quartil (DQ ) é metade da amplitude interqualítica, onde a amplitude interqualítica é a diferença
entre dois quartis.
Q3 − Q1
DQ = ( 2.17)
2
2.1.7 Desvio Médio Absoluto
O Desvio Médio (DM ) é definido como a média aritmética dos valores absolutos dos desvios em relação à
média aritmética de distribuição.
X
n
|xi − x̄ | · fi
i =1
DM = . ( 2.18)
X
n
fi
i =1
Se f1 = f2 = f3 = . . . = fk = 1, então
X
n
|xi − x̄ |
i =1
DM = . ( 2.19)
n
O desvio médio apresenta facilidades no cálculo, mas, é pouco empregado devido ao uso de módulos. O
seu estudo serve como introdução à construção do desvio padrão.
ER 20. Calcule o desvio médio para a amostra {1, 3, 4, 5, 7}.
1+3+4+5+7
Solução: Temos que x̄ = = 4. Os desvios, d1 = 1 − 4 = −3, d2 = 3 − 4 = −1, d3 = 0,
5
3+1+0+1+3
d4 = 5 − 4 = 1 e d5 = 7 − 4 = 3. Portanto, DM = = 1, 6.
5
2.1.8 Variância
A Variância populacional σ 2 é a média aritmética dos quadrados dos valores dos desvios em relação à
média aritmética da distribuição.
Sendo x1 , x2 , . . . , xn , n valores que a variável x assume e f1 , f2 , . . . , fn , as respectivas freqüências absolutas

temos:
X
n
(xi − x̄ )2 · fi
i =1
σ2 = . ( 2.20)
X
n
fi
i =1
Se f1 = f2 = f3 = . . . = fn = 1 então
X
n
(xi − x̄ )2
i =1
σ2 = . ( 2.21)
n
No caso da Variância amostral se torna conveniente o uso da fórmula

X
n
(xi − x̄ )2 · fi
i =1
S2 = . ( 2.22)
n−1
Propriedades da Variância
1. Somando-se ou subtraindo-se um valor constante a cada elemento de um conjunto de dados, a variância

não se altera.
2. Multiplicando-se ou dividindo-se por um valor constante cada elemento de um conjunto de dados, a

variância fica multiplicada ou dividida pelo quadrado dessa constante.
2.1.9 Desvio Padrão
O Desvio Padrão populacional σ é a raiz quadrada da variância populacional, ou seja, sendo x1 , x2 , . . . , xn ,

n valores que a variável x assume e f1 , f2 , . . . , fn , as respectivas freqüências absolutas temos:
Ñ
X
n
(xi − x̄ )2 · fi
i =1
σ= . ( 2.23)
X
n
fi
i =1
Se f1 = f2 = f3 = . . . = fn = 1, então Î
X
n
(xi − x̄ )2
i =1
σ= . ( 2.24)
n
No caso do Desvio Padrão amostral temos

Î
X
n
(xi − x̄ )2 · fi
i =1
S= . ( 2.25)
n−1
ER 21. Determine o Desvio Padrão populacional para os conjuntos X = {1, 3, 4, 5, 7} e Y = {1, 2, 3, 6, 9, 10, 11}.
1+3+5+7 1 + 2 + 3 + 6 + 9 + 10 + 11
Solução: Já sabemos que x̄ = = 4 e ȳ = = 6 , logo temos:
5 7
xi (xi − x̄ )2
xi (xi − x̄ )2 1 (1 − 6)2 = 25
1 (1 − 4)2 = 9 2 (2 − 6)2 = 16
3 (3 − 4)2 = 1 3 (3 − 6)2 = 9
2
4 (4 − 4) = 0 6 (6 − 6)2 = 0
5 (5 − 4)2 = 1 9 (9 − 6)2 = 9
7 (7 − 4)2 = 9 10 (10 − 6)2 = 16
Total 20 11 (11 − 6)2 = 25
r Total 100
20
σ= =2 r
5 100
σ= = 3, 78
7
ER 22. Calcular o desvio padrão considerando as notas de Matemática de 10 alunos de uma determinada
classe como sendo {2, 2, 3, 4, 4, 4, 5, 5, 6, 7}. Lembre-se de que se os dados estão agrupados em intervalos de
classe, basta representar cada classe por seu ponto médio.

xi fi xi · fi (xi − x̄ )2 (xi − x̄ )2 · fi
Solução: Observe que os val-
2 2 4 4, 84 9, 68
ores de di são calculados após o
42 3 1 3 1, 44 1, 44
cálculo da média x̄ = = 4, 2.
10 4 3 12 0, 04 0, 12
Com o preenchimento adequado
5 2 10 0, 64 1, 28
da tabela temos que o valor do
6 1 6 3, 24 3, 24
desvio padrão σ é, aproximada-
7 1 7 7, 84 7, 84
mente, 2, 36. X
10 42 23, 60
ER 23. Calcule o desvio padrão populacional considerando a tabela
Notas fi
0 ⊢ 2 4
2 ⊢ 4 10
4 ⊢ 6 16
6 ⊢ 8 6
8 ⊢ 10 4
Solução: Observe que os val- Notas fi xi xi · fi di di2 di2 · fi

ores de di são calculados após o 0 ⊢ 2 4 1 4 −3, 8 14, 44 57, 76
192
cálculo da média x̄ = = 4, 8. 2 ⊢ 4 10 3 30 −1, 8 3, 24 32, 4
40
Com o preenchimento adequado 4 ⊢ 6 16 5 80 0, 2 0, 04 0, 64
da tabela temos que o valor do 6 ⊢ 8 6 7 42 2, 2 4, 84 29, 04
desvio padrão σ é, aproximada- 8 ⊢ 10 4 9 36 4, 2 17, 64 70, 56
X
mente, 6, 3. 40 192 190, 4
Propriedades do Desvio Padrão
1. Somando-se ou subtraindo-se um valor constante a cada elemento de um conjunto de dados, o desvio

padrão no se altera. Por exemplo, se numa turma de 40 alunos a idade média é de 16 anos com desvio
padrão de 1, 5 ano, qual será o desvio padrão de idade para esse mesmo grupo 10 anos depois?
2. Multiplicando se ou dividindo se por um valor constante a cada elemento de um conjunto de dados,

o desvio padrão fica multiplicado ou dividido pela constante. Por exemplo, se o custo médio da cesta
básica é de R $56, 00, com desvio padrão de R $6, 10 e se o governo aumentar em 5% o preço de todos os
produtos, em quanto ficará a dispersão no custo da cesta básica após o aumento? Resposta: 56 · 1, 05 =
58, 80 e o desvio padrão: 6, 10 · 1, 05 = 6, 41.
Fique Atento! O Desvio Padrão possui a mesma unidade de medida original da variável original, enquanto
que a Variância apresenta a unidade de medida elevado ao quadrado.
2.1.10 Relações Importantes para o Desvio Padrão
A relação entre as fórmulas de Desvio Padrão populacional e amostral é dada pela equação
r
n−1
σ=S . ( 2.26)
n
O esforço computacional que a fórmula na equação ( 2.23) pode ser diminuída se fizermos a seguinte
simplificação:
X
n X
n X
n X
n X
n X
n X
n
(xi − x̄ )2 xi2 − 2xi x̄ + x̄ 2 xi2 − 2x̄ xi + x̄ 2 xi2 − 2x̄ xi + nx̄ 2
i =1 i =1 i =1 i =1 i =1 i =1 i =1
σ2 = = = =
n n n n
2 32
X
n X
n
xi 6 xi 7 " #2
X
n X
n
6 i =1 7 X
n
xi2 − 2 i =1
xi + n 6
6 n
7
7
xi 2 32
n 4 5 X
n
i =1
X
n X
n
i =1 i =1 xi2 − xi2 6 xi 7
n 6 i =1 7
= = i =1
= i =1
−6
6 n 7 .
7
n n n 4 5
Conseqüentemente, Ñ
2 32
X
n X
n
xi2 6 xi 7
6 i =1 7
σ= i =1 6
−6 7 . ( 2.27)
n 7
4 n 5
X
n
xi
◦ i =1
Na 5 igualdade utilizamos x̄ = .
n
Para uma distribuição de freqüências podemos utilizar
Ñ
2 32
X
n X
n
Classes fi F ci
xi2 fi 6 xi fi 7
6 i =1 7 240 ⊢ 260 7
σ= i =1
−6
6
7 . ( 2.28)
n 4 n 7 5 260 ⊢ 280 20
280 ⊢ 300 33
300 ⊢ 320 25
2.1.11 Exercício Proposto 320 ⊢ 340 11
340 ⊢ 360 4
EP 2.5. De posse da tabela ao lado, calcule o desvio médio, Total
o desvio padrão, a variância e os coeficientes de assimetria e de
curtose. O que se pode dizer sobre a Curva de Freqüência?
2.1.12 Variância Relativa
A variância relativa V R é definida pelo quociente entre a variância e o quadrado da média aritmética de uma
distribuição.
σ2
VR = .
x̄
Seu principal objetivo é o de ser utilizado no cálculo do coeficiente de variação de Pearson.
2.1.13 Coeficiente de Variação de Pearson
O Coeficiente de Variação de Pearson C V é um valor relativo para um conjunto de n observações e é

definido como o quociente entre o desvio padrão e a média aritmética da distribuição, ou seja
σ S
CV = ou CV = . ( 2.29)
x̄ x̄
É uma medida relativa de dispersão utilizada para comparar o grau de concentração em torno da média de
séries distintas.
Uma distribuição pode ser classificada quanto a sua variabilidade. Dizemos que ela possui pequena variabil-
idade quando o coeficiente de variabilidade for, no máximo, 10%. A variabilidade é média quando o coeficiente
de variabilidade estiver entre 10% e 20%. Acima de 20% dizemos que a distribuição possui grande variabilidade.
ER 24. Tomemos os resultados das estaturas e dos pesos de um mesmo

x̄ σ
grupo de indivíduos, conforme tabela ao lado. Qual das medidas (Estatura ou
Estaturas 175cm 5, 0cm
Peso) possui maior homogeneidade?
Pesos 68kg 2, 0kg
Solução: Para responder a esta questão devemos calcular o C V da Estatura e o do Peso. Aquele que
apresentar menor valor será o de maior homogeneidade (menor dispersão ou variabilidade).
5 2
C Vestatur a = = 2, 85% C Vpeso = = 2, 94%.
175 68
Logo, nesse grupo de indivíduos, as estaturas são mais homogêneas que o peso.
2.2 Medidas de Assimetria
Uma distribuição pode ser classificada quanto a assimetria onde é observado o grau de afastamento que
uma distribuição possui relativamente a uma unidade de simetria. Uma distribuição simétrica possui os mesmos
valores para a média, a moda e a mediana. Já as assimetrias podem ser positiva ou à direita (Mo < Md < x̄ ),
ou negativa ou à esquerda (x̄ < Md < Mo ).
A assimetria da distribuição pode também ser constatada se:
⋄ (Md − Q1 ) < (Q3 − Md ) então a assimetria é à direita ou positiva;
⋄ (Md − Q1 ) > (Q3 − Md ) então a assimetria é à esquerda ou negativa;
⋄ (Md − Q1 ) = (Q3 − Md ) então a distribuição é simétrica.
Podemos também classificar uma distribuição quanto a assimetria, através de coeficientes. Vejamos algu-
mas relações que determinam importantes coeficientes de assimetria.
2.2.1 Coeficientes de Assimetria de Pearson
Razão entre a diferença entre a média e a moda e o desvio padrão.
x̄ − Mo x̄ − Mo
CAS = ou AS = . ( 2.30)
σ S
Uma outra relação atribuída também a Pearson e que também mede o grau de simetria de uma distribuição
é dada por
Q1 + Q3 − 2Md
CAS = . ( 2.31)
Q3 − Q1
Em ambos os casos temos que: se CAS = 0, então dizemos que a distribuição é simétrica;
se CAS > 0, a distribuição é assimétrica positiva, caso contrário a
distribuição é assimétrica negativa. Salário dos funcionários da ACB-2004
Nas distribuições assimétricas, os valores Normais são aqueles Salário fi F ci
que pertencem ao intervalo definido por (x̄ − σ, x̄ + σ) denominado 240 ⊢ 260 7
Zona de Normalidade. 260 ⊢ 280 20
280 ⊢ 300 33
300 ⊢ 320 25
320 ⊢ 340 11
EP 2.6. Calcule os coeficientes de Pearson para a distribuição 340 ⊢ 360 4
amostral dada ao lado. Total
2.3 Medidas de Curtose
Curtose é o grau de achatamento de uma distribuição em relação a uma distribuição padrão, também
denominada curva normal ou Mesocúrtica .
Quando a distribuição apresenta: uma curva de freqüência mais fechada que a normal (mais delgada, mais
aguda ou afilada em sua parte superior), ela recebe o nome de Leptocúrtica ; uma curva de freqüência mais
aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de Platicúrtica.
O coeficiente de Curtose ou percentílico
Q3 − Q1
K= ( 2.32)
2(C90 − C10 )
é utilizado para determinarmos se a curva de freqüência é Mesocúrtica (K = 0, 263), Platicúrtica

(K > 0, 263) ou Leptocúrtica (K < 0, 263).
ER 25. O que dizer sobre a curva de distribuição do exemplo 23?
EP 2.7. Dada a amostra 2, 3, 5, 6, 7, 8, 10, 11, 12 calcule:

(a) a amplitude total; (d) o coeficiente de variação de Pearson;
(b) o desvio médio; (e) o tipo de assimetria.
(c) a variância;
2.4 Gabarito
2.1 2.2 2.3 (a) 10 e 14, 63 (b) 10 e 14, 5 (c) Amodal e Amodal (d) 6, 5 e 11, 475 (e) 14, 4 e 18, 6 (f) 13, 68 e 17, 62 2.4 (a) x̄ = 153, 55cm; (b)
Md = 153, 25cm; (c) MoB = 152, 50cm; MoC = 152, 91cm; MoK = 152, 97cm e MoP = 152, 65cm (d) Q1 = 150, 12cm e Q3 = 157, 50cm
(e) D5 = 153, 25cm e D7 = 156, 36cm (f) C60 = 154, 50cm e C88 = 161, 00cm 2.5 2.6 2.7

BLOCO 02 Probabilidade, Regressão e Correlação.
TEMA 03 Probabilidade
3.1 Apresentação
Os modelos matemáticos consistem em uma simplificação da realidade. São uma idealização das carac-
terísticas do fenômeno observado. Eles podem ser:
⋄ Determinísticos: quando dadas as condições de experimentação pode-se determinar ou predizer o resul-

tado final do experimento.
⋄ Não-determinísticos (ou probabilísticos ou estocásticos): quando não é possível predizer, com certeza, o
resultado antes da realização do experimento.
Como exemplos de modelos estocásticos temos:
1. Um médico investigando o efeito de uma droga administrada em pacientes;
2. O estudo do efeito de um fertilizante químico em uma parcela de solo;
3. A análise dos preços mensais de três bens de consumo;
4. A qualidade da produção de uma máquina de determinado produto industrializado; etc.
A Teoria das Probabilidades, de modo geral, visa definir um modelo matemático não determinístico (proba-
bilístico ou estocástico) que seja conveniente a descrição e interpretação de fenômenos aleatórios.
3.2 Considerações Iniciais
3.1 Definição. [Experimento Aleatório] Um experimento E é aleatório quando está sujeito a influências de
fatores casuais e, como conseqüência destes, não podemos precisar o seu resultado.
Os experimentos aleatórios são caracterizados por:
- Repetições sob as mesmas condições;
- O conjunto de todos os resultados possíveis do experimento pode ser descrito, porém, não podemos afirmar
que resultado em particular ocorrerá;
- Quando o experimento for repetido um grande número de vezes, ocorrerá uma regularidade nos resultados.
Exemplo 3.1. São exemplos de experimentos aleatórios:
1. Lançar uma moeda e observar a face de cima;
2. Lançar um dado e observar a face de cima;
3. Lançar um dado várias vezes e observar as seqüências obtidas;
4. De uma urna contendo bolas brancas e bolas pretas, retirar uma e observar a sua cor;
5. De um baralho contendo 52 cartas, selecionar uma carta e observar o seu naipe.
3.2 Definição. [Espaço Amostral] O conjunto S de todos os resultados possíveis de um experimento aleatório
é chamado de Espaço Amostral.
Exemplo 3.2.
1. E1 : Jogar uma moeda e observar a face superior. S1 = {Cara, Coroa}.
2. E2 : Jogar um dado e observar o número da face de cima. S2 = {1, 2, 3, 4, 5, 6}.
3. E3 : Consumo de energia elétrica de uma residência em um dia (em K w h). S3 = {x ∈ R : x > 0}.
4. E4 : Número de ligações novas de energia elétrica no mês Y . S4 = {0, 1, 2, 3, . . .}.
Diremos que um espaço amostral S é finito se #S = n ∈ N. Caso contrário diremos que S é infinito.
ER 26. Dar o espaço amostral para cada experimento abaixo.
(a) Uma letra é escolhida entre as letras da palavra matemática;
(b) Uma bola é extraída de uma urna contendo bolas azuis (A), brancas (B) e vermelhas (V), e é observada
sua cor;
(c) Uma carta é extraída de um baralho contendo 52 cartas e é observado seu naipe;
(d) Um casal deseja ter 3 filhos;
(e) Duas moedas lançadas;
(f) Escolher, entre 3 pessoas, 2 para formar uma comissão.
Solução: (a) S = {m, a, t , e , i , c }; (b) S = {A, B , V }; (c) S = {♣, ♦, ♥, ♠};

(d) S = {(M , M , M ); (F , M , M ); (M , F , M ); (M , M , F ); (F , F , M ); (F , M , F ); (M , F , F ); (F , F , F )};
(e) S = {(C , C ); (C , K ); (K , C ); (K , K )}; (f) S = {(A, B )(A, C )(B , C )}.
3.3 Definição. [Evento] Dado um experimento aleatório cujo espaço amostral é S , chamaremos de Evento
qualquer subconjunto do espaço amostral S . Denotamos um evento através de uma letra maiúscula qualquer
do alfabeto.
Se um espaço amostral S possui n elementos, então S possuirá 2n subconjuntos e, portanto, 2n eventos.

Em particular, o evento S é chamado de evento certo, o conjunto vazio de evento impossível e o evento que
possui um único elemento de evento elementar.
ER 27. No lançamento de um dado S = {1, 2, 3, 4, 5, 6}, determine os eventos:
◦ A: ocorrer um número par. ◦ B : ocorrer um número primo. ◦ C : ocorrer um número maior que 6.
Solução: É imediato que: A = {2, 4, 6}, B = {2, 3, 5} e C = ∅.
ER 28. Uma moeda é lançada duas vezes. Determine os eventos:

(a) A: ocorrer cara no primeiro lançamento; (c) C : ocorrer exatamente duas caras;
(b) B : ocorrer, no máximo, uma coroa;

Solução: Trata-se de uma seqüência de caras C e coroas K . Portanto,
(a) A = {(C , K ); (C , C )}. (b) B = {(K , C ); (C , K ); (C , C )}. (c) C = {(C , C )}.
EP 3.1. Descrever o espaço amostral para cada um dos seguintes experimentos:
(a) Observar o sexo de uma criança ao nascer.
(b) Lançar uma moeda três vezes sucessivamente e observar a face voltada para cima. Anotar a seqüência
de caras e coroas.
(c) Lançar uma moeda três vezes sucessivamente e observar a face voltada para cima. Registrar o numero
de caras ocorrido.
(d) Registrar o numero de pessoas atendidas num ambulatório no período de vinte e quatro horas.
(e) Lançar uma moeda e um dado, simultaneamente, e registrar os resultados ocorridos nas faces voltadas
para cima.
(f) Um lote de dez pecas contem três defeituosas. As pecas sao retiradas uma a uma, sem reposição, ate
que a ultima peca defeituosa e encontrada. O numero total de pecas retiradas e registrado.
(g) Pecas sao fabricadas ate que dez pecas perfeitas sejam produzidas. O numero total de pecas fabricadas
e anotado.
(h) Registrar o tempo de vida de uma lâmpada.
(i) De uma baralho completo de 52 cartas retira-se, ao acaso, uma carta e observa-se o resultado.
EP 3.2. Determine o numero de elementos do espaço amostral do experimento: observar os lados voltados
para cima ao lançarmos uma moeda, um dado e depois uma moeda.
EP 3.3. Cite, dentro da sua área de estudo, dois exemplos sobre experimentos aleatórios e para cada um
descreva o espaço amostral.
3.3 Operações com Eventos
Os operadores união e interseção de eventos são utilizados para combinar dois eventos, criando, assim,
outro evento distinto dos originais.
3.4 Definição. [União de eventos] Consideremos dois eventos A e B . O evento união A ∪ B é um novo evento
e ocorre quando o evento A, o evento B ou ambos os eventos ocorrem.
3.5 Definição. [Interseção de eventos] Consideremos dois eventos A e B de um espaço amostral S . O evento
interseção A ∩ B é um novo evento e ocorre quando os eventos A e B ocorrerem simultaneamente.
3.6 Definição. [Evento complementar] O complementar Ā de um evento A de um espaço amostral S é um
novo evento que ocorre quando A não ocorre.
ER 29. Ao lançar um dado e observar a face superior, considere os seguintes eventos:
◦ A: ocorrência de número par (A = {2, 4, 6});

◦ B : ocorrência de número ímpar (B = {1, 3, 5});
◦ C : ocorrência de número menor que quatro C = {1, 2, 3}. Obtenha:
(a) A ∪ B ; (b) A ∩ B ; (c) A ∪ C . (d) Ā ∩ C̄ .
Solução:
(a) A ∪ B = {1, 2, 3, 4, 5, 6} (b) A ∩ B = ∅ (c) A ∪ C = {1, 2, 3, 4, 6}. (d) Ā ∩ C̄ = A ∪ C = {5}.
3.7 Definição. [Eventos mutuamente exclusivos] Dois eventos A e B de um espaço amostral finito S são
mutuamente exclusivos se eles não ocorrem simultaneamente, isto é, quando A ∩ B = ∅.
Exemplo 3.3. No lançamento de um dado considere A o evento ocorrer número par e B o evento ocorrer
número ímpar. Verificamos, portanto, que A e B são eventos mutuamente exclusivos, pois, A ∩ B = ∅.
EP 3.4. Sejam A, B e C três eventos quaisquer. Estabeleça uma expressão para os eventos abaixo utilizando
a Teoria dos Conjuntos e construa o Diagrama de Venn correspondente:
(a) A e B ocorrem; (e) não ocorre A e não ocorre B ;

(b) A ou B ocorrem; (f) A e B ocorrem, mas C não ocorre;
(c) B ocorre, mas A não ocorre; (g) A e C ocorrem, mas B não ocorre;
(d) A não ocorre; (h) somente A ocorre.
EP 3.5. Sendo S = {10, 20, 30, 40, 50, 60, 70, 80, 90, 100}, listar cada um dos subconjuntos de S :
(a) A = {a|a é exatamente divisível por 3}; (c) C = A ∪ B ; (e) B̄ ∩ Ā; (g) B − A;
(b) B = {b |b é exatamente divisível por 4}; (d) A ∩ B ; (f) Ā ∪ B̄ ; (h) A − B .
EP 3.6. Considere o lançamento de uma moeda e um dado, simultaneamente, e registrar os resultados
ocorridos nas faces voltadas para cima. Com base no experimento relacione os elementos dos seguintes
eventos:
(a) A: aparece coroa e número ímpar; (c) C : aparece coroa; (e) A ∪ B ;
(b) B : aparece coroa e número par; (d) D : aparece numero ímpar; (f) A ∪ B ∪ D .
EP 3.7. Uma urna contém 30 bolas numeradas de 1 a 30. Uma bola é escolhida e observada o seu número.
Descreva os seguintes eventos quando o número obtido é:
A: par; C : primo; E : múltiplo de 2 e 5; G : múltiplo de 2 ou 6;

B : ímpar; D : maior que 20; F : múltiplo de 3 ou 8; H : não múltiplo de 6.
EP 3.8. Dois dados, um azul e outro vermelho, são lançados nesta ordem. Descrever os eventos:
A: ocorre 3 no dado azul; D : ocorrem números cuja soma é oito;

B : ocorrem mesmos números em ambos os dados; E : ocorrem números cuja soma é maior que oito;
C : ocorre número 5 em ao menos um dado; F : ocorrem números cujo produto é seis.
EP 3.9. São lançados um dado e uma moeda. Descreva os eventos:
A: ocorre cara; C : ocorre o número 3; B ∩ C; Ā ∩ C̄ ;;

B : ocorre número par; A ∪ B; A ∩ C; B̄ ∩ C .
EP 3.10. Considere os conjuntos A = {1, 2, 3, 4} e B = {1, 2, 3, 4, 5}. Descreva os eventos:
E1 = {(a, b ) ∈ A × B ; a = b }; E5 = {(a, b ) ∈ A × B ; b = a2 + 1};

E2 = {(a, b ) ∈ A × B ; a > b }; E6 = {(a, b ) ∈ A × B ; a2 + b 2 = 2a};
E3 = {(a, b ) ∈ A × B ; a + b = 3}; E7 = {(a, b ) ∈ A × B ; a2 + b = b 2 };
E4 = {(a, b ) ∈ A × B ; b = 2}; E8 = {(a, b ) ∈ A × B ; a = 3}.

EP 3.11. Uma urna 1 contendo duas bolas cinzas e três bolas pretas e uma urna 2 contendo cinco bolas
cinzas e seis bolas pretas. Uma urna é escolhida ao acaso e dela extraída uma bola também ao acaso e
observada sua cor. Descreva os eventos:
E1 : a urna escolhida é 1; E3 : a bola escolhida é cinza; E5 = E1 ∪ E2 ; E7 = Ē4 ;

E2 : a urna escolhida é 2; E4 : a bola escolhida é preta; E6 = E1 ∩ E3 ; E8 = Ē1 ∩ Ē3 .
EP 3.12. Lança-se um dado e uma moeda. Enumere os seguintes eventos:
A = {número ímpar; cara} C = { número primo; cara}

B = {número par; coroa} D = { múltiplos de 4}
3.4 Um Pouco de História
O Cálculo das Probabilidades desenvolveu-se, a partir do século XVII, paralelamente ao desenvolvimento

da Estatística como disciplina científica, porém de forma independente. Os matemáticos italianos e franceses
desse século, particularmente FERMAT e PASCAL, iniciaram os estudos do cálculo das probabilidades tratando
de resolver problemas de jogos de azar propostos pelo cavaleiro de MÉRÉ.
Pouco a pouco outros matemáticos, e, posteriormente, os do século XVIII, foram interessando-se por este
tipo de estudo e ampliando os resultados, até que Tiago BERNOULLI (1.654 − 1.705) obteve o teorema que se
conhece com seu nome e que permitiu estruturar o cálculo das probabilidades como disciplina orgânica.
Pelos fins do século XVIII e princípios do século XIX, os trabalhos de LAPLACE permitiram dar a estru-
turação definitiva ao Cálculo das Probabilidades; em suas obras: Teoria Analítica da Probabilidade (1.818) e
Ensaio Filosófico sobre as Probabilidades (1.814), completou a obra de BERNOULLI e seus continuadores,
provendo o Cálculo das Probabilidades de recursos matemáticos que haveriam de levá-lo mediante a obra do
próprio LAPLACE e de outros matemáticos como POISSON, GAUSS, etc., ao grau de aperfeiçoamento que o
tornou apto para as aplicações a diversos campos da ciência e muito especialmente à Estatística.
A partir de LAPLACE, as disciplinas: Cálculo das Probabilidades e Estatística fundiram-se. Assim, o Cálculo
das Probabilidades constituiu o alicerce matemático no qual a estatística pôde tomar o impulso teórico que a
levou ao extraordinário desenvolvimento e aperfeiçoamento alcançado no século XX.
3.5 Cálculos Probabilísticos
3.5.1 A Probabilidade de um Evento
Consideremos um experimento aleatório com espaço amostral S = {s1 , s2 , . . . , sk } e suponhamos que o

experimento tenha sido repetido N vezes, nas mesmas condições. A razão entre a quantidade de vezes (ni )
que um determinado evento elementar {si } ocorre e a quantidade de repetições do experimento é chamada de
ni
freqüência relativa (f ri ), isto é, f ri = , ∀ i . Pode-se observar que
N
1. 0 ≤ f ri ≤ 1, ∀ i ;
X
k
n1 n2 nk n1 + n2 + . . . + nk N
2. f ri = + + ...+ = = = 1.
N N N N N
i =1
3. se A 6= ∅ é um evento qualquer de S , a freqüência relativa f rA deste evento é dada por:

X
f rA = f ri ;
a i ∈A
4. a freqüência relativa de um evento A ⊂ S tende a se estabilizar na vizinhança de um determinado valor
quando o número de repetições do experimento aleatório é suficientemente grande.
Ao repetirmos um experimento aleatório um grande número de vezes, nas mesmas condições, sabemos
que determinados eventos ocorrem com maior freqüência relativa que outros. Esta informação quantitativa
dada pela freqüência relativa e suas propriedades, nos ajudará a definir um número chamado de probabilidade
de um evento.
Dados um experimento aleatório E e um espaço amostral S = {si , 1 ≤ i ≤ n}, a cada evento elementar
Si = {si } associamos um número real P (Si ) = pi , chamado a probabilidade do evento elementar Si , satis-
fazendo as seguintes propriedades
(1) 0 ≤ pi ≤ 1, ∀ i ∈ {1, 2, . . . , n};

X
n
(2) pi = 1.
i =1
Os números pi associados à probabilidade de um evento elementar definem o que chamamos de uma dis-
tribuição de probabilidade sobre o espaço amostral S .
Podemos estender o conceito de probabilidade para um evento arbitrário A de um espaço amostral S se

considerarmos a aplicação:
P :S → [0, 1] 8
< 0 , se A = ∅
X
A 7→ P (A) = pi , se A 6= ∅
:
s i ∈A
ou seja, a probabilidade P (A) de um evento qualquer A de um espaço amostral finito S é a soma das probabili-
dades dos eventos elementares que o constituem.
A priori, quaisquer valores pi satisfazendo as propriedades (1) e (2) constituem uma distribuição de proba-
bilidades sobre o espaço amostral S , porém, devemos entender o número pi como sendo um valor próximo da
freqüência relativa f ri , quando o experimento aleatório é repetido um grande número de vezes.
Em particular, dizemos que uma distribuição de probabilidades sobre S = {s1 , s2 , . . . , sk } é equiprovável se

p1 = p2 = . . . = pk , isto é, se todos os ventos elementares de S possuem a mesma probabilidade.
Seja S = {s1 , s2 , . . . , sk } um espaço amostral equiprovável cuja distribuição de probabilidades é dada por
1 r
pi = . A probabilidade P (A) de um evento A = {s1 , s2 , . . . , sr } é . De fato,
N N
X
r X
r
1 1 X
r
r
P (A) = pi = = 1= .
i =1 i =1
N N i =1 N
Um evento qualquer pode ser obtido de outros através de operações conhecidas em teoria de conjuntos. A
partir da definição de probabilidade de um evento vamos estender o cálculo de probabilidades para a resolução
de uma série de problemas que envolvem estes eventos.
3.8 Teorema. Se A e B são eventos mutuamente exclusivos, então
P (A ∪ B ) = P (A) + P (B ).
Prova: Seja o evento A = {a1 , a2 , . . . , ar }, onde ai 6= aj , ∀ i , j , e o evento B = {ar +1 , ar +2 , . . . , ar +q }, então
X
r +q X
r X
q
P (A ∪ B ) = pi = pi + pk = P (A) + P (B ).
i =1 i =1 k =r +1

3.9 Teorema. Considere ∅, A e B eventos de um espaço amostral S .
1. A probabilidade de ∅ é zero;
2. A probabilidade de um evento certo é um, isto é, P (S ) = 1;
3. Se Ā é o complemento do evento A, então P (Ā) = 1 − P (A);
4. Se A ⊂ B , então P (A) ≤ P (B );
5. P (A ∪ B ) = P (A) + P (B ) − P (A ∩ B ).
Prova:
1. Temos que, para todo A ⊂ S , A ∩ ∅ = ∅, e, pelo teorema 3.8,
P (A) = P (A ∪ ∅) = P (A) + P (∅).
Logo, P (∅) = 0.
X
k
2. P (S ) = P ({s1 , s2 , . . . , sk }) = P ∪ki=1 {si } = pi = 1
i =1
3. Sabemos que Ā ∪ A = S e Ā ∩ A = ∅
1 = P (S ) = P (Ā ∪ A) = P (Ā) + P (A).
Logo, P (Ā) = 1 − P (A).
4. Se escrevermos B = A ∪ (Ā ∩ B ), teremos que
P (B ) = P (A ∪ (Ā ∩ B )) = P (A) + P (Ā ∩ B ).
Portanto, P (B ) − P (A) = P (Ā ∩ B ) ≥ 0. Logo, P (B ) ≥ P (A).
5. Sejam A e B dois eventos distintos tais que A ∩ B 6= ∅. Observe que:

(
A ∩ (Ā ∩ B ) = ∅
B = (B ∩ A) ∪ (B ∩ Ā)
Logo,
P (A ∪ B ) = P (A ∪ ((B ∩ A) ∪ (B ∩ Ā))) = P (A ∪ (B ∩ Ā)) = P (A) + P (B ∩ Ā)
P (B ) = P ((B ∩ A) ∪ (B ∩ Ā)) = P (B ∩ A) + P (B ∩ Ā).
Logo, P (A ∪ B ) − P (B ) = P (A) − P (A ∩ B ). Segue que
P (A ∪ B ) = P (A) + P (B ) − P (A ∩ B ).
ER 30. No lançamento de um dado qual a probabilidade de

(a) obter um número maior que 2 e primo? (c) não obter um número menor que 5?
(b) obter um número menor que 4 ou primo?
Solução: Considere os eventos: obter um número maior que 2 – E1 = {3, 4, 5, 6}; obter um número
menor que 4 – E2 = {1, 2, 3}; obter um número menor que 5 – E3 = {1, 2, 3, 4}; obter um número primo –
E4 = {2, 3, 5}. Portanto,
2 1 4 2
(a) P (E1 ∩ E4 ) = P ({3, 5}) = = ; (b) P (E2 ∪ E4 ) = P ({1, 2, 3, 5}) = = ;
6 3 6 3
1
(c) P (E3 ∩ E4 ) = P ({1, 2, 3, 4} ∩ {2, 3, 5}) = P ({2, 3}) = .
3
Exercícios Propostos
EP 3.13. Determinar a probabilidade de cada um dos seguintes eventos:
(a) Aparecer exatamente duas caras em três lances de uma moeda honesta;
(b) Aparecer pelo menos uma cara em três lances de uma moeda honesta;
(c) Retirar um “dez de paus” ao extrairmos uma carta de um baralho completo de 52 cartas;
(d) Aparecer a soma “oito” no lançamento de dois dados;
(e) Retirar uma carta de “paus” ou uma “figura”, numa única extração, de um baralho completo de 52 cartas;
(f) Aparecer coroa no próximo lance de uma moeda se de um total de 100 lances 56 foram caras.
EP 3.14. Uma urna contem quatro bolas azuis, três vermelhas e duas brancas. Calcule a probabilidade de,
se retirarmos uma bola ao acaso:
(a) ser vermelha; (c) ser vermelha ou branca;
(b) não ser vermelha; (d) ser azul.
1 3 1
EP 3.15. Dados P (A) = ; P (B ) = ; e P (A ∩ B ) = , calcule:
2 8 8
(a) P (A ∪ B ); (c) P (Ā ∪ B̄ ); (e) P (A ∩ B̄ );

(b) P (Ā ∩ B̄ ); (d) P (Ā ∩ B ); (f) P (A ∪ B̄ ).
EP 3.16. Um espaço amostral e dividido em três regiões mutuamente exclusivas A1 , A2 e A3 . Se P (A1 ) = 1/2,
P (A2 ) = 1/3 e P (A3 ) = 1/6, calcule:
(a) P (A1 ∪ A2 ); (b) P (A1 ∪ A2 ∪ A3 ); (c) P (Ā1 ); (d) P (A1 ∪ A2 ).
EP 3.17. Se P (A ∪ B̄ ) e P (B̄ ), achar P (A ∪ B ).
EP 3.18. Uma companhia de seguros analisou a freqüência com que 2.000 segurados usaram o hospital,
distribuídos segundo a tabela abaixo. Escolhe-se um segurado ao acaso. Sendo definidos os eventos A: o
segurado usou o hospital e B : o segurado é homem, determine:
(a) P (Ā ∪ B̄ );
Homens Mulheres
(b) P (Ā ∩ B );
Usaram o hospital 100 150
(c) P (A ∩ B ). Não usaram o hospital 900 850
EP 3.19. Uma associação de indústrias transformadoras de resinas plásticas é composta de 20 empresas

que produzem sacos plásticos (S), 10 produzem garrafas (G), 8 produzem utensílios domésticos (U) e 2 se
encarregam de brinquedos (B). Ao escolhermos uma empresa ao acaso, achar a probabilidade de que:
(a) seja uma indústria que produza sacos plásticos ou utensílios domésticos;
(b) seja uma indústria produtora de sacos plásticos ou brinquedos;
(c) não seja uma indústria que produza garrafas.

3.5.2 Probabilidade Condicional
3.10 Definição. Sejam A e B dois eventos de um espaço amostral finito S . A probabilidade do evento A,
condicionada ao evento B , denotado por P (A|B ), isto é, a probabilidade do evento A visto que B ocorreu, é a
probabilidade do evento A adotando-se B como sendo o novo espaço amostral ao invés de S .
Dados dois eventos A e B associados a um mesmo espaço amostral S , se P (B ) > 0, então determinamos
a probabilidade de ocorrência do evento A condicionado a ocorrência do evento B ou probabilidade de A visto
que B ocorreu, por:
P (A ∩ B )
P (A|B ) = , P (B ) > 0, ( 3.33)
P (B )
em que P (A ∩ B ) e P (B ) são calculados em relação ao espaço amostral S .
ER 31. No lançamento de um dado é observado o número da face superior. Considere os eventos:
A: a face é um número ímpar; B : a face é um número maior que um.
Qual a probabilidade de ter sido ímpar uma vez que o número era maior que um?
Solução: O espaço amostral é S = {1, 2, 3, 4, 5, 6} e os eventos são A = {1, 3, 5} e B = {2, 3, 4, 5, 6}.

Observe que A ∩ B = {3, 5}. Portanto, #S = 6, #B = 5 e #(A ∩ B ) = 2. Logo,
P (A ∩ B ) #(A ∩ B ) 2
P (A|B ) = = = .
P (B ) #B 5
ER 32. A tabela a seguir retrata a distribuição do número de formandos por curso em uma universidade U
distinguindo-se o sexo.
Engenharia (E) Direito (D) Biologia (B)

Masculino (M) 20 50 30
Feminino (F) 10 30 40
Uma pessoa é escolhida ao acaso. Qual a probabilidade de
(a) ser biólogo, visto ser do sexo feminino? (c) ser engenheiro, visto que era do sexo masculino?
(b) ser do sexo feminino, visto que era biólogo? (d) ser do sexo masculino, visto que era advogado?
Solução: Temos que

E D B P (B ∩ F ) 40 1 P (E ∩ M ) 20 1
(a) P (B |F ) = = = ; (c) P (E |M ) = = = ;
M 20 50 30 100 P (F ) 80 2 P (M ) 100 5
F 10 30 40 80 P (B ∩ F ) 40 4 P (M ∩ D ) 50 5
(b) P (F |B ) = = = ; (d) P (M |D ) = = = .
30 80 70 P (B ) 70 7 P (D ) 80 8
EP 3.20. Com os dados do exemplo 32 anterior, calcular a probabilidade da

(a) pessoa fazer biologia e ser do sexo masculino; (c) pessoa ser do sexo feminino e fazer direito.
(b) pessoa fazer engenharia e ser do sexo feminino;
EP 3.21. Imagine que um dado foi jogado. Já entendemos que a probabilidade de ocorrer o número 3 é igual
a 1/6. Agora imagine que o dado foi jogado e sem que vejamos o resultado alguém nos informa que ocorreu
um número ímpar. Qual a probabilidade de que seja o numero 3?
EP 3.22. No lançamento de dois dados considere os eventos:
A: O primeiro dado apresenta o número 2; B : A soma dos dois números é 6.
Calcule P (A|B ) e P (B |A).
3.5.4 Probabilidade da Ocorrência Simultânea de Eventos
3.11 Teorema. [do Produto] A probabilidade da ocorrência simultânea de dois eventos A e B de um espaço
amostral finito S é o produto da probabilidade de um deles pela probabilidade condicional do outro, dado o
primeiro.
Prova: Considerando a definição de probabilidade condicional, é imediato que
P (A ∩ B )
P (A|B ) = ⇒ P (A ∩ B ) = P (B ) · P (A|B ).
P (B )
ER 33. Uma urna I contém 2 bolas vermelhas e 3 brancas e uma urna I I contém 4 bolas vermelhas e 5
brancas. Uma urna é escolhida ao acaso e dela uma bola é extraída ao acaso. Qual a probabilidade de
observamos: Urna I e bola vermelha?
1 2 1
Solução: P (UI ∩ V ) = P (UI ) · P (V |UI ) = · = .
2 5 5
ER 34. Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a outra sem reposição.
Qual a probabilidade de que ambas sejam boas?
8 7 14
Solução: P (B1 ∩ B2 ) = P (B1 ) · P (B2 |B1 ) = · = .
12 11 33
Podemos generalizar o teorema do produto para mais de dois eventos.
3.12 Teorema. Sejam A1 , A2 , . . . , An , n eventos de um espaço amostral finito S . A probabilidade de ocorrência

simultânea destes eventos é dado por:
P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 ) · P (A2 |A1 ) · P (A3 |A1 ∩ A2 ) · . . . · P (An |A1 ∩ A2 ∩ . . . ∩ An−1 ).
ER 35. Uma urna contém duas bolas brancas, três vermelhas e cinco azuis. Qual a probabilidade de se
retirar, sem reposição, uma bola azul, uma branca e uma vermelha, exatamente nessa ordem?
5 2 3 1
Solução: P (A ∩ B ∩ V ) = P (A) · P (B |A) · P (V |A ∩ B ) = · · = .
10 9 8 24
3.5.5 Independência de Eventos
3.13 Definição. Um evento A é considerado independente de outro B , ambos do mesmo espaço amostral S ,
se a ocorrência de B não afeta a probabilidade do evento A, ou seja, A independe de B se P (A|B ) = P (A).
3.14 Proposição. Considere os eventos A e B de um espaço amostral finito. Se A independe de B , então B

independe de A. Desta forma, diremos que A e B são independentes.

Prova: Suponha que A independe de B , ou seja, P (A) = P (A|B ). Utilizando-se do teorema do produto,
temos que:
P (A ∩ B ) P (B ) · P (A|B ) P (B ) · P (A)
P (B |A) = = = = P (B ).
P (A) P (A) P (A)
3.15 Definição. Dois eventos são ditos dependentes quando não são independentes.
3.16 Proposição. Se dois eventos A e B de um mesmo espaço amostral finito são independentes, então
P (A ∩ B ) = P (A) · P (B ).
Prova: (
P (A) · P (B |A) = P (A) · P (B )
P (A ∩ B ) =
P (B ) · P (A|B ) = P (B ) · P (A)
ER 36. Uma moeda é lançada 3 vezes. Sejam os eventos A: Ocorrer pelo menos duas caras; B : Ocorrer
resultados iguais nos 3 lançamentos. Os eventos são independentes?
1 4 2 1
Solução: P (A ∩ B ) = , P (A) = e P (B ) = . P (A) · P (B ) = . Logo, os eventos são independentes.
8 8 8 8
Podemos generalizar o resultado anterior para mais de dois eventos.
3.17 Proposição. Se os n eventos A1 , A2 , . . . , An , todos do mesmo espaço amostral, são independentes, então
P (Ai ∩ Aj ) = P (Ai ) · P (Aj ); ∀ i , j , i 6= j ;

P (Ai ∩ Aj ∩ Ak ) = P (Ai ) · P (Aj ) · P (Ak ); ∀ i , j , k i 6= j 6= k ;
..
.
P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 ) · P (A2 ) · . . . · P (An ).
Prova: Os eventos Ai e Aj são independentes. Portanto, P (Ai ∩ Aj ) = P (Ai ) · P (Aj ); ∀ i , j , i 6= j . Para

três eventos independentes Ai , Aj e Ak , com i 6= j 6= k , temos que
P (Ai ∩ Aj ∩ Ak ) = P (Ai ) · P (Aj ∩ Ak |Ai ) = P (Ai ) · P (Aj |Ai ) · P (Ak |Ai ) = P (Ai ) · P (Aj ) · P (Ak ); ∀ i , j , k i 6= j 6= k .
Utilizando-se o mesmo raciocínio, podemos concluir que para n eventos independentes Ai , 1 ≤ i ≤ n,
P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 ) · P (A2 ) · . . . · P (An ).
ER 37. Um dado é lançado 8 vezes. Qual a probabilidade de observarmos a face 2 em todos os lançamentos?
Solução: Considere os eventos
A1 : ocorrer 2 no primeiro lançamento;

A2 : ocorrer 2 no segundo lançamento;
..
.
A8 : ocorrer 2 no oitavo lançamento.
Como o resultado de um lançamento não influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8}, são inde-
pendentes. Logo:
8
1 1 1 1
P (A1 ∩ A2 ∩ · · · ∩ A8 ) = P (A1 ) · P (A2 ) · . . . · P (A8 ) = · · ...· = .
6
| 6 {z 6
} 6
×8
ER 38. Qual a probabilidade de que a face 5 seja observada pelo menos uma vez em 8 lançamentos de uma
dado?
Solução: Considere os eventos
A1 : ocorre um número diferente de 5 no primeiro lançamento;

A2 : ocorre um número diferente de 5 no segundo lançamento;
..
.
A8 : ocorre um número diferente de 5 no oitavo lançamento.
Como o resultado de um lançamento não influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8} são inde-
pendentes, então a probabilidade de não observamos a face 5 nestes lançamentos é dado por:
8
5 5 5 5
P (A1 ∩ A2 ∩ · · · ∩ A8 ) = P (A1 ) · P (A2 ) · . . . · P (A8 ) = · · . . . · = .
6
| 6 {z 6
} 6
×8
Como o evento A: observar a face 5 pelo menos uma vez em 8 lançamentos é o evento complementar
do evento B : não observar a face 5 em 8 lançamentos, temos:
8
5
P (A) = P (B̄ ) = 1 − P (B ) = 1 − .
6
3.18 Proposição. Se A e B são dois eventos independentes, então A e B̄ , Ā e B , Ā e B̄ são também

independentes.
Prova: Mostremos o caso A e B̄ independentes, pois a prova dos demais casos é análoga.
Por hipótese P (A|B ) = P (A) e P (B |A) = P (B ).
P (A ∩ B̄ ) P (A) · P (B̄ |A) P (A) · P (B̄ |A)

P (A|B̄ ) = = = = P (A).
P (B̄ ) 1 − P (B |A) P (B̄ |A)
3.19 Proposição. Se A e B são dois eventos não vazios e mutuamente exclusivos, então A e B são depen-
dentes.
Prova: Suponha A e B dois eventos independentes. Logo, pela definição, P (A) = P (B |A). Pela
proposição 3.16, P (A ∩ B ) = P (A) · P (B ). Por hipótese, P (A ∪ B ) = P (A) + P (B ). Segue que
P (A) + P (B ) − P (A ∩ B ) = P (A) + P (B ) e, portanto, P (A ∩ B ) = 0, o que significa que A ou B é vazio,
contrariando a hipótese. Logo, A e B são dependentes.
EP 3.23. Numa sala existem 5 homens e 12 mulheres. Um aluno é sorteado ao acaso para ir a lousa. Qual
a probabilidade que:
(a) seja homem? (b) seja mulher? (c) Estes eventos são independentes?
EP 3.24. De um baralho de 52 cartas, uma é extraída ao acaso. Considere os eventos:
A: a carta é de espadas; B : a carta é um valete; C : a carta é um valete ou uma dama.
Qual par de eventos é independente?

EP 3.25. A probabilidade de que um aluno A resolva uma questão de Física é 0, 6 e de que um aluno B
resolva esta mesma questão é 0, 2. Qual a probabilidade de que:
(a) ambos a resolvam? (d) A a resolva, mas B não a resolva?
(b) ao menos um a resolva? (e) B a resolva, mas A não a resolva?
(c) nenhum deles a resolva?
EP 3.26. A probabilidade de que um homem sobreviva mais 10 anos, a partir de uma determinada data, é
0, 5 e de que sua esposa sobreviva a este mesmo tempo, a partir da mesma data, é 0, 6. Qual a probabilidade:
(a) de que ambos sobrevivam mais 10 anos, a partir daquela data?
(b) de que ao menos um sobreviver mais 10 anos, a partir daquela data?
EP 3.27. A probabilidade de que um aluno A resolva uma questão de Matemática é 0, 4, de que um aluno B
a resolva é 0, 3 e a de que o aluno C a resolva é de 0, 2. Qual a probabilidade de que:
(a) os três a resolvam? (b) ao menos um a resolva? (c) nenhum deles a resolva?
EP 3.28. A probabilidade de que os pais de Anita, de 15 anos de idade, a deixem sair acompanhada é
inversamente proporcional à idade do garoto, com mesma idade ou superior à dela. Sabendo que as idades de
Alberto, Gabriel e Matheus são, respectivamente, 16, 18 e 20 anos, determine qual a probabilidade de que:
(a) os três saiam com Anita; (b) ao menos um saia com Anita; (c) nenhum deles saia com Anita?
EP 3.29. Em um circuito elétrico, 4 componentes são ligados em série e trabalham independentemente um

do outro. As probabilidades de falharem são, respectivamente, 0.1, 0.2, 0.3 e 0.4. Qual a probabilidade de que
não passe corrente elétrica pelo circuito.
EP 3.30. Uma moeda é lançada 10 vezes. Qual a probabilidade de observarmos:
(a) 10 coroas? (b) 10 caras? (c) 4 coros e 6 caras?
EP 3.31. Com os dados do exercício 3.18, calcular as seguintes probabilidades:
(a) o segurado escolhido ser homem, sabendo-se que utilizou o hospital;
(b) o segurado escolhido ter utilizado o hospital, dado que era do sexo masculino;
(c) o segurado ser mulher, dado que não utilizou o hospital.
EP 3.32. Sejam A e B dois eventos tais que P (A) = 0, 4, P (A ∪ B ) = 0, 7 e P (B ) = p .
(a) Para que valor de p , os eventos A e B são mutuamente exclusivos?
(b) Para que valor de p , os eventos A e B são independentes?
EP 3.33. Certo aparelho eletrônico tem duas lâmpadas que podem estar acesas ou apagadas, tendo sido
observadas as probabilidades de acordo com a tabela que mostra, por exemplo, ambas as lâmpadas estavam
simultaneamente apagadas 30% do tempo.
Pergunta-se: Lâmpada 2
(a) O fato “lâmpada 1 acesa” é independente de “lâmpada 2 acesa”? Lâmpada 1 Acesa Apagada
Acesa 0, 15 0, 45
(b) O fato “lâmpada 1 apagada” é independente de “lâmpada 2 acesa”?
Apagada 0, 10 0, 30
EP 3.34. Em certa indústria a manutenção de um equipamento utilizado no processo produtivo é feita
por dois técnicos diariamente. Caso haja qualquer falha no equipamento, o produto apresenta defeito e é
descartado, mas o custo do descarte do produto é elevado. Se num dia a probabilidade do técnico 1 não
perceber um problema no equipamento é de 1/5 e a probabilidade de que o técnico 2 não detecte problema no
equipamento é de 1/8 e se os técnicos fazem a verificação diária no equipamento de forma independente, qual
a probabilidade da indústria não descartar produto em certo dia se o equipamento apresentou defeito.
EP 3.35. Uma partida de certo produto consiste de 10 artigos perfeitos, 4 com pequenos defeitos e 2 com
graves defeitos. Retirando-se ao acaso dois artigos, sem reposição, qual a probabilidade de que:
(a) ambos estejam perfeitos; (b) pelos menos um seja perfeito.
EP 3.36. Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica e da parte
de encanamento de um edifício. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica é de
1/2. Caso ele ganhe a parte elétrica, a chance de ganhar a parte de encanamento é de 3/4; caso contrário,
essa probabilidade é de 1/3. Qual a probabilidade dele:
(a) ganhar os dois contratos? (b) ganhar apenas um contrato?
EP 3.37. Suponha que numa escola 60% dos alunos sejam homens e 40% sejam mulheres. Sabe-se
que dentre os alunos do sexo masculino 3% são canhotos, enquanto que dentre as mulheres apenas 2% são
canhotas. Escolhe-se um aluno ao acaso. Achar a probabilidade de que seja canhoto.
EP 3.38. A probabilidade de que um time de futebol vença seu oponente é estimada em 0, 7, se não chover;
mas só 0, 5, se chover. Se os registros meteorológicos mostrarem que choveu 40% das vezes na data do jogo,
nos anos passados, qual a probabilidade de que o time vença seu próximo oponente?
EP 3.39. Um processo industrial produz 4% de ítens defeituosos. A experiência mostra que 25% dos ítens
defeituosos produzidos não são percebidos pelo inspetor de qualidade. Os ítens bons sempre passam sat-
isfatoriamente pela inspeção. Qual a probabilidade de que, se você comprar um desses ítens, seja um item
defeituoso?
EP 3.40. Um artigo manufaturado, que não pode ser usado se for defeituoso, deve passar por duas inspeções
antes de receber embalagem. A experiência mostra que um dos inspetores deixará passar 5% dos artigos
defeituosos, ao passo que o segundo inspetor deixará passar 4% de tais artigos. Se os artigos sem defeito
sempre passam pela inspeção e se 10% dos artigos processados são defeituosos, que percentagem dos artigos
produzidos que passam pela duas inspeções são defeituosos?
EP 3.41. Marque verdadeiro ou falso. Justifique suas respostas.
(a) O espaço amostral de um experimento é o conjunto de resultados possíveis deste experimento;
(b) O evento é um resultado possível do experimento;
(c) Se A e B são eventos independentes, então P (A|B ) = P (A);
(d) Se A e B são eventos mutuamente exclusivos, então eles são independentes.
3.5.6 O Teorema da Probabilidade Total
3.20 Definição. [Partição de um Espaço Amostral] Um conjunto {A1 , A2 , . . . , An } de eventos forma uma par-
tição para espaço amostral S se os seus elementos são não vazios, mutuamente exclusivos e exaustivos (a
união é S ), ou seja:
[
n
1. Ai 6= ∅, ∀ i ; 2. Ai ∩ Aj = ∅, para i 6= j ; 3. Ai = S .
i =1

3.21 Teorema. [da Probabilidade Total] Sejam A um evento e {A1 , A2 , . . . , An } uma partição de um espaço
amostral S . Então
X
n
P (A) = P (Ai ) · P (A|Ai ).
i =1
Prova: Podemos escrever A = (A1 ∩ A) ∪ (A2 ∩ A) ∪ · · · ∪ (An ∩ A) = ∪ni=1 (Ai ∩ A). Sendo {A1 , A2 , . . . , An }
uma partição para S , os n eventos (Ai ∩ A) são mutuamente exclusivos. Portanto,
P (A) = P ((A1 ∩ A) ∪ (A2 ∩ A) ∪ · · · ∪ (An ∩ A))

= P (A1 ∩ A) + P (A2 ∩ A) + . . . + P (An ∩ A)
= P (A1 ) · P (A|A1 ) + P (A2 ) · P (A|A2 ) + . . . + P (An ) · P (A|An ).
Uma probabilidade total é sempre calculada como uma soma de probabilidades parciais correspondentes à
intersecção do acontecimento de interesse com outros mutuamente exclusivos e exaustivos. Este resultado é
utilizado quando é difícil de se obter diretamente a probabilidade de um evento P (A).
ER 39. Em três urnas numeradas são distribuídas uma determinada quanti-
dade de bolas coloridas conforme a tabela ao lado. Uma urna é selecionada Brancas(B ) Pretas (P )
ao acaso e dela é retirada uma bola também ao acaso. Qual a probabilidade U1 3 4
dela ser U2 5 2
(a) preta? (b) branca? U3 4 5
Solução: Esta é uma aplicação direta do teorema da probabilidade total. Assim,
X
3
1 4 2 5 89
P (P ) = P (Ui ) · P (P |Ui ) = P (U1 ) · P (P |U1 ) + P (U2 ) · P (P |U2 ) + P (U3 ) · P (P |U3 ) = · + + =
i =1
3 7 7 9 189
EP 3.42. Em duas urnas numeradas são distribuídas uma determinada quan-

Brancas Pretas
tidade de bolas coloridas conforme tabela ao lado. Uma urna é selecionada ao
U1 3 9
acaso e dela é retirada ao acaso um bola. Qual a probabilidade dela
U2 7 8
(a) ser de U1 e branca? (b) ser de U1 e preta? (c) ser de U2 e branca? (d) ser de U2 e preta?
EP 3.43. Uma urna tem 10 bolas brancas 6 azuis e 8 pretas. Uma bola é selecionada ao acaso e sem
reposição desta é retirada ao acaso outra bola. Qual a probabilidade de
(a) a primeira ser branca e a segunda azul? (c) a primeira a segunda serem brancas?
(b) a primeira ser azul e a segunda preta?
EP 3.44. Em Salvador, no mês de Outubro, costuma chover 5 dias. Qual a probabilidade de não chover nos
três primeiros dias de Outubro?
EP 3.45. Em três urnas numeradas são distribuídas uma determinada quan-

tidade de bolas coloridas conforme tabela ao lado. Uma urna é selecionada Brancas Azuis Pretas
ao acaso e dela é retirada ao acaso um bola. Qual a probabilidade dela ser: U1 3 4 5
U2 5 2 6
(a) azul? (b) preta? (c) branca? U3 2 4 3
EP 3.46. Numa fábrica de automóveis, em um lote A existem 295 peças boas e 5 peças defeituosas. Em
outro lote B desta fábrica, existem 224 peças boas e 16 peças defeituosas e, em outro lote C , existem 471 peças
boas e 9 peças defeituosas. Um dos lotes é sorteado ao acaso e dele é extraída uma peça ao acaso. Qual a
probabilidade da peça ser: (a) boa? (b) defeituosa?
EP 3.47. Seja A e B dois eventos tais que: P (A ∩ B ) = 0.6 e P (A ∩ B̄ ) = 0.2. Calcule P (A).
EP 3.48. Em três urnas numeradas são distribuídas uma determinada

quantidade de bolas coloridas conforme tabela ao lado. Uma urna é sele- Brancas Azuis Pretas
cionada ao acaso e dela é retirada ao acaso um bola. U1 2 5 3
U2 4 7 9
(a) Qual a probabilidade dela ser de U1 e ser azul? U3 5 3 2
(b) Qual a probabilidade dela ser branca?
(c) Se a bola observada foi branca, qual a probabilidade que tenha vindo de U2 ?
EP 3.49. Suponha que temos duas urnas (1 e 2), cada uma com duas gavetas. A urna 1 contém uma moeda
de ouro em uma gaveta e uma moeda de prata na outra gaveta; enquanto que a urna 2 contém uma moeda
de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir, uma de suas gavetas é aberta ao acaso e
verifica-se que a moeda encontrada nessa gaveta é de ouro. Qual a probabilidade de que a moeda provenha
da urna 2?
EP 3.50. Suponhamos um teste de aptidão colegial destinado a separar estudantes colegiais em grupos
que “prometem” e grupos que “não prometem”, ao entrarem para a faculdade. Entre os estudantes que tiveram
notas satisfatórias em seu primeiro ano, 80% passou no teste de aptidão. Entre os estudantes que tiveram um
trabalho insatisfatório, 40% passou no teste. Supõe-se que não se use o teste de admissão nessa faculdade.
Sabe-se que somente 70% dos alunos do primeiro ano obtiveram notas satisfatórias, qual a probabilidade de
que um estudante que tenha passado no teste seja um estudante satisfatório?
3.5.7 O Teorema de Bayes
3.22 Teorema. [Bayes] Sejam B um evento e {A1 , A2 , . . . , An } uma partição de um espaço amostral S . Então
P (Ai ) · P (B |Ai )
P (Ai |B ) = .
X
n
P (Ai ) · P (B |Ai )
i =1
Prova: Como P (B ) · P (Ai |B ) = P (Ai ) · P (B |Ai ), ∀ i , podemos escrever:
P (Ai ) · P (B |Ai )
P (Ai |B ) = , ∀ i.
P (B )
Como B é um evento qualquer de S e {A1 , A2 , . . . , An } é uma partição de S , pelo teorema da probabilidade

X
n
total, temos que P (B ) = P (Ai ) · P (B |Ai ). Conseqüentemente,
i =1
P (Ai ) · P (B |Ai )
P (Ai |B ) = , ∀ i.
P (A)
Nota 10. Observe que a regra de Bayes é obtida de uma expressão que caracteriza a probabilidade
condicional e é muito utilizada pois relaciona as probabilidades a priori P (Ai ), com a posteriori P (Ai |B ).

ER 40. Em três urnas numeradas são distribuídas uma determinada quan-
Brancas Azuis Pretas
tidade de bolas coloridas conforme tabela ao lado. Uma urna é selecionada
U1 3 1 6
ao acaso e dela é retirada ao acaso uma bola e verificada que ela é branca.
U2 4 3 2
Qual a probabilidade dela ter vindo:
U3 5 2 3
(a) da urna U1 ? (b) da urna U1 ou U3 ?
Solução:
1 3
P (U1 ) · P (B |U1 ) · 1
(a) P (U1 |B ) = = 3 10 = .
P (U1 ) · P (B |U1 ) + P (U2 ) · P (B |U2 ) + P (U3 ) · P (B |U3 ) 1 3 1 4 1 5 4
· + · + ·
3 10 3 10 3 10
(b) Temos que os eventos U1 e U3 são mutuamente exclusivos. Portanto, P (U1 ∪ U3 |B ) = P (U1 |B ) +
P (U3 |B ). Calculemos
1 5
P (U3 ) · P (B |U3 ) · 5
P (U3 |B ) = = 3 10 =
P (U1 ) · P (B |U1 ) + P (U2 ) · P (B |U2 ) + P (U3 ) · P (B |U3 ) 1 3 1 4 1 5 12
· + · + ·
3 10 3 10 3 10
1 5 2
Logo, P (U1 ∪ U3 |B ) = + =
4 12 3
EP 3.51. Uma urna I possui 4 bolas vermelhas e 5 brancas, a urna I I possui 6 bolas vermelhas e 2 brancas.
Uma urna é escolhida ao acaso e dela é extraída ao acaso uma bola.
(a) Qual a probabilidade de observarmos urna I e bola branca?
(b) Qual a probabilidade de observarmos urna bola branca?
(c) Se a bola observada foi branca, qual a probabilidade de que tenha vindo da urna I ?
EP 3.52. Uma caixa contém 3 moedas M1 , M2 e M3 . A primeira moeda é honesta, a segunda tem duas
caras e a terceira é viciada de tal modo que caras são quatro vezes mais prováveis que coroas. uma moeda é
escolhida ao acaso e lançada.
(a) Qual a probabilidade de observarmos moeda M2 e coroa?
(b) Qual a probabilidade de observarmos coroa?
(c) Se o resultado final foi cara, qual a probabilidade de que a moeda lançada tenha sido M1 ?
EP 3.53. Duas máquinas A e B produzem peças idênticas, sendo que a produção da máquina A é o triplo
da produção da máquina B . A máquina A produz 80% de peças boas e a máquina B produz 90%. Uma peça
do estoque é selecionada ao acaso e verifica-se que é boa. Qual a probabilidade de que tenha sido fabricada
pela máquina A?
EP 3.54. Uma clínica especializada trata de três tipos de doenças: X , Y e Z . 50% dos que procuram a clínica
são portadores de X e 30% de Y . As probabilidades de cura, nessa clínica, são: P (X ) = 0, 8, P (Y ) = 0, 9 e
P (Z ) = 0, 95. Um enfermo saiu curado dessa clínica. Qual a probabilidade de que ele sofria da doença X ? E
das doenças Y e Z ?
EP 3.55. Em uma população 55% são de mulheres. 5% dos homens são cegos e 2% das mulheres são
cegas. Uma pessoa é selecionada ao acaso e verifica-se que ela é cega. Qual a probabilidade de que seja
homem?
3.6 Gabarito
3.1 (a) Se masculino = 0, se feminino = 1. Logo, S = {0; 1}; (b) Se cara = 0, se coroa = 1. Logo,
S = {(0, 0, 0); (0, 0, 1); (0, 1, 0); (1, 0, 0); (0, 1, 1); (1, 0, 1); (1, 1, 0); (1, 1, 1)}; (c) S = {0, 1, 2, 3}; (d) S = {0, 1, 2, . . . , N },
onde N é o numero máximo de pessoas atendidas no período de 24 horas; (e) Se cara C , se coroa K . Então,
S = {(C , 1); (C , 2); (C , 3); (C , 4); (C , 5); (C , 6); (K , 1); (K , 2); (K , 3); (K , 4); (K , 5); (K , 6)}; (f) S = {3, 4, 5, 6, 7, 8, 9, 10}; (g) S =
{10, 11, 12, . . .}; (h) S = {t ∈ R; 0 ≤ t ≤ t0 }, onde t0 é o tempo máximo de vida da lampâda; (i) O espaço amostral é constituído
por um conjunto de 52 cartas sendo quatro tipos de naipe (copas ♥; ouros ♦; paus ♣; espadas ♠) e cada naipe com um total de 13 cartas
(A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J , Q , K ). 3.2 24. 3.3 3.4 (a) A ∩ B ; (b) A ∪ B ; (c) B ⊂ A; (d) A; (e) A ∩ B ; (f) A ∩ B ∩ C ; (g) A ∩ C ∩ B ; (h) A ∩ A ∪ B .
3.5 (a) A = {30, 60, 90}; (b) B = {20, 40, 60, 80, 100}; (c) C = {20, 30, 40, 60, 80, 90, 100}; (d) {60}; (e) {10, 50, 70}; (f) {20, 40, 80, 100};
(g) {30, 90}. (h) 3.6 (a) {(K , 1); (K , 3); (K , 5)}; (b) {(K , 2); (K , 4); (K , 6)}; (c) {(K , 1); (K , 2); (K , 3); (K , 4); (K , 5); (K , 6)}; (d)
{(C , 1); (C , 3); (C , 5); (K , 1); (K , 3); (K , 5)}; (e) A ∪ B = C ; (f) {(C , 1); (C , 3); (C , 5); (K , 1); (K , 2); (K , 3); (K , 4); (K , 5); (K , 6)}.
3.7 3.8 3.9 A = {(1, C ); (2, C ); (3, C ); (4, C ); (5, C ); (6, C )}; B = {(2, C ); (4, C ); (6, C ); (2, K ); (4, K ); (6, K )}; C =
{(3, C ); (3, K )}; A ∪ B = {(1, C ); (2, C ); (3, C ); (4, C ); (5, C ); (6, C ); (2, K ); (4, K ); (6, K )}; B ∩ C = ∅; A ∩ C = {(3, C )};
Ā ∩ C̄ = {(1, K ); (2, K ); (4, K ); (5, K ); (6, K )}; B̄ ∩ C = {(3, C ); (3, K )}. 3.10 E1 = {(1, 1); (2, 2); (3, 3); (4, 4)}; E2 =
{(2, 1); (3, 1); (3, 2); (4, 1); (4, 2); (4, 3)}; E3 = {(1, 2); (2, 1)}; E4 = {(1, 2); (2, 2); (3, 2); (4, 2)}; E5 = {(1, 2); (2, 5)}; E6 = {(1, 1)};
E7 = ∅; E8 = {(3, 1); (3, 2); (3, 3); (3, 4); (3, 5)}; 3.11 E1 = {(U1 , C ); (U1 , P )}; E2 = {(U2 , C ); (U2 , P )}; E3 = {(U1 , C ); (U2 , C )};
E4 = {(U1 , P ); (U2 , P )}; E5 = {(U1 , C ); (U1 , P ); (U2 , C ); (U2 , P )}; E6 = {(U1 , C )}; E7 = {(U1 , C ); (U2 , C )}; E8 = ∅. 3.12 3.13 (a) 3/8;
(b) 7/8; (c) 1/52; (d) 5/36; (e) 11/26; (f) 44/100. 3.14 (a) 1/3; (b) 2/3; (c) 5/9; (d) 4/9. 3.15 (a) 3/4; (b) 1/4; (c) 7/8; (d) 3/8; (e) 1/4.
3.16 (a) 5/6; (b) 1; (c) 1/2; (d) 1/6. 3.17 0, 5. 3.18 (a) 19/20; (b) 9/20; (c) 23/40. 3.19 (a) 7/10; (b) 11/20; (c) 3/4. 3.20 3.21 3.22
2
3.23 (a) 5/17; (b) 12/17; (c) Não. ?? A e B e A e C . 3.25 (a) 0, 12; (b) (c) 0, 32 (d) 0, 48 (e) 3.26 ?? 3.28 3.29 3.30 3.31 (a) ; (b)
5
1 17
; (c) . 3.32 (a) 0, 3; (b) 0, 5. 3.33 (a) sim; (b) sim. 3.34 39/40. 3.35 (a) 3/8; (b) 7/8. 3.36 (a) 3/8; (b) 7/24. 3.37 2, 6%. 3.38
10 35
1 3 7 4 520
0, 62. 3.39 0, 01. 3.40 0, 02%. 3.41 (a) Certo; (b) Certo; (c) Certo; (d) Errado. 3.42 (a) , (b) , (c) , (d) . 3.44 . 3.45 (a)
8 8 30 15 899
109 21 1.391 49 1 3 2
, (b) . 3.46 (a) , (b) . 3.47 0, 8. 3.48 (a) , (b) , (c) . 3.49 2/3. 3.50 14/17. 3.51 3.52 3.53 3.54 3.55
351 52 1.440 1.440 6 10 9

Principais Modelos Probabilísticos,
TEMA 04
Regressão e Correlação Linear
A descrição matemática de um fenômeno empírico é sempre uma representação idealizada do mundo real.
Este tipo de representação é chamado de modelo probabilístico ou estatístico.
4.1 Variável Aleatória
Em geral os métodos estatísticos são necessários quando estudamos fenômenos aleatórios, ou seja, não
completamente previsíveis. Muitos experimentos produzem resultados não numéricos. Podemos, entretanto,
transformar seus resultados em números, utilizando alguma regra de associação.
4.1 Definição. Seja E um experimento aleatório e S o espaço amostral associado a esse experimento. Uma
variável aleatória X é uma função que associa a cada elemento s ∈ S um número real X (s ), isto é
X :S → R
s 7 → X (s )
Exemplo 4.1. No lançamento de duas moedas o espaço amostral é

(C , C ) 2
S = {(C , C ); (C , K ); (K , C ); (K , K )}. Uma variável aleatória X para o evento
(C , K ) ou (K , C ) 1
número ocorrido de caras nos dois lançamentos da moeda pode ser definida
(K , K ) 0
pela tabela ao lado.
1 2 3 4 5 6
1 2 3 4 5 6 7
Exemplo 4.2. Seja o evento E : lançar dois dados e observar o soma
2 3 4 5 6 7 8
dos pontos das faces voltadas para cima. Uma variável aleatória (X , Y )
3 4 5 6 7 8 9
pode ser obtida ao associarmos os números obtidos na face superior em
4 5 6 7 8 9 10
cada face com a sua soma. Veja isso ao lado.
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Exemplo 4.3. Velocidade média do vento em um certa estação meteorológica. Vamos associar a letra Y a
velocidade do vento, logo Y é uma variável aleatória.
4.1.1 Tipos de Variáveis Aleatórias
Um conjunto X é enumerável quando é possível estabelecer uma relação unívoca entre seus elementos e
o conjunto dos números naturais. Se X for finito, podemos dizer quantos elementos o conjunto X (S ) possui.
Podemos classificar uma variável aleatória X em:
— discreta: quando seu conjunto imagem X (S ) é enumerável, finito ou infinito.
Exemplo 4.4.
(
0, se x é par
(a) Considerando o evento: lançamento de um dado e observar a face superior, seja X (x ) =
1, se x é ímpar
(b) A escolha ao acaso de n indivíduos para formar uma comissão. S = {conjunto de indivíduos},
X (S ) = {0, 1, 2, . . . , n}
— contínua: quando ela assume valores em um conjunto não-enumerável (em nosso estudo, intervalos
reais ou união de intervalos de números reais).
Exemplo 4.5. Tempo de vida de um determinado ser vivo.
4.2 Funções de Probabilidades
Seja X uma variável aleatória. Uma caracterização completa de X é dada por uma função de probabilidade.
Seja E um experimento aleatório associado a um espaço amostral S e X : S → R uma variável aleatória.

A função de probabilidade f é uma função que associa X à probabilidade de que X assuma um determinado
valor y ∈ X (S ) (caso a variável aleatória seja discreta) ou associa X à probabilidade de que X pertença a um
intervalo I ⊂ X (S ) (caso a variável aleatória seja contínua).
Algumas características são inerentes a esta definição. Estudaremos estas conforme a variável aleatória
seja discreta ou contínua.
4.2.1 Distribuição de Probabilidades
4.2 Definição. Considere E um experimento aleatório associado a um espaço amostral S = {si , i ∈ N} e X é

uma variável aleatória discreta que assume valores X (si ) = xi , i ∈ N. Uma distribuição de probabilidades de X
é uma função que associa a probabilidade de que uma variável aleatória discreta X assuma um determinado
valor xi ∈ X (S ) e é representada por P (X = xi ), ou simplesmente P (xi ), i ∈ N. Em outras palavras, a
distribuição de probabilidades é o conjunto de pares (xi , P (xi )), i ∈ N. Como característica a distribuição de
probabilidades de X deve satisfazer aos seguintes axiomas:
X
∞
1. P (X = xi ) ≥ 0, ∀ i 2. P (X = xi ) = 1.
i =1
Por se tratar de pares (xi , P (xi )), a distribuição de probabilidades pode também ser representada através de
fórmulas, tabelas, gráficos e diagramas.
Exemplo 4.6. Consideremos novamente o lançamento de duas moedas ( 4.1) e,
uma vez que já sabemos calcular as probabilidades de todos os pontos do espaço xi 0 1 2
1 1 1
amostral, a distribuição de probabilidades é dada ao lado. P (X = xi ) 4 2 4
4.2.2 Densidade de Probabilidade
Por se tratar de uma função que assume valores em um conjunto não-enumerável, uma variável aleatória
contínua não pode ter cada um de seus valores x ∈ X (S ) associado a uma determinada probabilidade P (X =
x ), como no caso da distribuição de probabilidades. Portanto, é necessário a construção de uma outra função
com as mesmas características da distribuição de probabilidades.
4.3 Definição. Considere E um experimento aleatório associado a um espaço amostral S e X uma variável
aleatória contínua. A densidade de probabilidade é uma função f (x ) satisfazendo aos seguintes axiomas:
Z +∞
1. f (x ) ≥ 0, ∀ x ∈ R; 2. f (x ) dx = 1.
−∞
Além disso, a probabilidade de que uma variável aleatória contínua X assuma valor em um determinado inter-
valo [a, b ] ⊂ R é dado por:
Z b
P (a < X < b ) = f (x ) dx . ( 4.34)
a

Por se tratar de uma função que assume valores em um conjunto não-enumerável, uma densidade de
probabilidade é representada através de fórmulas e gráficos e, claramente,
Z x0
1. P (X = x0 ) = P (x0 ) = f (x ) dx = 0;
x0
e, como conseqüência da definição,
2. P (a < X < b ) = P (a ≤ X < b ) = P (a < X ≤ b ) = P (a ≤ X ≤ b );
3. a densidade de probabilidade f (x ) não representa a probabilidade;
4. a probabilidade P (a < X < b ) é a área da figura limitada por a < x < b , y = 0 e o gráfico de f (x ).
ER 41. Seja X uma variável aleatória contínua. Verifique se

8
< 8x
1
, 0≤x ≤
f (x ) = 2
: 1
0 , x < 0 ou x >
2
é uma densidade de probabilidade. Caso afirmativo, calcule P (0, 1 < X < 0, 2), P (X < 0, 4) e represente
graficamente.
y
Solução: Para que f (x ) seja uma densidade de probabilidade, os ax-
iomas relativos a este tipo de função devem ser satisfeitos. Claramente, 4
pela definição,
1. f (x ) ≥ 0, ∀ x ∈ R;
Z +∞ Z 0 Z 1
2
2. f (x ) dx = 0 dx + 8x dx = 1, e, portanto, o
−∞ −∞ 0
segundo axioma também é satisfeito. 1 x
2
4.3 Função de Repartição
A função de repartição F (x ) de uma variável aleatória X , no ponto x , é a probabilidade de que X assume

um valor menor ou igual a x , isto é
F (x ) = P (X ≤ x ) ( 4.35)
Desta forma,
X
1. F (x ) = P (xi ), no caso em que X é uma variável aleatória discreta;
xi ≤x
Z x
2. F (x ) = f (s ) ds , no caso em que X é uma variável aleatória contínua. Claramente,
−∞
F (−∞) = 0 e F (+∞) = 1.
Podemos utilizar a função de repartição para calcular a probabilidade P (a < X < b ), da seguinte
maneira:
P (a < X < b ) = P (X < b ) − P (X ≤ a) = F (b ) − F (a). ( 4.36)
ER 42. Determine o valor de k para que a função
(
0 , x < 0 ou x ≥ 1
f (x ) = 2
kx , 0≤x <1
seja uma densidade de probabilidade. Em seguida, determine sua função de repartição.
Solução: A primeira característica é que k > 0. Além disso,

Z Z Z Z 1
+∞ 0 1 +∞
k
1= f (x ) dx = 0 dx + kx 2
dx + 0 dx = x 3
−∞ −∞ 0 1 3 0
Logo, k = 3. Quanto à função de repartição temos, para:

Z x
x <0 , F (x ) = 0 dx = 0
Z−∞
0 Z x
0≤x <1 , F (x ) = 0 dx + 3x 2 dx = x 3
Z−∞
0 Z0 1 Z +∞
x ≥1 , F (x ) = 0 dx + 3x 2 dx + 0 dx = 1
−∞ 0 1
EP 4.1. Uma variável aleatória X tem a seguinte função densidade de probabilidade:

8
>
< kx , 0 ≤ x < 5
f (x ) = k (10 − x ) , 5 ≤ x < 10
>
:
0 , x < 0 ou x ≥ 10.
(a) Determine o valor de k ; (b) P (2, 5 ≤ X ≤ 7, 5).

8
0 > , x < −1
<
x +1
EP 4.2. Dada a função de repartição: F (X ) = , −1 ≤ x < 1 Calcule:
>
: 2
1 , x ≥ 1.

1 1
(a) P − ≤X ≤ ; (b) P (X = 0).
2 2
4.4 Variáveis Aleatórias Bidimensionais
Existem experimentos em que o interesse está voltado para duas ou mais características (variáveis), simul-
taneamente.
Sejam E um experimento aleatório e S um espaço amostral associado a E . Para um mesmo ponto amostral s
podemos obter os valores X (s ) e Y (s ) de duas variáveis aleatórias X e Y . Uma variável aleatória bidimensional
é uma função (X , Y ) que associa s ∈ S ao par (X (s ), Y (s )).
Assim como a variável aleatória unidimensional, a bidimensional pode ser discreta ou contínua. Nosso
enfoque tratará, apenas, da variável aleatória bidimensional discreta.

4.5 Distribuição de Probabilidade Conjunta
A distribuição de probabilidade conjunta é uma função que associa uma variável aleatória bidimensional
discreta (X , Y ) ao número P (X = xi , Y = yj ), i ∈ N, ou seja,
P : (X , Y ) → [0, 1]
(xi , yj ) 7→ P (X = xi , Y = yj )
Esta função satisfaz aos seguintes axiomas:

1. P (X = xi , Y = yj ) ≥ 0, ∀ i , j ;
X
∞ X
∞ X \Y 1 2 3 4 5 6
2. P (xi , yj ) = 1. 1 1 1 1 1 1 1
36 36 36 36 36 36
i =1 j =1 1 1 1 1 1 1
2 36 36 36 36 36 36
Sua representação pode ser efetuada através de uma fórmula, tabela ou 1 1 1 1 1 1
3 36 36 36 36 36 36
gráfico. 4 1 1 1 1 1 1
36 36 36 36 36 36
1 1 1 1 1 1
5 36 36 36 36 36 36
Exemplo 4.7. A tabela ao representar a distribuição de probabilidades
1 1 1 1 1 1
6 36 36 36 36 36 36
correspondente ao lançamento de dois dados.
4.6 Função de Repartição Conjunta
A função de repartição conjunta de uma variável aleatória bidimensional discreta é definida por
XX
F (x , y ) = P (X ≤ x , Y ≤ y ) = P (xi , yj ).. ( 4.37)
xi ≤x yj ≤y
ER 43. Sejam M e N duas variáveis aleatórias independentes com as seguintes distribuições:
M 1 3 N 5 10 12
P (m) 0, 6 0, 4 P (n) 0, 3 0, 5 0, 2
Achar a distribuição conjunta da variável aleatória (M , N ).
4.7 Funções de Probabilidade Marginais
Seja (X , Y ) uma variável aleatória bidimensional discreta. Pode-se, a partir da função distribuição de proba-
bilidade conjunta, achar a distribuição ou densidade de probabilidade de X (distribuição ou densidade marginal
de X ) e de Y (distribuição ou densidade marginal de Y ).
4.8 Distribuição de Probabilidade Marginal
Seja (X , Y ) uma variável aleatória bidimensional discreta. A distribuição de probabilidade marginal de X ,

respectivamente, Y , são:
X
∞
P (X = xi ) = P (X = xi , Y = yj ) ( 4.38)
j =1
X∞
P (Y = yj ) = P (X = xi , Y = yj ) ( 4.39)
i =1
Exemplo 4.8. As tabelas abaixo representam, respectivamente, uma distribuição de probabilidades e as
distribuições de probabilidades marginais.
xi \yj 0 1 2 P (xi )
xi \yj 0 1 2
0 0, 10 0, 04 0, 06 0, 20
0 0, 10 0, 04 0, 06
1 0, 20 0, 08 0, 12 0, 40
1 0, 20 0, 08 0, 12
2 0, 12 0, 20 0, 08 0, 40
2 0, 12 0, 20 0, 08
P (yi ) 0, 42 0, 32 0, 26 1
4.9 Variáveis Aleatórias Discretas Independentes
Sejam X e Y duas variáveis aleatórias discretas independentes, então
P (xi , yj ) = P (xi ) · P (yj ), ∀ i , j . ( 4.40) xi \yj 0 1 2

0 0, 10 0, 20 0, 20
ER 44. Considere a seguinte distribuição de probabilidade ao lado. Verifique
1 0, 04 0, 08 0, 08
se as variáveis aleatórias X e Y são independentes.
2 0, 06 0, 12 0, 12
Solução: De acordo com a tabela
xi \yj 0 1 2 P (xi )
0 0, 10 0, 20 0, 20 0, 50
1 0, 04 0, 08 0, 08 0, 20
2 0, 06 0, 12 0, 12 0, 30
P (yi ) 0, 20 0, 40 0, 40 1
podemos escrever
(xi , yj ) (0, 0) (0, 1) (0, 2) (1, 0) (1, 1) (1, 2) (2, 0) (2, 1) (2, 2)
P (xi , yj ) 0, 10 0, 20 0, 20 0, 04 0, 08 0, 08 0, 06 0, 12 0, 12
P (xi ) 0, 50 0, 50 0, 50 0, 20 0, 20 0, 20 0, 30 0, 30 0, 30
P (yj ) 0, 20 0, 40 0, 40 0, 20 0, 40 0, 40 0, 20 0, 40 0, 40
P (xi ) · P (yj ) 0, 10 0, 20 0, 20 0, 04 0, 08 0, 08 0, 06 0, 12 0, 12
Como P (X = xi , Y = yj ) = P (X = xi ) · P (Y = yj ), ∀ i , j , X e Y são duas variáveis aleatórias independentes.
4.9.1 Exercícios Propostos xi \yj 0 1 2

0 0, 10 0, 04 0, 06
EP 4.3. Considere a seguinte distribuição de probabilidade ao lado. Veri-
1 0, 20 0, 08 0, 12
fique se as variáveis aleatórias X e Y são independentes.
2 0, 12 0, 20 0, 08
EP 4.4. Considere a seguinte distribuição conjunta das variáveis aleatórias xi \yj −2 −1 4 5

X e Y ao lado. 1 0, 1 0, 2 0, 0 0, 3
2 0, 2 0, 1 0, 1 0, 0
(a) Achar as probabilidades marginais de X e Y ; (b) As variáveis X e Y são independentes? Justifique.

4.10 Probabilidade Condicional
Seja xi um valor da variável aleatória discreta X , tal que P (xi ) > 0. A probabilidade
P (xi , yj )
P (Y = yj |X = xi ) = , ( 4.41)
P (xi )
é denominada probabilidade condicional de Y = yj dado que X = xi ocorreu. Desta forma, uma vez fixado o
valor xi , os pares (yj , P (Y = yj |X = xi )) definem uma distribuição condicional de Y , dado que X = xi , pois
X
∞ X
∞
P (X = xi , Y = yj ) X
∞
P (X = xi )
P (Y = yj |X = xi ) = = = 1. ( 4.42)
P (X = xi ) P (X = xi )
j =1 j =1 j =1
xi \yj 0 1 2
ER 45. Considere a seguinte distribuição de probabilidade ao lado. 0 0, 10 0, 04 0, 06
Calcule a distribuição de probabilidade de X , dado Y = 1. 1 0, 20 0, 08 0, 12
2 0, 12 0, 20 0, 08
Solução:
P (X = 0, Y = 1) 0, 04 A distribuição de probabilidade condicionada fica:
P (X = 0|Y = 1) = = = 0, 125;
P (Y = 1) 0, 32
xi P (X = xi |Y = 1)
P (X = 1, Y = 1) 0, 08 0 0, 125
P (X = 1|Y = 1) = = = 0, 25;
P (Y = 1) 0, 32 1 0, 25
P (X = 2, Y = 1) 0, 20 2 0, 625
P (X = 2|Y = 1) = = = 0, 625;
P (Y = 1) 0, 32 Total 1
Medidas de Posição
Da mesma maneira que em Estatística Descritiva, podemos falar de medidas de tendência central em uma
distribuição de probabilidade.
4.11 Esperança de uma Variável Aleatória
Seja X uma variável aleatória. A esperança matemática E (X ) ou, simplesmente esperança, valor esperado,
expectância ou média de uma distribuição de probabilidade, é a média dos valores da variável aleatória quando
repetimos o experimento um grande número de vezes.
4.11.1 Esperança de uma Variável Aleatória Discreta
Seja X é uma variável aleatória discreta com a seguinte distribuição de probabilidade:
X x1 x2 x3 ··· xn ···
P (X = xi ) P (X = x1 ) P (X = x2 ) P (X = x3 ) ··· P (X = xn ) ···
O valor esperado de X é dado por

X
∞
E (X ) = xi · P (X = xi ) ( 4.43)
i =1
ER 46. Ao lançarmos um dado um grande número de vezes, qual a esperança?
X 1 2 3 4 5 6
Solução: Da tabela 1 1 1 1 1 1
, temos:
P (X = xi ) 6 6 6 6 6 6
X
6
1 7
E (X ) = xi · P (X = xi ) = · (1 + 2 + 3 + 4 + 5 + 6) = .
6 2
i =1
ER 47. O tempo T , em minutos, necessário para um operário processar certa peça é uma variável aleatória
com a seguinte distribuição de probabilidade exibida abaixo.
(a) Estabeleça a função de repartição conjunta;

T 1 2 3 4 5 6 7
(b) Calcule o tempo médio de processamento. P (T = ti ) 0, 1 0, 2 0, 1 0, 3 0, 1 0, 1 0, 1.
Solução:
(a) A função de repartição conjunta é: (b) O valor esperado de T é
8
> 0 , se t < 1 X
7
>
>
> 0, 1 , se 1 ≤ t < 2 E (T ) = ti · P (T = ti )
>
> i =1
>
> 0, 3 , se 2 ≤ t < 3
>
< 0, 4 = 0, 1 · 1 + 0, 2 · 3 + 0, 1 · 3+
, se 3 ≤ t < 4
>
> 0, 7 , se 4 ≤ t < 5 0, 3 · 4 + 0, 1 · 5 + 0, 1 · 6 + 0, 1 · 7
>
>
>
>
0, 8 , se 5 ≤ t < 6
>
> = 0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5 + 0, 6 + 0, 7
> 0, 9 , se 6 ≤ t < 7
: = 4.
1, 0 , se t ≥ 7
4.11.2 Esperança de uma Variável Aleatória Contínua
Seja X é uma variável aleatória contínua com densidade de probabilidade f (x ). De forma análoga ao caso
discreto, o valor esperado de X é dado por
Z +∞
E (X ) = x · f (x ) dx . ( 4.44)
−∞
ER 48. Uma liga metálica é formada ao misturarmos dois metais em estado líquido. A liga resultante contém
uma certa percentagem de chumbo, que pode ser considerada uma variável aleatória X cuja função densidade
de probabilidade é dada por f (x ) = 0, 3 · 10−5 x (100 − x ), 0 ≤ x ≤ 100. Qual o valor esperado para X ?
Solução: O valor esperado de X é

Z +∞ Z 100
−5 −5
E (X ) = x · 0, 3 · 10 x (100 − x ) dx = 0, 3 · 10 (100x 2 − x 3 ) dx
−∞ 0
100
x 3 x 4 108 108 1
= 0, 3 · 10−5 100 − = 0, 3 · 10−5 − = 0, 3 · 103 = 25
3 4 0 3 4 12
Isto significa que é esperado, em média, 25% em chumbo nessa liga.
4.11.3 Propriedades da Esperança
Sejam k ∈ R uma constante, X e Y duas variáveis aleatórias com esperanças E (X ) e E (Y ) respectiva-

mente. Então

1. E (k ) = k ;
Prova: Seja X uma variável aleatória com distribuição de probabilidade P (X = xi ) = P (xi ), i ∈ N.

Então
X
∞ X
∞
E (k ) = k · P (xi ) = k P (xi ) = k .
i =1 i =1
2. E (k + X ) = k + E (X );
Prova: Se X é uma variável aleatória discreta, então

X
∞ X
∞ X
∞ X
∞
E (k + X ) = (k + xi ) · P (xi ) = (k · P (xi ) + xi · P (xi )) = k P (xi ) + xi · P (xi ) = k + E (X )
i =1 i =1 i =1 i =1
3. E (k · X ) = k · E (X );
Prova: Se X é uma variável aleatória discreta, então

X
∞ X
∞
E (k · X ) = (k · xi ) · P (xi ) = k xi · P (xi ) = k · E (X )
i =1 i =1
4. E (X + Y ) = E (X ) + E (Y );
Prova: Se X e Y são duas variáveis aleatórias discretas com distribuições de probabilidade, re-
spectivamente,
P (X = xi ) = P (xi ), i ∈ N
,
P (Y = yj ) = P (yj ), j ∈ N
então
X
∞ X
∞ X
∞ X
∞
E (X + Y ) = (xi + yj ) · P (xi , yj ) = (xi · P (xi , yj ) + yj · P (xi , yj ))
i =1 j =1 i =1 j =1
X∞ X ∞ X
∞ X
∞ X
∞ X
∞ X
∞ X
∞
= xi · P (xi , yj ) + yj · P (xi , yj ) = xi P (xi , yj ) + yj P (xi , yj )
i =1 j =1 i =1 j =1 i =1 j =1 j =1 i =1
X∞ X
∞
= xi P (xi ) + yj P (yj ) = E (X ) + E (Y )
i =1 j =1
5. Se X e Y são duas variáveis aleatórias discretas independentes, então E (X · Y ) = E (X ) · E (Y );
Prova: Se X e Y são duas variáveis aleatórias discretas com distribuições de probabilidade, re-
spectivamente,
P (X = xi ) = P (xi ), i ∈ N
.
P (Y = yj ) = P (yj ), j ∈ N
Como X e Y são independentes
P (xi , yj ) = P (xi ) · P (yj ), ∀ i , j .
Então
X
∞ X
∞ X
∞ X
∞ X
∞ X
∞
E (X · Y ) = (xi · yj ) · P (xi , yj ) = xi · P (xi ) · yj · P (yj ) = xi · P (xi ) · yj · P (yj )
i =1 j =1 i =1 j =1 i =1 j =1
= E (X ) · E (Y )
Em todos estes casos, supondo a presença de variáveis aleatórias contínuas, a demonstração seria
similar.
ER 49. Sejam X e Y duas variáveis aleatórias e Z = 5X + 3Y + 2. Sabendo-se que E (X ) = 3 e E (Y ) = 2,
calcule E (Z ).
Solução: E (Z ) = E (5X + 3Y + 2) = 5E (X ) + 3E (Y ) + 2 = 15 + 6 + 2 = 23.
4.12 Mediana
A mediana de uma distribuição de probabilidades é o valor Md da variável aleatória que divide a distribuição
em duas partes iguais, ou seja
1 1
⋄ P (Md ) = (variável aleatória discreta); ⋄ F (Md ) = (variável aleatória contínua)
2 2
ER 50. Determine a mediana, se X uma variável aleatória cuja densidade de probabilidade é
(
0 , x ∈ R \ [0, 1]
f (x ) = .
2x , x ∈ [0, 1]
Z x Z 0 Z x
√
1 1 2
Solução: Como = F (x ) = f (x ) dx = 0 dx + 2x dx = x 2 , então x 2 = . Daí x = .
2 −∞ −∞ 0 2 2
4.13 Moda
A moda de uma distribuição de probabilidades é o valor Mo da variável aleatória que possui a maior proba-
bilidade, se X for discreta, ou maior densidade, se X for contínua
ER 51. Determine a moda, se X é uma variável aleatória com a

X 0 1 2
seguinte distribuição de probabilidade dada ao lado.
P (X = xi ) 0, 2 0, 3 0, 5
Solução: Claramente, pela definição de moda, temos Mo = 2.
ER 52. Determine a moda se X uma variável aleatória cuja densidade de probabilidade é

(
0 , x ∈ R \ [0, 1]
f (x ) = .
2x , x ∈ [0, 1]
Solução: Claramente que Mo = 1, pois, é neste ponto que a função assume o valor máximo 2, (f (1) = 2).
4.14 Variância
A variância de uma variável aleatória corresponde à uma dispersão ou variabilidade dos diferentes valores
possíveis em torno da esperança.
Seja X uma variável aleatória. A variância VAR (X ) ou σ 2 de X é definida por:
VAR (X ) = σ 2 = E [(X − E (X ))2 ]. ( 4.45)

4.14.1 Variância de uma Variável Aleatória Discreta
4.4 Teorema. Seja X uma variável aleatória discreta. Então

X
∞
VAR (X ) = [xi − E (X )]2 · P (xi ). ( 4.46)
i =1
X
∞
Prova: VAR (X ) = E [(X − E (X ))2 ] = [xi − E (X )]2 · P (xi ).
i =1
1 1 3
ER 53. A variável aleatória X assume valores 1, 2 e 3, com probabilidades , e , respectivamente.
8 2 8
(a) Determine sua função de repartição F (x ); (c) P (1 < X < 3), P (1 ≤ X ≤ 2), P (1 < X ≤ 3), F (1) e F (2);
(b) Represente graficamente F (x ); (d) E (X ) e VAR (X ).
1 2 3 1
Solução: (a) P (X = xi ) 1 1 3
8 2 8
1 5
P (X ≤ xi ) 8 8 1 x
1 2 3
(b)
1 1 1 5
(c) P (1 < X < 3) = P (X = 2) = , P (1 ≤ X ≤ 2) = P (X = 1) + P (X = 2) = + = ,
2 8 2 8
1 3 7 1 5
P (1 < X ≤ 3) = P (X = 2) + P (X = 3) = + = , F (1) = e F (2) =
2 8 8 8 8
1 1 3 9
(d) E (X ) = 1 · + 2 · + 3 · = .
8 2 8 4
9 2 9 2 9 2 11
Portanto, VAR (X ) = 1 − · P (X = 1) + 2 − · P (X = 2) + 3 − · P (X = 3) = .
4 4 4 8
4.14.2 Variância de uma Variável Aleatória Contínua
4.5 Teorema. Sejam X uma variável aleatória contínua com função densidade de probabilidade f (x ) e esper-
ança E (X ). Então
Z +∞
VAR (X ) = [x − E (X )]2 · f (x ) dx . ( 4.47)
−∞
Z +∞
Prova: VAR (X ) = E [(X − E (X ))2 ] = [x − E (X )]2 · f (x ) dx .
−∞
4.6 Teorema. Seja X uma variável aleatória com esperança E (X ). Então
VAR (X ) = E (X 2 ) − [E (X )]2 . ( 4.48)
Prova: Seja X uma variável aleatória discreta com distribuição de probabilidade P (X = xi ) = P (xi ) e
esperança E (X ). Então,
X
∞ X
∞
VAR (X ) = E [(X − E (X ))2 ] = [xi − E (X )]2 · P (xi ) = xi2 · P (xi ) − 2E (X )xi · P (xi ) + [E (X )]2 · P (xi )
i =1 i =1
X
∞ X
∞ X
∞
= xi2 · P (xi ) − 2E (X ) · xi · P (xi ) + [E (X )]2 · P (xi )
i =1 i =1 i =1
= E (X 2 ) − 2E (X ) · E (X ) + [E (X )]2 = E (X 2 ) − 2[E (X )]2 + [E (X )]2 = E (X 2 ) − [E (X )]2 .
Pode-se demonstrar, analogamente, se considerarmos X uma variável aleatória contínua com densidade
de probabilidade f (x ) e esperança E (X ).
4.14.3 Propriedades da Variância de uma Variável Aleatória
Sejam k ∈ R uma constante, X e Y duas variáveis aleatórias com esperanças E (X ) e E (Y ). Então
1. VAR (k ) = 0
Prova: VAR (k ) = E [(k − E (k ))2 ] = E [(k − k )2 ] = E (0) = 0.
2. VAR (k + X ) = VAR (X ).
Prova:
VAR (k + X ) = E [(k + X − E (k + X ))2 ] = E ([k + X − {k + E (X )}2 ]) = E ([X − E (X )]2 ) = VAR (X )
3. VAR (kX ) = k 2 VAR (X ).

Prova:

VAR (kX ) = E [kX − E (kX )]2 = E [kX − kE (X )]2 = E {k [X − E (X )]}2

= E k 2 [X − E (X )]2 = k 2 E [X − E (X )]2 = k 2 VAR (X )
4.15 Desvio Padrão
O desvio padrão σ de uma variável aleatória X é a raiz quadrada da variância, isto é

È
σ = σ(X ) = VAR (X ) ( 4.49)
ER 54. Qual o desvio padrão de uma distribuição obtida ao lançarmos um dado um grande número de vezes?
X 1 2 3 4 5 6
Solução: A distribuição de probabilidade é dada por: 1 1 1 1 1 1
P (X = xi ) 6 6 6 6 6 6
1 7 1 91
E (X ) = (1 + 2 + 3 + 4 + 5 + 6) = e E (X 2 ) = (1 + 4 + 9 + 16 + 25 + 36) = . Logo,
6 2 6 6
2
91 7 91 49 182 − 147 35
VAR (X ) = − = − = = .
6 2 6 4 12 12
É
35
Portanto, σ = ≈ 1, 71.
12
Nota 11. De modo geral, o desvio padrão é a mais importante e útil medida de variação. O desvio
padrão de um conjunto de valores é uma medida de variação dos valores em relação à média aritmética.
A variância é o quadrado do desvio padrão, ou, podemos dizer que o desvio padrão é igual a raiz quadrada
da variância. Uma dificuldade com a variância é que ela não é expressa nas mesmas unidades dos dados
originais, enquanto que o desvio padrão tem a mesma unidade de medida dos dados originais.
ER 55. Para cada peça processada, o operário ganha um valor fixo de R $10, 00, mas, se ele processa a peça
em menos de 6 minutos, ganha 1% deste valor, por cada minuto poupado. Encontre a distribuição, a média e o
desvio padrão da variável aleatória G : quantia em reais ganha por peça.

Solução: (a) A função de repartição conjunta é: (b) O valor esperado de T é
8
> 0 , se t < 1 X
7
>
> E (T ) = ti · P (T = ti )
>
> 0, 1 , se 1 ≤ t < 2 i =1
>
>
> 0, 3 , se 2 ≤ t < 3 = 0, 1 · 1 + 0, 2 · 3 + 0, 1 · 3+
>
< 0, 4 , se 3 ≤ t < 4
> 0, 3 · 4 + 0, 1 · 5 + 0, 1 · 6 + 0, 1 · 7
> 0, 7 , se 4 ≤ t < 5
>
>
> 0, 8 , se 5 ≤ t < 6
>
> = 0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5+
>
> 0, 9 , se 6 ≤ t < 7
:
1, 0 , se t ≥ 7 0, 6 + 0, 7 = 4.
ER 56. Calcule σ(X ), se S = [0, 1] e X uma variável aleatória contínua com densidade de probabilidade
(
0 , x ∈S
f (x ) = .
3x 2 , x ∈S
Z Z Z 1
+∞ 1 1
x4 3
Solução: E (X ) = xf (x ) dx = x · 3x 2
dx = 3 x 3
dx = 3 = .
−∞ 0 0 4 0 4
Z +∞ Z 1 2
3
VAR (X ) = (x − E (X ))2 f (x ) dx = x− · 3x 2 dx
Z 1 Z
4
−∞ 1 0
3 9 3 9
= 3 x2 − x + · x 2 dx = 3 x4 − x3 + x2 dx
0 2 16 0 2 16
1
x5 3 4 3 3 1 3 3 3
= 3 − x + x =3 − + = .
5 4 16 0 5 4 16 80
É
3
σ(X ) = .
80
4.16 Covariância entre duas Variáveis Aleatórias
A covariância é uma medida da distribuição conjunta dos valores dos desvios das variáveis X e Y em
relação às respectivas médias, que descreve a dependência linear entre as variáveis.
4.7 Definição. Se X e Y são duas variáveis aleatórias, então a covariância C OV (X , Y ) entre X e Y é definida
por:
C OV (X , Y ) = E ([X − E (X )] · [Y − E (Y )]). ( 4.50)
4.8 Teorema. A covariância entre duas variáveis aleatórias X e Y é C OV (X , Y ) = E (X Y ) − E (X ) · E (Y ).
Prova:
C OV (X , Y ) = E ([X − E (X )] · [Y − E (Y )]) = E (X Y − X E (Y ) + E (X )Y − X E (Y ))
= E (X Y ) − E (X )E (Y ) + E (X )E (Y ) − E (X )E (Y ) = E (X Y ) − E (X )E (Y ).
Y \X 0 1
1
0 5 0
ER 57. De acordo com a distribuição conjunta de X e Y , ao lado, calcule a covariância.
1 0 0
2
2 0 5
1 1
3 5 5
Solução: Primeiramente calcula-se as distribuições de probabilidade marginais para cada variável
aleatória.
Y \X 0 1 P (yj )
1 1
0 5 0 5
1 0 0 0
2 2
2 0 5 5
1 1 2
3 5 5 5
2 3
P (xi ) 5 5 1
Agora calcularemos separadamente as esperanças necessárias.
X
2
2 3 3
E (X ) = xi P (xi ) = 0 · +1· =
i =1
5 5 5
X
4
1 2 2 10
E (Y ) = yi P (yi ) = 0 · +1·0+2· +3· = =2
5 5 5 5
i =1
X
2 X
4
E (X Y ) = xi yj P (xi , yj )
i =1 j =1
1 1 2 1 7
= 0·0· +0·1·0+0·2·0+0·3· +1·0·0+1·1·0+1·2· +1·3· =
5 5 5 5 5
7 3
C OV (X , Y ) = E (X Y ) − E (X )E (Y ) = − · 2 = 0, 2
5 5
4.9 Teorema. Sejam X e Y duas variáveis aleatórias. Então
VAR (X ± Y ) = VAR (X ) + VAR (Y ) ± 2 · C OV (X , Y ).
Prova:

VAR (X + Y ) = E [X + Y − E (X + Y )]2 = E (X + Y )2 − 2(X + Y )E (X + Y ) + [E (X + Y )]2

= E X 2 + 2X Y + Y 2 − 2(X + Y )[E (X ) + E (Y )] + [E (X ) + E (Y )]2
= E X 2 + 2X Y + Y 2 − 2(X + Y )E (X ) − 2(X + Y )E (Y ) +

[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
= E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2E (X )E (X + Y ) − 2E (Y )E (X + Y )+
[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
= E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2E (X )[E (X ) + E (Y )] − 2E (Y )[E (X ) + E (Y )]+
[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
= E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2[E (X )]2 − 2E (X )E (Y ) − 2E (Y )E (X ) − 2[E (Y )]2 +
[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
= E (X 2 ) − [E (X )]2 + E (Y 2 ) − [E (Y )]2 + 2E (X Y ) − 2E (X )E (Y )
= VAR (X ) + VAR (Y ) + 2 · C OV (X , Y )
A demonstração para VAR (X − Y ) = VAR (X ) + VAR (Y )2 · C OV (X , Y ) é análoga.
4.10 Teorema. Sejam X e Y duas variáveis aleatórias independentes. Então
C OV (X , Y ) = 0 e VAR (X ± Y ) = VAR (X ) + VAR (Y ).
Prova: C OV (X , Y ) = E (X Y ) − E (X )E (Y ) = E (X )E (Y ) − E (X )E (Y ) = 0 e
VAR (X ± Y ) = VAR (X ) + VAR (Y ) ± 2 · C OV (X , Y ) = VAR (X ) + VAR (Y ).
Quando C OV (X , Y ) = 0 dizemos que as variáveis aleatórias X e Y são não correlacionadas. A recíproca

do Teorema 4.10 não é verdadeira, isto é, se C OV (X , Y ) = 0, não podemos afirmar que as variáveis aleatórias
X e Y sejam independentes.
ER 58. Dada a distribuição de probabilidade conjunta ao lado, verificar se X Y \X −1 0 1

e Y são independentes e calcular a covariância entre X e Y . −1 0, 10 0, 30 0, 10
1 0, 25 0, 00 0, 25
Solução: Se X e Y são independentes a probabilidade da distribuição conjunta é igual ao produto das

distribuições marginais. Então, calculando as distribuições marginais para verificar a independência:
Y \X −1 0 1 P (yi )
−1 0, 10 0, 30 0, 10 0, 50
1 0, 25 0, 00 0, 25 0, 50
P (xi ) 0, 35 0, 30 0, 35 1, 00
Para que duas variáveis aleatórias X e Y sejam independentes a condição de independência tem que
ser verificada para todos os pares de valores possíveis de X e Y . Sendo assim, observe que as variáveis X
e Y são dependentes, pois, P (X = −1, Y = −1) = 0, 1 e P (X = −1) · P (Y = −1) = 0, 35 · 0, 50 = 0, 175.
Entretanto, C OV (X , Y ) = E (X Y ) − E (X )E (Y ) = 0. De fato,
X
E (X ) = xi P (xi ) = −1 · 0, 35 + 0 · 0, 3 + 1 · 0, 35 = 0
X
i
E (Y ) = yj P (yj ) = −1 · 0, 50 + 1 · 0, 50 = 0
XX
j
E (X Y ) = xi yj P (xi , yj ) = 0
i j
4.17 Exercícios Propostos
EP 4.5. No lançamento simultâneo de dois dados, considere as seguintes variáveis aleatórias:
⋄ X : o número obtido na face superior do 1◦ dado;
⋄ Y : o número obtido na face superior do 2◦ dado.
(a) Construir a distribuição de probabilidade através de uma tabela e de um gráfico das seguinte variáveis:
(i) W = X − Y ; (ii) A = 2Y ; (iii) Z = X · Y .
(b) Construir a função de repartição das variáveis W , A e Z
(c) Aplicando-se as propriedades e determinar:
(i) P (−3 < W ≤ 3); (ii) P (0 ≤ W ≤ 4) (iii) P (A > 6) (iv) P (Z ≤ 5.5)

(v) P (Z = 3) (vi) P (A ≥ 11) (iii) P (20 ≤ Z ≤ 35) (viii) P (3, 5 < Z < 34)
(d) Determine E (W ), E (A), E (Z ), VAR (W ), VAR (A) e VAR (Z ).
EP 4.6. Uma variável aleatória discreta tem a distribuição de probabilidade dada por:
k
P (X ) = , para x = 1, 3, 5, 7.
x
(a) Calcule o valor de k ; (b) Calcular P (X = 5); (c) VAR (X )
EP 4.7. Seja Z a variável aleatória correspondente ao número de pontos de uma peça de dominó.
(a) Construir a distribuição de probabilidades; (d) Calcular F (8).

(b) Determinar F (Z ); (e) VAR (Z ).
(c) Calcular P (2 ≤ Z < 6);
EP 4.8. Um dado é viciado, de modo que cada número par tem cinco vezes mais chances de aparecer num
lançamento, que qualquer número ímpar. Determine a esperança e o desvio padrão.
EP 4.9. Considere a seguinte distribuição conjunta de X e Y , dada abaixo.
(a) Determine as distribuições marginais de X e Y ; X Y −2 −1 4 5

1 0, 1 0, 2 0 0, 3
(b) Calcule E (X ), E (Y ) e E (X Y );
2 0, 2 0, 1 0, 1 0
(c) As variáveis X e Y são independentes. Por quê?

(e) Calcule os desvios padrões de X e de Y ;
(d) Calcule a covariância entre X e Y ;
EP 4.10. Seja X uma variável aleatória cuja função densidade de probabilidade é dada abaixo.
(a) Ache a função de repartição e esboce o gráfico;
8
< 3
(b) Calcule P (0, 25 < X < 0, 65) (1 − x 2 ) , x ∈ (0, 1)
f (x ) = 2
: 0 , x ∈ R \ (0, 1)
(c) Determine VAR (X ).
EP 4.11. Considere a densidade de probabilidade f (x ) abaixo.
(a) Ache a função de repartição e esboce o gráfico; ( x

, x ∈ [0, 2]
(b) P (1 < X < 1, 5); f (x ) = 2
0 , x ∈ R \ [0, 2]
(c) VAR (X ).
EP 4.12. Uma variável aleatória X tem a seguinte função densidade de probabilidade abaixo.
8
(a) Determine k e represente graficamente f (x ); > k , 0≤x <2
<
f (x ) = k (x − 1) , 2 ≤ x < 4
(b) VAR (X ). >
:
0 , x < 0 ou x ≥ 4.
EP 4.13. A função densidade de probabilidade de uma variável aleatória X é dada abaixo.

(a) Represente-a graficamente;
(
1
(b) Calcule P X ≥ ; 6x (1 − x ) , x ∈ (0; 1)
2 f (x ) =
0 , x ∈ R \ (0; 1).
(c) Calcule E (X ) e VAR (X ).
Alguns Modelos Probabilísticos para Variáveis Aleatórias
Existem modelos probabilísticos que ocorrem com freqüência na prática. Nas próximas seções, serão
definidos alguns modelos, apresentando as condições que devem ser satisfeitas e algumas características, tais
como, esperança, variância e como calcular probabilidade.

4.18 Modelos Probabilísticos para Variáveis Aleatórias Discretas
4.18.1 Distribuição de Bernoulli
Uma variável aleatória discreta X tem distribuição, prova ou ensaio de Bernoulli, X ∼ B (p ), se é um modelo
probabilístico aplicado a variáveis aleatórias dicotômicas, isto é, se representa um experimento cujo resultado
pode ser um sucesso (se ocorrer o evento de interesse) ou um fracasso (o evento de interesse não ocorre). Por
exemplo:
(a) de um lote contendo um certo número de peças, escolher, ao acaso, uma peça é defeituosa ou não;
(b) no lançamento de um dado, observar se o resultado foi o lado “2” ou outro lado qualquer;
(c) observar se uma peça produzida por uma empresa é perfeita ou defeituosa.
Probabilidade numa Distribuição de Bernoulli
Seja X uma variável aleatória definida para um experimento aleatório E com apenas dois resultados pos-
síveis. Podemos associar o valor 0 ao fracasso e o valor 1 ao sucesso. Portanto, o espaço amostral associado
a este experimento pode ser representado da seguinte forma:
S = {fracasso; sucesso} ou S = {0; 1}.
Suponha que um sucesso ocorra com probabilidade p . Então, a função de probabilidade de X é definida
como:
P (X = 1) = P (ocorrer sucesso) = P (1) = p
P (X = 0) = P (ocorrer fracasso) = P (0) = q = 1 − p ,
ou seja,
X 0 1
P (X = xi ) 1−p p
NOTAÇÃO: X ∼ Ber noulli (p ). Lê-se da seguinte forma: X tem distribuição Bernoulli com parâmetro p .
ER 59. Qual a função de probabilidade no lançamento de um dado e a ocorrência da face “6”?
Solução: Sucesso: ocorrer a face “6”. Podemos definir a variável aleatória X da seguinte forma
face 6 demais faces

X 1 0
A função de probabilidade da variável aleatória X é, portanto,

(
1
6 se x = 1
P (X = x ) = 5
6 se x = 0
A Esperança e a Variância numa Distribuição de Bernoulli
4.11 Teorema. A esperança e a variância de sucessos de uma variável aleatória X em uma distribuição
Bernoulli com parâmetro p são, respectivamente
E (X ) = p e VAR (X ) = p (1 − p ).
Prova: Seja a variável aleatória X com distribuição de Bernoulli:
X 0 1
P (X = xi ) 1−p p
Sendo X uma variável aleatória discreta, temos:
X
2
E (X ) = xi · P (X = xi ) = 1 · p + 0 · (1 − p ) = p .
i =1
VAR (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).
2
ER 60. Qual a variância numa distribuição dada ao consideramos o lançamento de um dado e obtenção da
face 2?
Solução: Consideremos o evento E (sucesso): ocorrer a face 2. Podemos definir uma variável aleatória
X da seguinte forma: (
1 , se ocorrer a face 2
X =
0 , se ocorrer uma face diferente de2
A distribuição de Bernoulli da variável aleatória X é
8
> 1
>
< 6
, se x = 1
P (X = x ) =
>
>
: 5 , se x = 0
6
1 1 5 5
A esperança e a variância de X são, respectivamente, E (X ) = e VAR (X ) = · = .
6 6 6 36
4.18.2 Distribuição Binomial
Podemos entender a distribuição binomial como uma extensão da distribuição de Bernoulli.
Considere E um experimento aleatório do tipo Bernoulli. Ao repetirmos este experimento n vezes, n ≥ 2,

de forma independente, podemos associar uma variável aleatória Xi , 1 ≤ i ≤ n, a cada i -ésima repetição do
experimento E .
Uma vez que, para cada repetição do experimento E , temos a seguinte distribuição de probabilidade:
¨
p , se x = 1
P (Xi = x ) = P (x ) =
1−p , se x = 0
A partir dessas repetições, pode-se definir uma seqüência de n elementos do tipo
(X1 , X2 , X3 , . . . , Xn )
de sucessos e fracassos, ou seja, uma seqüência onde cada termo assumirá valores iguais a zero ou um, num
total de n elementos. Portanto, definamos uma nova variável aleatória Y que representa o número de sucessos
ocorridos nas n-ésimas repetições do experimento E , ou seja,
Y : Xn → N
X
n
(X1 , X2 , . . . , Xn ) 7→ Y (X ) = Xi .
i =1
Nestas condições dizemos que Y tem distribuição binomial com parâmetros n e p (Y ∼ B (n, p )) e

n
P (Yi = y ) = P (y ) = · p y · (1 − p )n−y ,
y

em que os valores possíveis de y são inteiros positivos e no máximo igual a n.
Nota 12. Em outras palavras, um experimento é binomial se:
i. n repetições de um experimento básico que tem apenas dois resultados possíveis;
ii. as repetições são independentes;
iii. a probabilidade de ocorrer o evento no qual estamos interessados (sucesso) em cada repetição é
sempre igual a p .

n n!
Lembre-se! =
x (n − x )! · x !
ER 61. Uma usina hidrelétrica tem 5 geradores que funcionam independentemente, cada um com probabili-
dade 0, 98 de estar em operação. Qual a probabilidade de que exatamente dois estejam em funcionamento em
determinado instante?
Solução: Seja Y a variável aleatória que expressa se o gerador está ou não em funcionamento. A
probabilidade de um gerador estar em funcionamento (a probabilidade de sucesso) é p = 0, 98.
Por se tratar de uma distribuição binomial, a probabilidade de 2 geradores estarem em funcionamento é

5
P (X = 2) = 0, 982 · (1 − 0, 98)5−2 = 10 · (0, 98)2 · (0, 02)3 = 0, 000077.
2
ER 62. Se a probabilidade de um estabelecimento agrícola possuir trator e 0, 3 e se pesquisarmos oito

estabelecimentos, qual a probabilidade de:
(a) Exatamente dois possuírem trator? (c) No mínimo três possuírem trator?
(b) No máximo dois possuírem trator?
Solução:
8
(a) P (X = 2) = · 0, 32 · 0, 76 = 0, 29647548.
2
(b )P (X ≤ 2) = P (X = 0) + P (X =

1)
+ P (X = 2)
8 0 8 8 8
= · 0, 3 · 0, 7 + · 0, 31 · 0, 77 + · 0, 32 · 0, 76 = 0, 55177381.
0 1 2
(c) Como a variável aleatória X assume apenas os valores em {0, 1, 2, 3, 4, 5, 6, 7, 8}, podemos calcular
esta probabilidade pelo complementar. P (X ≥ 3) = 1 − P (X ≤ 2) = 1 − 0, 55177381 = 0, 44822619
ER 63. Vinte peças são extraídas, ao acaso e com reposição, de um lote contendo 1000 peças. Qual a
probabilidade de que 5 peças, dentre as 20 selecionadas, sejam defeituosas, sabendo-se que 8% das peças do
lote são defeituosas?

20
Solução: P (X = 5) = · 0, 085 · 0, 9215 = 0, 014544912.
5
Esperança e Variância em uma Distribuição Binomial
4.12 Teorema. Seja Y uma variável aleatória com distribuição binomial de parâmetros n e p . Então
E (Y ) = n · p e VAR (Y ) = n · p · (1 − p ).
Prova: Sejam Xi , 1 ≤ i ≤ n, n variáveis aleatórias independentes do tipo Bernoulli, ou seja,
(
p , se x = 1
P (Xi = x ) = P (x ) =
1−p , se x = 0
Então, E (Xi = p ) e VAR (Xi ) = p · (1 − p ), para cada i .

Seja Y = X1 + X2 + . . . + Xn , o número de sucessos nas n provas independentes de Bernoulli, e a variável
aleatória Y ∼ B (n, p ). Então, a esperança de Y é dada por:
E (Y ) = E (X1 + X2 + . . . + Xn ) = E (X1 ) + E (X2 ) + . . . + E (Xn ) = p + p + . . . + p = n · p ,
e a variância de Y
VAR (Y ) = VAR (X1 + X2 + . . . + Xn )
= VAR (X1 ) + VAR (X2 ) + . . . + VAR (Xn )
= p · q + p · q + . . . + p · q = n · p · q.
2
ER 64. Com os dados do exemplo anterior, calcular o número esperado, a variância e o desvio-padrão dos
geradores em funcionamento.
Solução:
√
E (X ) = n · p = 5 · 0, 98 = 4, 9, VAR (X ) = n · p · q = 5 · 0, 98 · 0, 02 = 0, 098 e σ(X ) = 0, 098 = 0, 3130.
EP 4.14. Das variáveis abaixo descritas, assinale quais são binomiais, e para estas dê os respectivos campos
de definição e distribuição de probabilidades. Quando julgar que a variável não é binomial, aponte as razões
de sua conclusão.
(a) De um urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas. Seja X é o
número de bolas brancas nas 5 extrações.
(b) Refaça o problema anterior, mas desta vez as n extrações são sem reposição.
(c) De 5 urnas com bolas pretas e brancas, vamos extrair de cada uma delas uma bola. Suponha que X é o
número de bolas brancas obtidas no final.
(d) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada peça é classificada como
sendo boa ou defeituosa. Escolhemos ao acaso um instante de tempo, e verificamos uma peça de cada
uma das máquinas. Suponha que X seja o número de peças defeituosas.
EP 4.15. Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no máximo,
2 defeituosas. Se a caixa contém 18 peças, e a experiência tem demonstrado que esse processo de fabricação
produz 5% das peças defeituosas, qual a probabilidade de que uma caixa satisfaça a garantia?
EP 4.16. Dez peças são extraídas, ao acaso, com reposição de um lote contendo 500 peças, qual a proba-
bilidade de que três peças, dentre as 10 selecionadas, sejam defeituosas, sabendo-se que 10% das peças do
lote são defeituosas?
EP 4.17. Uma tampa de garrafa é lançada 10 vezes para o alto. Calcule a probabilidade da tampa cair virada
para cima:
(a) 9 vezes. (b) Pelo menos 8 vezes. (c) No máximo 3 vezes.

EP 4.18. Um dado honesto é lançado 5 vezes para cima. Calcule a probabilidade da face 3 aparecer:
(a) 2 vezes. (b) Pelo menos 3 vezes. (c) No máximo 2 vezes.
EP 4.19. Admitindo-se que as chances de saírem cara e coroa sejam iguais em uma moeda não viciada.
Calcular a probabilidade de se obter 6 caras e 2 coroas.
EP 4.20. Um time X tem 1/3 de probabilidade de vitória sempre que joga. Se X jogar 3 partidas, calcule a
probabilidade de:
(a) X vencer exatamente 2 partidas; (b) X vencer pelo menos uma partida
EP 4.21. Uma moeda não-viciada é lançada 6 vezes:
(a) Qual a probabilidade de se obter duas coroas; (b) a probabilidade de acontecer ao menos 4 caras.
EP 4.22. Se 15% das peças produzidas por uma máquina tem algum defeito, determinara probabilidade de
que entre 10 peças escolhidas ao acaso:
(a) Uma ter defeito; (b) nenhuma ter defeito.
EP 4.23. Qual a probabilidade de uma casa com 6 filhos ter 4 filhos homens e 2 mulheres, sabendo que a
probabilidade de nascer filho homem é 75%?
EP 4.24. Num cesto cheio de bombons onde 40% deles estão envenenados, qual a probabilidade de uma
pessoa pegar 2 bombons sem veneno em 4 idas ao cesto?
EP 4.25. Uma moeda não viciada é lançada 4 vezes. Encontre a probabilidade de:
(a) Dar 2 caras (c) No máximo 3 caras
(b) Pelo menos 1 cara (d) Calcular a variância e a média da distribuição
EP 4.26. Admitindo-se a probabilidade de nascimento de meninos e meninas sejam iguais. Calcular a

probabilidade de um casal com 8 filhos ter 6 homens e 2 mulheres.
4.18.3 Distribuição de Poisson
A distribuição foi descoberta por Siméon-Denis Poisson (1.781 − 1.840) e publicada, conjuntamente com a
sua teoria da probabilidade, em 1.838 no seu trabalho Recherches sur la probabilité des jugements en matières
criminelles et matière civile (“Inquérito sobre a probabilidade em julgamentos sobre matérias criminais e civis”).
O trabalho focava-se em certas variáveis aleatórias N que contavam, entre outras coisas, o número de ocor-
rências discretas (por vezes chamadas de “chegadas”) que tinham lugar durante um intervalo de tempo de
determinado comprimento.
Em muitos casos, conhece-se o número de sucessos, porém, se torna difícil e, às vezes, sem sentido, de-
terminar o número de fracassos ou o número total de provas. Por exemplo: automóveis que passam numa
esquina. Pode-se num determinado intervalo de tempo anotar o número de carros que passaram, porém, o
número de carros que deixaram de passar pela esquina não poderá ser determinado. Veremos que a dis-
tribuição de Poisson se aplica nestes casos.
A distribuição de Poisson é largamente usada quando de deseja contar o número de eventos de um certo tipo
que ocorrem em um intervalo de tempo, superfície ou volume. Por exemplo: o número de chamadas telefônicas
recebidas por um PABX durante um intervalo pequeno de tempo; o número de falhas de um computador em
um dia de operação; o número de glóbulos sanguíneos visíveis ao microscópio ou a área de superfície visível
no campo do microscópio sendo dada por unidades quadradas; o número de estrelas encontradas em uma
parte da Via-Láctea que tenha o volume V .

A Probabilidade numa Distribuição de Poisson
Seja X a variável aleatória “número de repetições de um determinado evento”, que ocorre em um intervalo
de tempo, ou em uma superfície, ou em um volume. Certamente X assume valores numa sucessão infinita
0, 1, 2, 3, 4, . . .. Suponha que estes eventos ocorrem em instantes aleatórios de tempo ou de espaço e que as
hipóteses abaixo sejam válidas:
1. o número de ocorrências de um evento em um intervalo de tempo, ou superfície, ou volume é indepen-

dente do número de ocorrências do evento em qualquer outro intervalo disjunto.
2. a probabilidade de duas ou mais ocorrências simultâneas é praticamente zero.
3. o número médio de ocorrências por unidade de tempo, ou superfície, ou volume, α, é constante ao longo
do tempo, ou superfície, ou volume.
Nestas condições dizemos que X tem distribuição Poisson com parâmetro λ = αt (X ∼ Poisson(λ)) e a
probabilidade de X assumir um valor x é calculado por
e −λt · (λt )x
P (X = x ) = ( 4.51)
x!
em que
⋄ e é base do logaritmo natural (e = 2.71828 . . .).
⋄ x é o número de ocorrências no intervalo t analisado.
⋄ x ! é o fatorial de x .
⋄ λ é um número real, igual ao número esperado de ocorrências que ocorrem num dado intervalo de tempo.
⋄ t é o intervalo de tempo ou espaço que se está analisando o número de ocorrências desejadas.
⋄ P (x ) é a probabilidade de observarmos as ocorrências no intervalo t analisado.
ER 65. Numa indústria têxtil existem numerosos teares de certo tipo. Depois de muitas observações, chegou-
se à conclusão que o número de teares que se avariam em cada mês é uma variável aleatória X com dis-
tribuição de Poisson com parâmetro λ = 3. Calcule a probabilidade de que 3 ou mais teares se avariem durante
um mês.
Solução:
P (X ≥ 3) = P (X = 3) + P (X = 4) + . . . = 1 − P (X < 3) = 1 − [P (X = 0) + P (X = 1) + P (X = 2)]

e −3 · 30 e −3 · 31 e −3 · 32 9 17 −3
= 1− + + = 1 − e −3 − 3e −3 − · e −3 = 1 − · e ≈ 0, 57681
0! 1! 2! 2 2
A Esperança e a Variância numa Distribuição de Poisson
4.13 Teorema. Se X tem distribuição Poisson com parâmetro λ, então
E (X ) = VAR (X ) = λ.

Prova: Por definição
X
∞ X
∞
e −λ · λxi X∞
e −λ · λxi X e −λ · λxi
∞
E (X ) = xi · P (xi ) = xi = xi =
i =1 i =1
xi ! i =1
xi · (xi − 1)! i =1
(xi − 1)!
Fazendo xi − 1 = yj , j ≥ 0 , tem-se
X
n
e −λ · λy +1 X
n
λy
E (X ) = = λe −λ .
y! y!
i =0 i =0
X
n
λy
Como = e λ (Série de Maclaurin), obtém-se E (X ) = λ, donde
y!
i =1
X
∞
e −λ · λxi X ∞
e −λ · λxi X e −λ · λxi
∞
E (X 2 ) = xi2 = xi2 = xi .
i =1
xi ! i =1
xi (xi − 1)! i =1
(xi − 1)!
Fazendo xi − 1 = yj , j ≥ 0, tem-se
X
∞
e −λ · λyi +1 X e −λ · λyi +1
∞ X e −λ · λyi +1 ∞
E (X 2 ) = (yj + 1) = yj +
yj ! yj ! yj !
j =0 j =0 j =0
X
∞
λyi X λyj ∞ X ∞
λyj −1 X λyj ∞
= λe −λ yj + λe −λ = λ2 e −λ yj + λe −λ
j =0
yj ! y!
j =0 j j =0
yj (yj − 1)! y!
j =0 j
= λ2 e −λ e λ + λe −λ e λ = λ2 + λ.
No caso da variância, temos, de acordo com a definição, que
VAR (X ) = E (X 2 ) − [E (X )]2 = λ2 + λ − λ2 = λ.
√
Atenção! Claro que, se a variância é VAR (X ) = λ, então σ(X ) = λ.
Nota 13. A média e a variância numa distribuição de Poisson são iguais. Portanto, quando se for analisar
a ocorrência de determinado evento e observarmos que a média é um valor próximo da variância, é
razoável aproximarmos a ocorrência deste evento através de uma distribuição de Poisson.
ER 66. Um pesquisador está interessado no número de ovos depositados por uma espécie de pássaro. Na
primavera, ele procura e acha 80 ninhos. O número médio de ovos por ninho foi 3, 8 e a variância foi 3, 1. Porque
a variância é aproximadamente igual á média, ele acha que pode ser razoável descrever o número de ovos por
ninho como tendo uma distribuição de Poisson com média 3, 8.
(a) Qual a probabilidade de encontrarmos um ninho com 4 ovos, se vamos verificar 2 ninhos?
(b) Qual seria a probabilidade de não encontrar nenhum ovo num ninho?
Solução: (a) Temos uma média de ocorrência de 3, 8 ovos para cada ninho, ou seja
3, 8 ovos
λ= ,
1 ninho
neste caso, vamos analisar um espaço t de 2 ninhos, ou seja, t = 2 ninhos e x = 4 ovos. Logo, queremos
calcular:
e −3,8·2 (3, 8 · 2)4
P (4) = ≈ 0, 0696 = 6, 96%
4!

3, 8 ovos
(b) Temos λ = . Assim, vamos analisar um espaço t de 1 ninho, ou seja, t = 1 ninho e x = 0
1 ninho
ovo. Logo, queremos calcular:
e −3,8·1 (3, 8 · 1)0

P (0) = ≈ 0, 0224 = 2, 24%
0!
ER 67. Uma pizzaria recebe, em média, 5 chamadas a cada 1, 4 horas. Qual a probabilidade da pizzaria
receber no mínimo uma chamada em 10 minutos?
Solução: Devemos colocar, inicialmente, a unidade de tempo em horas ou em minutos. Portanto,
5 chamadas 5 chamadas
λ= =
1, 4 horas 84 minutos
10
et = horas = 10 minutos . Note que para transformarmos horas em minutos basta multiplicarmos por 60,
60
pois uma hora tem 60 minutos, e para transformarmos minutos em hora, basta dividirmos por 60.
Temos que, no mínimo, uma chamada significa termos uma ou mais chamadas, ou seja, x = 1, 2, 3, . . .,
então desejamos calcular a probabilidade de P (1) + P (2) + P (3) + . . .. Como o espaço amostral deste
evento é Ω = {0, 1, 2, 3, . . .}, ou seja, o conjunto de todas as possibilidades do número de chamadas em 10
minutos é dado pelo conjunto Ω . Como a probabilidade do espaço amostral é igual a 100% = 1, P (Ω ) =
P (0) + P (1) + P (2) + P (3) + . . . = 1. Segue que,
0 0
5 10 5 10 5 5
e − 1,4 · 60 · · e − 84 ·10 · · 10
1, 4 60 84
P (1) + P (2) + P (3) + . . . = 1 − P (0) = 1 − =1−
0 0
≈ 0, 4486 = 44, 86%.
ER 68. Em média há duas chamadas por hora num certo telefone. Calcular a probabilidade de se receber no
máximo 3 chamadas em duas horas e a probabilidade de nenhuma chamada em 90 minutos.
Solução: Seja X o número de chamadas telefônicas em duas horas. Então, α = 2 (número médio
chamadas por hora), t = 2h. Logo, λ = α · t = 4 (número médio chamadas em duas horas). Portanto,
X
4 X
4
e −4 · 4xi
P (X ≤ 3) = P (X = xi ) = = 0, 4331.
xi !
i =1 i =1
2
Seja Y o número de chamadas telefônicas em 90 minutos. Então, t = 90 min, α = (número médio de
60
chamadas por minuto) e λ = α · t = 3 (número médio chamadas em 90 minutos).
e −3 · 30
P (Y = 0) = = 0, 0498.
0!
4.14 Teorema. A média ou valor esperado de sucesso de uma distribuição de Poisson de parâmetro λ é λ e
a variância por VAR (X ) = λ.
Prova:
X
∞ X
∞
e −λ · λx X ∞
λ · λx −1 X λx −1 ∞
E (X ) = x · P (x ) = x· = e −λ · x· = λ · e −λ ·
x =0 x =0
x! x =0
x · (x − 1)! x =0
(x − 1)!
= λ · e −λ · e λ = λ

X
∞ X
∞
e −λ · λx X ∞
λ · λx −1 X ∞
λx −1
2 2
2
E (X ) = x · P (x ) = x · = e −λ · x2 · = λ · e −λ · x·
x! x · (x − 1)! (x − 1)!
x =0 " x =0 x =0 # x =0
e 0−1 X ∞
λx −1
−λ
= λ·e · 0· + x·
(0 − 1)! x =1 (x − 1)!

X
∞
λx −1 X
∞
λx −1 X
∞
λx −1
= λ·e −λ
· (x − 1 + 1) · = λ · e −λ · (x − 1) · +
x =1
(x − 1)! x=
(x − 1)! x=
(x − 1)!

X
∞
λx −1 X
∞
e −λ · λx −1
= λ · e −λ · (x − 1) · + eλ = λ · (x − 1) · + e −λ · e λ
x=
(x − 1)! x=
(x − 1)!
= λ · [E (x ) + 1] = λ · [λ + 1] = λ2 + λ
Logo, V (X ) = E (X 2 ) − [E (X )]2 = λ2 + λ − λ2 = λ.
4.18.4 Distribuição Binomial × Distribuição de Poisson
4.15 Teorema. Seja X uma variável aleatória com distribuição binomial com parâmetros n e p . Quando o
número n de repetições do experimento E cresce e a probabilidade p de sucesso se aproxima de zero, de modo
que n · p se aproxima de uma constante λ, dizemos que a distribuição binomial converge para a distribuição de
Poisson com parâmetro λ. Então
!
n e −λ · λx
lim · p x · (1 − p)n−x =
n→∞
p →0 x x!
n·p →λ
A distribuição de Poisson pode ser usada como uma aproximação da distribuição Binomial quando n é
grande e p é pequeno (np ≤ 7).

n e −λ · λx
P (X = x ) = · p x · (1 − p )n−x ≈ , onde λ = np .
x x!
Ou seja, X ∼ B (n, p ) ≈ Poisson(λ = np )
ER 69. Em um jogo de futebol, o público estimado foi de 50.000 pessoas. A probabilidade de uma pessoa
consumir determinada marca de refrigerante durante o jogo é de 1/20.000, supondo que o ato do consumo de
uma pessoa seja independente, qual a probabilidade de 5 pessoas comprarem esse produto durante o jogo?
Solução: Sejam E o evento assistir o jogo de futebol, p = 1/20.000 a probabilidade de comprar o referido
refrigerante (sucesso), n = 50.000 (número de pessoas que assistiram o jogo) e X a variável aleatória que
representa o consumo por esse produto. Observe que X tem distribuição binomial, ou seja,
X ∼ B (50.000; 1/20.000),
e que calcular a probabilidade de 5 pessoas comprarem este refrigerante por uma distribuição binomial é uma
tarefa bastante extensa devido aos elevados números utilizados, como indicado a seguir

50.000
P (X = 5) = 0, 000055 · 0, 9999549.995 = 0, 066800108.
5
Entretanto, sendo n = 50.000, um número muito grande, e p = 0, 00005, bem próximo a zero, as condições
para a aproximação entre as distribuições Binomial e de Poisson estão satisfeitas. Sendo assim, X converge
para uma distribuição de Poisson com parâmetro λ = nλp = 50.000 · 0, 00005 = 2, 5 e cuja esperança é
E (X ) = λ = 2, 5.

Calculando, agora, a probabilidade pedida pela distribuição de Poisson:
e −λ · λx e −2,5 · 2, 55
P (X = 5) = = ≈ 0, 066800942.
x! 5!
ER 70. Consideremos 1.000 ensaios independentes de Bernoulli cada um com probabilidade p = 0, 0001 de
sucesso. Determine a probabilidade de observarmos exatamente 2 sucessos.
e −0,1 · 0, 12
Solução: P (X = 2) ≈ = 0, 0045.
2!
ER 71. Determinado tipo de foto-receptor é vendido em caixas com 5.000 peças. É uma característica da
fabricação produzir 0, 03% de defeituosos. Determine a probabilidade de que em uma caixa haja mais de dois
defeituosos.
Solução: n = 5.000 e p = 0, 0003, assim λ = np = 1, 5. P (X > 2) = 1 − P (X ≤ 2) = 1 − [P (X =

0) + P (X = 1) + P (X = 2)] = 0, 1912
Comparativo entre as Distribuições Binomial e Poisson
Binomial Poisson
é afetada pelo tamanho da amostra n e pela é afetada apenas pela média λ.
probabilidade p de ocorrer sucesso.
os valores possíveis da variável aleatória X numa Poisson os valores possíveis de X são
são 0,1,2,...,n 0,1,2,..., sem limite superior.
indicada para fenômenos considerados
raros, ou seja, quando a probabilidade de
ocorrência da característica de interesse é
pequena (próxima a zero).
EP 4.27. Uma fábrica produz tecidos com média de 2, 2 defeitos por jarda quadrada. Determine as seguintes
probabilidades:
(a) não mais de 4 defeitos numa jarda quadrada;
(b) nenhum defeito em duas jardas quadradas;
(c) duas jardas quadradas cada uma com dois defeitos.
EP 4.28. O número de petroleiros que chegam a uma refinaria em cada dia ocorre segundo uma distribuição
de Poisson, com λ = 2. As atuais instalações podem atender, no máximo, a 3 petroleiros por dia. Se mais de 3
aportarem num dia, o excesso é enviado a outro porto.
(a) Em um dia, qual a probabilidade de se enviar petroleiros para outro porto?
(b) De quanto deverão ser aumentadas as instalações para permitir atender a todos os navios que chegarem
pelo menos em 95% dos dias?
(c) Qual o número médio de petroleiros que chegam por dia?

EP 4.29. Uma agência recebe em média 4 ligações por minuto. Calcule a probabilidade de:
(a) Receber no máximo 2 ligações por minuto. (b) Receber nenhuma ligação durante 1 minuto.
EP 4.30. Em uma avenida passam em média 5 carros por segundo. Calcule a probabilidade de passar:
(a) Exatamente 2 carros em 1 segundo. (b) No máximo 3 carros em 2 segundos.
EP 4.31. Uma montadora de carros constatou que ao testar os carros, em média, um defeito a cada 3.000km
rodados.
(a) Qual a probabilidade de que num teste de 2.500km haja no máximo um defeito?
(b) Qual a probabilidade de que um carro ande 5.000km sem que haja defeito?
EP 4.32. A média de chamadas telefônicas numa hora é 2. Qual a probabilidade de:

(a) Receber exatamente 2 chamadas numa hora. (b) Receber 3 ou mais chamadas em 90 minutos.
EP 4.33. Um advogado atende em média 4 clientes por hora. Calcule a probabilidade de se atendes
exatamente 4 clientes.
EP 4.34. Para este mesmo advogado, calcule a probabilidade de:

(a) atender apenas dois clientes em uma hora; (b)não atender nenhum cliente em uma hora.
EP 4.35. Se a probabilidade de um aparelho telefônico ser instado possuindo algum tipo de defeito é 0, 002,
determinar a probabilidade de entre 5000 aparelhos instalados:
(a) exatamente 5 serem defeituosos; (b) mais do que 2 serem defeituosos.
EP 4.36. Na pintura de parede aparecem defeitos em média na proporção de 2 defeitos por metro quadrado.
Qual a probabilidade de aparecerem 5 defeitos numa parede de 3 × 2 m?
EP 4.37. Um call-center recebe em média 6 chamadas por hora. Qual a probabilidade de:
(a) Receber 10 chamadas em 1 hora. (b) Receber 3 chamadas em 30 minutos
EP 4.38. Uma loja atende em média 4 clientes por hora calcular a probabilidade de atender:
(a) atender 1 cliente (b) não atender nenhum cliente
EP 4.39. A média de chamadas telefônicas em uma hora é 2. Qual a probabilidade de:

(a) não receber nenhuma chamada em 90 minutos. (b) receber 3 chamadas no máximo.
4.19 Modelos Probabilísticos para Variáveis Aleatórias Contínuas
4.19.1 Distribuição Uniforme
Uma variável aleatória X é uniformemente distribuída num intervalo [a, b ] se sua densidade de probabilidade
é dada pela função: 8
< 1
, a≤x ≤b
f (x ) = b−a ( 4.52)
:
0 , x 6∈ [a, b ]
y
De fato, para uma variável aleatória X uniformemente distribuída em [a, b ]
Z b f (x )
devemos ter que Aretângulo = f (x ) dx = 1 (observe o gráfico ao lado).
a A
1
Assim, (b − a) · f (x ) = 1, ou seja, f (x ) = , para a ≤ x ≤ b .
b−a a b x

Facilmente, podemos encontrar a sua função de repartição:
8
> 0, x <a
<
x −a
F (x ) = , a≤x <b ( 4.53)
>
: b−a
1, x ≥b
4.19.2 A Esperança e a Variância de uma Distribuição Uniforme
4.16 Teorema. A esperança matemática e a variância de uma variável aleatória uniforme são, respectiva-
a+b (b − a)2
mente, E [X ] = e VAR [X ] = σ 2 = .
2 12
Prova: Para a esperança, temos:

Z Z Z b
b
x 1 b b
1 x 2 1 b 2 − a2
E (X ) = x · f (x )dx = dx = xdx = =
a a b− a b−a a b−a 2 a b−a 2
1 (b − a)(b + a) a+b
= =
b−a 2 2
Vamos determinar, inicialmente,
Z Z Z b
b b
x2 1 b
1 x 3 1 b 3 − a3
E (X ) = x 2 · f (x )dx = dx = x 2 dx = =
a a b−a b−a a b − a 3 a (b − a) 3
b 3 − a3
=
3(b − a)
2
b 3 − a3 a+b (b − a)2
Portanto, VAR (X ) = E (X 2 ) − E (X )2 = − = .
3(b − a) 2 12
ER 72. Um ponto é escolhido aleatoriamente em um segmento de reta [2, 8]. Calcular:

(a) Probabilidade de encontrar um ponto entre 4 e 5. (b) Média. (c) Variância.
x −2
Solução: (a) A função de repartição é F (x ) = e o que queremos calcular é
6
5−2 4−2 1 1 1
P (4 < X < 5) = F (5) − F (4) = − = − = .
6 6 2 3 6
2+8 (8 − 2)2
(b) A média é obtida por E [X ] = = 5 e (c) a variância por VAR [X ] = = 3.
2 12
EP 4.40. Dada uma determinada distribuição uniforme, um intervalo [2, 5], calcule pelas fórmulas conhecidas
a média e a variância.
EP 4.41. Um ponto é escolhido ao acaso em um segmento de reta [5, 10]. Calcular:

(a) Probabilidade de encontrar um ponto entre 6 e 8. (b) Média. (c) Variância.
EP 4.42. Dado o intervalo [3/2, 8/3] um número é escolhido ao acaso calcular:

(a) A probabilidade deste número estar entre [7/4, 9/4]; (b) Qual a variância da distribuição.
EP 4.43. Um ponto é escolhido ao acaso no segmento de reta [1, 5]. Calcular:

(a) A probabilidade de que o ponto escolhido esteja entre 5/2 e 4 (b) Calcule a média da distribuição

EP 4.44. Um ponto é escolhido ao acaso no segmento [1, 5]. Calcule:
(a) Probabilidade de que o ponto escolhido esteja entre 2 e 4; (b) A média dessa distribuição
EP 4.45. Supondo que X seja uniformemente distribuído entre [−α, α], onde α > 0. Calcule α de modo que
P (X > 1) = 1/3.
EP 4.46. Um ponto é escolhido ao acaso num segmento de reta [0, 3], calcule a probabilidade de que este
ponto esteja entre 1/2 e 2, sabendo-se que a f (x ) é dada por (b 2 − a)/18.
EP 4.47. A probabilidade de um animal selvagem ir para um zoológico e permanecer vivo lá é de 0, 25.

Determine a probabilidade de entre 10 animais.
(a) nenhum sobreviver; (b) ao menos um sobreviver; (c) um animal sobreviver.
EP 4.48. Um ponto é escolhido ao acaso no segmento de reta [2, 6]. Calcular:
(a) a probabilidade de que o ponto esteja entre 4 e 5.

(b) entre 3 e 6 (d) a média dessa distribuição
(c) seja exatamente 5 (e) a variância dessa distribuição
EP 4.49. Um ponto é escolhido ao acaso no segmento de reta [1, 10]. Qual a probabilidade de:
(a) o ponto estar entre 7 e 9; (b) o ponto estar entre 1, 5 e 3; (c) o ponto ser maior que 10.
EP 4.50. Dois pontos são escolhidos independentemente no intervalo [0, 1], cada um de acordo com uma
distribuição uniforme. Calcule o valor esperado:
(a) do quadrado da distância entre eles. (b) da distância entre eles.
EP 4.51. Um número X é escolhido de acordo com uma distribuição uniforme em [a, b ]. Sem conhecer o
número escolhido, você deve escolher um segundo número c e pagar uma quantia igual a (X − c )2 . Como
você deve escolher c para minimizar o valor esperado desta quantia? Generalize para o caso em que X é uma
variável integrável qualquer.
4.19.4 Distribuição Normal
A Normal é uma das distribuições de probabilidade mais importantes na análise de fenômenos reais e de
grande utilidade na Inferência Estatística e em Amostragem. Esta distribuição é também conhecida com os
nomes de Curva de Gauss, Distribuição de Laplace ou ainda como Distribuição de Laplace-Gauss.
O conhecimento desta distribuição de probabilidades se deve a Abraham de Moivre (1.667 − 1.754) que,
em 1.733, apresentou a função que a representa. Tratava-se até então de um exercício teórico, sem aplicação
prática. J. Bernoulli (1.654 − 1.705) acreditava que poderia haver aplicação na área da economia, no entanto,
o uso desses conhecimentos na prática se deve a Pierre-Simon Laplace (1.749 − 1.827) na França e a Johan
K. F. Gauss (1.777 − 1.855) na Alemanha. O nome “Curva de Gauss” se deve à suposição que Gauss tivesse
sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1.924, Karl Pearson reafirmou o papel
fundamental de Abraham de Moivre.
4.17 Definição. Uma variável aleatória X segue uma distribuição Normal se a sua função de densidade é
definida por
1 (x−µ)2
f (x) = √ · e − 2σ2 , ( 4.54)
σ 2π
em que µ e σ são, respectivamente, a média e o desvio-padrão da distribuição.

Podemos observar que a equação da distribuição y
Normal utiliza 2 parâmetros: a média populacional µ
N (µ,σ2 )
e o desvio padrão populacional σ. Denotamos por
X ∼ N (µ, σ 2 ) a função de probabilidade cuja variável
aleatória X segue uma Distribuição Normal com mé-
dia µ e variância σ 2 . A média µ se refere ao centro da
distribuição e o desvio padrão σ ao espalhamento de
curva. A Distribuição Normal é simétrica em torno da
média o que implica que e média, a mediana e a moda
µ−σ µ+σ x
são todas coincidentes (ver gráfico ao lado). Mo =µ=Md
4.19.5 Principais Características
Considere a função f em 4.54. Suas principais características são:
⋄ A variável x pode assumir qualquer valor real x ∈ (−∞, +∞);
⋄ Os valores de y = f (x ) são assintóticos em relação ao eixo das abscissas, isto é, nunca tocam o eixo de x ;
⋄ A curva é simétrica e unimodal, apresentando um ponto de inflexão à esquerda em x = µ − σ e outro à

direita em x = µ + σ;
⋄ Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da
média são:
Parâmetro Porcentagem
µ + 1σ 68.3%
µ + 2σ 95.5%
µ + 3σ 99.7%
Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe
podem ser descritos por uma distribuição normal, com média 140mm e desvio padrão 15mm. Podemos calcular
a proporção dos peixes que têm comprimentos entre 110 e 170mm, por exemplo, como a proporção da área
sob a curva entre 110 e 170mm. Então, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm.
A figura a seguir mostra como a curva (gráfico da função f ) é afetada pelos valores numéricos de µ e σ.
Nota 14. A aplicação da distribuição y

normal na análise de dados na área
N (3, 0.25)
biomédica é grande, pois muitas variáveis
numéricas contínuas que estudamos têm
distribuição normal ou aproximadamente
N (0, 1) N (3, 1)
normal. Em alguns casos é possível
transformá-las, tornando-as compatíveis
com a normal. Como exemplo, podemos
N (3, 4)
citar a altura, o peso, o índice de massa
corporal, etc. x
O Cálculo da Probabilidade pela Distribuição Normal
Alguns dos principais métodos empregados na análise estatística (teste t de Student, análise de variância,
análise de regressão, etc.) exigem que os dados tenham distribuição normal.

Como se trata de distribuição de probabilidade contínua, a área que fica entre a curva e o eixo das abscissas
representa a probabilidade.
A probabilidade de ocorrer um evento entre os pontos a e b é calculada pela integral definida da função
avaliada neste intervalo, i.e.
Z b
1 (x −µ)2
P (a ≤ X ≤ b ) = √ · e − 2σ2 dx .
a σ 2π
A probabilidade é representada pela medida de área da região hachurada no gráfico seguinte.
a b
A probabilidade de ocorrer um evento entre:
−∞ e +∞ é igual a 1 ou 100%, representada pela região hachurada no gráfico seguinte.
−∞ e µ ou entre µ e +∞ é 0, 5 ou 50%, representada pela região hachurada no gráfico seguinte.
A Curva Normal Padrão ou Reduzida
O cálculo das probabilidades usando as técnicas de integração é sofisticado e complexo.
Na prática desejamos calcular probabilidades para diferentes valores de µ e σ. Para isso, a variável aleatória
X cuja distribuição é N (µ, σ 2 ) é transformada numa forma padronizada N (0, 1) com distribuição (distribuição
normal padrão) pois tal distribuição é tabelada. A quantidade Z é dada por
X −µ
Z = .
σ
Como a curva normal é simétrica, é somente necessário apresentar as probabilidades da metade direita
da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade do intervalo
equivalente na metade direita.
Na normal reduzida P (0, z ) = p enquanto P (Z ≥ z ) = 0, 5 − p .
N (0, 1)
p
1−p
0 z

A tabela a seguir apresenta em cada célula o valor das área limitada pelo gráfico da curva e o eixo horizontal,
no intervalo [0, z ].
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
ER 73. Determine:
(a) P (0 < z < 1, 32); (b) P (−2, 15 < z < 0); (c) P (−1, 56 < z < 1, 48).
Solução: Com o auxílio da tabela da distribuição normal, temos que:

(a) 0,4066 ; b) 0,4842 ; c) 0,4406+0,4306=0,8712
ER 74. A concentração de um poluente em água liberada por uma fábrica tem distribuição N (8, 1.5). Qual a
chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10ppm?
Solução: Devemos determinar a proporção da distribuição que está acima de 10ppm, i.e. P (X > 10).
Usando a estatística z temos:

10 − 8
P (X > 10) = P Z > = P (Z > 1.33) = 1 − P (Z ≤ 1.33) = 0.09.
1.5
Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do tempo.

EP 4.52. A concentração de cádmio em cinzas de um certo lixo radioativo tem distribuição N (1, 0.72). Quais
são as chances de que uma amostra aleatória das cinzas tenha uma concentração de cádmio entre 0.5 e
1.75ppm?
EP 4.53. Uma fábrica de pneus verificou que o desgaste de seus pneus tem uma média de 48.000km e
desvio-padrão de 2.000km. Calcule a probabilidade de um pneu:
(a) Durar mais que 50.000km. (b) Durar entre 47.000km à 48.000km.
EP 4.54. Uma televisão dura em média 10 anos e tem um desvio-padrão de 1 ano. Calcule a probabilidade
de durar:
(a) Acima de 12 anos. (b) Menos de 9 anos. (c) Entre 11 à 12 anos.
EP 4.55. As alturas dos alunos de determinada escola são distribuídas com média 1, 65m e desvio-padrão
0, 35m. Encontre a probabilidade de um aluno medir entre 1, 55m e 1, 85m.
EP 4.56. Considerando a distribuição de alunos onde a média é 1, 55m e o desvio-padrão é 0, 42m. Qual
deve ser o menor número para que possamos escolher os 10% maiores números.
EP 4.57. A média dos diâmetros de uma amostra de 100 argolas para correntes produzidas por uma máquina
é de 1, 500 polegadas e o desvio padrão é 0, 003 polegadas. Sendo fabricadas para tal finalidade, permite
a tolerância de 1, 495 polegadas a 1, 505 polegadas, se isso não se verificar as argolas serão consideradas
defeituosas. Determine a percentagem de argolas defeituosas.
EP 4.58. As alturas das portas de um determinado prédio são em média 2, 50m e o desvio padrão é de
0, 20m. Encontre a probabilidade de uma porta medir:
(a) entre 2, 30 e 2, 80; (b) mais de 2, 40.
EP 4.59. Numa empresa a média salarial é de R $1.500, 00 o desvio padrão é de R $200, 00. Calcule a
probabilidade de um funcionário receber entre R $1.350, 00 e R $1.600, 00.
EP 4.60. Uma concessionária vende em média 6 carros por dia e o desvio-padrão é de 3 carros. Qual a
probabilidade de se vender mais de 7 carros em um dia?
EP 4.61. A duração de um certo componente eletrônico tem média de 800 dias e desvio-padrão 40 dias.
Calcular a probabilidade desse componente durar:
(a) entre 700 e 800 dias; (b) mais que 700 dias; (c) menos que 750 dias.
EP 4.62. Um produto pesa em média, 20g , com desvio-padrão de 4g . É embalado em caixas com 100
unidades. Sabe-se que as caixas vazias pesam 1000g , com desvio-padrão de 50g . Admitindo-se uma dis-
tribuição normal nos pesos dos produtos e independência entre as variáveis dos pesos do produto e da caixa.
Calcular a probabilidade de uma caixa cheia pesar mais que 3100g .
Regressão e Correlação
Nas pesquisas estatísticas, um dos objetivos é estabelecer relações que possibilitem predizer uma ou mais
variáveis em termos de outra. Podemos citar o estudo das vendas futuras de um produto em função do seu
preço, ou a perda de peso de uma pessoa em decorrência do número de semanas que se submete a uma
dieta de 500 calorias por dia, ou a despesa de uma família com a educação dos filhos em função da idade dos
mesmos, etc.

O ideal seria a predição de uma quantidade exata em termos de outra, mas isso raramente é possível. Na
maioria dos casos podemos obter a predição de médias ou valores esperados. Por exemplo, não podemos
predizer exatamente quanto ganhará um engenheiro nos cinco anos subseqüentes a sua formatura, mas, com
base em dados adequados, é possível predizer o ganho médio de todos os engenheiros nos cinco anos sub-
seqüentes às formaturas. A predição do valor médio de uma variável em termos dos valores conhecidos de
outras variáveis constitui o problema análise de regressão.
Portanto, a regressão e a correlação são técnicas estreitamente relacionadas que envolvem uma forma de
estimação. A regressão nos dá uma equação matemática, que descreve o relacionamento entre as variáveis e
a correlação mede a força, ou grau, de relacionamento entre duas variáveis.
4.20 Ajustamento de Curvas
O ajustamento de curvas é um processo pelo qual procura-se adequar uma curva que melhor se ajusta ao
conjunto de dados que lhe foram apresentados.
Inicialmente, estudaremos o ajuste linear: método utilizado para definir dentre as retas dadas, a de melhor
ajuste, considerando um conjunto de dados. Este método exige que a reta de melhor ajuste aos dados tenha
como resultado o menor valor para a soma dos quadrados das distâncias verticais dos pontos dados à reta.
A Regressão linear simples constitui uma tentativa de se estabelecer uma equação matemática (modelo)
linear (linha reta) que descreva o relacionamento entre duas variáveis.
O objetivo principal da Análise de Regressão Linear Simples (objeto de estudo nesta disciplina) é predizer
o valor de uma variável (variável dependente), dado que seja conhecido o valor de uma variável associada
(variável independente).
A equação de regressão é uma expressão algébrica pela qual se prevê o valor da variável dependente.
Desta forma, a expressão análise de regressão simples indica que a predição da variável dependente é feita
através de uma variável independente, enquanto que a análise de regressão múltipla diz respeito à predição
da variável dependente através de duas ou mais variáveis independentes.
Para um melhor entendimento consideremos o seguinte exemplo.
ER 75. Considerando os dados o lado, qual das duas retas y = 5 ou y = 1 + x , é

X 4 9 1 6
a de melhor ajuste?
Y 6 10 2 2
Solução:
⋄p : y =1+x
⋄r : y =5
2
x (yp − yr )
x (xp − yr )2
2
1 (2 − 5) = 9
1 (2 − 2)2 = 0
2
4 (6 − 5) = 1 4 (6 − 5)2 = 1
6 (2 − 5)2 = 9
6 (2 − 7)2 = 25
9 (10 − 5)2 = 25 9 (10 − 10)2 = 0
Concluímos, observando o método, que a reta de melhor ajuste para estes dados é y = x + 1, pois,
comparando a soma dos quadrados das distâncias obtivemos 26 < 44. Perceba na ilustração gráfica abaixo.

y
b p
10
6 b
2 b b
1 4 6 9 x
Considerando os mesmos dados anteriores, verifique se a reta 14x − 17y + 15 = 0 é de melhor ajuste que
as apresentadas.
Naturalmente uma questão é levantada: a partir dos dados coletados e sabendo que a curva de melhor
ajuste é uma reta (y = ax + b ), como determinar esta reta, ou melhor, como achar os coeficientes angular a e
o linear b ?
Na próxima seção desenvolveremos a teoria que poderá responder essa pergunta.
4.21 Equações Normais (Método dos Mínimos Quadrados)
Sejam (xi , yi ), 1 ≤ i ≤ n, n pares. As equações normais são dadas pelo sistema
8 !
> X
n X
n
>
> yi = a xi + nb
>
< i =1 i =1
( 4.55)
> ! !
>
> X
n X
n X
n
>
: xi yi = a xi2 +b xi
i =1 i =1 i =1
As equações ( 4.55) são utilizadas para determinar os valores de a e b que minimizam o somatório do
X
quadrados das distâncias verticais [yi − (ax + b )]2 , isto é, são utilizadas para encontrar a equação da reta
i
y = ax + b , chamada de equação de predição, que melhor se ajusta ao conjunto de dados. A finalidade de
encontrar a equação y = ax + b é de prever ou se aproximar da realidade.
Para se chegar às equações normais ( 4.55) partimos do fato de que
X X
(yi − y )2 = [yi − (ax + b )]2
i i
e, fazendo-se uso do cálculo das derivadas parciais.
ER 76. Consideremos os seguintes dados amostrais
x 4 10 13 15 20 28
y 0, 9 1, 7 1, 3 2, 0 1, 9 2, 7
Qual a melhor reta que se ajusta a estes dados?

Solução: Temos que n = 6 e
x y x2 xy
4 0, 9 16 3, 6
10 1, 7 100 17
13 1, 3 169 16, 9
15 2, 0 225 30
20 1, 9 400 38
28 2, 7 784 75, 6
P
90 10, 5 1694 181, 1
Substituindo os resultados nas equações normais ( 4.55), temos:
10, 5 = 90a + 6b
181, 1 = 1694a + 90b
Resolvendo essas duas equações simultâneas pelo método da adição ou pelo método da substituição, obtém-
se como resultados a = 0, 07 e b = 0, 73. Logo, a equação de predição é dada por:
y = 0, 07x + 0, 73.
4.21.1 Processo Alternativo
Para se ganhar tempo na resolução do sistema, obteve-se um processo alternativo para a determinação
dos valores dos coeficientes da equação de predição.
Sxy
a =
Sxx
b = y − ax
onde,
!2 ! !
X X X X
xi xi xi · yi
i
X i
X i i
x̄ = , Sxx = xi2 − e Sxx = xi · yi − .
n i
n i
n
ER 77. Refazer o exemplo anterior, utilizando as fórmulas do processo alternativo.
Solução:
902 90 · 10, 5 23, 6 10, 5 0, 07 · 90

Sxx = 1694 − = 344; Sxy = 181, 1 − = 23, 6; a = = 0, 07 e b = − = 0, 73.
6 6 344 6 6
Então, a equação de predição é: y = 0, 07x + 0, 73.
Uma vez determinada a equação de predição também chamada de reta de regressão ou reta de re-
gressão estimada, podemos aplicá-la para fazer predições. Por exemplo, x = 2 na equação de predição,
obtém-se:
y = 0, 07(2) + 0, 73 = 0, 87.
ER 78. Considerando os dados abaixo (números de anos que certos candidatos ao serviço diplomático
estudaram alemão no curso secundário ou na faculdade e as notas por eles obtidas em um teste de proficiência
naquele idioma). Achar a equação de predição. Qual a nota no teste de proficiência do candidato que estudou

alemão no secundário ou na faculdade durante 6 anos? E 2 anos?
Candidato N ◦ de anos Nota no teste

x y
1 2 48
2 2 58
3 3 63
4 3 57
5 3 75
6 4 78
7 4 72
8 4 73
9 5 89
10 5 84
P
35 697
Solução: Temos que n = 10 e
Candidato N ◦ de anos Nota no teste

x y x2 y2 xy
1 2 48 4 2.304 96
2 2 58 4 3.364 116
3 3 63 9 3.969 189
4 3 57 9 3.249 171
5 3 75 9 5.625 225
6 4 78 16 6.084 312
7 4 72 16 5.184 288
8 4 73 16 5.329 292
9 5 89 25 7.921 445
10 5 84 25 7.056 420
P
35 697 133 50.085
Substituindo os resultados nas equações normais ( 4.55), temos:
697 = 35a + 10b

2.554 = 133a + 35b
Resolvendo essas duas equações, obtém-se como resultados a = 10, 9 e b = 31, 55. Logo, a equação de
predição é dada por:
y = 10, 9x + 31, 55.
Desta forma, fazendo x = 6 na equação de predição, obtém-se:
y = 10, 90 · 6 + 31, 55 = 96, 95.
Fazendo x = 2 na equação, obtém-se:
y = 10, 90 · 2 + 31, 55 = 53, 35.
Quando se faz uma predição, não se pode esperar atingir precisamente um valor de dado coletado como
se percebe na resposta obtida para x = 2 (compare o valor obtido com o valor da tabela). Este fato ocorre
devido ao erro de predição do processo chamado de Erro Padrão de Estimativa.

EP 4.63. A tabela a seguir mostra o número de horas que um atleta correu em cada dia x durante 8 semanas
consecutivas e o seu tempo correspondente de corrida para uma milha y .
x 13 15 18 20 19 17 21 16
y 5, 2 5, 1 4, 9 4, 6 4, 7 4, 8 4, 6 4, 9
Responda:
(a) Qual a equação de predição que permite estabelecer a relação entre o número de horas corrida e o seu
tempo para uma milha?
(b) Utilize a equação obtida no item (a) para predizer o tempo de corrida de uma milha a partir de 14 horas de
corrida numa determinada semana.
4.22 Correlação
O coeficiente de correlação mede o grau de associação linear entre duas variáveis aleatórias. É um valor
adimensional, não dependendo, portanto, de nenhuma unidade de medida.
Podemos entender o termo “correlação” (“co-relacionamento”) como a indicação de até que ponto os valores
de uma variável estão relacionados com os valores de outra variável. Existem muitos casos em que pode existir
um relacionamento entre duas variáveis. Por exemplo:
⋄ o esforço físico e o risco de parada cardíaca;
⋄ a escolaridade e a classe social;
⋄ o sucesso em um emprego pode ser predito com base no resultado de testes;
⋄ a temperatura e a quantidade de doenças de pele em uma determinada população ou amostra.
4.22.1 O Coeficiente de Correlação
O coeficiente de correlação ρ(X , Y ) de duas variáveis aleatórias X e Y é definido por:

C OV (X , Y ) E (X Y ) − E (X )E (Y )
ρ = ρ(X , Y ) = = È ( 4.56)
σ(X ) · σ(Y ) VAR (X ) · VAR (Y )
O coeficiente de correlação ρ é calculado a partir de uma amostra de n pares de observações de duas

variáveis e mede a quantidade de dispersão em torno de equação linear ajustada através do método dos
mínimos quadrados, ou o grau de relação das variáveis, na amostra. O valor de ρ é, portanto, uma estimativa
que mede os desvios em relação à reta determinada pelo método dos mínimos quadrados. É importante notar
que a dispersão em torno da reta poderia igualmente ser medida através do desvio-padrão, sendo esse último
preferido por muitos estatísticos. Não obstante, o uso do coeficiente de correlação permanece, principalmente,
devido à vantagem que apresenta decorrente da facilidade de interpretação e de seu intervalo compreender
valores com uma escala reduzida.
O sinal aritmético associado com o coeficiente de correlação indica a direção da relação entre x e y , ou
seja, se ρ > 0 e o valor de x aumenta (diminui), o valor de y também aumenta (diminui); se ρ < 0 e o valor de
x diminui (aumenta), o valor de y aumenta (diminui). Já o valor absoluto do coeficiente indica a extensão da
relação. No entanto, o coeficiente de correlação é mais freqüentemente apresentado como medida de relação.

4.18 Teorema. O coeficiente de correlação entre duas variáveis aleatórias está definido no intervalo [−1; 1],
ou seja, −1 ≤ ρ ≤ 1.
4.19 Teorema. Se X e Y são variáveis aleatórias independentes, então o coeficiente de correlação é zero.
A recíproca deste teorema não é verdadeira. Observe que, no exemplo anterior verificamos que, embora
X e Y não sejam variáveis aleatórias independentes, a C OV (X , Y ) = 0. Conseqüentemente, o coeficiente de
correlação também é zero.
4.22.2 Interpretação Gráfica
A correlação linear entre X e Y é positiva se 0 < ρ ≤ 1 e negativa se −1 ≤ ρ < 0. Quando |ρ| = 1 a

correlação linear é dita perfeita. Observe os gráficos ilustrando cada uma destas situações.
Y Y Y
Observe que o grau deX associação linear entre duas variáveis

X muda à medida que o coeficienteX de corre-
ρ=1 ρ = −1 −1 < ρ < 0
lação varia entre −1 e 1. Nos gráficos apresentamos distribuições em que ρ = 1 e ρ = −1 as correlações
lineares são, respectivamente, positiva e negativa perfeitas, enquanto que na distribuição em que −1 < ρ < 0 é
não perfeita e negativa.
ER 79. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos com o peso real e a
média dos pesos aparentes. Obteve-se a tabela:
i Peso Real (X ) Peso Aparente (Y )

1 18 10
2 30 23
3 42 33
4 62 60
5 73 93
6 96 98
7 120 159
Calcule o coeficiente de correlação.
Solução:
X Y X − E (X ) Y − E (Y ) (X − E (X )) · (Y − E (Y )) [X − E (X )]2 [Y − E (Y )]2
18 10 −45 −58 2.610 2.025 3.364
30 23 −33 −45 1.485 1.089 2.025
42 33 −21 −35 735 441 1.225
62 60 −1 −8 8 1 64
73 93 10 25 250 100 625
96 98 33 30 990 1.089 900
120 159 57 91 5.187 3.249 8.281
X
441 476 11.265 7.994 16.484

441 476 11.265
Portanto, temos que E (X ) = = 63, E (Y ) = = 68, C OV (X , Y ) = = 1.609, 3, σ(X ) =
É É 7 7 7
7.994 16.484 1.609, 3
≈ 33, 8, σ(Y ) = ≈ 48, 5 e ρ ≈ ≈ 0, 98.
7 7 33, 8 · 48, 5
EP 4.64. A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia
conforme a temperatura:
i Temperatura (X ) Comprimento (Y )
1 10 1, 003
2 15 1, 005
3 20 1, 010
4 25 1, 011
5 30 1, 014
Determine:
(a) O coeficiente de correlação;
(b) O valor estimado do comprimento da barra para a temperatura de 18◦ C ;
(c) O valor estimado do comprimento da barra para a temperatura de 35◦ C .
4.23 Erro Padrão
O erro padrão de uma estimativa, denotado por Se , significa determinar o intervalo de variação dos valores
calculados para a e b na equação de predição e tem por objetivo determinar o grau de certeza dos resultados
obtidos. O seu valor é dado por: Í
X
(yi − y )
i
Se = . ( 4.57)
n−2
onde, yi são valores observados, y são os valores calculados a partir da reta de predição e n − 2 é chamado
de grau de liberdade.
Desenvolvendo a fórmula, obtém-se r

Syy − aSxy
Se = . ( 4.58)
n−2
ER 80. Com base nos dados do exercício anterior, qual é o erro-padrão estimado?
Solução:
!2
X
yi
X i 6972
Syy = yi2 − = 50.085 − = 1.504, 1
n 10
ri É
Syy − aSxy 1504, 1 − 10, 9114, 5
Se = = = 5, 66.
n−2 8
4.24 Limites de Confiança para Coeficientes de Regressão
Os intervalos de confiança para os coeficientes de regressão a e b tem por objetivo determinar os intervalos
−tb tb
que contém os coeficientes a e b e são definidos através do valor médio da dupla desigualdade <t< ,
2 2
onde t é a distribuição t -student. O valor algébrico é obtido através das fórmulas:
Ê
Se 1 x̄ 2
a ± t α2 √ b ± t α2 Se + ( 4.59)
Sxx n Sxx
onde o grau de confiança é igual a (1 − α)100% e o valor de t α2 é encontrado na tabela da distribuição t -student
cruzando o valor de α2 (coluna) pelo valor de n − 2 (linha) chamado de grau de liberdade.
ER 81. Baseados nos dados a seguir (tempo médio semanais, em horas, que seis estudantes gastaram em
seus trabalhos para casa e os índices de pontuação para os cursos que fizeram em determinado semestre),
construa os intervalos de 95% de confiança para a e b .
Horas gastas em Índice de

deveres de casa X pontuação Y
15 2, 0
28 2, 7
13 1, 3
20 1, 9
4 0, 9
10 1, 7
Solução: Calculando inicialmente as somas necessárias, obtém-se:

X X X
x̄ = 90; ȳ = 10, 5; x 2 = 1.694; n = 6; xy = 181, 1; y 2 = 20, 29
Daí,
902
Sxx = 1.694 − = 344
6
10, 52
Syy = 20, 29 − = 1, 915
6
90 · 10, 5
Sxy = 181, 1 − = 23, 6
6
10, 5 − 0, 686 · 90
Logo, a, b = = −8, 54 e n − 2 = 4 (grau de liberdade). Então, t 0, 025 = 2, 776. Portanto, os
6
limites de confiança para a e b são: b : 0, 06860, 0407 e a : −8, 540, 684
Ou seja, o intervalo de 95% de confiança para b e a são: 0, 028 < b < 0, l 09 e −9, 224 < a < −7, 856.
Esses intervalos de confiança são bastante amplos, e isso se deve a dois fatores, ao tamanho da amostra
e à variação medida por Se, ou seja, a variação entre os índices de pontuação de estudantes sujeitos à
mesma quantidade de trabalho para casa.

4.25 Gabarito
N
M 1 3
X 1 2 Y −2 −1 4 5
4.1 4.2 43 5 0, 18 0, 12 4.3 4.4 (a) (b) Não. 4.5
P (x ) 0, 6 0, 4 P (y ) 0, 3 0, 3 0, 1 0, 3
10 0, 30 0, 2
12 0, 12 0, 08
105 21 Z 0 1 2 3 4 5 6 7 8 9 10 11 12
4.6 (a) k = ; (b) ; (c) ≈ 3, 85. 4.7 (a) 1 2 3 4 5 6 1 6 5 4 3 2 1
176 176 P (z ) 49 49 49 49 49 49 7 49 49 49 49 49 49
z <0 0≤z <1 1≤z <2 2≤z <3 3≤z <4 4≤z <5 5≤z <6 6≤z<7 7≤z <8
(b) 1 3 6 10 15 21 28 34
0 49 49 49 49 49 49 49 49
8≤z <9 9 ≤ z < 10 10 ≤ z < 11 11 ≤ z < 12 z ≥ 12 18 34
39 43 46 48 49
(c) 49 ; (d) 49 ; (e) ≈ 8, 04;
49 49 49 49 8
49
< 0 , x ≤0
3x x3 19
4.8 (a) ≈ 3, 83 (b) ≈ 2, 81 4.9 4.10 (a) FX (x ) = − , 0 < x < 1 ; (b) . 4.11 (a) FX (x ) =
: 2 2 320
1 , x ≥1
8
< 0 , x <0
3x x2 2 1 1 1 1
− , 0 ≤ x ≤ 2 ; (b) 0, 3125; (c) . 4.12 (a) k = (b) 4.13 (b) ; (c) E (X ) = e VAR (X ) = 4.14 (a)
: 2 4 9 6 2 2 120
1 , x >2
Binomial; (b) Não é binomial; (c) Não é binomial; (d) Naõ é binomial. 4.15 0, 9419. 4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23
0, 30. 4.24 0, 34 4.25 (a) 3/8; (b) 15/16; (c) 15/16; (d) σ2 = 1, µ = 2. 4.26 35/128. 4.27 (a) 0, 9275; (b) 0, 0123; (c) 0, 0719. 4.28
(a) 0, 1431 (b) 2 (c) 2. 4.29 (a) 23, 81% (b) 1, 83% 4.30 (a) 8, 42% (b) 1, 03% 4.31 4.32 4.33 4.34 4.35 4.36 0, 13 = 13% 4.37 (a)
0, 041 = 4, 1% (b) 0, 22 = 22% 4.38 (a) 0, 091578194 (b) 0, 018315638 4.39 (a) 0, 0498 (b) 0, 085712346 4.40 4.41 (a) (2/5) (b) (7, 5) (c)
(25/12) 4.42 (a) 3/34 (b) 0, 11 4.43 (a) 3/8 (b) 3 4.44 4.45 4.46 4.47 4.48 (a) 1/4 (b) 3/4 (c) 0 (d) 4 (e) 4/3 4.49 (a) 2/9; (b) 1/6; (c)
0. 4.50 4.51 4.52 4.53 (a) 15, 87% (b) 38, 3% 4.54 (a) 2, 28% (b) 15, 87% (c) 81, 85% 4.55 4.56 4.57 4.58 4.59 0, 4649 = 46, 49%
4.60 0, 3085 = 30, 85% 4.61 (a) 0, 9876 (b) 0, 0062 (c) 0, 1056 4.62 0, 0594 4.63 4.64

Referências Bibliográficas
[1] BUSSAB, WILTON O.& MORETTINI, PEDRO A.; Estatística Básica. 4a edição. São Paulo: Atual Editora,
2.001.
[2] MORETTIN, Pedro A.& Introdução à Estatística para Ciências Exatas. 1a edição. São Paulo: Atual
Editora, 1.981.
[3] FONSECA, J. S.& MARTINS, G. A.; Curso de Estatística. 6a edição. São Paulo: Atlas, 1.998.
[4] HOEL, PORT STONE& Introdução à Teoria da Probabilidade. 1a edição. Rio de Janeiro: Interciência,
1.978.
[5] MEYER, Paul L.& Probabilidade, Aplicações à Estatística. 2a edição. São Paulo: LTC, 1.969.
[6] SPIEGEL, M.& Probabilidade e Estatística. 2a edição. São Paulo: McGraw-Hill, 1.978.
[7] MAGALHÃES, M. N.& LIMA, A. C. P.; Noções de Probabilidade e Estatística. 3a edição. São Paulo:
IME/USP, 2.001.
[8] ROSS, S.& , 5a edição. Prentice Hall, 1.998.
[9] NEUFELD, J. L.& Estatística Aplicada à Administração Usando Excel. 1a edição. São Paulo: Makron
Books, 2.003.
[10] SMAILES, J.& MAGRANE, A.; Estatística Aplicada à Administração com Excel. 1a edição. São Paulo:
Atlas, 2.003.
[11] COSTA, Sérgio Francisco& Introdução Ilustrada á Estatística. 1a edição. São Paulo: Harbra Ltda, 1.998.
[12] MORETTIN, Luiz Gonzaga& Estatística Básica: probabilidade. 7a edição. São Paulo: Makron Books,
1.999.
[13] KASMIER, L. J.& Estatística Aplicada à Economia e Administração. 1a edição. São Paulo: Atlas, 1.982.
[14] SILVER, M.& Estatística para Administração. 1a edição. São Paulo: Atlas, 2.000.
[15] BRAULE, R.& Estatística Aplicada com Excel para Cursos de Administração e Economia. 1a edição.
São Paulo: Campus, 2.001.
[16] LIPSCHUTZ, Seymour& Probabilidade. 3a edição. São Paulo: McGraw-Hill, 1.972.
[17] KARMEL, P. H.& POLASEK, M.; Estatística Geral e Aplicada para economistas. 2a edição. São Paulo:
Atlas, 1.974.
[18] HOEL, Paul G.& Estatística Geral e Aplicada para economistas. 1a edição. São Paulo: Atlas, 1.977.
[19] BLACKWELL, David.& Estatística Básica. 1a edição. São Paulo: McGraw-Hill, 1.973.

FTC-E A D
Faculdade de Tecnologia e Ciências – Educação a Distância
Democratizando a educação.
www.ead.ftc.br
www.ead.ftc.br

02 Estatisticaeprobabilidade 140614153429 Phpapp02 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

02 Estatisticaeprobabilidade 140614153429 Phpapp02 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

E STATÍSTICA

G ERVÁSIO M ENESES DE O LIVEIRA

R EINALDO DE O LIVEIRA B ORBA

G ECIARA DA S ILVA C ARVALHO J ONES G ARCIA DA M ATA

Todos os direitos reservados e protegidos pela lei 9.610 de 19/02/98.

Bloco 1: Estatística Descritiva 8

Tema 1: Séries Estatísticas, Medidas de Tendência Central e Moda 8

Bloco 2: Probabilidade, Regressão e Correlação. 63

4 FTC EaD | LICENCIATURA EM MATEMÁTICA

Tema 4: Principais Modelos Probabilísticos, Regressão e Correlação Linear 81

Alguns Modelos Probabilísticos para Variáveis Aleatórias 96

Regressão e Correlação 113

Dois grandes blocos são apresentados: a Estatística Descritiva e a Teoria de Probabilidades. A

No Tema 1, apresentamos alguns conceitos introdutórios. As séries estatísticas e as represen-

No Tema 2, trabalharemos as separatrizes e as medidas de dispersão, assimetria e curtose.

No Tema 3, veremos os principais resultados na teoria de probabilidades.

No Tema 4, expande-se o conceito de probabilidade com a inserção do conceito de variável

Prof. Paulo Henrique Ribeiro do Nascimento

Séries Estatísticas, Medidas de

8 FTC EaD | LICENCIATURA EM MATEMÁTICA

1.1 Método Estatístico

Dos métodos científicos podemos destacar os métodos:

1.1.1 Fases do Método Estatístico

1. DEFINIÇÃO DO PROBLEMA: Consiste em uma apreciação ou formulação correta do problema a ser

2. PLANEJAMENTO: Nesta fase temos a considerar o procedimento necessário para o desenvolvimento

6. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: É a maneira de mostrar as informações a terceiros,

10 FTC EaD | LICENCIATURA EM MATEMÁTICA

1.2 Divisões da Estatística

A Teoria Estatística moderna se divide em dois grandes campos:

1.3 População e Amostra

População: χ = {o conjunto formado por todas as crianças portuguesas com 7 anos}.

Característica: ‫{ = ג‬nível de glucose no sangue}.

População: χ = {indústrias situadas no Estado da Bahia em 1997}.

Característica: ‫{ = ג‬existência ou não de algum tipo de controle ambiental na indústria}.

iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997.

População ou universo: χ = {área referente à Região Nordeste}.

Característica: ‫{ = ג‬precipitação pluviométrica}.

1.3 Definição. [Amostra] Chamamos de amostra um subconjunto próprio e finito da população.

A seleção da amostra é baseada em características da população.

População Técnicas de amostragem

Conclusões sobre Inferência Estatística Informações

Figura 1.1: Notas de Aula da Disciplina MAT116 - USP

12 FTC EaD | LICENCIATURA EM MATEMÁTICA

1.4 Variáveis Estatísticas

Variáveis qualitativas - quando o resultado da observação é apresentado na forma de qualidade ou atributo.

Variáveis quantitativas - quando o resultado da observação é um número, decorrente de um processo de

Dados Brutos e Rol

Classificação das Séries Estatísticas

- A época (fator temporal ou cronológico) a que se refere o fenômeno observado;

- O local (fator espacial ou geográfico) onde o fenômeno acontece;

- O fenômeno (espécie do fato ou fator especificativo) que é descrito.

Série Homógrada: a variável apresenta variação descontínua:

1a . Série temporal, cronológica, histórica ou marchas- quando os resultados da observação do

2a . Série geográfica ou espacial - o local varia, permanecendo fixos o tempo e o fenômeno.

3a . Série especificativa, específica ou categórica - quando o fenômeno é observado segundo algu-

14 FTC EaD | LICENCIATURA EM MATEMÁTICA

1.6.1 Apresentação Tabular

N ORMAS DE A PRESENTAÇÃO TABULAR DE DADOS

Topo : Espaço superior de uma tabela destinado ao seu título; TOPO

16 FTC EaD | LICENCIATURA EM MATEMÁTICA

Arredondamento de Dados Numéricos

2o . No arredondamento do dado numérico, quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4,

3o . No arredondamento de dado numérico, quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9,