Estatistica Universidade de Sao Paulo Dep Engenharia Mecanica Eesc

lOMoARcPSD|32583331
Estatística - Universidade de São Paulo - Dep. Engenharia

Mecânica - EESC
Estatística (Universidade de São Paulo)
A Studocu não é patrocinada ou endossada por nenhuma faculdade ou universidade

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)
lOMoARcPSD|32583331
Universidade de São Paulo

Escola de Engenharia de São Carlos
Departamento de Engenharia Mecânica
Prof. Dr. Eduardo Vila Gonçalves Filho

Prof. Dr. Roberto Hideaki Tsunaki
ESTATÍSTICA
Departamento de Engenharia
Mecânica – EESC-USP
São Carlos, Julho de 2012.

lOMoARcPSD|32583331
Sumário
1 INTRODUÇÃO ...................................................................................................................................................... 1
1.1 O que é estatística ...........................................................................................2

1.2 Tipos de estatística ..........................................................................................2
2 ESTATÍSTICA DESCRITIVA ................................................................................................................................. 5
2.1 Dados ..............................................................................................................6

2.2 Medidas de tendência central ........................................................................10
2.3 Notação de somatório....................................................................................15
2.4 Medidas de dispersão ....................................................................................16
2.5 Agrupamento de dados .................................................................................26
3 GRÁFICOS .......................................................................................................................................................... 33
3.1 Gráfico de barra .............................................................................................34

3.2 Gráfico de pizza ............................................................................................36
3.3 Gráfico de linha .............................................................................................37
3.4 Histograma ....................................................................................................38
3.5 Disposição ramo e folha (stem –and-leaf display) ..........................................39
3.6 Diagrama de pontos (dotplot) ........................................................................40
4 PROBABILIDADES .............................................................................................................................................. 43
4.1 Técnicas de contagem ...................................................................................44

4.2 Tipos de agrupamentos .................................................................................46
4.3 Probabilidade clássica....................................................................................49
4.4 Regra de adição .............................................................................................53
4.5 Tabelas de contingência ................................................................................57
4.6 Probabilidade condicional ..............................................................................59
4.7 Regra da multiplicação – Independência ........................................................62
ii

lOMoARcPSD|32583331
5 VARIÁVEIS ALEATÓRIAS DISCRETAS .............................................................................................................. 69
5.1 Variáveis aleatórias discretas .........................................................................70

5.2 Notação .........................................................................................................72
5.3 Distribuição de probabilidades de uma variável aleatória ..............................72
5.4 Cálculo da média e do desvio padrão para dados agrupados .........................78
5.5 Média e desvio padrão de uma variável aleatória discreta ..............................81
5.6 Experimentos binomiais ................................................................................85
5.7 Distribuição binomial.....................................................................................89
5.8 Média e desvio padrão de uma variável binomial ...........................................95
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS E A DISTRIBUIÇÃO NORMAL ........................................................ 101
6.1 Variáveis aleatórias contínuas ......................................................................102

6.2 Distribuição de probabilidades para variáveis aleatórias contínuas ..............102
6.3 Distribuição uniforme ..................................................................................105
6.4 Distribuição normal .....................................................................................108
6.5 Curvas normais............................................................................................119
6.7 Populações com distribuição normal ...........................................................126
6.8 Variáveis aleatórias normalmente distribuídas .............................................131
7 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA POPULAÇÃO ......................................................... 133
7.1 Populações ..................................................................................................134

7.2 Amostras e amostragens .............................................................................134
7.3 Estatísticas de amostras como estimativas de parâmetros ...........................135
7.4 Distribuição de amostragens .......................................................................136
7.5 O erro padrão ..............................................................................................140
7.6 Intervalo de confiança para a média – grandes amostras .............................142
7.7 Intervalo de confiança para a média de uma população normal ...................151
8 TESTE DE HIPÓTESE PARA A MÉDIA ........................................................................................................... 159
8.1 A natureza do teste de hipótese ..................................................................160

8.2 A lógica do teste de hipótese.......................................................................161
8.3 Teste de hipótese para média de uma população - grandes amostras .........167
8.4 Teste de hipótese para uma população normal............................................169
8.5 Teste de hipótese para média de duas populações ......................................174
iii

lOMoARcPSD|32583331
9 ANÁLISE DE VARIÂNCIA - ANOVA............................................................................................................. 179
9.1 Distribuição F ..............................................................................................180

9.2 Análise de variância para um fator...............................................................186
9.3 Adequabilidade do modelo ..........................................................................196
9.4 Blocos aleatorizados ....................................................................................199
9.5 Quadrados latinos .......................................................................................206
10 PLANEJAMENTO DE EXPERIMENTOS ......................................................................................................... 211
10.1 O que é um planejamento de experimentos ..............................................212

10.2 Experimentos fatoriais com dois fatores ....................................................215
10.3 Experimentos fatoriais com três fatores ....................................................220
10.4 Planejamento fatorial 2k ............................................................................223
10.5 Planejamento fatorial fracionário ...............................................................238
RESPOSTAS DE EXERCÍCIOS SELECIONADOS ................................................................................................... 247
iv

lOMoARcPSD|32583331
Capítulo 1
Introdução
Objetivos do Capítulo
O termo “estatística” é amplamente usado, às vezes sem muito rigor, em inúmeros

setores da nossa vida cotidiana como nos esportes, na economia, na área da saúde, etc..
O estudo da estatística é importante pela influência que ela exerce em nossas vidas. Ao
término deste capítulo você será capaz de:
1. Distinguir entre os significados das frases “a estatística é” e “as estatísticas são”.

2. Definir e distinguir entre estatística descritiva e estatística indutiva.
3. Definir e distinguir entre uma população e uma amostra.
4. Descrever como a estatística indutiva pode nos proporcionar informações sobre as
quais basear decisões importantes.
5. Descrever algumas maneiras de usar erradamente estatísticas.

lOMoARcPSD|32583331
1.1 – O que é estatística?
A palavra estatística tem dois significados. Se dissermos “a estatística é”, estaremos

nos referindo ao estudo da estatística, ou seja, ao estudo do assunto englobado pela estatística.
Se nós dissermos “as estatísticas são”, estaremos nos referindo a números derivados de uma
coleção de dados tais como taxa de desemprego, média de aprovação em um exame
vestibular, taxa de mortalidade infantil ou média de gols em um campeonato de futebol.
É difícil conseguir uma definição concisa de estatística porque é um assunto que

envolve muito mais que uma simples coleção, tabulação e sumarização de dados. Uma
definição comumente usada é dada abaixo:
Definição 1.1 - A estatística é uma coleção de métodos para o planejamento de

experimentos, obtenção de dados e, ainda, para a análise, interpretação e inferências
baseadas nesses dados.
Estatística é uma importante ferramenta de pesquisa. Ela é aplicada em praticamente

todas as áreas. Educação, agricultura, economia, engenharia e marketing são alguns dos
exemplos mais comuns.
1.2 – Tipos de estatística
Existem dois tipos de estatística: estatística dedutiva (ou descritiva) e estatística

indutiva (ou inferência estatística).
Definição 1.2 - A estatística descritiva trata da organização, sumário e apresentação

gráfica de dados.
Por esta definição pode-se ver que a estatística descritiva se preocupa em organizar e
apresentar dados de uma forma clara e efetiva. Para isso ela utiliza gráficos, tabelas e valores
calculados a partir dos dados (médias, mediana, desvio padrão, etc.).
Em alguns casos os dados podem ser obtidos a partir de toda a população em estudo
ou, se a população é muito grande, os dados podem ser referentes a uma amostra retirada da
população. Os conceitos de população e amostra (ou amostragem) são fundamentais em
estatística. As definições abaixo e a figura 1.1 consideram estes dois conceitos.
Definição 1.3 - Uma população é a coleção completa e total dos elementos (pessoas,
medidas, escores, itens, e outros) a serem considerados em um estudo estatístico.
Definição 1.4 - Uma amostra é um subconjunto de uma população de interesse.

lOMoARcPSD|32583331
Exemplo 1.1 – Ilustra os conceitos de população e amostra
Se estivermos interessados em determinar a idade média dos alunos de uma

determinada classe em uma universidade, podemos perguntar a cada aluno desta classe a sua
idade e, então, calcular a idade média. Neste caso, a população estudada é constituída pelos
alunos pertencentes àquela classe. Entretanto, se estivermos interessados em determinar a
idade média dos alunos pertencentes à universidade, a população estudada passa a ser
constituída por todos os alunos da universidade e a classe anteriormente considerada passa a
ser uma amostra da população total.
População
Amostra
Figura 1.1 – População e amostra
Quando a população de interesse é muito grande, torna-se economicamente inviável

efetuar medições em cada um de seus elementos. Nestes casos, a estatística indutiva nos
possibilita obter informações a partir de uma amostra menor, porém representativa, retirada da
população em estudo. Através da medição dos elementos da amostra nós podemos usar os
procedimentos da estatística indutiva para fazermos inferências ou projeções, sobre certas
características da população. Uma definição de estatística indutiva é:
Definição 1.5 - Estatística indutiva consiste de métodos para tirar conclusões sobre uma
população baseadas em informações obtidas a partir de uma amostra da população.
A definição da população é uma etapa importante de um estudo estatístico. A escolha

da população está intimamente ligada às respostas que queremos obter no nosso estudo. O
exemplo 1.2 ilustra essa questão.

lOMoARcPSD|32583331
Exemplo 1.2 – Ilustra os conceitos de população e amostra
Suponha que estamos querendo conhecer a altura média de todas as mulheres com
idade entre 16 anos e 30 anos vivendo atualmente no Brasil. A nossa população de interesse
está muito bem definida. Claramente, não vamos obter uma resposta precisa a esta questão
porque é economicamente inviável determinar a altura de todos os membros de uma
população tão grande. Entretanto, podemos retirar uma amostra de duas mil mulheres desta
população, medir a altura de cada uma delas e usar os métodos da estatística indutiva para
obter informações sobre a altura média de toda a população em estudo.
Exercícios – Seqüência 1.1
1) Defina estatística
2) Defina os seguintes termos:

a) população b) amostra
3) Qual a diferença entre se dizer “a estatística é” e “as estatísticas são”?
4) Quais são os dois tipos de estatística? Descreva cada um deles em detalhes.
5) Descreva três situações ou problemas para as quais a estatística indutiva poderia ser
aplicada.
6) Identifique em cada caso abaixo se estamos tratando com uma população ou com uma
amostra.
a) Todos os estudantes universitários paulistas.
b) Os moradores de Brasília.
c) Cinqüenta pessoas escolhidas entre os sócios de um clube.
d) Vinte pacientes de AIDS escolhidos para participar em um teste de uma nova droga.
e) Os estudantes do curso de estatística de uma certa universidade.
f) Cem jogadores profissionais de futebol do estado de São Paulo.
7) Um jornal americano realizou uma pesquisa com 800 pessoas divorciadas perguntando se
elas desejavam se casar novamente. Foi encontrado que 58% dos entrevistados não
desejavam um novo casamento. Os 800 entrevistados constituem uma população ou uma
amostra? Se a resposta for uma amostra qual é a população?
8) Defina uma amostra contendo quatro elementos retirados de cada uma das populações
abaixo.
a) A população formada por todas as universidades brasileiras.
b) A população de todos os times de futebol do estado de São Paulo.
c) A população de todos os jornais diários do Brasil.

lOMoARcPSD|32583331
Capítulo 2
Estatística Descritiva
Neste capítulo serão discutidos os modos de apresentação de dados que permitam

realçar as informações contidas em uma amostra retirada de uma população. Ao
término deste capítulo você será capaz de:
1. Definir as quatro categorias de dados que serão aqui discutidas.

2. Definir e calcular as principais medidas de tendência central.
3. Definir e calcular medida de dispersão.
4. Construir e usar uma tabela de freqüência para o cálculo dos valores da média,
variância e desvio padrão de um conjunto de números.
5. Usar tabelas de freqüência, gráficos tipo boxplot, dotplot e stem-and-leaf displays
para identificar padrões em um conjunto de números.

lOMoARcPSD|32583331
2.1 – Dados
Dados são definidos como informações coletadas de um experimento. Existem vários

tipos diferentes de dados e a metodologia usada para organizar e analisar os dados é
parcialmente determinada pelo tipo de dado sendo considerado. Dados podem ser
quantitativos, isto é, consistindo de números, ou podem ser qualitativos, isto é envolvendo
atributos tais como cor dos olhos, sexo, religião praticada, cor dos cabelos, etc. Uma definição
mais precisa de dados é colocada a seguir.
Definição 2.1 – Dados qualitativo, ordinal e métrico

Dados qualitativos: Dados que fornecem informação não numérica tais como cor
dos olhos e tipo de sangue.
Dados ordinais: Dados sobre ordem ou ranking em uma escala tais como 1,2,3,...
ou A, B, C, ....
Dados métricos: Dados obtidos de medida de quantidades tais como peso, altura,
vazão e tempo.
Outro tipo importante de dado é o dado de freqüência. Contando o número de

indivíduos ou itens que pertencem a categorias como, por exemplo, feminino e masculino
produz dados de freqüência.
Definição 2.2 – Dados de freqüência são dados sobre o número de indivíduos

pertencentes a uma dentre várias categorias.
Exemplo 2.1 – Ilustra os tipos de dados
As pessoas são classificadas de acordo com seu tipo sangüíneo em quatro grupos A, B,
AB e O.
a) Que tipo de dado é definido quando lhe dizem seu tipo de sangue?
b) Geneticistas e antropologistas registram o numero de pessoas de cada tipo de sangue.
Que tipo de dado eles estão coletando?
Solução:
a) Seu tipo de sangue é um dado qualitativo. Ele coloca você em uma das quatro
categorias não numéricas – A, B, AB ou O.
b) Registrar o número de indivíduos em cada uma das quatro categorias define o tipo de
dado que denominamos dado de freqüência.

lOMoARcPSD|32583331
Exemplo 2.2 – Ilustra tipos de dados
Nos cursos de pós-graduação da maioria das universidades, o aluno, ao completar uma

disciplina, recebe uma nota ou avaliação A, B, C, D ou E.
a) Que tipo de dado é uma informação de que um aluno X recebeu uma nota A em uma
determinada disciplina?
b) Que tipo de dado é fornecido pela informação de que as notas finais em uma disciplina
foram 10 A, 7 B, 2 C, 1 D e nenhum E?
Solução:
a) A informação de que o aluno X recebeu nota A é um dado ordinal, pois as notas A, B,
C, D e E classificam o desempenho do estudante.
b) A informação sobre o número de estudantes com notas A, B, C, D e E define o tipo de
dado denominado dado de freqüência uma vez que ela nos diz o número de
indivíduos pertencentes a cada um das cinco categorias de notas.
Exemplo 2.3 – Ilustra tipos de dados
Considere a lista das quedas de água mais altas do mundo.

a) A informação de que a queda d’água Angel Falls, na Venezuela, tem uma altura de
1000m e a queda d’água Ribbon Falls, na Califórnia, tem 491m de altura
correspondem a qual tipo de dado?
b) Da lista também é possível mostrar que das 40 quedas d’água mais altas, quatro tem
uma altura maior que 518m, cinco estão entre 518m e 305m e 31 tem uma altura
menor que 305m. Que tipo de dado esta informação proporciona?
Solução:
a) As alturas das quedas d’água são dados métricos, determinados através de medições.
b) A distribuição das 40 quedas mais altas em três categorias de alturas resulta no tipo de
dado denominado dados de freqüência.
A classificação dos dados nas quatro categorias (qualitativo, ordinal, métrico e

freqüência), descritas nessa seção, representa uma das muitas possibilidades de classificação
de dados encontradas na literatura. É, portanto, possível encontrarmos outros esquemas de
classificação de dados defendidos por outros pesquisadores. Deve estar claro para o leitor que
não existe uma classificação de dados única, aceita por todos os estudiosos da estatística.
A tabela 2.1, mostrada na próxima página, nos dá um resumo dos diversos tipos de dados
discutidos nesta seção.

lOMoARcPSD|32583331
Tabela 2.1 – Resumo dos tipos de dados.
Dados
Tipo Descrição Exemplo
Somente categorias. Os dados não Os quatro principais times de
Qualitativo podem ser arranjados segundo uma futebol do Rio de Janeiro:
ordem ou esquema. Flamengo, Vasco,
Fluminense, Botafogo
As categorias são ordenadas Os dez primeiros lugares numa
Ordinal segundo um esquema ou conceito. maratona
Dado obtido através de medições. Altura dos alunos da disciplina
Métrico É possível comparar um dado com Probabilidade e Estatística.
outro.
O número de itens por categoria é Número de estudantes masculinos e
Freqüência fornecido. femininos da disciplina
Probabilidade e Estatística.
1) Em cada uma dos casos abaixo, determine o tipo de dados mais apropriado.
a) Um carro é descrito como subcompacto, compacto, médio ou grande.
b) Peso de peças em uma amostra.
c) As cores de uma amostra de carros envolvidos em colisões com vítimas.
d) Códigos de endereçamento postal (CEP).
e) Número de famílias atualmente vivendo em cada uma das cinco regiões do país
(Norte, Nordeste, Sul, Sudeste e Centro-Oeste).
2) Em 1988, as principais línguas faladas do mundo eram as seguintes:
Classificação Língua Número de pessoas

(milhões)
1 Chinês 825
2 Inglês 431
3 Hindu 325
4 Espanhol 320
5 Russo 289
6 Árabe 187
7 Bengali 178
a) Qual tipo de dado é mostrado na primeira coluna da tabela?

b) Qual tipo de dado é definido pela informação de que Mike Jordan fala Inglês?
c) Qual tipo de dado é mostrado na terceira coluna da tabela?

lOMoARcPSD|32583331
3) Em 4 de Maio de 1961, o comandante Malcon Ross, USNR, alcançou 34667,92m de

altitude em um balão. Qual tipo de dado é representado pela altura alcançada?
4) A tabela abaixo fornece dados de área e população referentes aos seis continentes no ano
de 1988.
Continente Área de terra(Km2) População (milhões)

Ásia 27248 2.995
África 29970 623
América de Norte 23962 416
América do Sul 17620 286
Europa 4877 497
Oceania 8407 26
a) Qual tipo de dado é proporcionado pelos valores de áreas?

b) Qual tipo de dado está contido na afirmação “a África é o maior continente em área e
o segundo mais populoso”?
c) Qual tipo de dado é proporcionado pelos valores da população?
d) Qual tipo de dado nós obtemos do fato de que Madame Curie nasceu na Europa?
5) As exportações Brasileiras, nos anos de 1993 e 1996, por região de destino, podem ser
vistas no quadro abaixo.
Regiões 1993 1996

(milhões de US$) (milhões de US$)
União Européia 10.234 12.834
Aladi* 3.750 3.622
Nafta** 8.337 9.688
Mercosul 5.394 7.305
Ásia 6.112 7.813
África 1.074 1.492
demais 3.797 4.989
*Aladi = Bolívia, Chile, Equador, Colômbia, México, Peru e Venezuela.
**Nafta = EUA, México e Canadá.
Fonte: Folha de São Paulo, 24/02/98.
a) Qual tipo de dado é definido pelos valores das exportações em cada ano?
b) A afirmação “a Europa é o maior importador e o Nafta é o segundo maior importador
de produtos brasileiros” define qual tipo de dado?
c) Qual tipo de dado nós obtemos do fato de que a França faz parte da União Européia?

lOMoARcPSD|32583331
2.2 – Medidas de tendência central
As medidas descritivas de tendência central definem o valor central ou valor mais

típico de um conjunto de dados. De certa forma, essas medidas tentam nos dar alguma
informação sobre um conjunto de dados. Nesta seção serão discutidas as três medidas mais
utilizadas – média, mediana e moda.
MÉDIA
A medida de tendência central mais utilizada é a média. A definição de média de um

conjunto de dados é dada no quadro abaixo.
Definição 2.3 – A média de um conjunto de dados é definida como sendo a soma dos
dados dividida pelo número de elementos do conjunto:
Média = (Soma dos dados)/(número de elementos)
Exemplo 2.4 – Ilustra o cálculo da média
Considere o conjunto de dados mostrado na tabela abaixo. Suponha que esses valores
correspondam à ajuda de custo de alunos estagiários pagas por empresas da área de
engenharia. Determinar a média de salários para cada empresa.
Tabela 2.2 – Dados referentes a salários
Empresa Salários de estagiários(R$)
A 200 200 200 840 200 200 300 200 300 350 700 350 950
B 200 200 840 350 300 300 200 200 950 200
Nota: Os zeros correspondentes aos centavos foram omitidos para facilitar a leitura.
Solução:
De acordo com a definição 2.3, a média de um conjunto de dados é obtida somando-se
todos os valores e dividindo essa soma pelo número de valores. Chamando MA a média da
empresa A e MB a média da empresa B, podemos escrever:
R$4990,00 R$3740,00
MA = = R$383,85 MB = = R$374,00
13 10
Dessa forma, o salário médio dos 13 estagiários da empresa A é R$383,85 e dos 10

estagiários da empresa B é R$373,00.
10

lOMoARcPSD|32583331
MEDIANA
A mediana é uma outra medida de tendência central freqüentemente usada em

estatística. Essencialmente, a mediana divide um conjunto de dados ao meio, isto é, a mediana
corresponde ao dado central, ficando 50% dos dados à sua esquerda e 50% dos dados à sua
direita. Para obter o dado central é necessário ordenar os valores, do menor ao maior valor. A
definição 2.4 esclarece este conceito de uma forma mais precisa.
Definição 2.4 – A mediana de um conjunto de dados é definida como:

O valor que se encontra exatamente no meio de uma lista ordenada dos valores dados, se o
número de dados do conjunto for ímpar.
A média dos dois valores do meio da lista ordenada, se o número de dados for par.
Exemplo 2.5 – Ilustra o cálculo da mediana
Considerando novamente os dados da tabela 2.2, determinar a mediana para os dois

conjuntos de dados (empresa A e empresa B).
Solução:
O número de dados para a empresa A é 13, ou seja, um número ímpar.
Conseqüentemente, a mediana deste conjunto de dados será o sétimo valor quando
ordenarmos os valores segundo uma ordem crescente dos mesmos, como mostrado abaixo.
200 200 200 200 200 200 300 300 350 350 700 840 950
Seis valores mais baixos Seis valores mais altos
Mediana = 300
Assim, a mediana dos salários da empresa A é R$300,00.
O número de dados para a empresa B é 10, ou seja, um número par. Por isso, de
acordo com a definição 2.4, a mediana será dada pela média dos dois valores centrais da lista
ordenada dos dados. Esta lista é dada a seguir.
200 200 200 200 200 300 300 350 840 950
Cinco valores mais baixos Cinco valores mais altos
Mediana = (200 +300)/2 = 250
Assim, a mediana dos salários da empresa B é R$250,00.
11

lOMoARcPSD|32583331
MODA
A última medida de tendência central que será aqui discutida é a moda. Basicamente,
a moda é o dado ou valor que ocorre com mais freqüência, ou seja, que ocorre mais vezes em
um conjunto de dados. A definição da moda é feita como se segue:
Definição 2.5 - A moda de um conjunto de dados é definida como sendo o valor ou

valores que ocorrerem mais freqüentemente. Se nenhum valor em um conjunto de dados
ocorrer mais que uma vez, então dizemos que o conjunto não possui moda.
Pela definição 2.5, um conjunto de dados pode não ter uma moda, ter uma única moda,
ter duas modas ou mais que duas. Quando existir uma única moda, o conjunto de dados é dito
unimodal. Se existirem duas modas ele é dito bimodal, e assim por diante.
Para obter a(s) moda(s) é necessário construir a distribuição de freqüência para o

conjunto de dados usando classes baseadas em um único valor, como mostra o exemplo
abaixo.
Exemplo 2.6 – Ilustra cálculo da moda
Determinar a(s) moda(s) para os conjuntos de salários mostrados na tabela 2.2.
Solução:
A tabela 2.3 mostra a distribuição de freqüências para os salários da empresa A. Para
cada valor são contadas as ocorrências, resultando nos valores da coluna 2 da tabela.
Tabela 2.3 – Distribuição de freqüências para a empresa A.
Salário 200 300 350 700 840 950

Freqüência 6 2 2 1 1 1
Pode ser visto que o valor ocorrendo com mais freqüência é o valor 200, que ocorre 6
vezes. Dessa forma, concluímos que a moda dos 13 salários da empresa A é R$200,00.
Para os salários da empresa B a distribuição de freqüências pode ser vista na tabela

2.4. O valor que ocorre mais freqüentemente é o valor 200. Portanto, a moda dos 10 salários
da empresa B é R$ 200,00.
Tabela 2.4 – Distribuição de freqüências para a empresa B.

Salário 200 300 350 840 950
Freqüência 5 2 1 1 1
12

lOMoARcPSD|32583331
Comparação entre a média, mediana e moda
A média, mediana e moda de um conjunto de dados são freqüentemente diferentes. A

tabela 2.5 resume as definições dessas três medidas de tendência central juntamente com os
valores calculados nos exemplos anteriores para os dados de salários das empresas A e B.
Tabela 2.5 – Valores da média, mediana e moda.

Medida de Definição Empresa A Empresa B
tendência central
Soma dos dados
Média Número de dados R$383,85 R$374,00
Mediana Valor médio da lista ordenada R$300,00 R$250,00
Moda Valor mais freqüente R$200,00 R$200,00
Em ambos os conjuntos de dados, a média é maior que a mediana. Isto ocorre porque a
média é fortemente afetada por poucos altos salários em cada conjunto de dados. Em geral, a
média é sensitiva a valores muito altos ou muito baixos, enquanto que a mediana não é
influenciada por valores extremos.
É importante realçar que a média, mediana e a moda geralmente proporcionam

informações diferentes. Não existe uma regra clara e simples de qual medida se deve usar em
uma dada situação. O exemplo seguinte discute três situações e sugere qual medida central é
provavelmente mais adequada.
Exemplo 2.7 – Ilustra a seleção da medida de tendência central mais apropriada
Em cada caso abaixo se pede a melhor medida a ser adotada.
a) Um estudante faz quatro provas em uma disciplina de cálculo. Suas notas são 88, 75, 95 e
100. Que medida de tendência central é mais adequada de se usar?
b) Uma grande construtora publica os preços de venda de seus apartamentos disponíveis na

grande São Paulo. Qual medida de tendência central é mais apropriada para tais preços de
venda?
c) Em uma maratona existiam duas categorias de corredores, masculinos e femininos. A

tabela seguinte mostra a distribuição de freqüências para os dados. Qual medida de
tendência central deveria ser usada?
Sexo Freqüência
Masculino 4239
Feminino 864
13

lOMoARcPSD|32583331
Solução:
a) A média é provavelmente a medida mais razoável de se usar uma vez que ela leva em
conta todas as quatro notas obtidas e indica o desempenho global do aluno. Neste caso, a
média a ser reportada é igual a 89,5.
b) Neste caso a medida de tendência central mais apropriada é a mediana. Isto porque a
mediana representa o valor central e ela não é afetada por valores muito altos de uns
poucos apartamentos que poderiam estar entre os apartamentos oferecidos para venda.
Assim a mediana proporciona uma melhor indicação do valor “típico” de venda do que a
média ou a moda.
c) A única medida apropriada para estes dados é a moda, que neste caso é “masculino”.
Cada dado desse conjunto ou é masculino ou é feminino. Não existe maneira de se
calcular a média ou a mediana para tal tipo de dado. Em geral a moda é a única medida de
tendência central que pode ser usada para dados qualitativos.
1) Qual é o propósito de uma medida de tendência central?
Determine a média, mediana e a moda para cada conjunto de dados nos exercícios 2 a 4.
2) A Fundação Nacional para a Ciência dos EUA coleta dados sobre a idade dos estudantes
que obtiveram o título de doutor em ciências e engenharia. Os resultados são publicados
no Survey of Earned Doctorates. Uma amostra relativa ao ano de 1991 é composta dos
seguintes valores, dados em anos:
37 28 36 33
37 43 41 28
24 44 27 24
3) Um fabricante de sabão líquido produz uma garrafa com um conteúdo de 310 ml. Uma
amostragem de 16 garrafas produziu os seguintes resultados:
297 318 306 300

311 303 291 298
322 307 312 300
315 296 309 311
4) Uma bióloga está estudando o período de gestação (duração da gravidez) de cães

domésticos. Quinze fêmeas foram observadas durante o período de gestação encontrando-
se os seguintes valores, em dias:
62,0 61,4 59,8 62,2 60,3

60,4 59,4 60,2 60,4 60,8
61,8 59,2 61,1 60,4 60,9
14

lOMoARcPSD|32583331
2.3 – Notação de somatório
O símbolo de somatório é representado pela letra grega Σ , que corresponde à letra S

do nosso alfabeto. O símbolo de somatório serve para indicar de uma maneira resumida uma
soma de várias parcelas. Por exemplo, considere o conjunto formado pelos elementos 25, 23,
12, 9, 32, 38 e 15. A soma desses números seria indicada por:
S = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
Chamando de xi um valor genérico desse conjunto, onde i representa o i-ésimo

elemento do conjunto, a soma desses números seria indicada por:
S = x1 + x2 + x3 + x4 + x5 + x6 + x7 = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
Com o símbolo de somatório podemos escrever essa soma de uma maneira muito mais
resumida. Nós podemos usar Σx para indicar o total resultante da soma dos valores de x e a
expressão acima se torna:
7
Total = ∑ xi = x1 + x 2 + x3 + x 4 + x5 + x6 + x7
i =1
Ou simplesmente,
7
Total = ∑ xi
i =1
O resultado é
7
∑x
i =1
i = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
Com a notação de somatório, a definição de média pode ser expressa, mais

simplificadamente, como:
Soma dos dados
Média da amostra X=
∑x
n
Número de elementos da amostra
O exemplo a seguir ilustra o uso da notação de somatório para o calculo da média de um

conjunto de dados.
15

lOMoARcPSD|32583331
Exemplo 2.8 – Ilustra o cálculo da média
Um fabricante de linhas de pescar que produz linhas capazes de suportar 10 Kgf,

coletou uma amostra de 12 elementos para realizar testes de resistência. Os resultados são:
9,8 10,2 9,8 9,4

9,7 9,7 10,1 10,1
9,8 9,6 9,1 9,7
a) Calcule Σx.
b) Qual o valor de n?
c) Determine a média x .
Solução:
a) Σx = 9,8 + 10,2 + 9,8 + 9,4 + 9,7 + 9,7 + 10,1 + 10,1 + 9,8 + 9,6 + 9,1 + 9,7 = 117
b) n = 12
c) x = (117) / 12 = 9,75
2.4 – Medidas de dispersão
Até este ponto, as únicas medidas descritivas discutidas foram as medidas de

tendência central, ou seja, a média, a mediana e a moda. Estas medidas descritivas indicam
onde se encontra o centro ou o valor mais típico de um conjunto de dados.
Entretanto, dois conjuntos de dados podem ter a mesma média, a mesma mediana ou a
mesma moda e ainda serem bem diferentes em outros aspectos. Por exemplo, considere as
alturas dos cinco jogadores de dois times de basquete, como mostrado na figura 2.1. As duas
equipes tem a mesma média que é igual a 191 cm e a mesma mediana que é igual a 193 cm.
As modas dos dois conjuntos de alturas também são iguais (193 cm). Entretanto, é óbvio que
os dois conjuntos de dados são diferentes. Em particular, existe muito mais variação nas
alturas dos jogadores da equipe II do que nas alturas dos jogadores da equipe I. Para descrever
esta diferença quantitativamente, nós usamos uma medida de dispersão que indica quanto de
variação existe entre os dados de um conjunto.
Da mesma forma que existem diferentes medidas de tendência central, também

existem diversas medidas de dispersão. A seguir serão apresentadas as duas medidas de
dispersão mais utilizadas, a amplitude e o desvio padrão.
AMPLITUDE
A amplitude é fácil de entender e de calcular. Utilizando os dois conjuntos de dados

que mostram as alturas dos jogadores, nós podemos observar que o contraste entre os dois
times se torna aparente se colocarmos o jogador mais baixo de um time próximo do jogador
mais alto do mesmo time. Isto pode ser visto na figura 2.2.
16

lOMoARcPSD|32583331
A amplitude de um conjunto de dados é obtida computando a diferença entre o maior

e o menor valor entre os elementos do conjunto. Assim, podemos ver da figura 2.2 que:
Equipe I: Amplitude = 199 – 184 = 15 cm

Equipe II: Amplitude = 215 – 171 = 44 cm
17

lOMoARcPSD|32583331
Em geral, adotamos a seguinte definição:
Definição 2.6 – Amplitude de um conjunto de dados - A amplitude de um conjunto de

dados é definida como a diferença entre o maior valor e o menor valor pertencentes ao
conjunto.
Amplitude = Maior valor – Menor valor
A amplitude de um conjunto de dados é bastante fácil de calcular. Entretanto, ao

usarmos a amplitude, uma grande quantidade de informação é ignorada – somente o maior e o
menor valores são considerados, o restante dos dados é desprezado.
DESVIO PADRÃO DE UMA AMOSTRA
Em contraste com a amplitude, o desvio padrão leva em conta todos os valores de um

conjunto de dados. Por essa razão, o desvio padrão é preferível como uma medida de
dispersão.
De uma forma genérica, o desvio padrão mede a variação em um conjunto de dados

através da determinação do quanto, em média, cada valor está distante da média do conjunto.
Se existe uma larga variação nos dados, então, em média, os valores estarão longe da média e
o desvio padrão será grande. Por outro lado, se existe uma pequena variação nos dados, então,
em média, os valores estarão próximos da média do conjunto e, conseqüentemente, o desvio
padrão será menor.
Para computar o desvio padrão de um conjunto de dados nós precisamos saber se

estamos lidando com toda a população ou se estamos lidando somente com uma amostra de
uma população. A razão disso é que a fórmula usada para calcular o desvio padrão de uma
amostra é ligeiramente diferente da fórmula para usada para obter o desvio padrão de uma
população. Por enquanto, nós iremos mostrar o cálculo do desvio padrão de uma amostra.
Posteriormente, mostraremos o cálculo do desvio padrão para uma população.
O primeiro passo no cálculo do desvio padrão de uma amostra é determinar o quanto

cada valor está longe da média, isto é, os desvios dos valores com relação à média. Isto será
feito através do exemplo abaixo.
Exemplo 2.9 – Ilustra o cálculo dos desvios das medidas com relação à média
As alturas dos cinco jogadores da equipe I são: 184, 186, 193, 193 e 199 cm.
Determine os desvios desses valores com relação à média.
Solução:
A altura média dos jogadores da equipe I é:
−
∑ x = 184 + 186 + 193 + 193 + 199 = 191cm
x= n 5
18

lOMoARcPSD|32583331
Para obter o desvio de cada valor com relação à média, nós simplesmente calculamos a
diferença entre o valor e a média; isto é, nós computamos x – x. Por exemplo, o desvio com
relação à média da altura de 184 cm é 184 – 191 = -7. Os desvios com relação à média dos
cinco valores de altura estão dados na segunda coluna da tabela 2.6 e estão mostrados
graficamente na figura 2.3.
Tabela 2.6 – Desvios com relação à média.

Altura (cm) Desvio com relação à média
x x-x
184 -7
186 -5
193 2
193 2
199 8
-7 8
-5 2
x
184 186 191 193 199
Figura 2.3 – Desvios com relação à média
O segundo passo para computar o desvio padrão de uma amostra consiste em obter a
medida do desvio total com relação à média, para todos os valores do conjunto de dados.
Observe que a soma dos desvios com relação a media ( x – x ), é sempre igual a zero e, por
isso, não adianta somá-los para obter um desvio total.
No cálculo do desvio padrão, as diferenças ( x – x ) , são elevadas ao quadrado para

obter quantidades que quando somadas, resultem em valores diferentes de zero. A soma dos
quadrados dos desvios Σ( x – x )2 é uma medida do desvio total de todos os dados com
relação à média.
19

lOMoARcPSD|32583331
Exemplo 2.10 – Ilustra a soma dos quadrados dos desvios
Calcule a soma dos quadrados dos desvios para as alturas dos jogadores da equipe I.
Solução:
A tabela 2.7 foi obtida da tabela 2.6, adicionando-se a esta a coluna ( x – x )2 .
Tabela 2.7 – Cálculo da soma dos quadrados dos desvios

Altura Desvio com relação à média Quadrado do desvio
x (cm) x – x (cm) ( x – x )2 (cm2)

184 -7 49
186 -5 25
193 2 4
193 2 4
199 8 64
146
Da terceira coluna encontramos que:
Soma dos quadrados dos desvios = Σ ( x – x )2 = 146 cm2
O terceiro passo para calcular o desvio padrão de uma amostra é tomar a média dos
quadrados dos desvios. Isto é feito dividindo-se a soma dos quadrados dos desvios por n-1. O
valor resultante é denominado variância da amostra e é indicado por s2. Em símbolos:
s 2
=
∑ ( x − x) 2
n −1
Exemplo 2.11 – Ilustra o cálculo da variância de uma amostra
Calcule a variância da amostra das alturas de cinco jogadores da equipe I.
Solução:
Do exemplo 2.10, a soma dos quadrados dos desvios foi calculada como sendo igual a
146 cm2. Como n = 5 a variância da amostra das alturas será igual a
_
s 2
=
∑ ( x − x) 2
=
146
= 36,5cm 2
n −1 5 −1
Nota: Se em vez de dividirmos por n-1, nós dividíssemos por n, então a variância da amostra
seria a média dos quadrados dos desvios. Embora a divisão por n possa parecer mais natural,
nós dividimos por n-1 pela seguinte razão: Um dos principais usos da variância de uma
amostra é para estimar a variância da população (como veremos mais adiante). A divisão por
20

lOMoARcPSD|32583331
n tende a subestimar a variância da população enquanto que a divisão por n-1 tende a
produzir valores da variância da população mais corretos.
É importante entender que a variância de uma amostra é dada em unidades que são o
quadrado das unidades originais. Isto ocorre por elevarmos ao quadrado os desvios com
relação à média. Por exemplo, a variância da amostra das alturas de cinco jogadores da equipe
I é 36,5 cm2. Uma vez que é desejável ter medidas descritivas nas mesmas unidades que os
dados do conjunto, o passo final para calcular o desvio padrão de uma amostra é tomar a raiz
quadrada da variância da amostra. Em outras palavras, o desvio padrão de uma amostra, s, é
s=
∑ ( x − x) 2
n −1
Exemplo 2.12 – Ilustra o cálculo do desvio padrão de uma amostra
Calcule o desvio padrão da amostra das alturas de cinco jogadores da equipe I.
Solução:
Do exemplo 2.11, a variância da amostra foi calculada em 36,5 cm2. Assim, o desvio
padrão será:
s=
∑ ( x − x) 2 = 36,5 = 6,04cm
n −1
A definição abaixo resume o conceito de desvio padrão de uma amostra.
Definição 2.7 – O desvio padrão s de uma amostra é definido por
s=
∑ ( x − x) 2
n −1
onde n é o número de elementos da amostra.
Os passos necessários para calcular o desvio padrão de uma amostra foram detalhados
nos exemplos 2.8 - 2.11. Podemos resumir esses passos da seguinte maneira:
1. Calcule a média da amostra, x.

2. Construa uma tabela para determinar a soma dos quadrados dos desvios, Σ( x – x )2.
3. Aplique a definição 2.7 para obter o desvio padrão da amostra, s.
21

lOMoARcPSD|32583331
Exemplo 2.13 – Ilustra a definição 2.7
As alturas de cinco jogadores da equipe II são 171, 183, 193,193 e 215. Calcule o
desvio padrão desta amostra.
Solução:
Aplicando o procedimento descrito acima, devemos inicialmente calcular a média das
cinco medidas.
−
x=
∑ x = 171 + 183 + 193 + 193 + 215 = 191 cm
n 5
Agora, nós construímos uma tabela para calcular a soma dos quadrados dos desvios.
x x-x ( x – x )2
171 -20 400
183 -8 64
193 2 4
193 2 4
215 24 576
_ 2
∑ (x - x ) = 0  _
∑  x - x  = 1048
Da 3ª coluna da tabela, vemos que a soma dos quadrados dos desvios é
Σ( x – x )2 = 1048 cm2.
Finalmente, aplicando a definição 2.7 teremos
s=
∑ ( x − x) 2
=
1048
= 16,18cm
n −1 5 −1
No exemplo 2.11 nós encontramos que o desvio padrão das alturas de cinco jogadores
da equipe I é s = 6,04 cm. No exemplo 2.12 encontramos que o desvio padrão das alturas de
cinco jogadores da equipe II é s = 16,18 cm. Conseqüentemente, vemos que a equipe II, que
tem uma variação maior nas alturas dos jogadores do que a equipe I, também tem um desvio
padrão maior. Isto mostra que quanto maior for a variação entre os dados de um conjunto de
valores, maior será o desvio padrão do conjunto de dados.
22

lOMoARcPSD|32583331
Fórmula simplificada para s
O cálculo do desvio padrão s, de acordo com a fórmula da definição, requer que

primeiro calculemos a média x dos valores do conjunto para, em seguida, calcularmos os
desvios com relação à média ( x – x ). Existe, entretanto, uma fórmula mais simples para o
cálculo do desvio padrão s. Esta fórmula que chamaremos de fórmula simplificada, é dada a
seguir.
n(∑ x 2 ) − (∑ x )
2
s=
n(n − 1)
A fórmula simplificada é equivalente à fórmula da definição, isto é, ambas dão o

mesmo resultado. Entretanto, a fórmula simplificada é mais fácil de ser aplicada e, como se
pode notar, ela não requer que calculemos a média inicialmente.
Exemplo 2.14 – Ilustra a fórmula simplificada
No exemplo 2.12 computamos o desvio padrão das alturas dos jogadores da equipe II
e encontramos o valor 16,18 cm. Calcule novamente o desvio padrão das alturas utilizando a
fórmula simplificada.
Solução:
Para aplicar a fórmula simplificada, precisamos das somas ∑x e ∑x2 . Podemos
determinar esses valores com o auxílio da tabela abaixo.
x x2
171 29241
183 33489
193 37249
193 37249
215 46225
∑ x = 955 ∑ x = 183453
2
Neste exemplo temos n = 5 e, da última linha da tabela acima, vemos que ∑x = 955 e
∑x = 183453. Assim, pela fórmula simplificada obtemos:
2
n(∑ x 2 ) − (∑ x )
2
5(183453) − (955) 2
s= = = 16,18cm
n(n − 1) 5(5 − 1)
Como podemos ver, os resultados obtidos pelas duas fórmulas são iguais, como era de
se esperar. Pequenas diferenças nas casas decimais podem ser esperadas e são devidas a erros
de arredondamento.
23

lOMoARcPSD|32583331
1) Qual o uso de uma medida de dispersão?
2) Porque se prefere o desvio padrão em vez da amplitude como medida de dispersão?
Os enunciados dos exercícios 3 a 5 a seguir correspondem aos enunciados dos exercícios

2 a 4 da seqüência 2.2 de exercícios (página 14). Para cada um deles
a) Determine a amplitude.
b) Compute o desvio padrão, s, usando a fórmula da definição.
c) Compute o desvio padrão, s, usando a fórmula simplificada.
d) Diga, em cada exercício, qual fórmula é mais fácil de aplicar para o cálculo de s.
3) A Fundação Nacional para a Ciência dos EUA coleta dados sobre a idade dos estudantes
que obtiveram o título de doutor em ciências e engenharia. Os resultados são publicados
no Survey of Earned Doctorates. Uma amostra relativa ao ano de 1991 é composta dos
seguintes valores, em anos:
37 28 36 33
37 43 41 28
24 44 27 24
4) Um fabricante de sabão líquido produz uma garrafa com um conteúdo de 310 ml. Uma
amostragem de 16 garrafas produziu os seguintes resultados, em ml:
297 318 306 300

311 303 291 298
322 307 312 300
315 296 309 311
5) Uma bióloga está estudando o período de gestação(duração da gravidez) de cães

domésticos. Quinze fêmeas foram observadas durante o período de gestação encontrando-
se os seguintes valores, em dias:
62,0 61,4 59,8 62,2 60,3

60,4 59,4 60,2 60,4 60,8
61,8 59,2 61,1 60,4 60,9
6) Um laboratório de pesquisa testou a vida de duas marcas de lâmpadas existentes no

mercado. A vida de uma lâmpada é definida como o número de horas que a lâmpada
permanece acesa, continuamente, até se queimar. Os resultados de sete lâmpadas são
mostrados na tabela abaixo( dados em centenas de horas).
a) Calcule a média para cada conjunto de dados.

b) Determine a mediana de cada conjunto de dados.
24

lOMoARcPSD|32583331
c) Embora os dois conjuntos de dados tenham a mesma média e mesma mediana, eles
são bastante diferentes em outro aspecto. No que ou como eles são deferentes?
d) Qual conjunto de dados parece ter menor variação?
e) Calcule s para cada conjunto de dados.
f) Suas respostas em parte (d) e (e) são consistentes? Porque?
Marca A Marca B
10,5 11,3
9,1 7,0
10,0 9,7
10,3 9,6
9,4 10,5
9,6 11,8
9,7 8,7
25

lOMoARcPSD|32583331
2.5 - Agrupamento de dados
Dados coletados em experimentos reais podem ser difíceis de interpretar e de se obter

informações úteis. Através de uma organização adequada dos dados, é geralmente possível
tornar um conjunto complicado de dados mais fácil de ser entendido. Um dos métodos mais
utilizado para organizar dados é o método do agrupamento. Nesta seção mostraremos como
aplicá-lo com o auxílio de um exemplo.
Exemplo 2.15 – Ilustra agrupamento de dados
Os dados da tabela 2.8 representam as médias finais obtidas por alunos cursando uma
disciplina de Probabilidade e Estatística de uma faculdade.
Tabela 2.8 – Médias de 40 alunos em uma disciplina.

7,0 6,4 9,9 5,5 6,4 8,9 8,7 6,5
6,2 3,8 6,7 7,0 6,0 6,9 7,8 3,9
7,5 5,6 7,1 5,1 9,9 6,8 9,5 8,6
5,7 5,3 4,7 5,0 5,5 8,1 8,0 9,8
5,1 3,6 6,3 6,6 8,5 7,9 8,3 7,0
Observando o conjunto de dados acima pode-se perceber que pouca informação pode
ser obtida. É difícil ter uma visão clara de como a turma se comportou nessa disciplina.
Agrupando-se os dados em classes podemos tornar este conjunto de dados mais fácil de ser
interpretado.
O primeiro passo é decidir quantas classes iremos adotar. Como o menor valor é (3,6)
e o maior valor é (9,9), podemos adotar as classes 3,0 – 3,9; 4,0 – 4,9; 5,0 – 5,9; ... ; 9,0 – 9,9.
Essas classes podem ser vistas na primeira coluna da tabela 2.9.
O segundo (e último) passo para o agrupamento dos dados é determinar o número de

notas caindo dentro de cada intervalo ou classe. Tomando-se cada nota da tabela 2.8
verificamos a qual classe ela pertence e fazemos uma marca (barra vertical) na segunda
coluna da tabela 2.9. Por exemplo, a primeira nota da tabela é 7,0 e, portanto, ela pertence à
classe 7,0 – 7,9. Devemos, então, colocar uma pequena barra vertical na segunda coluna.
Repetindo esse procedimento para cada valor da tabela, vamos obter as marcas mostradas na
segunda coluna da tabela 2.9. Finalmente, contamos o número de barras em cada classe e
escrevemos esse número na terceira coluna.
Agora, basta dar uma olhada na tabela 2.9 para obtermos várias informações úteis. Por
exemplo, podemos ver que a nota mais comum está na classe 6,0 – 6,9. Comparando-se as
tabelas 2.8 e 2.9 vemos que a última nos dá muito mais informações.
26

lOMoARcPSD|32583331
Tabela 2.9 – Dados agrupados

Notas Marcas Número de Notas
3,0 – 3,9 III 3
4,0 – 4,9 I 1
5,0 – 5,9 IIIII III 8
6,0 – 6,9 IIIII IIIII 10
7,0 – 7,9 IIIII II 7
8,0 – 8,9 IIIII II 7
9,0 – 9,0 IIII 4
40
Construção da tabela de distribuição de freqüências
A construção da tabela de distribuição de freqüências exige a definição do número de

classes e da amplitude de cada classe.A escolha do número de classes é na maioria das vezes
arbitrária. Em alguns casos o pesquisador tem uma idéia precisa ou um critério de como
dividir um conjunto de dados em um número de classes. O exemplo acima mostrou que
tomando-se classes com amplitude igual a 1 temos uma boa informação sobre o conjunto de
dados. As fórmulas abaixo permitem obter o número de classes quando o pesquisador não tem
uma idéia definida sobre qual deve ser esse número.
25 ≤ N ≤ 400 → k= N
16 ≤ N ≤ 572 → k = 1 + 3,3 log N
20 ≤ N ≤ 36 → k = −1 + 2 ln N
Outras orientações podem ser dadas de modo a facilitar a construção da tabela de

dados agrupados. As três orientações mais importantes são:
1. O número de classes deve ser entre 5 e 20.
2. Cada dado deve pertencer a uma, e somente uma, classe.
3. Quando possível todas as classes devem ter a mesma amplitude.
Distribuição de freqüências e de freqüências relativas
O número de dados que caem em uma classe particular é denominado freqüência da

classe. Por exemplo, da tabela 2.9 vemos que a freqüência da classe 8,0 – 8,9 é sete uma vez
que existem sete valores entre 8,0 e 8,9. Uma tabela mostrando todas as classes e suas
respectivas freqüências é denominada distribuição de freqüência.
Além da freqüência de uma classe, é também importante determinarmos a

porcentagem de cada classe. Para determinar a porcentagem basta dividir a freqüência de cada
classe pelo número total de dados. Tomando-se a tabela 2.9, podemos ver que a porcentagem
de notas na classe 6,0 – 6,9 é:
Freqüência da
classe 6,0 – 6,9
Número total 10
de dados = 0,25 ou 25%
40
27

lOMoARcPSD|32583331
Em outras palavras, 25% das notas estão entre 6,0 e 6,9, inclusive. A porcentagem de
uma classe, expressa como um número decimal, é chamada freqüência relativa da classe. A
classe 6,0 – 6,9 tem freqüência relativa igual a 0,25. Uma tabela listando todas as classes e
suas respectivas freqüências relativas é chamada distribuição de freqüência relativa. A
tabela 2.10 abaixo mostra a distribuição de freqüência relativa para os dados correspondentes
às notas dos alunos. Note que a soma das freqüências relativas é igual a 1.
Tabela 2.10 – Distribuição de freqüência relativa das notas.

Notas Freqüência relativa
3,0 – 3,9 0,075 ← 3/40
4,0 – 4,9 0,025 ← 1/40
5,0 – 5,9 0,200 ← 8/40
6,0 – 6,9 0,250 ← 10/40
7,0 – 7,9 0,175 ← 7/40
8,0 – 8,9 0,175 ← 7/40
9,0 – 9,0 0,100 ← 4/40
1,000
Terminologia
Existem diversos termos associados com agrupamento de dados. Considere, por
exemplo, a classe 6,0 – 6,9. O menor valor 6,0 é denominado limite inferior da classe e o
maior valor 6,9 é denominado limite superior da classe. O valor médio da classe 6,0 – 6,9 é
denominado ponto médio da classe ou simplesmente ponto médio e é determinado por (6,0
+ 6,9)/2 = 6,45. Finalmente, a diferença entre o limite inferior de uma classe e o limite
inferior da classe seguinte é denominada amplitude da classe. A amplitude das classes é o
quociente entre a amplitude total e o número de classes.
Uma tabela dando as classes, freqüências, freqüências relativas e pontos médios é

chamada tabela de dados agrupados. Uma tabela de dados agrupados, para os dados
relativos às notas, é apresentada abaixo.
Tabela 2.11 – Tabela de dados agrupados para as notas.

Notas Freqüência Freqüência Relativa Ponto Médio
3,0 – 3,9 3 0,075 3,45
4,0 – 4,9 1 0,025 4,45
5,0 – 5,9 8 0,200 5,45
6,0 – 6,9 10 0,250 6,45
7,0 – 7,9 7 0,175 7,45
8,0 – 8,9 7 0,175 8,45
9,0 – 9,0 4 0,100 9,45
40 1,000
Exemplo 2.16 – Ilustra tabela de dados agrupados
A tabela 2.12 é o resultado de testes de níveis de colesterol em 20 pacientes jovens. O

nível de colesterol é dado em miligramas por mililitro. Construa uma tabela de dados
agrupados usando classes com amplitude igual a 5 e iniciando em 195.
28

lOMoARcPSD|32583331
Tabela 2.12 – Níveis de colesterol em pacientes.

210 209 212 208
217 207 210 203
208 210 210 199
215 221 213 218
202 218 200 214
Solução:
Como a amplitude de cada classe foi definida como sendo igual a 5 e, a primeira classe
deve iniciar em 195, então teremos as classes 195 – 199, 200 –204, etc.. A tabela 2.13 mostra
cada classe e sua freqüência.
Tabela 2.13 – Classes e freqüências

Nível de colesterol Marcas Freqüência
195 – 199 I 1
200 – 204 III 3
205 – 209 IIII 4
210 –214 IIIII II 7
215 –219 IIII 4
220 – 224 I 1
20
A tabela de dados agrupados pode ser facilmente obtida a partir da tabela 2.13.
Tabela 2.14 - Tabela de dados agrupados para os níveis de colesterol.

Nível de Freqüência Freqüência Ponto Médio
colesterol Relativa
195 – 199 1 0,05 197
200 – 204 3 0,15 202
205 – 209 4 0,20 207
210 –214 7 0,35 212
215 –219 4 0,20 217
220 – 224 1 0,05 222
20 1,00
Para ilustrar os cálculos típicos efetuados para a determinação dos valores da terceira e
quarta colunas, considere a classe 205 – 209. A freqüência relativa e o ponto médio são
Freqüência relativa = 4/20 = 0,20 e Ponto médio = (205 + 209)/2 = 207
Exemplo 2.17 – Ilustra agrupamento com classe pontual
Um pesquisador está coletando dados do número de crianças em idade escolar por

família, em uma pequena cidade. Trinta famílias foram selecionadas aleatoriamente. A tabela
2.15 resume os dados coletados.
29

lOMoARcPSD|32583331
Tabela 2.15 – Número de crianças em idade escolar por família.
0 3 0 0 3 0
2 2 0 1 2 1
0 0 1 2 4 0
4 2 1 0 1 0
0 2 0 1 3 2
a) Agrupar estes dados usando classes representadas por um único valor.

b) Identificar os limites de classe e os pontos de classe.
c) Construir a tabela de dados agrupados.
Solução:
a) Como cada classe será representada por um único valor, então as classes serão 0, 1, 2, 3 e
4. A tabela 2.16 mostra as freqüências e freqüências relativas para este exemplo.
Tabela 2.16 – Tabela de freqüências

Número de crianças Freqüência Freqüência relativa
em idade escolar
0 12 0,400
1 6 0,200
2 7 0,233
3 3 0,100
4 2 0,067
30 1,000
b) Da tabela podemos ver que para a classe “3”, por exemplo, teremos:
Limite inferior = 3 (menor valor na classe)

Limite superior = 3 (maior valor na classe)
e
Ponto de classe = (3 +3)/2 = 3
Assim, para a classe “3”, o limite superior, o limite inferior e o ponto médio ou ponto
de classe são todos iguais ao valor da classe, isto é, 3. Resultado similar ocorre para as
outras classes.
c) Finalmente, para construir a tabela de dados agrupados devemos adicionar uma quarta
coluna com os pontos de classe. Como eles são iguais aos valores das classes, esta quarta
coluna será idêntica à primeira coluna da tabela 2.16. Podemos então dizer que a tabela
2.16 serve como tabela de dados agrupados.
Outra maneira de agrupar dados
Quando lidamos com dados reais (contínuos) ou dados decimais é freqüentemente

conveniente definirmos classes que vão de um valor até outro valor mas não inclua este
último. Assim, por exemplo, se definimos uma classe A-B e uma classe B-C, então a classe
30

lOMoARcPSD|32583331
A-B conteria valores maiores ou iguais a A porém menores que B. A classe B-C conteria
valores maiores ou iguais a B e menores que C, e assim por diante. O exemplo a seguir
detalha este caso.
Exemplo 2.18 – Ilustra outra maneira de agrupar dados
Considere os dados da tabela 2.17 que ilustra o peso de 20 pessoas do sexo masculino
com idades entre 18 e 24 anos.
Tabela 2.17 – Peso de 20 homens com idade 18 a 24 anos

62,5 75,4 79,3 58,7 79,4
73,0 87,0 71,4 74,2 77,3
81,5 71,3 64,0 67,2 83.0
89,1 66,8 70,8 74,2 73,7
67,9 73,9 78,6 84,5 69,0
Como o menor valor é próximo de 55 e o maior valor é aproximadamente 90,

podemos agrupar os dados em classes de amplitude 5. A tabela 2.18 resume os dados na
forma de uma tabela agrupada.
Tabela 2.18 – Tabela agrupada para os dados de pesos de vinte homens.

Pesos Freqüência Freqüência relativa Ponto de classe
55 até < 60 1 0,04 55,7
60 até < 65 2 0,08 62,5
65 até < 70 4 0,16 67,5
70 até < 75 8 0,32 72,5
75 até < 80 5 0,20 77,5
80 até < 85 3 0,12 82,5
85 até < 90 2 0,08 87,5
25 1,00
Observe que em cada classe nós incluímos o limite inferior e excluímos o limite
superior. Assim, um dado com valor igual a 70 seria incluído na classe 70 – 75.
31

lOMoARcPSD|32583331
Capítulo 3
Gráficos
No capítulo anterior apresentamos alguns conceitos de estatística descritiva.

Especificamente, vimos como obter informações de um conjunto de medidas ou dados
através do cálculo de medidas de tendência central (média, mediana e moda) e de
medidas de dispersão (amplitude, variância e desvio padrão). Neste capítulo serão
discutidos outros modos de apresentação de dados envolvendo gráficos. A apresentação
de dados na forma de gráficos é largamente utilizado por revistas, jornais e outras
publicações. Ao término deste capítulo você será capaz de:
1. Construir gráficos do tipo:

barra
linha
histograma
torta
Pontos (dotplot)
Ramo e Folhas (stem-and-leaf)
Caixa (boxplot)
2. Discutir como um gráfico pode ser enganoso
33

lOMoARcPSD|32583331
3.1 - Gráfico de Barra
Gráficos são usados para apresentar dados e transmitir idéias de uma forma clara e
simples. Um gráfico é um método visual que pode nos ajudar a esclarecer idéias e mostrar
aspectos que possam estar escondidos em um monte de dados. Um dos tipos mais simples de
gráficos é o gráfico de barra. A tabela 3.1 mostra a porcentagem de eleitores, que votaram na
eleição presidencial americana, em 1980, segundo várias faixas de idade.
Tabela 3.1 – Porcentagem de eleitores.
Faixa de idade Porcentagem

18 – 20 36
21 - 24 43
25 –34 55
35 – 44 65
45 – 64 69
> 64 65
Usando a informação dada na tabela podemos construir o gráfico de barras mostrado

na figura 3.1. Pode-se observar que as faixas de idade estão no eixo horizontal e a
porcentagem é mostrada no eixo vertical.
80
Porcentagem
60
40
20
0
18 – 20 21 - 24 25 –34 35 – 44 45 – 64 > 64
Faixas de idade
Porcentagem
Figura 3.1 – Gráfico de barras mostrando a porcentagem de eleitores, em várias faixas de

idade, que votaram na eleição presidencial americana de 1980.
As principais características dos gráficos de barra são:
1. O eixo horizontal (eixo x) contém categorias tais como faixas de idade, anos, meses,
masculino, feminino, branco, preto e assim por diante.
2. Alguma medida quantitativa associada com uma dada categoria é representada pela
altura da barra.
3. As larguras de todas as barras são iguais.
34

lOMoARcPSD|32583331
4. As barras podem ser horizontais ou verticais e podem ser separadas ou serem

justapostas.
Exemplo 3.1 – Ilustra gráfico de barras
Nos anos 70, o índice de mortalidade infantil nos EUA era como mostrado abaixo na
tabela 3.2. Construa um gráfico de barras para estes dados.
Tabela 3.2 – Mortalidade infantil nos Estados Unidos (idade < 1 ano)
Ano Índice (mortes/1000)
Brancos Negros
1970 17,8 30,9
1971 17,1 28,5
1972 16,4 27,7
1973 15,8 26,2
1974 14,8 24,9
1975 14,2 24,2
1976 13,3 23,5
1977 12,3 21,7
1978 12,0 21,1
1979 11,4 19,8
Fonte: U.S. Department of Health and Human Services, Vital Statistics
of the United States (1979).
Solução:
O gráfico de barras é mostrado na figura 3.2. Ele permite observar que o índice de
mortalidade infantil dos negros diminuiu ao longo da década de 70, porém sempre se manteve
acima do índice de mortalidade dos brancos.
35,0
Mortes por 1000
30,0
25,0
20,0
15,0
10,0
5,0
0,0
70
71
72
73
74
75
76
77
78
79
19
19
19
19
19
19
19
19
19
19
Ano
Brancos Negros
Figura 3.2 – Gráfico de barra de mortalidade infantil.
35

lOMoARcPSD|32583331
3.2 – Gráfico de Pizza
O gráfico de pizza ou gráfico de círculo pode ser usado para mostrar a participação
de cada item com relação ao todo. A participação de cada item é dada como uma porcentagem
do todo. Para construir um gráfico de pizza, pense em um círculo como estando dividido em
360 partes iguais, formando ângulos centrais de 1 grau. Com isso, podemos facilmente dividir
o círculo, em pedaços de tamanho apropriado, multiplicando a porcentagem que representa
uma dada categoria por 360. Em outras palavras, 360 multiplicado por x% produz o número
de graus do ângulo central que define a porção do círculo (setor circular) a ser assinalada a
uma dada categoria.
Exemplo 3.2 – Ilustra a construção de um gráfico de pizza
Considere a tabela 3.3 que detalha os custos para sustentar um filho até os 17 anos.
Construa um gráfico de Pizza com os dados fornecidos.
Tabela 3.3 – Subdivisão dos custos

Item Custo (US$-1985) Porcentagem do total
Moradia 32200 22,6
Alimentação 32600 22,8
Transporte 32500 25,6
Vestuário 8900 6,2
Saúde 8500 6,0
Recreação 15000 10,5
Outros 9000 6,3
142700
Solução:
O gráfico é mostrado na figura 3.3.
Figura 3.3 – Gráfico de círculo (pizza) dos custos de criação até os 17 anos.
36

lOMoARcPSD|32583331
Visualmente fica fácil observar que moradia, transporte e alimentação são os itens de
maior peso no valor total gasto. O cálculo do número de graus do setor circular que irá
representar a porcentagem correspondente à alimentação (22,8%) é dado por:
360 x 0,228 = 82,08 graus
Desta maneira, um ângulo de 82 graus, aproximadamente, define a parte do círculo

que representa o custo com alimentação.
3.3 – Gráfico de Linha
Os gráficos de linha são especialmente úteis para mostrar tendências em um

determinado período de tempo. Neste caso, no eixo horizontal x colocamos uma escala de
tempo e no eixo vertical y colocamos as medições, isto é, os valores coletados.
Exemplo 3.3 – Ilustra a construção de um gráfico de linha
Usando os dados da tabela 3.2, traçar o gráfico de linha correspondente.
Solução:
O gráfico é mostrado na figura 3.4. A linha mais espessa corresponde aos valores da
segunda coluna (Brancos).
35
30
Mortes por 1000
25
20 Brancos
15 Negros
10
5
0
70
72
74
76
78
19
19
19
19
19
Ano
Figura 3.4 – Gráfico de linha dupla.
Novamente, o gráfico permite concluir que houve uma clara diminuição dos índices de
mortalidade ao longo da década de 70.
37

lOMoARcPSD|32583331
3.4 – Histogramas
Uma representação gráfica de uma distribuição de freqüência pode ser obtida através
da construção de um histograma. Um histograma é uma forma especial de gráfico de barra
no qual os intervalos das classes são representados pelas larguras das barras e as freqüências
dos dados que caem nas classes são representadas pela área das barras.
Para construir um histograma, primeiro desenhe uma linha horizontal que irá
representar o eixo das medições (dados) e marque os limites das classes adjacentes neste eixo.
Em seguida, acima de cada classe, desenhe um retângulo cuja área seja proporcional à
freqüência daquele intervalo. Assim se o intervalo i contém o dobro de observações do
intervalo j, então o retângulo acima do intervalo i deve ter uma área que seja o dobro da área
do retângulo acima do intervalo j. A tabela 2.13 do capítulo dois é uma tabela de freqüências
para os níveis de colesterol de vinte pacientes jovens. Para facilitar, esta tabela é aqui repetida
e identificada como tabela 3.4. O histograma para os dados dessa tabela pode ser visto na
figura 3.5.
Tabela 3.4 - Tabela de dados agrupados para os níveis de colesterol.
Nível de Freqüência Freqüência Ponto de Classe

colesterol Relativa
195 – 199 1 0,05 197
200 – 204 3 0,15 202
205 – 209 4 0,20 207
210 –214 7 0,35 212
215 –219 4 0,20 217
220 – 224 1 0,05 222
20 1,00
5
Freqüência
194,5 199,5 204,5 209,5 214,5 219,5 224,5
Nível de Colesterol
Figura 3.5 – Histograma para os dados da tabela 3.4.
38

lOMoARcPSD|32583331
Um histograma é mais fácil de ser construído se as classes possuírem mesma

amplitude. Neste caso, basta construir retângulos cujas alturas sejam proporcionais às
freqüências. É também mais fácil olhar para dois retângulos com bases de mesmo tamanho e
julgar que um é duas vezes mais alto do que o outro do que comparar as áreas de dois
retângulos que tem bases e alturas diferentes.
O eixo vertical no histograma acima poderia conter os valores das freqüências

relativas em vez das freqüências. Outra possibilidade é fazer a área de cada retângulo igual ao
valor da freqüência relativa. Com isso a soma das áreas seria igual a 1. Isso é feito fixando-se
o valor da base (amplitude do intervalo) e calculando-se a altura do retângulo pela divisão
(freqüência relativa)/(base).
3.5 – Disposição Ramo e Folhas (Stem-and-Leaf Display)
Assuma que um conjunto de dados contenha n elementos x1, x2, ..., xn, onde cada dado
consiste de pelo menos dois dígitos. Uma maneira simples de obter uma informação visual
dos dados é fazer uma disposição dos mesmos em uma forma denominada ramo e folhas. Para
isso divida cada dado xi em duas componentes: um ramo, constituído por um ou mais dígitos
iniciais do dado e, uma folha, constituída dos dígitos restantes. Em geral, para um conjunto de
dados típico, o número de troncos é pequeno, algo entre 6 e 20 é usualmente adequado.
Uma vez que os troncos tenham sido definidos, eles devem ser colocados segundo
uma ordem crescente de valores na forma de uma coluna do lado esquerdo da página. Ao lado
de cada tronco todas as folhas correspondentes aos valores dos dados são dispostas à direita
do tronco na ordem em que os dados aparecem no conjunto. O exemplo a seguir ilustra este
tipo de disposição de dados.
Exemplo 3.4 – Ilustra a construção de uma disposição ramo e folhas
Uma pesquisa sobre consumo de gasolina de carros de tamanho médio coletou os

seguintes valores, em km/l:
8,5 12,4 10,0 9,7 10,4 6,7 7,5

13,2 11,1 8,9 10,8 11,5 18,2 12,0
13,8 11,2 16,6 8,8 9,3 13,3 10,7
11,6 15,8 12,3 9,2 14,2 14,5 10,9
Coloque esses dados segundo uma disposição tronco e folhas.
Solução:
Como o menor valor presente entre os dados é 7,5 e o maior valor é 16,6, podemos
fazer uma escolha dos troncos como sendo 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, dando um total
de 10 troncos. A disposição fica como mostrada abaixo.
39

lOMoARcPSD|32583331
6 ,7
7 ,5
8 ,5; ,9; ,8
9 ,7; ,3; ,2
10 ,0; ,4; ,8; ,7; ,9
11 ,1; ,5; ,2; ,6
12 ,4; ,0; ,3
13 ,2; ,8; ,3
14 ,2; ,5
15 ,8
16 ,6
17
18 ,2
Pela disposição fica fácil observar que a maior parte das taxas de consumo se
encontram entre 8 e 13 km/l e que os valores se distribuem com uma forma de sino em torno
dos valores 10 e 11, isto é, pode-se observar que o valor médio é algo entre 10 e 11 km/l.
Este exemplo mostra que esta disposição dos dados nos auxilia a extrair alguns
aspectos importantes do conjunto de dados sob análise. A vantagem sobre um histograma é
que não perdemos informações sobre os valores.
3.6 – Diagrama de Pontos (dotplot)
Este tipo de diagrama é bastante simples e consiste em marcar a posição de cada dado
em um eixo horizontal com uma escala adequada para representar todos os valores do
conjunto de dados. O exemplo abaixo ilustra este tipo de diagrama.
Exemplo 3.4 – Ilustra a construção de um diagrama de pontos
Em um determinado mês, uma concessionária de energia elétrica registrou 11 quedas

de energia, em uma determinada região, com as seguintes durações em horas:
1,0 3,0 1,5 1,0 10,0 1,5
2,0 1,5 1,0 2,5 2,0 1,5
Construa um diagrama de pontos com esses valores.
Solução:
O diagrama está mostrado na figura 3.6. Os valores repetidos são colocados alinhados
em uma coluna acima do eixo.
40

lOMoARcPSD|32583331
Figura 3.6 – Diagrama de pontos para os tempos de duração das quedas de energia.
No diagrama nota-se que a maioria dos pontos estão situados entre 1 e 2 horas. O valor
excessivamente alto de 10 h aparece isolado no gráfico, mostrando que algo excepcional deve
ter ocorrido.
1) Um artigo no Environmental Concentration and Toxicology (“Trace Metals in Sea

Scallops”, vol.19) relatou a quantidade de Cádmio em conchas do mar observadas em
diferentes locais em águas do Atlântico Norte. Os valores coletados são:
5,1 14,4 14,7 10,8 6,5 5,7 7,7 14,1

3,7 8,9 7,9 7,9 4,5 10,1 5,0 9,6
5,1 11,4 8,0 12,1 7,5 8,5 13,1 6,4
27,0 18,9 10,8 13,1 8,4 16,9 2,7 9,6
12,4 5,5 12,7 17,1 9,5 5,5 18,0 4,5
a) Construa uma tabela de freqüência para o conjunto de dados acima adotando o

intervalo 0,0 – 4,0 como o primeiro intervalo.
b) Construa um histograma correspondente à distribuição de freqüência determinada em
(a) de modo que a área seja igual à freqüência relativa.
2) Um levantamento dos salários dos empregados de uma empresa resultou nos seguintes
valores em reais (a parte decimal foi omitida):
405 371 621 190 268 380 319 570

443 370 508 426 288 490 344 235
a) Determine a média e o desvio padrão dos dados.

b) Construa um diagrama ramo-e-folhas (stem-and-leaf display)
c) Construa um diagrama de caixa (boxplot)
Nota: Utilize um software de Estatística.
41

lOMoARcPSD|32583331
Capítulo 4
Probabilidades
O assunto desenvolvido neste capítulo é fundamental para o entendimento dos assuntos

tratados nos próximos capítulos. Além disso, os conceitos aqui apresentados têm
aplicações em várias outras áreas. Após o término deste capítulo, você deverá ser capaz
de:
1. Aplicar a definição clássica de probabilidade.

2. Computar probabilidades usando as regras da adição e produto.
3. Realizar cálculos que envolvam probabilidade condicional.
4. Entender e calcular probabilidades associadas a eventos independentes.
43

lOMoARcPSD|32583331
• 4.1 – Técnicas de contagem
Freqüentemente necessitamos determinar o número de maneiras de ocorrer um

determinado evento. Por exemplo, podemos estar interessados em saber o número de
resultados possíveis em um jogo de loteria, ou o número de placas de automóvel que podem
ser formadas com três letras do alfabeto e quatro dígitos. Em alguns casos é possível listar
todas as possibilidades e, então, contar quantas elas são. Em outros casos, o número de
possibilidades é tão grande que se torna impraticável listar todas elas. Neste caso, devemos
dispor de conceitos e fórmulas que permitam determinar o número de maneiras do evento
ocorrer e que independam de uma listagem direta das possibilidades. Esses conceitos e
fórmulas estão reunidos dentro de uma teoria que denominamos Análise Combinatória ou
Técnicas de Contagem.
4.1.1 – Princípio multiplicativo
O princípio multiplicativo, também denominado princípio fundamental da contagem,

pode ser melhor entendido através de um exemplo.
Exemplo 4.1 – Introduz o princípio multiplicativo
Uma pessoa possui quatro camisas e três calças. De quantas maneiras diferentes ele
pode se vestir escolhendo uma camisa e uma calça por vez?
Solução:
Para solucionar esse problema usaremos primeiramente uma ferramenta denominada
diagrama em árvore, que permite obter uma listagem direta de todas as possibilidades. A
figura 4.1 ilustra o diagrama em árvore para este exemplo. Podemos notar que neste caso
temos apenas dois níveis, sendo que no primeiro nível temos quatro ramos, correspondendo às
quatro possibilidades de escolha de uma camisa e, para cada ramo do primeiro nível temos
três ramos no segundo nível, correspondendo às três possibilidades de escolha de uma calça.
O total de maneiras de uma pessoa se vestir pode ser obtido contando-se o número de ramos
no fim da árvore. Podemos ver que existem 12 maneiras diferentes de uma pessoa se vestir.
Embora o método do diagrama em árvore para determinar o número total de

possibilidades seja uma listagem direta, ele nos proporciona uma indicação de como obter o
número de possibilidades sem a necessidade de uma listagem extensiva. Especificamente,
existem quatro possibilidades para camisas, definidas pelos quatro ramos que emanam do
ponto inicial da árvore e, para cada uma delas, existem três possibilidades de escolha de
uma calça, indicadas pelos três ramos emanando de cada extremidade dos ramos anteriores.
Consequentemente, existem 12 possibilidades.
3 + 3 + 3 + 3 = 4 x 3 = 12
Assim podemos ver que o número total de possibilidades pode ser obtido
multiplicando-se o número de possibilidades de se escolher uma camisa pelo número de
possibilidades de se escolher uma calça.
44

lOMoARcPSD|32583331
Camisas Calças Possibilidades

1 11
1
2 12
3 13
2 1 21
2 22
3 23
3 1 31
2 32
3 33
1 41
4
2 42
3 43
Figura 4.1 – Diagrama em árvore para escolha da roupa.
Essa regra pode ser generalizada dando origem ao princípio multiplicativo.
Princípio Multiplicativo - Se n ações (escolhas, experimentos, eventos) devem ser

realizadas em seqüência e em determinada ordem e, se existirem m1 possibilidades para a
primeira ação, e para cada uma dessas possibilidades existirem m2 possibilidades para a
segunda ação e, para cada uma dessas possibilidades existirem m3 possibilidades para a
terceira ação, e assim por diante, então existirão
m1 x m2 x m3 x...x mn
possibilidades no total para as n ações.
Exemplo 4.2: Ilustra o princípio multiplicativo
Uma placa de carro é formada com três letras ( de A a Z, incluindo K, Y e W)

seguidas de quatro dígitos(0 a 9).
a) Quantas placas diferentes são possíveis formar?
b) Quantas placas podemos montar se não for permitida a repetição de letras e dígitos?
Solução:
a) Aplicando o princípio multiplicativo podemos ver que teremos n = 7. O total de
possibilidades é dado por:
26 x 26 x 26 x 10 x 10 x 10 x 10 = 175.760.000
45

lOMoARcPSD|32583331
b) Se uma letra ou um dígito não puder ser repetido, então o número de possibilidades
será dado por:
26 x 25 x 24 x 10 x 9 x 8 x 7 = 78.624.000
4.1.2 – Fatorial
O fatorial de um número natural n é dado por
n! = n(n-1)(n-2)(n-3) ... 3.2.1 se n ≥ 2

1! = 1
0! = 1
Exemplo 4.3 – Ilustra o cálculo de fatoriais
a) Calcular o fatorial dos números 4, 5 e 7.

b) Simplificar a expressão.
n!+(n + 1)!
n!
Solução:
a) 4! = 4 x 3 x 2 x 1 = 24
5! = 5 x 4 x 3 x 2 x 1 = 120
7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 720
b) [n! + (n+1)!]/n! = n![1 + (n+1)]/n! = n + 2
4.2 – Tipos de agrupamentos
Na teoria de análise combinatória existem três tipos de agrupamentos denominados

Arranjos, Permutações e Combinações. Estes três agrupamentos têm leis de formação
distintas. A seguir daremos as definições de modo a tornar mais fácil a diferenciação entre
eles.
Definição 4.1 – Arranjos, Permutações e Combinações
Arranjos são agrupamentos que diferem entre si na ordem ou na natureza de seus
elementos.
Permutações são agrupamentos que diferem entre si somente na ordem de seus
elementos.
Combinações são agrupamentos que diferem entre si somente na natureza de seus
elementos.
Exemplo 4.4 – Ilustra agrupamentos tipo arranjo
Determinar todos os agrupamentos de três elementos, tipo arranjo, que podemos

formar com os elementos do conjunto {a, b, c, d}.
46

lOMoARcPSD|32583331
Solução: abc abd acd bcd

acb adb adc bdc
bac bad cad cbd
bca bda cda cdb
cab dab dac dbc
cba dba dca dcb
Observe que os agrupamentos de uma mesma coluna diferem na ordem dos elementos
e os agrupamentos de uma mesma linha diferem em pelo menos um elemento, isto é, diferem
na natureza de seus elementos. No total conseguimos formar 24 agrupamentos.
Na maioria dos problemas, entretanto, não é viável listar todos os agrupamentos para
depois determinar quantos são eles. A fórmula para calcular a quantidade de agrupamentos,
contendo p elementos cada um, que podemos formar dispondo-se de um total de n elementos
é dada por:
n!
An , p =
(n − p )!
Aplicando essa fórmula ao problema do exemplo 4.4 teríamos:
4! 4!
A4,3 = = = 24
(4 − 3)! 1!
Exemplo 4.5 – Ilustra agrupamento tipo permutação
Determinar todos os agrupamentos de três elementos, tipo permutação, que podemos

formar com os elementos do conjunto {a, b, c}.
Solução: abc acb bac bca cab cba
Observe que os agrupamentos são formados com todos os elementos do conjunto e,

portanto, um agrupamento difere do outro somente na ordem de seus elementos. No total
obtivemos 6 agrupamentos.
Novamente, se desejarmos apenas calcular o número de agrupamentos do tipo

permutação, podemos usar a fórmula
Pn = n!
Aplicando a fórmula no problema do exemplo 4.5 obtemos
Pn = 3! = 6
47

lOMoARcPSD|32583331
Exemplo 4.6 – Ilustra agrupamentos tipo combinação
Determinar todos os agrupamentos de três elementos, tipo combinação, que

podemos formar com os elementos do conjunto {a, b, c, d}.
Solução: abc abd acd bcd
Neste caso um agrupamento difere do outro somente na natureza de seus elementos e

o total de agrupamentos desse tipo é 4. Observe que, por exemplo, o agrupamento cba não é
considerado diferente do agrupamento abc já que ambos contém os mesmos elementos.
Da mesma maneira que os exemplos anteriores, para calcular o número de

agrupamentos tipo combinação que podemos formar dispondo-se de n elementos e
agrupando-os p a p, aplicamos a fórmula:
n!
C n, p =
p!(n − p )!
Aplicando a fórmula acima ao problema do exemplo 4.6 obtemos:
4! 4!
C 4,3 = = =4
3!(4 − 3)! 3!
1) Para recrutar novos membros, um clube do livro faz uma oferta especial. Um novo
membro concorda em comprar um livro pelo preço normal e, então, recebe de graça
quatro livros à sua escolha de uma coleção de 69 livros. Quantas possibilidades de
escolha de quatro livros têm um novo membro?
2) Um estudante tem 7 livros para arranjar em um estante. De quantas maneiras isto

pode ser feito?
3) Quantos resultados são possíveis na

a) Megasena?
b) E na loteria esportiva?
4) Um professor leciona em uma classe contendo 42 estudantes. O professor deseja

conduzir uma pesquisa de modo a determinar a aceitação do seu método de ensino.
Para isso ele decide trabalhar com uma amostra de 5 estudantes. Quantas amostras
diferentes existem?
5) Em um festival de música, um júri deve selecionar uma música, para ganhar o

primeiro prêmio, uma para o segundo e outra para o terceiro prêmio. Quantas
possibilidades de escolha existem sabendo-se que 20 músicas estão concorrendo?
48

lOMoARcPSD|32583331
4.3 – Probabilidade clássica
A maioria das aplicações de probabilidade em estatística indutiva envolve grandes

populações. Entretanto, os conceitos fundamentais de probabilidade podem ser mais
facilmente entendidos utilizando-se exemplos envolvendo populações pequenas e jogos de
azar. Iniciaremos nosso estudo de probabilidades dando alguns conceitos importantes.
Definição 4.2 - Experimento (ou Fenômeno) aleatório – É todo experimento cujo resultado
é impossível de se prever. Por exemplo, lançamento de uma moeda, lançamento de um dado,
sorteio de uma loteria, etc..
Definição 4.3 - Espaço amostral de um experimento – É o conjunto de todos os resultados

possíveis de um experimento aleatório. Por exemplo, no lançamento de uma moeda os
resultados possíveis são Cara(Ca) ou Coroa(Co) e, assim o espaço amostral possui somente
dois elementos.
Definição 4.4 - Evento – É qualquer subconjunto de um espaço amostral. Por exemplo, no

lançamento de um dado tem-se seis possíveis resultados, e o espaço amostral seria o conjunto
{1,2,3,4,5,6}. O evento “sair número par” seria definido pelo subconjunto {2,4,6}.
As três definições acima permitem introduzir o conceito de probabilidade clássica. A

probabilidade clássica se aplica quando todos os possíveis resultados de um experimento tem
a mesma chance de ocorrer.
Exemplo 4.7 – Introduz a probabilidade clássica
As idades dos estudantes em uma classe estão listadas abaixo.
19 24 24 24 23 20 22 21 18 20
19 19 21 19 19 23 36 22 20 35
22 23 19 26 22 17 19 20 20 21
19 21 20 20 21 19 24 21 22 21
Uma tabela de dados agrupados pode ser construída para esses dados.
Idade(anos) Freqüência Freqüência

x f Relativa
17 1 0,025
18 1 0,025
19 9 0,225
20 7 0,175
21 7 0,175
22 5 0,125
23 3 0,075
24 4 0,100
26 1 0,025
35 1 0,025
36 1 0,025
40 1,000
49

lOMoARcPSD|32583331
Suponha que um dos estudantes seja selecionado ao acaso, significando que cada
estudante tenha a mesma chance de ser escolhido que qualquer outro. Qual é a probabilidade
de que o estudante selecionado tenha 20 anos de idade?
Solução:
Podemos ver na tabela de dados agrupados que sete dos quarenta estudantes possuem
20 anos de idade. Assim, as chances são de 7 em 40 de se selecionar um estudante com 20
anos de idade.
Em outras palavras podemos dizer que o evento “selecionar estudante com 20 anos”
possui 7 elementos e o espaço amostral é constituído de 40 elementos.
A probabilidade pode ser dada por:
(Número de estudantes com 20 anos) / (Número total de estudantes) = 7/40
Note que a probabilidade, 7/40, de selecionar um estudante de 20 anos é exatamente

igual à freqüência relativa, 0,175, dos estudantes com 20 anos. A partir deste exemplo fica
fácil entender a seguinte definição de probabilidade.
Definição 4.5 – Probabilidade clássica - Suponha que existam N possíveis resultados,

igualmente prováveis, para um experimento. A probabilidade de que um determinado evento
ocorra é igual ao número de maneiras, f, que o evento pode ocorrer, dividido pelo número
total, N, de possíveis resultados.
Assim, a probabilidade de um evento A ocorrer pode ser expressa por:
Número de maneiras de ocorrer o evento A

f
P( A) =
N
Número total de resultados possíveis
A tabela abaixo mostra a distribuição de notas de quarenta alunos de uma classe.

Selecionando-se, ao acaso, um aluno, qual é a probabilidade de que ele tenha tirado uma
nota inferior a 7?
Notas Freqüência Freqüência

Relativa
3,0 – 3,9 3 0,075
4,0 – 4,9 1 0,025
5,0 – 5,9 8 0,200
6,0 – 6,9 10 0,250
7,0 – 7,9 7 0,175
8,0 – 8,9 7 0,175
9,0 – 9,9 4 0,100
40 1,000
50

lOMoARcPSD|32583331
Solução:
Da tabela acima podemos ver que existem 22 (3+1+8+10) estudantes com notas
inferiores a 7. Isto é, o evento A = “escolher um estudante com nota menor que 7” possui
22 elementos. Portanto, f = 22 e a probabilidade é
f 22
P ( A) = = = 0,55
N 40
Em termos de porcentagem, isto significa que 55% dos estudantes da classe tiraram
nota menor que 7. Observe também que o valor calculado de 0,55 nada mais é que a soma
das freqüências relativas 0,075 + 0,025 + 0,200 + 0,250.
Nota importante – Probabilidades e porcentagens

Suponha que um experimento consista em selecionar um membro, ao acaso, de uma
população finita. Então a probabilidade de que um determinado evento ocorra é igual à
porcentagem (freqüência relativa) dos membros da população que satisfazem as condições
prescritas pelo evento especificado.
Assim, por exemplo, o fato de que 12,4% da população dos EUA é negra também
significa que a probabilidade é de 0,124 de que uma pessoa residente nos EUA, selecionada
aleatoriamente, seja negra.
Propriedades básicas das probabilidades
1) 0 ≤ P(A) ≤ 1
2) P(Evento Impossível) = 0
3) P(Evento Certo) = 1
4) P(A) + P( A) = 1
Exemplo 4.9 – Ilustra propriedades 2, 3 e 4
Usando a tabela de idades de estudantes utilizada no exemplo 4.7, calcule:

a) a probabilidade de selecionarmos um estudante de 25 anos de idade.
b) a probabilidade de selecionarmos um estudante com idade menor que 50 anos.
c) a probabilidade de não selecionarmos um estudante de 20 anos de idade.
Solução:
a) Como não há estudantes com 25 anos de idade, este evento é impossível de ocorrer e a
probabilidade será igual a zero, ou seja,
f 0
P ( A) = = =0
N 40
51

lOMoARcPSD|32583331
b) Uma vez que todos os estudantes têm idades menores que 50 anos, concluímos que este é
um evento certo e a probabilidade dele ocorrer é 1, ou seja,
f 40
P ( A) = = =1
N 40
c) O evento “não selecionar um estudante de 20 anos” é complementar do evento

“selecionar um estudante de 20 anos”, logo a probabilidade é dada por
7
P(A) = 1 − P( A) = 1 − = 1 − 0,175 = 0,825
40
1) Lançando-se um dado honesto de seis faces, qual a probabilidade de sair um valor maior
que 4 na face voltada para cima?
2) Lançando-se dois dados honestos, qual a probabilidade da soma dos valores ser igual a 7?
3) Um baralho contendo 52 cartas é composto de 13 cartas de cada naipe (ouro, copas,

espada e paus). Seleciona-se, ao acaso, uma carta deste baralho. Determine os elementos
de cada evento abaixo.
a) a carta selecionada é um rei de ouro.
b) a carta selecionada é um ás.
c) a carta selecionada é uma figura.
4) Determine a probabilidade de ocorrer cada um dos eventos definidos no exercício 3.
5) As ausências ou faltas ao trabalho de uma firma, durante o ano passado, estão resumidas
na tabela abaixo. Se um empregado é selecionado ao acaso, determine a probabilidade
dele ter perdido
a) três dias de trabalho.
b) entre um e cinco dias de trabalho, inclusive.
c) oito dias de trabalho.
d) no máximo oito dias de trabalho.
Número de faltas Número de

x empregados f
0 4
1 2
2 14
3 10
4 16
5 18
6 10
7 6
80
52

lOMoARcPSD|32583331
4.4 – Regra da adição
Para entendermos a regra da adição necessitamos antes do conceito de eventos

mutuamente exclusivos.
Definição 4.6 - Eventos mutuamente exclusivos - Dois eventos A e B são ditos

mutuamente exclusivos quando a intersecção desses dois eventos for o conjunto vazio.
Matematicamente podemos escrever:
A e B são eventos mutuamente exclusivos ⇔ A∩B=∅
A representação gráfica (diagramas de Venn) abaixo mostra mais claramente o

conceito de eventos mutuamente exclusivos. O retângulo representa o espaço amostral S, ou
seja, todos os resultados possíveis de ocorrerem. A e B são dois eventos desse espaço
amostral. Como os dois eventos são disjuntos, então podemos dizer que eles representam
eventos mutuamente exclusivos.
A B
Intuitivamente, quando dois eventos são mutuamente exclusivos, somente um deles

poderá ocorrer durante a realização do experimento, ou seja, se um ocorrer o outro não
poderá ter também ocorrido.
Exemplo 4.10 – Ilustra eventos mutuamente exclusivos
No lançamento de um dado honesto, verifique se os eventos abaixo são mutuamente

exclusivos.
A = “Sair número menor que 3” e B = “Sair número maior ou igual a 4”
Solução:
O espaço amostral S desse experimento e os eventos A e B são dados por:
S = {1, 2, 3, 4, 5 , 6}
A = {1,2}
B = {4, 5, 6}
É óbvio que A ∩ B = ∅, portanto, eles são mutuamente exclusivos .
53

lOMoARcPSD|32583331
Regra especial da adição (ou da união)
Observe no exemplo anterior que a probabilidade de ocorrer o evento A é
n( A) 2
P ( A) = = = 0,33
N 6
e, a probabilidade de ocorrer o evento B é
n( B ) 3
P( B) = = = 0,5
N 6
Se desejássemos calcular a probabilidade de ocorrer o evento A ou o evento B, isto é,

P(A ou B), basta ver que teremos um total de 2 + 3 = 5 elementos que satisfazem A ou B.
Assim,
2+3 5
P(AouB) = = = 0,83
6 6
O ponto importante aqui é notar que
2+3 2 3
P(AouB) = = + = 0,33 + 0,5 = 0,83
6 6 6
Ou seja, os valores 0,33 e 0,5 são, respectivamente, P(A) e P(B). Consequentemente, neste
caso nós temos
P(A ou B) = P(A) + P(B)
Esta fórmula é a regra especial da adição e ela vale desde que os dois eventos sejam
mutuamente exclusivos.
Regra especial da adição – Se os eventos A e B são mutuamente exclusivos, então

P(A ou B) = P(A) + P(B)
Mais genericamente, se os eventos A, B, C, ... são mutuamente exclusivos, então
P(A ou B ou C ou ...) = P(A) + P(B) + P(C) + ...
O evento A ou B também é entendido como o evento união A∪B e a regra especial

da adição pode ser escrita como:
P(A∪B) = P(A) + P(B)
Exemplo 4.11 – Ilustra a regra especial da adição
Uma urna contém quatro bolas brancas, três azuis e cinco pretas. Retirando-se uma
bola ao acaso da urna, qual a probabilidade de sair uma bola branca ou uma bola azul?
54

lOMoARcPSD|32583331
Solução:
O evento “sair bola branca ou sair bola azul” pode ser considerado como o evento
união do evento A = ”sair bola branca” com o evento B = “sair bola azul”. Os eventos A e B
são eventos mutuamente exclusivos e a aplicação da regra especial da adição resulta em
P(A∪B) = P(A) + P(B) = (4/12) + (3/12) = 0,33 + 0,25 = 0,58
Exemplo 4.12 – Ilustra a regra especial da adição
A tabela abaixo mostra uma distribuição de freqüências de tamanhos de fazendas nos

EUA, de acordo com o U.S. Bureau of the Census. Com base nesta tabela, determine a
probabilidade de que uma fazenda, escolhida aleatoriamente, tenha
a) menos que 50 hectares.
b) entre 100 e 499 hectares, inclusive.
Tamanho Freqüência Eventos

(Hectares) Relativa
Menor que 10 0,087 A
10 – 49 0,192 B
50 – 99 0,156 C
100 – 179 0,173 D
180 – 259 0,098 E
260 – 499 0,143 F
500 – 999 0,085 G
1000 – 1999 0,040 H
Maior que 2000 0,026 I
Solução:
a) O evento de que uma fazenda selecionada tenha menos de 50 hectares pode ser expresso
por (AouB). Uma vez que os eventos A e B são mutuamente exclusivos (porque?),
podemos aplicar a regra especial da adição obtendo-se
P(A ou B) = P(A∪B) = P(A) + P(B) = 0,087 + 0,192 = 0,279
b) O evento de que uma fazenda selecionada tenha entre 100 e 499 hectares, pode ser
expresso por um evento união (D ou E ou F). Uma vez que os eventos D, E e F são
mutuamente exclusivos, obtemos
P(D ou E ou F) = P(D ∪ E ∪ F) = P(D) + P(E) + P(F)
= 0,173 + 0,098 + 0,143
= 0,414
55

lOMoARcPSD|32583331
Regra Geral da adição (ou da união)
A regra especial da adição é válida para eventos mutuamente exclusivos, isto é, se a

intersecção dos eventos é o conjunto vazio. Quando isto não ocorrer, a regra geral deve ser
aplicada.
Regra geral da adição – Se A e B são dois eventos quaisquer, então
P(A ou B) = P(A∪B) = P(A) + P(B) – P(A∩B)
Em palavras, a probabilidade de que o evento A ou o evento B ocorram é igual à

probabilidade de que o evento A ocorra mais a probabilidade de que o evento B ocorra
menos a probabilidade de que ambos ocorram.
Exemplo 4.13 – Ilustra a regra geral da adição
No lançamento de um dado honesto de seis faces calcular a probabilidade de sair um

número par ou um número menor que 4.
Solução:
O evento “sair número par” pode ser representado por A = {2,4,6} e o evento “sair
número menor que 4”pode ser representado por B = {1,2,3}. Pode-se ver que A e B não são
mutuamente exclusivos pois A∩B = {2}. Aplicando-se a regra geral obtemos
P(A ou B) = P(A∪B) = P(A) + P(B) – P(A∩B)
= (3/6) + (3/6) – (1/6) = 0,83
1) Uma carta é selecionada ao acaso de um baralho de 52 cartas. Calcule a probabilidade de

a) sair uma carta de copas.
b) sair uma figura ou um ás.
c) sair uma figura ou uma carta de copas.
2) Suponha que você possua 20 bilhetes de um total de 500 bilhetes vendidos de uma rifa.
Sorteando-se um bilhete aleatoriamente calcule a probabilidade de você ganhar o
prêmio.
3) Suponha que A e B sejam dois eventos tais que P(A) = 1/4 , P(B) = 1/3 e P(A∪B) = 1/2.
a) Os eventos A e B são mutuamente exclusivos?
b) Determine P(A∩B).
4) Dados P(A) = 1/3, P(A∪B) = 1/2 e P(A∩B) = 1/10, encontre P(B).
56

lOMoARcPSD|32583331
4.5 -Tabelas de contingência
Uma tabela de contingência permite classificar membros de uma população ou de

uma amostra segundo duas características, como por exemplo, segundo nível educacional
versus renda anual ou idade versus sexo. O exemplo seguinte esclarece este conceito.
Exemplo 4. 14 – Introduz tabelas de contingência
Considere uma classificação dos professores de uma universidade segundo idade e

posição na carreira.
Posição na Carreira
Professor Professor Professor Instrutor Total
Titular Associado Assistente
R1 R2 R3 R4
< 30 2 3 57 6 68
A1
30 – 39 52 170 163 17 402
A2
Idade
40 – 49 156 125 61 6 348

A3
50 – 59 145 68 36 4 253
A4
≥ 60 75 15 3 0 93
A5
Total 430 381 320 33 1164
Considerando a tabela acima, suponha que um professor seja selecionado ao acaso.

Observe que as linhas e colunas da tabela são identificadas com letras seguidas de um
número. A primeira linha é identificada como A1, representando o evento de que o professor
selecionado tem idade menor que 30 anos:
A1 = o professor selecionado tem menos de 30 anos
Da mesma maneira,
R2 = o professor selecionado é um professor associado
E assim por diante. Note que os eventos de A1 a A5 são mutuamente exclusivos assim
como os eventos de R1 a R4 .
Além de considerarmos os eventos de A1 a A5 e de R1 a R4 , separadamente,

podemos também considerá-los conjuntamente. Por exemplo, o evento de que o professor
selecionado tem menos de 30 anos (evento A1) e é também um professor associado (evento
R2) pode ser expresso como (A1 e R2) ou (A1 ∩ R2):
(A1 e R2) = (A1 ∩ R2)= o professor selecionado é um professor associado com

idade inferior a 30 anos
57

lOMoARcPSD|32583331
O evento (A1 e R2) é representado pela célula na primeira linha e segunda coluna da
tabela anterior. Na verdade existem 20 eventos conjuntos deste tipo, um para cada célula da
tabela,
Trabalhando agora com probabilidades, vemos que existe um total de 1164

professores. Para encontrar a probabilidade de que selecionando ao acaso um membro dessa
população ele seja um professor associado (evento R2), basta determinar quantos professores
estão na categoria “Professor Associado”. Da tabela tiramos f = 381, e assim
P(R2) = f/N = 381/1164 = 0,327
Da mesma forma, a probabilidade de que um membro escolhido aleatoriamente seja

um professor com idade menor que 30 anos (evento A1) é dada por
P(A1) = f/N = 68/1164 = 0,058
Em termos de porcentagem, essas duas probabilidades indicam que 32,7% dos

professores são professores associados e que 5,8% dos professores têm menos que 30 anos.
Além de podermos determinar a probabilidade de cada evento A ou evento R,

separadamente, podemos também determinar a probabilidade para eventos conjuntos,
denominada probabilidade conjunta. Por exemplo, a probabilidade de que o professor
selecionado seja um professor associado com menos de 30 anos será dada por
P(A1 e R2) = P(A1 ∩ R2) = f/N = 3/1164 = 0,003
Em outras palavras, 0,3% dos professores da universidade são professores associados

com menos de 30 anos. Substituindo cada valor da tabela de freqüência pela probabilidade
do evento conjunto correspondente ocorrer, obtemos a tabela abaixo que nos dá a
distribuição de probabilidade conjunta.
Professor Professor Professor Instrutor P(Ai)
Titular Associado Assistente
R1 R2 R3 R4
< 30 0,002 0,003 0,049 0,005 0,058
A1
30 – 39 0,045 0,146 0,140 0,015 0,345
A2
Idade
40 – 49 0,134 0,107 0,052 0,005 0,299

A3
50 – 59 0,125 0,058 0,031 0,003 0,217
A4
≥ 60 0,064 0,013 0,003 0,000 0,080
A5
P(Rj) 0,369 0,327 0,275 0,028 1
58

lOMoARcPSD|32583331
Observe que os valores da tabela dentro das linhas mais grossas representam as
probabilidades conjuntas dos eventos A’s e R’s. Observe também que os rótulos “Total”
que estavam na última linha e na última coluna foram substituídos por P(Rj) e P(Ai),
respectivamente. Isto porque a última linha da tabela acima nos dá as probabilidades dos
eventos R1 a R4 e a ultima coluna nos dá as probabilidades dos eventos A1 a A5. Essas
probabilidades são chamadas probabilidades marginais porque elas estão posicionadas na
“margem” da tabela de distribuição conjunta.
Finalmente devemos notar que a soma das probabilidades conjuntas em uma linha ou
coluna é igual à probabilidade marginal daquela linha ou coluna (qualquer discrepância é
devida a erros de arredondamento). Por exemplo, considere a linha 2 da tabela acima. A soma
das probabilidades conjuntas é igual a
P(A2 e R1) + P(A2 e R2) + P(A2 e R3) + P(A2 e R4) = 0,045 + 0,146 + 0,140 + 0,015
= 0,346
que é o valor da probabilidade marginal no final da linha 2.
4.6 - Probabilidade condicional
A probabilidade condicional de um evento é a probabilidade do evento ocorrer,

sabendo-se que um outro evento ocorreu. O exemplo abaixo ilustra este tipo de caso.
Exemplo 4.15 – Ilustra probabilidade condicional
Considere o lançamento de um dado honesto de seis faces. O espaço amostral é
S = {1, 2, 3, 4, 5, 6}, ou seja, existem seis resultados possíveis.
Se quisermos calcular a probabilidade do evento A={4} ocorrer, basta calcular
P(A) = f/N = 1/6 = 0,167
Para entender o conceito de probabilidade condicional, suponha que embora não

possamos ver o dado, alguém nos diga que o resultado é um número par. Neste caso, qual é a
probabilidade do evento A ocorrer? Isto é, sabendo que saiu um número par, qual é a
probabilidade de que seja o 4?
A resposta é muito simples. Se sabemos que saiu um número par, não existem mais
seis resultados possíveis, existem apenas três que são 2, 4 e 6. Assim a probabilidade de
ocorrer o número quatro (evento A) não é mais 1/6 = 0,167. Agora o resultado é
f/N = 1/3 = 0,333
Assim, a informação de que o valor ocorrido é um número par, afetou a probabilidade

de ocorrer o evento A, e o valor 0,333 é chamado de probabilidade condicional uma vez que
ela é calculada sob a condição de que o valor na face do dado seja um número par.
59

lOMoARcPSD|32583331
Notação
A notação usada para indicar a probabilidade condicional é P(A | B). Lê-se “probabilidade de
ocorrer o evento A sabendo-se que já ocorreu o evento B”. O símbolo “|” é lido “sabendo-se
que”, ou “dado que”. Resumindo os dois casos acima podemos escrever:
P(A) = 1/6 = 0,167 e P(A | B) = 1/3 = 0,333
Podemos agora dar a definição de probabilidade condicional
Definição 4. 7 – Probabilidade condicional - Suponha que A e B sejam dois eventos. Então

a probabilidade de ocorrer o evento A sabendo-se que o evento B ocorreu é denominada
probabilidade condicional . Ela é indicada pelo símbolo P(A | B).
O conceito de probabilidade condicional tem um papel importante na análise de dados

com classificação conjunta ou cruzada. O exemplo abaixo mostra como obter probabilidade
condicional para este tipo de dado.
Exemplo 4.15 – Ilustra definição 4.7
Considere a tabela do exemplo 4.14, repetida aqui por facilidade.
Professor Professor Professor Instrutor Total
Titular Associad Assistent
R1 o R2 e R3 R4
< 30 2 3 57 6 68
A1
30 – 39 52 170 163 17 402
A2
Idade
40 – 49 156 125 61 6 348

A3
50 – 59 145 68 36 4 253
A4
≥ 60 75 15 3 0 93
A5
Total 430 381 320 33 1164
Suponha que um professor seja selecionado ao acaso.

a) Encontre a probabilidade (incondicional) de que o professor selecionado esteja na casa
dos 50.
b) Encontre a probabilidade (condicional) de que o professor selecionado esteja na casa
dos 50, sabendo-se que um professor assistente foi selecionado.
c) Interprete as probabilidades encontradas em termos de porcentagens.
60

lOMoARcPSD|32583331
Solução:
a) A probabilidade de que o professor selecionado esteja na casa dos 50, é P(A4). Da tabela
acima, para N =1164 e f = 253 a probabilidade será dada por
P(A4) = 253/1164 = 0,217
b) Neste caso, queremos calcular a probabilidade de que o professor selecionado esteja na

casa dos 50 (evento A4), sabendo-se que um professor assistente já foi escolhido (evento R3).
A probabilidade condicional será dada por:
P(A4 | R3) = 36/320 = 0,113
c) P(A4) = 0,217 indica que 21,7% dos professores da universidade estão na casa dos 50.
P(A4 | R3) = 0,113 indica que 11,3% dos professores assistentes estão na casa dos 50.
Fórmula da probabilidade condicional
Analisando o exemplo dado, fica claro que para calcular uma probabilidade
condicional, primeiro encontramos quantos elementos pertencem aos dois eventos,
simultaneamente, e dividimos pelo número de elementos do evento que já ocorreu. Isto sugere
a seguinte fórmula:
n( A ∩ B ) P ( A ∩ B )
P( A| B) = =
n( B ) P( B)
1) Suponha que uma carta seja retirada de um baralho com 52 cartas. Considere
A = Sair uma figura

B = Sair um rei
C = Sair carta de copas
Determine as probabilidades abaixo.
a) P(B) b) P(B | A) c) P(B | C)

d) P(A) e) P(A | B) f) P(A | C)
2) Considere a tabela abaixo que fornece o número de dias de trabalho perdidos em um ano
em uma determinada empresa.
a) Determine a probabilidade de que um empregado selecionado aleatoriamente tenha

perdido exatamente três dias de trabalho.
61

lOMoARcPSD|32583331
b) Determine a probabilidade de que um empregado selecionado, aleatoriamente, tenha

perdido exatamente três dias de trabalho, sabendo que o empregado perdeu pelo
menos um dia de trabalho.
Dias Perdidos Número de

empregados
0 4
1 2
2 14
3 10
4 16
5 18
6 10
7 6
80
4.7 - Regra da multiplicação – Independência
A regra da probabilidade condicional, discutida no item anterior, é usada para calcular

probabilidades condicionais em função de probabilidades incondicionais e é dada por
P(B | A) = (P(A∩B))/P(A)
Multiplicando-se os dois lados dessa fórmula por P(A) obtemos
P(A∩B) = P(A) x P(B | A)
Que é uma fórmula que permite calcular probabilidades conjuntas em termos de probabilidade
marginal e probabilidade condicional. Isto define o que denominamos regra da multiplicação.
O enunciado para esta fórmula é dado a seguir.
Fórmula da regra geral da multiplicação – Dados dois eventos quaisquer A e B, então
P(A∩B) = P(A) x P(B | A)
Em palavras, a probabilidade de que ambos os eventos A e B ocorram é igual à

probabilidade de que o evento A ocorra, multiplicada pela probabilidade condicional de que
o evento B ocorra, sabendo-se que o evento A já ocorreu.
Note que a regra da probabilidade condicional e a regra da multiplicação são variações

uma da outra.
62

lOMoARcPSD|32583331
Exemplo 4. 16 – Ilustra a fórmula da multiplicação
Considere uma classe com a seguinte distribuição
Sexo Freqüência
Masculino 17
Feminino 23
40
Suponha que dois estudantes são selecionados ao acaso desta classe. Assuma que o
primeiro estudante selecionado não retorne à classe antes que o segundo estudante seja
selecionado. Qual é a probabilidade de que o primeiro estudante selecionado seja do sexo
masculino e o segundo seja do sexo feminino?
Solução:
Podemos escrever os seguintes eventos:
M1 = o primeiro estudante é do sexo masculino

F2 = o segundo estudante é do sexo feminino
O problema é determinar a probabilidade de que o primeiro estudante seja do sexo

masculino e o segundo estudante seja do sexo feminino, isto é, P(M1 e F2) ou P(M1∩F2).
Pela regra geral da multiplicação podemos escrever
P(M1∩F2) = P(M1) x P(F2 | M1)
Porém, da tabela dada podemos ver que 17 dos 40 estudantes são do sexo masculino,
logo
P(M1) = 17/40 = 0,425
Supondo que o primeiro estudante selecionado seja do sexo masculino, e que ele não
retorne à sala, a probabilidade de que o segundo estudante seja do sexo feminino é dada por
P(F2 | M1) = 23/39 = 0,588
Aplicando a fórmula da multiplicação teremos
P(M1∩F2) = P(M1) x P(F2 | M1) = (17/40) x (23/39)

= 0,425 x 0,588 = 0,251
Consequentemente, a probabilidade é de 0,251 de que o primeiro estudante

selecionado seja do sexo masculino e o segundo seja do sexo feminino.
Nós podemos usar um conceito denominado diagrama em árvore para calcular

probabilidades quando empregamos a regra geral da multiplicação. Este diagrama é mostrado
a seguir.
63

lOMoARcPSD|32583331
Evento Probabilidade
F2 F1 e F2 0,324
F1 22/39
17/39
M2 F1 e M2 0,251
23/40
17/40 0,251
F2 M1 e F2
23/39
M1 16/39
M2 M1 e M2 0,174
A parte do diagrama representando a determinação da probabilidade P(M1 e F2) está

mostrada com a linha mais grossa.
Independência
Dois eventos são estatisticamente independentes se a ocorrência (ou não ocorrência)

de um dos eventos não afetar a probabilidade de ocorrência do outro evento. Mais
formalmente podemos dar a definição a seguir.
Definição 4. 8 – Independência estatística - Um evento B é dito estatisticamente

independente de um evento A, se a ocorrência de A não afeta a probabilidade de ocorrência
do evento B. Em símbolos:
P(B | A) = P(B)
Exemplo 4. 17 – Ilustra definição 4. 8
Seja o experimento de selecionar ao acaso uma carta de um baralho com 52 cartas.

Vamos definir os seguintes eventos
A = uma figura é selecionada

B = um rei é selecionado
C = uma carta de copas é selecionada
64

lOMoARcPSD|32583331
Usando a definição 4.8, determine:

a) se o evento B é independente do evento A
b) se o evento B é independente do evento C
Solução:
A probabilidade incondicional do evento B é dada por
P(B) = f/N = 4/52 = 0,077
a) Para determinar se o evento B é independente do evento A temos de calcular P(B | A) e

comparar esse valor com P(B). Assumindo que o evento A tenha ocorrido, Qualquer uma
entre as 12 figuras do baralho pode ter sido selecionada, ou seja, existem 12 possíveis
resultados, e o evento B pode ocorrer de 4 maneiras, logo
P(B | A) = 4/12=0,333
Como P(B) ≠ P(B | A), o evento B não é independente de A. É interessante observar que
esta falta de independência vem do fato de que a porcentagem dos reis entre as figuras (33%)
não é a mesma que a porcentagem dos reis entre todas as cartas (7,7%).
b) Procedendo de maneira análoga ao item a, calculamos P(B | C) e P(B) e comparamos os

valores.
P(B | C) = 1/13 = 0,077
Como P(B) = P(B | C) = 0,077, concluímos que os eventos B e C são independentes e

é útil observar que a porcentagem de reis entre todas as cartas (7,7%) é a mesma porcentagem
de reis entre as cartas de copas (7,7%).
Regra especial da multiplicação
Se os eventos A e B são independentes então P(B | A) = P(B) e a regra da

multiplicação se torna
P(A∩B) = P(A) x P(B | A) = P(A) x P(B)
Mais formalmente podemos escrever a fórmula seguinte.
Fórmula especial da multiplicação

Se dois eventos A e B são independentes, então
P(A∩B) = P(A) x P(B)
E, reciprocamente, se P(A∩B) = P(A) x P(B), então os eventos A e B são independentes, e

então a probabilidade conjunta deles ocorrerem se iguala ao produto de suas probabilidades
marginais.
65

lOMoARcPSD|32583331
Exemplo 4.18 – Ilustra fórmula especial da multiplicação
Uma roleta contém 38 números dos quais 18 são vermelhos, 18 são pretos, e dois são
verdes. Quando a roleta é girada e a bola é solta, é igualmente provável que a bola caia em
qualquer uma das cavidades relativas aos 38 números. Em duas jogadas da roleta, qual é a
probabilidade de que
a) a bola caia no vermelho as duas vezes?
b) a bola caia no verde na primeira vez e no preto na segunda vez?
Solução:
Primeiro de tudo nós notamos que é razoável assumir que os resultados das jogadas
sucessivas da roleta são independentes (porquê?).
a) para esta primeira pergunta, considere os eventos
V1 = a bola cai no vermelho na primeira jogada

V2 = a bola cai no vermelho na segunda jogada
Temos de calcular P(V1∩V2). Como a ocorrência de V1 não interfere na ocorrência

de V2, isto é, V1 e V2 são eventos independentes, então
P(V1∩V2) = P(V1) x P(V2) = (18/38) x (18/38) = 0,224
Existe uma chance de 22,5% de que a bola caia duas vezes no vermelho.
b) Esta pergunta é semelhante à primeira e, assim podemos escrever:
P(Verde1∩Preto2) = P(Verde1) x P(Preto2) = (2/38) x (18/38) = 0,025
Existe uma chance de 2,5% de a bola caia a primeira vez no verde e a segunda vez no
preto.
Nota : Mutuamente exclusivo versus Independência
Não é incomum estudantes confundirem os conceitos de eventos mutuamente

exclusivos e eventos independentes. Estes termos não significam a mesma coisa. O conceito
de “mutuamente exclusivo” envolve se ou não dois eventos podem ocorrer simultaneamente.
Por outro lado, o conceito de independência envolve se ou não a ocorrência de um evento
afeta a probabilidade de ocorrência do outro.
66

lOMoARcPSD|32583331
1) Cartões numerados 1,2,3, ..., 10 são colocados em uma caixa. Os cartões são misturados e
uma pessoa, sem visão dos cartões, seleciona dois cartões sucessivos, sem reposição do
primeiro.
a) Qual é a probabilidade de que o primeiro cartão seja o de número 6?
b) Sabendo que o primeiro cartão é o 6, qual é a probabilidade de que o segundo cartão
seja o de número 9?
c) Qual é a probabilidade de selecionar primeiro um 6 e depois um 9?
d) Qual é a probabilidade de que ambos os cartões selecionados tenham números acima
de 5?
2) Considere a tabela de distribuição de freqüências abaixo, relativa a uma classe de alunos.
Sexo Freqüência
Masculino 27
Feminino 23
50
Suponha que dois estudantes sejam selecionados, ao acaso, sem reposição. Qual é a
probabilidade de que:
a) o primeiro selecionado seja do sexo feminino e o segundo seja do sexo masculino?
b) ambos os estudantes sejam do sexo feminino?
c) desenhe um diagrama em árvore para este problema.
d) qual é a probabilidade de ambos os estudantes sejam do mesmo sexo?
3) Considere a tabela de contingência abaixo que relaciona dados segundo dois fatores, sexo
e circunstâncias de acidentes. As freqüências são dadas em milhões.
Trabalho Casa Outros Total

C1 C2 C3
Masculino 8,0 9,8 17,8 35.6
S1
Feminino 1,3 11,6 12,9 25.8
S2
Total 9,3 21,4 30,7 61.4
a) Determine P(C1)
b) Determine P(C1 | S2)
c) Os eventos C1 e S2 são independentes? Porque?
d) O evento de que uma pessoa acidentada seja do sexo masculino é independente do
evento de que uma pessoa acidentada que sofreu o acidente em casa? Justifique sua
resposta.
67

lOMoARcPSD|32583331
Capítulo 5
Variáveis Aleatórias Discretas
Este é um capítulo particularmente importante pois trata de conceitos fundamentais para o

entendimento dos assuntos desenvolvidos nos próximos capítulos. Após o término deste
capítulo, você deverá ser capaz de:
1. Definir o termo variável aleatória.

2. Distinguir variável aleatória discreta de variável aleatória contínua.
3. Definir o termo distribuição de probabilidades.
4. Calcular a média e o desvio padrão de uma variável aleatória discreta.
5. Calcular probabilidade binomial para valores pequenos de n.
6. Calcular probabilidade binomial através de tabelas.
69

lOMoARcPSD|32583331
5.1 – Variáveis aleatórias discretas
Uma variável aleatória, que será indicada por x, é uma variável que pode assumir
valores numéricos quando um experimento é realizado. O valor particular que a variável
aleatória assume é dependente do acaso, sendo impossível prever sua ocorrência antes do
experimento ser realizado. O exemplo a seguir ilustra o conceito.
Exemplo 5.1 – Introduz variáveis aleatórias
A tabela 5.1 é uma tabela de dados agrupados correspondente ao número de carros

possuídos por cada família de uma pequena cidade.
Tabela 5.1 – Número de carros por família

Número de carros Freqüência Freqüência
por família f relativa
0 27 0.004
1 1422 0.219
2 2865 0.442
3 1796 0.277
4 324 0.050
5 53 0.008
6487 1.000
A tabela mostra, por exemplo, que 2865 famílias dentre 6487 famílias possuem 2
carros, ou seja, 44,2% das famílias possuem dois carros. Uma vez que o “número de carros
possuídos” varia de família para família, ele é chamado de variável. Suponha agora que uma
família seja selecionada ao acaso. Então, o número de carros possuídos pela família
selecionada é chamado variável aleatória porque seu valor depende do acaso, isto é, depende
da família selecionada. A figura 5.1 abaixo mostra que o conceito de variável aleatória pode
ser visto como uma função cujo domínio é o espaço amostral S do experimento e o
contradomínio é o conjunto dos números inteiros I. O conjunto imagem é o conjunto dos
valores que a variável pode assumir quando da realização do experimento.
Domínio = Espaço amostral S = Conjunto das
famílias da cidade Contradomínio = I
F1 Conjunto Imagem
0
F2 1
2
F3 3
4 5
...
F6487
Figura 5.1 – Variável aleatória como uma função de S em I.
70

lOMoARcPSD|32583331
Observe que a variável aleatória “número de carros possuídos por família” só pode
assumir valores inteiros, ou seja, valores discretos iguais a 0, 1, 2, 3, 4 ou 5. Este tipo de
variável é dito variável aleatória discreta.
Para resumir os conceitos de variável aleatória e variável aleatória discreta daremos as

definições a seguir.
Definição 5.1 – Variável aleatória – Uma variável aleatória é uma quantidade numérica
cujo valor depende do acaso.
Definição 5.2 – Conjunto discreto - Um conjunto é discreto se ele consiste de um número

finito de elementos ou se os seus elementos podem ser listados de modo que exista um
primeiro elemento, um segundo elemento, um terceiro elemento, e assim por diante, na lista.
Definição 5.3 – Variável aleatória discreta - Uma variável aleatória discreta é uma variável
aleatória cujos possíveis valores formam um conjunto discreto de dados.
Exemplo 5.2 – Ilustra variáveis aleatórias discretas
Em um mesmo espaço amostral podemos definir diversas variáveis aleatórias.

Considere o experimento de lançamento de dois dados, um vermelho e um azul, registrando-
se o valor da face superior de cada dado. Existem 36 possíveis resultados, como mostrado
abaixo.
Tabela 5.2 – Resultados possíveis no lançamento de dois dados

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Três possíveis exemplos de variáveis aleatórias discretas x, y e z que poderíamos

definir seriam:
x = soma dos dois números resultantes
y = a diferença entre o valor do dado vermelho e o valor do dado azul
z = o máximo dos dois números resultantes
Se o experimento for realizado e resultar no par (3,5) então o valor de x será 3+5 = 8,
o valor de y será 3-5 = -2 e o valor de z será 5 que é o máximo entre 3 e 5.
Como exercício, escreva os valores que cada uma das variáveis pode assumir, ou seja,
defina o conjunto dos possíveis valores de x, y e z.
71

lOMoARcPSD|32583331
Exemplo 5.3 – Ilustra variável aleatória contínua
Suponha que de uma maneira aleatória, uma localização (latitude e longitude) seja
selecionada dentro do território dos Estados Unidos e, seja uma variável aleatória definida por
x = a altura (ou altitude) acima do nível do mar deste local.
Por exemplo, se o local selecionado fosse dado por (39° 50’ Norte, 98° 35’ Oeste),
então poderíamos ter x (39° 50’ Norte, 98° 35’ Oeste) = 524,48 m. O maior valor possível de
x é de 4348,2 m (Monte Whitney) e o menor valor possível é -84,6 m (Vale da Morte). O
conjunto dos valores possíveis de x seria representado pelo intervalo [-84,6 ; 4348,2]. O que
indica que existe um número infinito de valores dentro deste intervalo.
Variáveis aleatórias que podem assumir valores em um intervalo de números reais são
ditas variáveis aleatórias contínuas. Este tipo de variável será estudado mais adiante.
5.2 – Notação
Usualmente denominamos uma variável aleatória por letras tais como x, y, z, etc..
Voltando ao exemplo 5.1, a variável aleatória era definida como “número de carros possuídos
por uma família”. Assumindo que x seja a variável, podemos representar o evento de a família
selecionada ter dois carros por {x = 2}, que se lê “x é igual a dois”.
A probabilidade de que a família selecionada tenha dois carros pode ser então indicada
simbolicamente por P(x = 2), que pode ser lido como “probabilidade de que x seja igual a
dois”. Quando não há dúvida sobre qual variável aleatória estamos lidando, podemos
simplesmente escrever P(2) em vez de P(x = 2).
5.3 – Distribuição de probabilidades de uma variável aleatória
Quando probabilidades são definidas para cada resultado possível de um experimento,

nós podemos determinar as probabilidades associadas com os valores de qualquer variável
aleatória definida sobre o espaço amostral do experimento. Utilizando novamente o exemplo
5.1, onde a variável aleatória era definida como o número de carros possuídos por uma
família, queremos agora determinar a probabilidade de cada um dos possíveis valores da
variável aleatória x. Para determinar, por exemplo, P(x = 2), isto é, a probabilidade de que a
família tenha dois carros, podemos aplicar a definição clássica de probabilidade, ou seja,
f 2865
P( x = 2) = = = 0,442
N 6487
As probabilidades relativas aos outros valores da variável x são obtidas da mesma

maneira e aparecem na tabela 5.3.
72

lOMoARcPSD|32583331
Tabela 5.3 – Distribuição de probabilidades da variável x

Número de carros Probabilidade
x P(x)
0 0,004
1 0,219
2 0,442
3 0,277
4 0,050
5 0,008
1,000
Da mesma maneira que uma tabela de freqüências é chamada de distribuição de

freqüências, uma tabela de probabilidades é chamada de distribuição de probabilidades.
Assim, a tabela 5.3 nos dá a distribuição de probabilidades da variável aleatória x; ela nos
mostra a distribuição de probabilidades para os vários valores da variável aleatória x. Isto nos
leva à seguinte definição.
Definição 5.4 – Distribuição de probabilidades - Uma distribuição de probabilidades dá

a probabilidade para cada valor da variável aleatória
Observe também que a soma das probabilidades de x, dadas na segunda coluna da

tabela 5.3, é igual a 1. Isto sempre acontece (por quê?).
Fato Importante 5.1

A soma das probabilidades de qualquer variável aleatória discreta é sempre igual a
1. Isto é, se x é uma variável aleatória discreta, então
∑ P(x) = 1
Exemplo 5.4 – Ilustra notação e distribuição de probabilidades de variáveis aleatórias
Os dados da tabela abaixo se referem ao número de alunos matriculados em escolas

públicas americanas do primeiro grau (0 = jardim de infância, 1 = primeira série, e assim por
diante), em um determinado ano. As freqüências são em milhares de estudantes.
Suponha que um estudante de uma dessas séries seja selecionado ao acaso. E seja y a
série do estudante selecionado. Então y é uma variável aleatória cujos valores possíveis são 0,
1, 2, 3, ... , 8.
a) Use a notação de variável aleatória para representar o evento “o estudante selecionado

é da quinta série”.
b) Determine P(y=5) e expresse seu resultado em termos de porcentagem.
c) Encontre P(7).
d) Determine a distribuição de probabilidades da variável aleatória y.
73

lOMoARcPSD|32583331
Tabela 5.4 – Distribuição de freqüências de alunos

matriculados por série.
Série Freqüência
y f
0 2.700
1 2.951
2 2.786
3 2812
4 2926
5 3.131
6 3.180
7 3.184
8 3.062
26.732
Solução:
a) O evento “o estudante selecionado é da quinta série” pode ser representado por {y=5}.
b) P(y=5) é a probabilidade de que o estudante selecionado seja da quinta série. Usando a

tabela 5.4 e a definição clássica de probabilidade podemos obter
f 3131
P ( y = 5) = = = 0,117
N 26732
Em termos de porcentagem, isto significa que 11,7% dos estudantes do primeiro grau
estão na quinta série.
c) P(7) significa a probabilidade de que o estudante selecionado esteja na sétima série.

Analogamente ao item (b), obtemos a probabilidade de
f 3184
P (7 ) = = = 0,119
N 26732
d) A distribuição de probabilidades da variável y é determinada computando-se P(y) para

y=0,1,2, ... ,8. Nós já fizemos este cálculo para y=5 e y=7. Essas e os outros valores
calculados podem ser vistos na tabela 5.5.
Uma vez determinada a distribuição de probabilidades, torna-se fácil determinar

qualquer probabilidade envolvendo aquela variável aleatória. A ferramenta básica para isso é
a regra especial da adição que diz que dados dois eventos mutuamente exclusivos A e B, a
probabilidade do evento união é a soma das probabilidades dos eventos individuais, isto é:
P(A∪B) = P(A) + P(B)
74

lOMoARcPSD|32583331
Tabela 5.5 - Distribuição de probabilidades da variável y.

Série Probabilidade
y P(y)
0 0,101
1 0,110
2 0,104
3 0,105
4 0,109
5 0,117
6 0,119
7 0,119
8 0,115
0,999
Nota: a soma das probabilidades resultou em 0,999 por uma
questão de arredondamento.
Exemplo 5.5 – Ilustra notação e distribuição de probabilidades de variáveis aleatórias
Quando uma moeda homogênea é lançada três vezes, existem oito resultados
igualmente possíveis que são:
Ca Ca Ca Ca Co Ca Co Ca Ca Co Co Ca
Ca Ca Co Ca Co Co Co Ca Co Co Co Co
Aqui, por exemplo, Ca Ca Co significa que os dois primeiros lançamentos resultaram

em Cara e Cara e o terceiro em Corôa. Seja x o número total de caras (Ca) obtidas nos três
lançamentos. Então x é uma variável aleatória discreta cujos valores possíveis são 0, 1, 2 e 3.
a) Use a notação de variável aleatória para representar o evento “exatamente duas caras
são obtidas”.
b) Determine P(x = 2) e expresse o resultado em termos de porcentagem.
c) Determine a distribuição de probabilidades da variável aleatória x.
d) Use a notação de variável aleatória para representar o evento “no máximo duas caras
são obtidas”.
e) Determine P(x ≤ 2).
Solução:
a) {x=2}
b) P(x=2) é dada por
f 3
P ( x = 2) = = = 0,375
N 8
Isto é porque existem três maneiras de se obter duas caras de um total de oito
possibilidades.
75

lOMoARcPSD|32583331
c) A distribuição de probabilidades é dada pela tabela abaixo.
Tabela 5.6 – Distribuição de probabilidades para o número de caras x.

Número de caras Probabilidade
x P(x)
0 0,125
1 0,375
2 0,375
3 0,125
1,000
d) O evento “no máximo duas caras são obtidas” pode ser representado por {x ≤ 2}, leia-se
“x é menor ou igual a 2”.
e) P(x ≤ 2) é a probabilidade de que no máximo duas caras sejam obtidas e o evento { x ≤ 2}

pode ser expresso por:
{ x ≤ 2} = ( {x=0} ou {x=1} ou {x=2} )
Uma vez que os três eventos da direita são mutuamente exclusivos, nós podemos usar
a regra especial da adição e os valores da tabela 5.6 para calcular P(x ≤ 2).
P(x ≤ 2) = P(x=0) + P(x=1) + P(x=2)

= 0,125 + 0,375 + 0,375 = 0,875
Assim, a probabilidade é 0,875 de que no máximo duas caras ocorram.
1) Quando dois dados são lançados, existem 36 resultados igualmente possíveis. Estes
resultados estão dados na tabela 5.2, na página 68. Representemos por y a soma dos
dados.
a) Quais são os possíveis valores da variável aleatória y?
b) Use a notação de variável aleatória para representar o evento “a soma dos dados é
sete”.
c) Determine P(y=7).
d) Determine P(11).
e) Determine a distribuição de probabilidades de y. Deixe os valores das probabilidades
na forma de frações.
2) Um banco possui seis caixas para atendimento ao público. O número de caixas

ocupados varia com o tempo sendo, então, uma variável aleatória que chamaremos de
x. De registros passados, a distribuição de probabilidades de x é conhecida e é dada
pela tabela a seguir.
76

lOMoARcPSD|32583331
Número de caixas ocupados Probabilidade

x P(x)
0 0,03
1 0,05
2 0,08
3 0,15
4 0,21
5 0,26
6 0,22
A tabela indica, por exemplo, que a probabilidade de que exatamente cinco caixas
estejam ocupados com clientes é 0,26; ou seja, 26% do tempo exatamente cinco caixas
estão ocupados com clientes. Use a notação de variável aleatória para representar os
seguintes eventos:
a) Exatamente quatro caixas estão ocupados.
b) Pelo menos dois caixas estão ocupados.
c) Menos de cinco caixas estão ocupados.
d) Pelo menos dois, porém menos que cinco caixas estão ocupados.
Use a regra especial da adição e a distribuição de probabilidades para calcular

e) P(x = 4).
f) P(x ≥ 2).
g) P(x < 5).
h) P(2 ≤ x < 5).
3) Suponha que z seja uma variável aleatória e que P(z > 1,96) = 0,025. Determine P(z≤1,96).
(Dica: Use o conceito de evento complementar)
4) Suponha que t seja uma variável aleatória e que P(t > 2,02) = 0,05 e que P(t < -2,02) =
0,05. Determine P(-2,02 ≤ t ≤ 2,02).
5) Assuma que x seja uma variável aleatória e que P( x > c) = α, onde c e α são números e
0≤α≤1. Determine P(x ≤ c) em termos de α.
6) Baseado em registros recentes, um gerente de uma oficina de pintura de carros determinou

a seguinte distribuição de probabilidades para o número de clientes por dia:
x 0 1 2 3 4 5
f(x) 0,05 0,20 0,30 0,25 0,15 0,05
a) Se a oficina tem capacidade de atender dois clientes por dia, qual é a probabilidade de
que um ou mais clientes não sejam atendidos em um dado dia?
b) Qual é a probabilidade de que a capacidade da oficina não seja completamente
utilizada em um dado dia?
c) De quanto devemos aumentar a capacidade de modo que a probabilidade de não
atender um cliente não seja maior que 0,10?
77

lOMoARcPSD|32583331
5.4 – Cálculo da média e do desvio padrão para dados agrupados
As fórmulas para cálculo da média e do desvio padrão, vistas no capítulo 2, devem ser
aplicadas apenas quando se tem um conjunto de dados não agrupados. Entretanto, nós
encontramos freqüentemente dados agrupados na forma de uma tabela de distribuição de
freqüências. Neste caso, precisamos aplicar fórmulas diferentes para o cálculo da média e do
desvio padrão.
5.4.1 – Cálculo da média
Para mostrar o cálculo da média para dados agrupados usaremos os dados usados no
exemplo 2.4 do capítulo 2.
Exemplo 5.6 – Ilustra cálculo da média para dados agrupados
Suponha que os valores da tabela abaixo correspondam a ajuda de custos de alunos

estagiários pagas por empresas da área de engenharia. Colocar esses dados na forma de uma
tabela de distribuição de freqüências (dados agrupados) e determinar a média de salários.
Tabela 5.7 – Dados referentes a salários

Salários de estagiários (R$)
200 200 840 350 300 300 200 200 950 200
Nota: Os zeros correspondentes aos centavos foram omitidos

para facilitar a leitura.
Solução:
A tabela de freqüências pode ser escrita como:
Tabela 5.8 – Tabela de freqüências.

Salário Freqüência
(R$) f
200 5
300 2
350 1
840 1
950 1
10
No exemplo 2.4, o cálculo da média foi feito somando-se os dados da tabela 5.6 e
dividindo o total pelo número de salários(dados), ou seja:
Soma dos salários = 200 + 200 + 840 + 350 + 300 + 300 + 200 + 200 + 950 + 200
= 200 + 200 + 200 + 200 + 200 + 300 + 300 + 350 + 840 + 950
5 2 1 1 1
78

lOMoARcPSD|32583331
Soma dos salários = 200 . 5 + 300 . 2 + 350 . 1 + 840 . 1 + 950 . 1 = 3740
Podemos observar que a soma dos salários é obtida adicionando-se os produtos dos
salários pelas respectivas freqüências. Isto pode ser feito mais eficientemente adicionando-se
uma coluna à tabela de freqüência (veja tabela abaixo).
Tabela 5.9 – Tabela para cálculo da média.

Salário($) Freqüência Salário . Freqüência
x f xf
200 5 1000
300 2 600
350 1 350
840 1 840
950 1 950
10 3740
Dessa forma, a média pode ser dada por
−
x=
Soma dos Salários
=
∑ xf =
3740
= 374
Número de Salários ∑f 10
Os cálculos mostrados acima permitem escrevermos a fórmula seguinte.
Fórmula 5.1 – Média de dados agrupados
A média de um conjunto de dados agrupados na forma de uma tabela de distribuição

de freqüências pode ser calculada por
−
x=
∑ xf
n
onde f representa a freqüência e n ( = Σf ) representa o tamanho da amostra.
5.4.2 – Cálculo do desvio padrão
Usando um raciocínio semelhante ao usado no cálculo da média, podemos determinar

uma fórmula para o cálculo do desvio padrão. Na verdade daremos duas fórmulas para o
cálculo do desvio padrão para dados agrupados sendo que a segunda fórmula é mais simples
de ser aplicada.
79

lOMoARcPSD|32583331
Fórmula 5.2 – Desvio padrão de dados agrupados
O desvio padrão de uma amostra, s, de um conjunto de dados que é agrupado na

forma de uma tabela de distribuição de freqüência pode ser computado usando a seguinte
fórmula
2
 −
∑ x− x  × f
s=
 
n −1
ou, uma versão simplificada dada por
s=
(
n ∑ x 2 f − (∑ xf ) ) 2
n(n − 1)
onde f é a freqüência do dado e n ( = Σf ) é o tamanho da amostra.
Exemplo 5.7 – Ilustra a fórmula de cálculo do desvio padrão
Usaremos os mesmos dados do exemplo anterior para mostrar a aplicação da fórmula

acima. O cálculo do desvio padrão é feito com o auxílio da tabela abaixo, obtida do exemplo
5.6 adicionando-se as colunas x2 e x2f.
Tabela 5.10 – Tabela para cálculo do desvio padrão.

Salário($) Freqüência Salário . Freqüência x2 x2f
x f xf
200 5 1000 40.000 200.000
300 2 600 90.000 180.000
350 1 350 122.500 122.500
840 1 840 705.600 705.600
950 1 950 902.500 902.500
10 3740 2.110.600
Com os dados da última linha da tabela acima podemos determinar s.
s=
( )
n ∑ x 2 f − (∑ xf )
2
=
10 × (2.110.600 ) − (3740 )
2
= 281,24
n(n − 1) 10 × (9 )
Portanto, o desvio padrão dos salários é R$ 281,24.
80

lOMoARcPSD|32583331
5.5 – Média e desvio padrão de uma variável aleatória discreta
A fórmula para o cálculo do valor médio, ou simplesmente média de uma variável

aleatória, pode ser derivada da fórmula 5.1. Para isso basta observar que para cada valor da
variável aleatória x, a probabilidade P(x) e a freqüência relativa f/N são iguais. Portanto,
podemos escrever:
µ=
∑ xf  f 
= ∑ x  = ∑ xP(x)
n N
A seguinte definição pode ser dada.
Definição 5.5 – Média de uma variável aleatória discreta - A média de uma variável
aleatória discreta, x, é definida por:
µx = ∑ xP(x)
Os termos valor esperado ou expectativa são também usados.
A fórmula para o cálculo do desvio padrão σx , pode ser deduzida de uma forma
similar à da média. Uma vez que as freqüências relativas e probabilidades são iguais, a
fórmula para σ é:
∑ (x − µ ) ×f
2
∑ (x − µ ) ∑ (x − µ )
f
σ= =
2
× =
2
P( x)
N N
Podemos mostrar também que a fórmula acima pode ser escrita de uma outra forma
para simplificar o cálculo do desvio padrão. Esta fórmula simplificada é dada por
σ= ∑x 2
P( x) − µ 2
A seguinte definição pode ser dada.
Definição 5.6 – Desvio padrão de uma variável aleatória - O desvio padrão de uma
variável aleatória x, é definido por:
σx = ∑ (x − µ ) P( x) = ∑x P ( x) − µ x2
2 2
x
81

lOMoARcPSD|32583331
Exemplo 5.8 – Ilustra o cálculo da média e do desvio padrão de uma variável aleatória
A variável x é o número de pessoas em uma família aleatoriamente selecionada em

uma comunidade. Assumindo que a distribuição de probabilidades seja a da tabela abaixo,
determine a média e o desvio padrão da variável aleatória x.
Tabela 5.11 – Distribuição de probabilidades da variável x.

Número de pessoas Probabilidade
x P(x)
1 0,232
2 0,317
3 0,175
4 0,154
5 0,073
6 0,030
7 0,019
Solução:
Para o cálculo da média basta acrescentar mais uma coluna à tabela acima.
Tabela 5.12 – Cálculo da média da variável “número de pessoas”.

Número de pessoas Probabilidade Produto
x P(x) x . P(x)
1 0,232 0,232
2 0,317 0,634
3 0,175 0,525
4 0,154 0,616
5 0,073 0,365
6 0,030 0,150
7 0,019 0,133
O valor da média será, então:
µx = ∑ x . P(x) = 2,65
Para o cálculo do desvio padrão precisamos acrescentar mais duas colunas à tabela de
distribuição de probabilidade dada.
82

lOMoARcPSD|32583331
Tabela 5.13 – Cálculo do desvio padrão da variável x.

Número de pessoas Probabilidade
x P(x) x2 x2P(x)
1 0,232 1 0,232
2 0,317 4 1,268
3 0,175 9 1,575
4 0,154 16 2,464
5 0,073 25 1,825
6 0,030 36 1,080
7 0,019 49 0,931
9,375
O valor do desvio padrão será, então:
σx = ∑x P ( x) − µ x2 = 9,375 − (2,65) = 1,53

2 2
83

lOMoARcPSD|32583331
1) A variável aleatória x é o número de caixas ocupados em um banco. A distribuição de

probabilidade é:
Número de caixas ocupados Probabilidade

x P(x)
0 0,03
1 0,05
2 0,08
3 0,15
4 0,21
5 0,26
6 0,22
a) Determine a média e o desvio padrão da variável x.

b) Construa um histograma da distribuição de probabilidade da variável x.
2) A variável aleatória y é o número de carros vendidos durante uma semana por um

vendedor de carros. A distribuição de probabilidade é dada na tabela seguinte.
a) Determine a média e o desvio padrão da variável y.

b) Construa um histograma da distribuição de probabilidade da variável y.
Carros vendidos Probabilidade

y P(y)
0 0,135
1 0,271
2 0,271
3 0,180
4 0,090
5 0,036
6 0,012
7 0,003
8 0,002
84

lOMoARcPSD|32583331
5.6 – Experimentos binomiais
Muitos problemas em estatística envolvem situações, onde um experimento, com dois

resultados possíveis, é repetido várias vezes, sempre em condições idênticas. Cada vez que o
experimento é realizado dizemos que ocorreu uma repetição ou realização do experimento.
Alguns exemplos dessas situações são:
• Eleições – eleitores escolhendo entre dois candidatos

• Fabricação – produtos sendo verificados como aceitáveis ou defeituosos.
• Medicina – nova droga sendo testada em pacientes, podendo ser efetiva ou não efetiva.
• Comércio – um vendedor atendendo vários clientes durante uma semana. Para cada
um uma venda ocorre ou não ocorre.
Todas as situações acima exibem uma característica de dualidade que caracterizam um

experimento binomial. A seguinte definição pode ser dada:
Definição 5.7 – Experimento binomial - Um experimento binomial é aquele que satisfaz

os seguintes requisitos:
1. O experimento deve ter um número fixo de repetições.

2. As repetições devem ser independentes.
3. Cada repetição deve ter um resultado classificado em apenas duas categorias.
4. A probabilidade deve permanecer constante em cada repetição.
Esta definição indica que em um experimento binomial, nós temos um número fixo de
repetições independentes onde cada resultado tem somente duas classificações. O termo
independente significa que o resultado de uma repetição ou realização do experimento não
afetará as probabilidades dos resultados em repetições subsequentes.
Em estatística é uma prática comum tratar eventos como independentes quando

amostras pequenas são retiradas de grandes populações. Uma orientação comum é assumir
independência quando o tamanho da amostra for no máximo 5% do tamanho da população.
Notação
Sucesso ou falha (s ou f) indicam as duas categorias de todos os resultados; p e q

indicam as probabilidades de sucesso(s) e de falha(f), respectivamente, ou seja
P(s) = p
P(f) = 1- p = q
n indica o número fixo de repetições.
x indica o número específico de sucessos nas n repetições
p indica a probabilidade de sucesso em uma repetição dentre as n.
q indica a probabilidade de falha em uma repetição dentre as n.
P(x) indica a probabilidade de se obter exatamente x sucessos entre as n repetições.
85

lOMoARcPSD|32583331
Exemplo 5.9 – Ilustra experimento binomial
Sabe-se que uma droga é 80% efetiva na cura de uma certa doença. Suponha que
quatro pacientes com a doença sejam submetidos a um tratamento com a droga e que os
resultados curado e não curado sejam registrados.
a) Formule o experimento como um experimento binomial com quatro repetições.
b) Determine os possíveis resultados das quatro repetições.
c) Determine a probabilidade de cada resultado da parte (b).
Solução:
a) Cada repetição consiste em administrar a droga a um paciente. Há dois possíveis

resultados para cada repetição: cura e não cura. As repetições são independentes. Se
chamarmos de sucesso uma cura, então a probabilidade de sucesso é p = 0,8 ( 80% ).
b) Os possíveis resultados das quatro repetições estão mostrados na tabela abaixo.
Tabela 5.14 – Resultados possíveis do experimento binomial.

ssss sfss ffss sfff
ffff fsss sfsf fsff
sssf ssff fsfs ffsf
ssfs sffs fssf fffs
Por exemplo, sssf representa o resultado de que os primeiros três pacientes são curados
e o último não é.
c) Como pode ser visto da tabela acima, existem 16 possíveis resultados e a probabilidade de
ocorrência de cada um pode ser calculada aplicando-se a regra especial da multiplicação,
uma vez que as repetições são independentes. A probabilidade de sucesso é 0,8 e,
portanto, a probabilidade de falha é 0,2. Isto significa que
P(s) = p = 0,8 e P(f) = q = 1-p = 1-0,8 = 0,2
A regra especial garante que, por exemplo, a probabilidade de ocorrer o resultado sssf
é:
P(sssf) = P(s) . P(s) . P(s) . P(f) = 0,8 . 0,8 . 0,8 . 0,2 = 0,1024
Para o resultado fsfs a probabilidade será:
P(fsfs) = P(f) . P(s) . P(f) . P(s) = 0,2 . 0,8 . 0,2 . 0,8 = 0,0256
As probabilidades desses dois resultados e dos outros 14 estão na tabela a seguir.
Observe que resultados com o mesmo número de sucessos têm a mesma probabilidade
de ocorrer.
86

lOMoARcPSD|32583331
Tabela 5.15 – Resultados e probabilidades do experimento.

Resultado Probabilidade Resultado Probabilidade
ssss 0,4096 fsss 0,1024
sssf 0,1024 fssf 0,0256
ssfs 0,1024 fsfs 0,0256
ssff 0,0256 fsff 0,0064
sfss 0.1024 ffss 0,0256
sfsf 0,0256 ffsf 0.0064
sffs 0,0256 fffs 0,0064
sfff 0,0064 ffff 0,0016
Um diagrama em árvore (árvore das probabilidades) é útil para organizar os possíveis

resultados e suas probabilidades. Isto é dado na figura 5.1, abaixo.
Figura 5.1 – Árvore das probabilidades correspondente à tabela 5.15.
87

lOMoARcPSD|32583331
1) Em um experimento, uma pessoa em um cômodo seleciona aleatoriamente uma carta

dentre 10 cartas numeradas de 1 a 10, e outra pessoa em um outro cômodo tenta
adivinhar o número da carta escolhida. Este experimento é repetido três vezes, sendo a
carta escolhida reposta antes da próxima escolha. Assumindo que a pessoa não tenha
poderes paranormais, a probabilidade de adivinhar corretamente em qualquer uma das
três repetições é 1/10 = 0,1. Assuma que um sucesso, s, signifique responder
corretamente qual carta foi selecionada. Assim, ssf significa responder corretamente as
duas primeiras cartas e erradamente a terceira.
a) Qual é a probabilidade de sucesso p?
b) Construa uma tabela similar à tabela 5.15, para as três tentativas.
c) Construa um diagrama em árvore para este problema, similar ao da figura 5.1.
d) Liste os resultados com exatamente um sucesso.
e) Determine a probabilidade de cada resultado da parte (d). Porque estas
probabilidades são todas iguais?
2) De acordo com o Instituto de Saúde Mental dos EUA, 20% dos adultos americanos
sofrem de pelo menos um problema psiquiátrico. Suponha que quatro adultos
americanos sejam selecionados para estudos sobre problemas psiquiátricos. Se
assumirmos que um sucesso, s, corresponda a um adulto tendo um problema
psiquiátrico, responda às questões abaixo.
b) Construa uma tabela similar à tabela 5.15, para as quatro tentativas.
d) Liste os resultados com exatamente três sucessos.
3) Um estudo de uma companhia telefônica em uma certa cidade mostrou que a duração
média de uma chamada telefônica residencial é de 3,8 minutos e que a probabilidade de
uma chamada telefônica, selecionada de maneira aleatória, com duração superior a 3,8
minutos é de 0,25. Para uma dada chamada telefônica, assuma que consideramos um
sucesso, s, se a chamada telefônica durar no máximo 3,8 minutos.
b) Construa uma tabela similar à tabela 5.15, para os resultados possíveis sucesso-
falha de três chamadas telefônicas aleatoriamente selecionadas. Calcule as
probabilidades com três casas decimais.
d) Liste os resultados nos quais exatamente duas das três chamadas duram no
máximo 3,8 minutos.
88

lOMoARcPSD|32583331
5.7 - Distribuição binomial
Agora que já estudamos experimentos binomiais nós estamos em condições de

examinar a distribuição binomial. A distribuição binomial é a distribuição de probabilidade
para o número de sucessos em um experimento binomial. Para introduzir este assunto
utilizaremos o experimento das drogas do exemplo 5.9.
Exemplo 5.10 – Introduz a distribuição binomial
Sabe-se que uma droga é 80% efetiva na cura de uma doença. Suponha que quatro
pacientes com a doença sejam submetidos a um tratamento com a droga. Determine a
probabilidade de que:
a) exatamente dois pacientes sejam curados.
Solução:
Lembrando que um sucesso significa que a droga foi efetiva, ou seja, que o paciente
foi curado e se queremos calcular a probabilidade de obtermos dois sucessos, o resultado ssff
é um dos resultados que satisfaz o que é pedido. A probabilidade de ocorrer este resultado é
dada pela regra especial da multiplicação
P(ssff) = P(s) . P(s) . P(f) . P(f) = 0,8 . 0,8 . 0,2 . 0,2 = 0,0256
Se indicarmos a probabilidade de sucesso por p e a probabilidade de fracasso por q,

como definido na notação, o produto acima seria escrito como
P(ssff) = p . p . q . q
Entretanto, este não é o único resultado aceitável. A tabela 5.15, aqui repetida como
tabela 5.16 mostra que outros resultados são possíveis.
Tabela 5.16 – Resultados e probabilidades do experimento.

Resultado Probabilidade Resultado Probabilidade
ssss 0,4096 fsss 0,1024
sssf 0,1024 fssf 0,0256
ssfs 0,1024 fsfs 0,0256
ssff 0,0256 fsff 0,0064
sfss 0.1024 ffss 0,0256
sfsf 0,0256 ffsf 0.0064
sffs 0,0256 fffs 0,0064
sfff 0,0064 ffff 0,0016
De fato, existem 6 maneiras de obtermos 2 sucessos entre os quatro pacientes e cada

maneira tem probabilidade 0,0256 de ocorrer. Assim, a probabilidade total será dada pela
regra especial da adição
89

lOMoARcPSD|32583331
P(x=2) = P(ssff) + P(ffss) + P(sfsf) + P(fsfs) + P(sffs) + P(fssf) =

= 0,0256 + 0,0256 + 0,0256 + 0,0256 + 0,0256 + 0,0256 =
= 6 . 0,0256 = 0,1536
A probabilidade de exatamente dois pacientes serem curados é 0,1536.
Este exemplo mostrou que em muitas situações estamos interessados no número de

sucessos em um experimento binomial. Se indicarmos o número total de sucessos por x, então
x é uma variável aleatória cujos possíveis valores seriam 0, 1, 2, 3, 4. Usando a notação de
variável aleatória para representar eventos e probabilidades, o evento “exatamente dois
pacientes dos quatro sejam curados” pode ser escrito como “{x = 2}”. A probabilidade
calculada no exemplo 5.10 poderia ser indicada como P(x=2) = 0,1536 ou simplesmente P(2)
= 0,1536.
A tabela 5.11 abaixo mostra os valores da variável aleatória x e as respectivas

probabilidades.
Tabela 5.11 – Distribuição de probabilidade para o

número de pacientes curados.
Número de pacientes curados Probabilidade
x P(x)
0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096
O exemplo 5.10 foi resolvido listando-se todas as possibilidades de resultados do

experimento. Entretanto se em vez de quatro pacientes tivéssemos 20 pacientes então este
modo de resolução não seria viável. Necessitamos assim de uma fórmula para definir uma
distribuição binomial e que permita obter a probabilidade de ocorrer um número de sucessos x
dentre n repetições do experimento. O fato importante, mostrado abaixo, nos dá o número de
resultados possíveis com x sucessos.
Fato Importante 5.2
Suponha que n repetições sejam realizadas em um experimento binomial. O número

de resultados com exatamente x sucessos é igual ao coeficiente binomial
n
x
Este fato importante não será demonstrado. Porém, podemos verificar sua consistência
com os resultados do exemplo anterior.
90

lOMoARcPSD|32583331
Na parte (a) do exemplo, encontramos seis resultados possíveis nos quais exatamente
dois dos quatro pacientes são curados: ssff, sfsf, sffs, fssf, fsfs e ffss. Em outras palavras, o
evento de exatamente dois sucessos (x=2) em quatro repetições (n=4) consiste de seis
resultados.
Usando o fato importante 5.2, podemos determinar este valor sem a necessidade de
listar todos eles.
n 4 4! 4.3.2!
x
= = = =6
2 2!.(4 − 2)! 2!.2!
Podemos agora desenvolver uma fórmula para o cálculo da probabilidade de se obter

um determinado número de sucessos em um experimento binomial. Por exemplo, para
determinar a probabilidade de ter três curas, P(x=3), raciocinamos da seguinte maneira.
Qualquer resultado particular com exatamente três curas (por exemplo, ssfs) tem
probabilidade:
três curas uma não-cura
(0,8)3 . (0,2)1 = 0,512 . 0,2 = 0,1024
probabilidade probabilidade
de cura de não-cura
O valor é obtido pela multiplicação das três probabilidades de sucesso de 0,8 e uma
probabilidade de falha de 0,2. Por outro lado, o fato importante 5.2 permite calcular o número
de resultados com exatamente três curas que é
4 4!
3 = =4
3!1!
Assim, pela regra especial da adição, a probabilidade de exatamente três curas é
4
P(x=3) = 3 (0.8)3 (0,2)1 = 4 . 0,1024 = 0,4096
Para um outro evento, com um número diferente de sucessos, o raciocínio seria

similar. Isto nos leva à fórmula seguinte.
91

lOMoARcPSD|32583331
Fórmula 5.2 –Distribuição binomial

Suponha que n repetições independentes sejam realizadas e que a probabilidade de
sucesso em qualquer repetição seja p. Seja x o número total de sucessos dentre as n
repetições. Então a distribuição de probabilidade da variável x é dada pela fórmula
n
P(x) = x px(1-p)n-x
A variável aleatória x é chamada variável aleatória binomial e é dita ter a distribuição

binomial com parâmetros n e p.
Para determinar a fórmula da distribuição binomial em problemas específicos, é útil ter

um procedimento bem organizado. Tal procedimento é apresentado abaixo.
Procedimento 5.1 – Como determinar uma distribuição binomial
Hipóteses
1. n idênticas repetições são realizadas.
2. Existem dois possíveis resultados ( sucesso ou falha ) para cada repetição.
3. As repetições são independentes.
4. A probabilidade de sucesso, p, permanece a mesma em cada repetição.
Passo 1 - Identifique um sucesso.

Passo 2 - Determine p, a probabilidade de sucesso.
Passo 3 - Determine n, o número de repetições.
Passo 4 - Substitua os valores na fórmula 5.2.
n
P( x ) =   p x (1 − p )
n− x
x
Exemplo 5.11 – Ilustra o procedimento
Um estudo de uma companhia telefônica em uma cidade mostrou que a duração média
de uma chamada telefônica residencial é de 3,8 minutos e que a probabilidade de uma
chamada telefônica, selecionada de maneira aleatória, com duração superior a 3,8 minutos é
de 0,25. Qual é a probabilidade de que entre três chamadas, aleatoriamente selecionadas,
a) exatamente duas durem mais que 3,8 minutos?

b) nenhuma dure mais que 3,8 minutos?
92

lOMoARcPSD|32583331
Solução:
Seja x o número de chamadas, dentre as três selecionadas, que duram mais que 3,8
minutos. Para encontrar as probabilidades pedidas, aplicaremos o procedimento anterior
sugerido.
Passo 1 - Identifique um sucesso

Um sucesso será uma chamada que durar mais que 3,8 minutos.
Passo 2 - Determine p, a probabilidade de sucesso.

A probabilidade p de uma chamada durar mais que 3,8 minutos é igual a 0,25. Assim,
p=0,25.
Passo 3 - Determine n, o número de repetições.

Neste caso, o número de repetições é o número de chamadas selecionadas. Logo n=3.
Passo 4 - A fórmula da distribuição binomial para o número de sucessos x, será
3
P(x) = x (0,25)x(0,75)3-x
Tendo completado o procedimento, podemos responder às perguntas formuladas.
a) A probabilidade de exatamente duas durarem mais que 3,8 minutos é obtida fazendo-se
x=2.
3
P(2) = 2 (0,25)2(0,75)1 = 0,141
b) A probabilidade de nenhuma das três chamadas durar mais que 3,8 minutos é obtida
fazendo-se x=0.
3
P(0) = 0 (0,25)0(0,75)3 = 0,422
Existe 42,2% de chance de que nenhuma das três chamadas selecionadas durem mais
que 3,8 minutos.
93

lOMoARcPSD|32583331
1) Um vendedor de carros novos sabe de experiência passada que, na média, ele faz uma
venda para cerca de 20% de seus clientes. Qual é a probabilidade de que em cinco
clientes aleatoriamente selecionados, ele fará uma venda
a) para exatamente três clientes?
b) Para no máximo um cliente?
c) Para no mínimo um cliente?
d) Determine a distribuição de probabilidade para o número de vendas em cinco clientes
aleatoriamente selecionados.
2) De acordo com a Associação de Banqueiros Americanos, somente 1 em 10 pessoas não

está satisfeita com seu banco local. Se 15 pessoas são selecionadas ao acaso, qual é a
probabilidade de que o número de pessoas descontentes com seu banco local seja
a) exatamente duas?
b) no máximo duas?
c) no mínimo duas?
d) entre uma e três?
3) Utilizando a tabela de probabilidades binomiais do apêndice, repita os exercícios 1 e 2.
94

lOMoARcPSD|32583331
5.8 – Média e desvio padrão de uma variável aleatória binomial
Na seção 5.5, aprendemos como obter a média e o desvio padrão de uma variável
discreta. A definição 5.5, na página 78, nos dá a fórmula para calcular a média de uma
variável aleatória discreta. O cálculo do desvio padrão é feito com o auxílio da fórmula dada
na definição 5.6. Estas fórmulas se aplicam para qualquer variável aleatória discreta e, em
particular, para uma variável aleatória binomial. Considere o exemplo 5.12.
Exemplo 5.12 – Ilustra o cálculo da média e desvio padrão de uma variável aleatória
binomial
O U.S. National Center for Health Statistics relata que 60% de todas as operações de
olhos são feitas em mulheres. Suponha que três pacientes operados dos olhos sejam
selecionados aleatoriamente. Façamos x representar o número de pacientes femininos dentre
os três pacientes selecionados. Com isso, x é uma variável aleatória binomial com
parâmetros n = 3 e p = 0,6.
a) determine a média da variável aleatória x.
b) encontre o desvio padrão da variável aleatória x.
Solução:
Para determinar a média e o desvio padrão de x, nós necessitamos primeiro determinar
a sua distribuição de probabilidades. Uma vez que x tem uma distribuição binomial com
parâmetros p = 0,6 e n = 3, probabilidades para x podem ser calculadas usando a fórmula 5.2
da página 84.
3
P(x) = x
(0,6)x(0,4)n-x
Os possíveis valores de x são 0, 1, 2 e 3. Substituindo estes valores na fórmula acima

obtemos a segunda coluna da tabela abaixo. As três últimas colunas são necessárias para o
cálculo da média e do desvio padrão.
x P(x) x.P(x) x2 x2.P(x)

0 0,064 0 0 0
1 0,288 0,288 1 0,288
2 0,432 0,864 4 1,728
3 0,216 0,648 9 1,944
1,800 3,960
a) A média da variável aleatória x pode ser obtida por:
µx = Σx.P(x) = 1,8
95

lOMoARcPSD|32583331
b) O desvio padrão será
σx = ∑ x 2 P ( x) − µ x2 = 3,96 − (1,8) = 0,85

2
Observe que o mesmo valor 1,8 determinado para a média da variável aleatória x,
poderia ser encontrado com o seguinte raciocínio. Se 60% de todos os pacientes de cirurgia
ocular são do sexo feminino, então dos três pacientes considerados podemos esperar que 60%
deles sejam do sexo feminino. Entretanto, 60% de 3 é igual a 1,8. Este tipo de raciocínio
sempre funciona quando se trata de variável aleatória binomial, o que sugere a seguinte
fórmula:
Fórmula 5.3 – Média de uma variável aleatória binomial
Suponha que x tenha uma distribuição binomial com parâmetros n e p. Então a

média da variável aleatória binomial x pode ser obtida por
µx = np
A fórmula para o desvio padrão pode também ser facilmente demonstrada porém nos
limitaremos apenas a apresentá-la abaixo.
Fórmula 5.4 – Desvio padrão de uma variável aleatória binomial
Suponha que x tenha uma distribuição binomial com parâmetros n e p. Então o

desvio padrão da variável aleatória binomial x pode ser obtida por
σx = np(1 − p )
Exemplo 5.13 – Ilustra as fórmulas 5.3 e 5.4
Repetiremos o exemplo 5.12 para mostrarmos a aplicação das fórmulas.
O U.S. National Center for Health Statistics relata que 60% de todas as operações de
olhos são feitas em mulheres. Suponha que três pacientes operados dos olhos sejam
selecionados aleatoriamente. Façamos x representar o número de pacientes femininos dentre
os três pacientes selecionados. Com isso, x é uma variável aleatória binomial com parâmetros
n = 3 e p = 0,6.
c) determine a média da variável aleatória x.
d) encontre o desvio padrão da variável aleatória x.
96

lOMoARcPSD|32583331
Solução:
Primeiramente observemos que a variável aleatória binomial x possui como
parâmetros os valores n=3 e p=0,6.
a) Aplicando a fórmula 5.3 obtemos a média da variável x
µx = np = 3 . 0,6 = 1,8
b) Com a fórmula 5.4 obtemos o desvio padrão
σx = np(1 − p ) = 3.0,6(1 − 0,6) = 0,85

Os valores encontrados para a média e o desvio padrão são, naturalmente, os mesmos
do exemplo 5.12. As fórmulas porém permitem um cálculo muito mais rápido e simples.
1) Em um experimento, uma pessoa em um cômodo seleciona aleatoriamente uma carta

dentre 10 cartas numeradas de 1 a 10 e, outra pessoa, em outro cômodo, tenta adivinhar
o número da carta escolhida. Este experimento é repetido três vezes, sendo a carta
escolhida reposta antes da próxima escolha. Assumindo que a pessoa não tenha poderes
paranormais, a probabilidade de adivinhar corretamente em qualquer uma das três
repetições é 1/10 = 0,1. Seja x a variável que indica o número de respostas corretas
dentre as três tentativas.
a) Determine a média e o desvio padrão aplicando as fórmulas gerais
µx = Σx.P(x) e σx = ∑ x 2 P( x) − µ x2
b) Determine a média e o desvio padrão aplicando as fórmulas especiais
µx = np e σx = np(1 − p )
2) Um vendedor de carros novos sabe de experiência passada que, na média, ele faz uma
venda para cerca de 20% de seus clientes. Seja x a variável que indica o número de
vendas efetuadas dentre cinco clientes aleatoriamente selecionados.
a) Determine a média e o desvio padrão aplicando as fórmulas gerais
µx = Σx.P(x) e σx = ∑ x 2 P( x) − µ x2
b) Determine a média e o desvio padrão aplicando as fórmulas especiais
µx = np e σx = np(1 − p )
97

lOMoARcPSD|32583331
APÊNDICE: TABELA DE PROBABILIDADES BINOMIAIS
PROBABILIDADES BINOMIAIS
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
2 0 980 902 810 640 490 360 250 160 090 040 010 002 0+ 0
1 020 095 180 320 420 480 500 480 420 320 180 095 020 1
2 0+ 002 010 040 090 160 250 360 490 640 810 902 980 2
3 0 970 857 729 512 343 216 125 064 027 008 001 0+ 0+ 0
1 029 135 243 384 441 432 375 288 189 096 027 007 0+ 1
2 0+ 007 027 096 189 288 375 432 441 384 243 135 029 2
3 0+ 0+ 001 008 027 064 125 216 343 512 729 857 970 3
4 0 961 815 656 410 240 130 062 026 008 002 0+ 0+ 0+ 0
1 039 171 292 410 412 346 250 154 076 026 004 0+ 0+ 1
2 001 014 049 154 265 346 375 346 265 154 049 014 001 2
3 0+ 0+ 004 026 076 154 250 346 412 410 292 171 039 3
4 0+ 0+ 0+ 002 008 026 062 130 240 410 656 815 961 4
5 0 951 774 590 328 168 078 031 010 002 0+ 0+ 0+ 0+ 0
1 048 204 328 410 360 259 156 077 028 006 0+ 0+ 0+ 1
2 001 021 073 205 309 346 312 230 132 051 008 001 0+ 2
3 0+ 001 008 051 132 230 312 346 309 205 073 021 001 3
4 0+ 0+ 0+ 006 028 077 156 259 360 410 328 204 048 4
5 0+ 0+ 0+ 0+ 002 010 031 078 168 328 590 774 951 5
6 0 941 735 531 262 118 047 016 004 001 0+ 0+ 0+ 0+ 0
1 057 232 354 393 303 187 094 037 010 002 0+ 0+ 0+ 1
2 001 031 098 246 324 311 234 138 060 015 001 0+ 0+ 2
3 0+ 002 015 082 185 276 312 276 185 082 015 002 0+ 3
4 0+ 0+ 001 015 060 138 234 311 324 246 098 031 001 4
5 0+ 0+ 0+ 002 010 037 094 187 303 393 354 232 057 5
6 0+ 0+ 0+ 0+ 001 004 016 047 118 262 531 735 941 6
7 0 932 698 478 210 082 028 008 002 0+ 0+ 0+ 0+ 0+ 0
1 066 257 372 376 247 131 055 017 004 0+ 0+ 0+ 0+ 1
2 002 041 124 275 318 261 164 077 025 004 0+ 0+ 0+ 2
3 0+ 004 023 115 227 290 273 194 097 029 003 0+ 0+ 3
4 0+ 0+ 003 029 097 194 273 290 227 115 023 004 0+ 4
5 0+ 0+ 0+ 004 025 077 164 261 318 275 124 041 002 5
6 0+ 0+ 0+ 0+ 004 017 055 131 247 367 372 257 066 6
7 0+ 0+ 0+ 0+ 0+ 002 008 028 082 210 478 698 932 7
8 0 923 663 430 168 058 017 004 001 0+ 0+ 0+ 0+ 0+ 0
1 075 279 383 336 198 090 031 008 001 0+ 0+ 0+ 0+ 1
2 003 051 149 294 296 209 109 041 010 001 0+ 0+ 0+ 2
3 0+ 005 033 147 254 279 219 124 047 009 0+ 0+ 0+ 3
4 0+ 0+ 005 046 136 232 273 232 136 046 005 0+ 0+ 4
5 0+ 0+ 0+ 009 047 124 219 279 254 147 033 005 0+ 5
6 0+ 0+ 0+ 001 010 041 109 209 296 294 149 051 003 6
7 0+ 0+ 0+ 0+ 001 008 031 090 198 336 383 279 075 7
8 0+ 0+ 0+ 0+ 0+ 001 004 017 058 168 430 663 923 8
98

lOMoARcPSD|32583331
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
9 0 914 630 387 134 040 010 002 0+ 0+ 0+ 0+ 0+ 0+ 0
1 083 299 387 302 156 060 018 004 0+ 0+ 0+ 0+ 0+ 1
2 003 063 172 302 267 161 070 021 004 0+ 0+ 0+ 0+ 2
3 0+ 008 045 176 267 251 164 074 021 003 0+ 0+ 0+ 3
4 0+ 001 007 066 172 251 246 167 074 017 001 0+ 0+ 4
5 0+ 0+ 001 017 074 167 246 251 172 066 007 001 0+ 5
6 0+ 0+ 0+ 003 021 074 164 251 267 176 045 008 0+ 6
7 0+ 0+ 0+ 0+ 004 021 070 161 267 302 172 063 003 7
8 0+ 0+ 0+ 0+ 0+ 004 018 060 156 302 387 299 083 8
9 0+ 0+ 0+ 0+ 0+ 0+ 002 010 040 134 387 630 914 9
10 0 904 599 349 107 028 006 001 0+ 0+ 0+ 0+ 0+ 0+ 0
1 091 315 387 268 121 040 010 002 0+ 0+ 0+ 0+ 0+ 1
2 004 075 194 302 233 121 044 011 001 0+ 0+ 0+ 0+ 2
3 0+ 010 057 201 267 215 117 042 009 001 0+ 0+ 0+ 3
4 0+ 001 011 088 200 251 205 111 037 006 0+ 0+ 0+ 4
5 0+ 0+ 001 026 103 201 246 201 103 026 001 0+ 0+ 5
6 0+ 0+ 0+ 006 037 111 205 251 200 088 011 001 0+ 6
7 0+ 0+ 0+ 001 009 042 117 215 267 201 057 010 0+ 7
8 0+ 0+ 0+ 0+ 001 011 044 121 233 302 194 075 004 8
9 0+ 0+ 0+ 0+ 0+ 002 010 040 121 268 387 315 091 9
10 0+ 0+ 0+ 0+ 0+ 0+ 001 006 028 107 349 599 904 10
11 0 895 569 314 086 020 004 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 099 329 384 236 093 027 005 001 0+ 0+ 0+ 0+ 0+ 1
2 005 087 213 295 200 089 027 005 001 0+ 0+ 0+ 0+ 2
3 0+ 014 071 221 257 177 081 023 004 0+ 0+ 0+ 0+ 3
4 0+ 001 016 111 220 236 161 070 017 002 0+ 0+ 0+ 4
5 0+ 0+ 002 039 132 221 226 147 057 010 0+ 0+ 0+ 5
6 0+ 0+ 0+ 010 057 147 226 221 132 039 002 0+ 0+ 6
7 0+ 0+ 0+ 002 017 070 161 236 220 111 016 001 0+ 7
8 0+ 0+ 0+ 0+ 004 023 081 177 257 221 071 014 0+ 8
9 0+ 0+ 0+ 0+ 001 005 027 089 200 295 213 087 005 9
10 0+ 0+ 0+ 0+ 0+ 001 005 027 093 236 384 329 099 10
11 0+ 0+ 0+ 0+ 0+ 0+ 0+ 004 020 086 314 569 895 11
12 0 886 540 282 069 014 002 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 107 341 377 206 071 017 003 0+ 0+ 0+ 0+ 0+ 0+ 1
2 006 099 230 283 168 064 016 002 0+ 0+ 0+ 0+ 0+ 2
3 0+ 017 085 236 240 142 054 012 001 0+ 0+ 0+ 0+ 3
4 0+ 002 021 133 231 213 121 042 008 001 0+ 0+ 0+ 4
5 0+ 0+ 004 053 158 227 193 101 029 003 0+ 0+ 0+ 5
6 0+ 0+ 0+ 016 079 177 226 177 079 016 0+ 0+ 0+ 6
7 0+ 0+ 0+ 003 029 101 193 227 158 053 004 0+ 0+ 7
8 0+ 0+ 0+ 001 008 042 121 213 231 133 021 002 0+ 8
9 0+ 0+ 0+ 0+ 001 012 054 142 240 236 085 017 0+ 9
10 0+ 0+ 0+ 0+ 0+ 002 016 064 168 283 230 099 006 10
11 0+ 0+ 0+ 0+ 0+ 0+ 003 017 071 206 377 341 107 11
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ 002 014 069 282 540 886 12
99

lOMoARcPSD|32583331
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1
2 007 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 021 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3
4 0+ 003 028 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4
5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5
6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6
7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7
8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8
9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9
10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10
11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 007 11
12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13
14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1
2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 026 114 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3
4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4
5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5
6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6
7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7
8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8
9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9
10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10
11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11
12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12
13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14
15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
2 009 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2
3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3
4 0+ 005 043 188 219 127 042 007 001 0+ 0+ 0+ 0+ 4
5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5
6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6
7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7
8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8
9 0+ 0+ 0+ 001 012 061 153 207 147 043 002 0+ 0+ 9
10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10
11 0+ 0+ 0+ 0+ 001 007 042 127 219 188 043 005 0+ 11
12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12
13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15
Notas:
1) Todos os valores da tabela são menores que 1. A vírgula foi suprimida para facilitar a leitura.
2) 0+ significa que se trata de um valor pequeno, porém não nulo.
100

lOMoARcPSD|32583331
Capítulo 6
Variáveis Aleatórias Contínuas e a

Distribuição Normal
Este capítulo é uma continuação do capítulo 5. Particularmente, serão apresentados os

conceitos fundamentais relativos à distribuição normal. Após o término deste capítulo, você
deverá ser capaz de:
1. Entender o termo distribuição ou curva normal padrão.

2. Determinar áreas sob esta curva..
3. Calcular a probabilidade de uma variável aleatória com distribuição normal.
101

lOMoARcPSD|32583331
6.1) Variáveis aleatórias contínuas
Como vimos no início do capítulo anterior, existem dois tipos principais de variáveis
aleatórias, discreta e contínua. Uma variável aleatória discreta é uma variável aleatória cujos
possíveis valores formam um conjunto discreto de dados, usualmente um conjunto de números
inteiros. Freqüentemente, uma variável aleatória discreta se relaciona com uma contagem de
alguma coisa, como por exemplo, o número de pessoas em uma família ou o número de carros
possuídos por uma família. Por outro lado, uma variável aleatória contínua é uma variável
aleatória cujos possíveis valores formam um conjunto contínuo de dados. Usualmente um
intervalo de números reais. Tipicamente, uma variável aleatória contínua envolve uma medição
de alguma coisa, como por exemplo, o peso de uma criança recém-nascida. A seguinte definição
caracteriza o conceito de variável aleatória contínua.
Definição 6.1 – Variável aleatória contínua
Uma variável aleatória x é considerada contínua se seu conjunto de valores possíveis

for um intervalo de números reais – isto é, se existirem dois números reais A e B, A<B, tais que
qualquer valor x entre A e B é possível de ocorrer.
Exemplo 6.1 – Ilustra variável contínua
a) Se em um estudo sobre ecologia de um lago nós fizermos medições de profundidade em

locais escolhidos aleatoriamente, então x = profundidade naquele local é uma variável
aleatória contínua. Aqui, A é a profundidade mínima e B é a profundidade máxima na região
sob estudo.
b) Se um composto químico é selecionado aleatoriamente e seu pH x é determinado, então x
é uma variável aleatória contínua, porque qualquer valor de pH entre 0 e 14 é possível de ser
encontrado.
Se a escala de medição de x puder ser subdividida em qualquer extensão desejada então a

variável é contínua; se ela não puder, a variável é discreta. Por exemplo, se a variável é altura ou
comprimento, então ela pode ser medida em quilômetros, metros, centímetros, milímetros,
microns, e assim por diante, logo a variável é contínua. Se, entretanto, x = conta de água de uma
casa aleatoriamente escolhida, então a menor unidade de medida é o centavo, desse modo,
qualquer valor de x é um múltiplo de R$0,01 e a variável x é discreta.
6.2) Distribuição de probabilidade para variáveis aleatórias contínuas
A distribuição de probabilidade para uma variável aleatória contínua é denominada

distribuição contínua de probabilidade. Esse conceito pode ser entendido da seguinte forma.
Suponha que a variável de interesse x seja a profundidade de um lago em um ponto
aleatoriamente escolhido na superfície do lago. Seja M = profundidade máxima (em metros),
de modo que qualquer valor no intervalo [0,M] seja um possível valor de x. Se nós
discretizarmos x, arredondando a medida de profundidade para o inteiro (metro) mais próximo,
então os possíveis valores de x seriam números inteiros ≤ M. A distribuição discreta de
profundidade resultante pode ser caracterizada usando um histograma de probabilidade. Se
desenharmos um histograma de modo que a área do retângulo acima de qualquer valor inteiro k
102

lOMoARcPSD|32583331
seja a proporção do lago cuja profundidade (arredondada ao inteiro mais próximo) é k, então a
soma das áreas de todos os retângulos é 1. Um possível histograma aparece na figura 6.1a.
Figura 6.1 – Histograma de probabilidade. a) profundidade arredondada em metros,

b) profundidade arredondada em centímetros, c) limite de uma seqüência de
histogramas discretos
Se a profundidade fosse arredondada ao centímetro mais próximo, e o mesmo eixo de

medição da figura 6.1a fosse usado, cada retângulo no histograma seria muito mais estreito,
embora a área total de todos os retângulos ainda fosse 1. Um possível histograma aparece na
figura 6.1b; ele tem uma aparência mais lisa do que o histograma da figura 6.1a. Se
continuarmos a medir a profundidade com resolução cada vez maior, a seqüência resultante de
histogramas se aproxima de uma curva contínua como a mostrada na figura 6.1c. Uma vez que
para cada histograma a área total de todos os retângulos é igual a 1, a área total sob a curva
também é igual a 1. A probabilidade de que a profundidade x em um ponto aleatoriamente
escolhido esteja entre dois valores a e b é simplesmente a área sob a curva entre os valores a e b.
É exatamente uma curva contínua como a mostrada na figura 6.1c que determina uma
distribuição contínua de probabilidade.
Definição 6.2 – Distribuição de probabilidade de uma variável aleatória contínua
Seja x uma variável aleatória. Então a função distribuição de probabilidade de x é uma

função f(x) tal que para quaisquer dois números a e b, com a ≤ b,
P (a ≤ x ≤ b) = ∫ f ( x)dx
a
Isto é, a probabilidade de que x assuma um valor no intervalo [a , b] é a área sob o
gráfico de f(x).
Fato importante 6.1
Para que uma função f(x) seja uma função distribuição de probabilidade, ela deve
satisfazer duas condições:
f(x) ≥ 0 para todo x, e

+∞
∫ f(x)dx = 1 = área sob o gráfico de f(x)

−∞
103

lOMoARcPSD|32583331
A figura 6.2 ilustra uma função distribuição de probabilidade genérica.
F(x)
Área total =1
Área entre a e b
x
a b
Figura 6.2 – P(a ≤ x ≤ b) = área sob o gráfico de f(x) entre a e b.
Notas:
1) Especificação de um Modelo de Probabilidade - Um modelo de probabilidade para uma
função aleatória contínua é especificado dando a forma matemática da função distribuição de
probabilidades. Se dispusermos de uma amostra com um número grande de observações,
podemos ajustar uma curva (com sua equação matemática) passando pelos pontos superiores
dos retângulos que compõem o histograma de freqüências relativas. Ou ainda, na ausência de
um grande volume de dados podemos assumir um modelo razoável baseado em uma fonte
similar de dados, ou seja, em uma situação similar àquela em questão.
2) Características de uma distribuição contínua - Uma curva, definindo uma função distribuição
de probabilidades, pode ter uma grande variedade de formas. Algumas delas são mostradas
nos esquemas abaixo.
Com pico Uniforme (plana)
Com forma Simétrica

de sino
104

lOMoARcPSD|32583331
6.3) Distribuição uniforme
Definição 6.3 - Variável aleatória contínua com distribuição uniforme
Uma variável aleatória contínua x tem uma distribuição uniforme em um intervalo

[A,B] se a função distribuição de probabilidade de x for definida por
1/(B-A) , A≤x≤B
f(x; A, B) =
0, caso contrário
Exemplo 6.2 – Ilustra variável com distribuição uniforme
Suponha que uma pessoa tome um ônibus para ir ao trabalho e que a cada 5 minutos um
ônibus passe pelo ponto. Assumindo que a pessoa deixe a casa de uma maneira aleatória, ela não
chega sempre no ponto no mesmo horário. Assim, o tempo de espera para o próximo ônibus é
uma variável contínua com valores no intervalo [0 ; 5].
a) Verificar se a função dada abaixo pode ser uma função distribuição de probabilidade para a
variável x.
1/5 , 0≤x≤5
f(x) =
0, caso contrário
b) Em caso positivo, determinar a probabilidade da pessoa esperar entre 1 e 3 minutos.
Solução:
a) De acordo com o fato importante 6.1, f(x) deve ser positiva ou nula para qualquer valor da
variável x. De fato, f(x) = 1/5 para todo x pertencente ao intervalo [0 ; 5] e é igual a zero para
qualquer outro valor de x. Portanto, f(x) satisfaz a primeira condição. A segunda condição
exige que a área sob o gráfico de f(x) seja igual a 1. Podemos verificar isto calculando a
integral de f(x) e verificar se obtemos 1.
+∞ 51 1 5
∫ f ( x)dx = ∫ 5 dx = 5 x =1
−∞ 0 0
De fato, a segunda condição também está satisfeita e a função f(x) é uma função
distribuição de probabilidade. Outra maneira de verificar a segunda condição é observar o
gráfico de f(x) abaixo, e verificar que a área sob a curva é dada pelo produto 5 . (1/5) que é igual
a 1.
105

lOMoARcPSD|32583331
f(x)
1/5
x
0 5
Figura 6.3 – Gráfico da função f(x) do exemplo 6.2
b) A probabilidade de esperar entre 1 e 3 minutos é dada por
3 3 3
P(1 ≤ x ≤ 3) = ∫ f ( x)dx = ∫ 1 dx = 1 x = 2
1 15 5 1 5
Outra maneira de determinar P(1≤ x ≤ 3) é calcular a área sob a curva, compreendida

entre 1 e 3. A figura 6.4 mostra que esta área é dada por
Área = P(1≤ x ≤ 3) = (3-1).(1/5) = 2/5
que é o mesmo valor dado pelo cálculo da integral da função entre os pontos 1 e 3.
f(x)
Área = P(1≤ x ≤ 3)
1/5
x
0 1 3 5
Figura 6.4 – Área hachurada corresponde a P(1≤ x ≤ 3).
106

lOMoARcPSD|32583331
O gráfico de qualquer função de distribuição de probabilidade uniforme se parece com o

gráfico da figura 6.3. Outro fato importante sobre variáveis contínuas é que não tem sentido
calcular a probabilidade em um ponto, isto é, para um determinado valor da variável x. Se x
fosse uma variável aleatória discreta, então para cada valor de x seria definida uma probabilidade
positiva, entretanto este não é o caso de variável aleatória contínua.
Fato importante 6.2
Se x é uma variável aleatória contínua, então para qualquer número c, P(x=c) = 0. Além
disso, para quaisquer dois números a e b , com a < b,
P(a ≤ x ≤ b) = P(a < x ≤ b) = P(a ≤ x < b) = P(a < x < b)
1) Qual das funções abaixo poderia ser uma função distribuição de probabilidades para uma
variável aleatória contínua? Justifique cada caso.
f(x) f(x) f(x)

1 1 1
0 1 2 0 1 2 0 1 2
(a) (b) (c)
f(x) f(x)
1 .5
0 1 2 0 1 2 3 4
(d) (e)
2) Determine as seguintes probabilidades com base na curva (c) acima.

a) P(0< x < 0,5) b) P(1,5 < x < 2)
3) Determine as seguintes probabilidades com base na curva (e) acima.

a) P(0 < x < 1.5) b) P(1,5 < x < 2,5)
107

lOMoARcPSD|32583331
6.4) Distribuição normal
A distribuição normal foi originalmente desenvolvida como o resultado de estudos

relacionados com erros que ocorrem em vários experimentos. Nós, agora, reconhecemos que
muitas ocorrências reais e naturais, assim como muitas medidas físicas tem distribuição de
freqüência que são aproximadamente normais. Níveis de colesterol no sangue, alturas de
mulheres adultas, peso de crianças recém nascidas, diâmetros de laranjas produzidas em um
pomar são todos exemplos de coleções de valores cujos histogramas de freqüência se aproximam
fortemente da distribuição normal de probabilidade. A forma da distribuição normal lembra a
forma de um sino como se pode ver na figura abaixo.
Figura 6.5 – Forma genérica da distribuição normal.
Definição 6.4 – Distribuição normal
Uma variável aleatória contínua x tem uma distribuição normal com parâmetros µ e σ,
com -∝ < µ < ∝, e 0 < σ, se a função distribuição de probabilidade de x for dada por
− ( x−µ ) 2
1
f ( x; µ , σ ) = e 2σ -∝ < x < ∝,
2
σ 2π
A letra e é a base do sistema de logaritmos neperianos e vale, aproximadamente, 2,71828,

enquanto que π tem valor aproximado de 3,14159.
É óbvio que f(x; µ, σ) ≥ 0 para qualquer número x, mas técnicas de cálculo integral
devem ser usadas para mostrar que
+∞
∫ f (x; µ , σ )dx = 1
−∞
108

lOMoARcPSD|32583331
Naturalmente existem muitas distribuições normais de probabilidade, cada uma

dependente de apenas dois parâmetros: a média da população µ e o desvio padrão da população
σ. A figura 6.6 mostra três diferentes gráficos de f(x) onde as diferenças são devidas aos
diferentes pares de valores (µ, σ). Uma mudança no valor da média da população µ provoca um
deslocamento da curva para a direita ou para a esquerda. Uma mudança no valor de σ causa uma
mudança na forma da curva; a forma básica de sino permanece, mas a curva se torna mais larga
ou mais estreita, dependendo de σ.
Figura 6.6 – Influência de µ e de σ na forma e localização da curva.
6.5) Distribuição normal padrão
Quando uma variável aleatória x tem uma distribuição normal de probabilidade com
parâmetros µ e σ, para calcularmos a probabilidade de x estar entre dois valores a e b, isto é para
calcularmos o valor de P(a ≤ x ≤ b), nós precisamos calcular
− ( x−µ ) 2
b
1
∫ e 2σ dx
2
a σ 2π
Nenhuma das técnicas comuns de integração pode ser usada para avaliar a expressão
acima. Por outro lado, para µ=0 e σ=1, a expressão acima já foi extensamente avaliada e
tabulada para certos valores de a e b. Usando esta tabela, podemos computar probabilidades
também para outros valores de µ e σ.
109

lOMoARcPSD|32583331
Definição 6.5 – Distribuição normal padrão
A distribuição normal com parâmetros µ=0 e σ=1 é chamada distribuição normal

padrão. A variável aleatória que tem uma distribuição normal padrão é chamada variável
aleatória normal padrão e será indicada por z. A função distribuição de probabilidade de z é
1 −2z
2
f ( z;0,1) = e -∝ < z < ∝,

2π
A figura 6.7 ilustra uma distribuição normal padrão. A área total sob a curva é igual a 1.
Os números decimais que aparecem entre dois valores consecutivos de z indicam o valor da área
sob a curva compreendida entre estes dois valores. Por exemplo, o valor da área sob a curva
entre os pontos z=0 e z=1 é 0,3413. Podemos observar que, aproximadamente 68% da área está
compreendida entre +1 e -1, aproximadamente 95% da área está entre +2 e –2 e 99,7% está entre
+3 e –3. Este é um fato importante que será mais tarde novamente discutido.
Figura 6.7 – Distribuição normal padrão.
A distribuição normal padrão possui quatro propriedades importantes que são:
1. A área total sob a curva normal padrão é igual a 1.

2. A curva normal padrão se estende indefinidamente em ambas as direções, se aproximando
cada vez mais do eixo z.
3. A curva normal padrão é simétrica com relação ao 0. Isto é, a parte que fica à esquerda do
zero é exatamente igual à parte que fica à direita do zero.
4. A maior parte da área sob a curva normal padrão está compreendida entre –3 e 3.
É necessário observar que a propriedade 1 não é unicamente uma propriedade da curva

normal padrão. De fato, a área total sob qualquer curva que represente uma distribuição de
probabilidade contínua é igual a 1.
110

lOMoARcPSD|32583331
Por causa da importância das áreas sob a curva normal padrão, tabelas dessas áreas foram
construídas. A tabela 6.1 da página seguinte é uma dessas tabelas. Os valores no corpo da tabela,
com quatro casas decimais, representam a área sob a curva entre 0 e um valor especificado de z.
O exemplo 6.3 mostra como usar a tabela 6.1.
Exemplo 6.3 – Ilustra o uso da tabela normal padrão
Determine a área sob a curva normal padrão entre 0 e 1,83.
Solução:
Primeiro encontramos na coluna esquerda o valor z = 1,8. Depois nos deslocamos nessa
linha até encontrarmos o valor 0,03 na linha superior. O número no corpo da tabela, que é
0,4664, é a área sob a curva normal entre z = 0 e z = 1,83, conforme mostra a figura 6.8.
Z=1,83
Figura 6.8 – Área sob a curva normal padrão entre z = 0 e z = 1,83.
Exemplo 6.4 – Ilustra como determinar a área entre 0 e um valor negativo de z.
Determine a área entre a curva normal padrão e z = -1,45 e z = 0.
Solução:
Primeiramente encontramos a área entre z = 0 e z = 1,45. Como no exemplo anterior,
percorremos a coluna z até encontrarmos o valor 1,4 e, em seguida, percorremos essa linha até
estarmos na coluna correspondente ao valor 0,05 da primeira linha. Neste ponto determinamos o
valor 0,4265 que é a área entre z = 0 e z = 1,45. Por simetria da curva, 0,4265 é também a área
entre z = -1,45 e z = 0. Veja figura 6.9.
111

lOMoARcPSD|32583331
Tabela 6.1 – Áreas sob a curva normal padrão
112

lOMoARcPSD|32583331
Z = 1,45 Z = -1,45
Figura 6.9 – Área entre z = -1,45 e z = 0.
Exemplo 6.5 – Ilustra como determinar a área à direita de um valor positivo de z
Determine a área sob a curva normal padrão à direita de z = 1,25.
Solução:
Uma vez que a área total sob a curva é 1 (propriedade 1) e a curva é simétrica com
relação a 0(Propriedade 3), segue que a área sob a curva normal à direita de z = 0 é 0,5. Da
tabela 6.1 vemos que a área entre z = 0 e z = 1,25 é igual a 0,3944. Uma vez que a área total à
direita de z = 0 é 0,5 então a área à direita de z = 1,25 vale
0,5000 – 0,3944 = 0,1056
Veja figura 6.10.
Figura 6.10 – Área à direita de z = 1,25.
113

lOMoARcPSD|32583331
Exemplo 6.6 – Ilustra como encontrar a área entre dois valores positivos de z
Determine a área sob a curva normal padrão entre z = 0,46 e z = 1,75.
Solução:
Pela tabela 6.1, a área entre z = 0 e z = 0,46 é 0,1772 e a área entre z = 0 e z = 1,75 é
0,4599(ver figura 6.11). Dessa forma, a área entre z = 0,46 e z = 1,75 é igual à diferença entre as
duas áreas anteriores, isto é
Área = 0,4599 – 0,1772 = 0,2827
Figura 6.11 – Área entre z = 0,46 e z = 1,75.
Exemplo 6.7 – Ilustra como encontrar a área à esquerda de um valor positivo de z
Obter a área sob a curva normal à esquerda de z=1.96
Solução:
Primeiro determinamos a área entre z = 0 e z = 1,96. Da tabela 6.1, a área é igual a
0,4750(ver figura 6.12). Uma vez que a área à esquerda de z = 0 vale 0,5(porque?) nós
concluímos que a área à esquerda de z = 1,96 vale
Área = 0,4750 + 0,5000 = 0,9750
114

lOMoARcPSD|32583331
Figura 6.12 – Área à esquerda de z = 1,96.
Exemplo 6.8 – Ilustra como determinar o valor de z para uma dada área
Determine o valor de z para o qual a área sob a curva normal padrão, à direita daquele
valor, seja igual a 0,025(veja figura 6.13)
Figura 6.13 – Área dada à direita de z.
Solução:
Para achar o valor de z, primeiro determinamos a área entre z = 0 e o z procurado,
lembrando que a área à direita de z = 0 vale 0,5. Por esse caminho encontramos que essa área é
dada por 0,500 – 0,025 = 0,475, como mostrado na figura 6.14.
115

lOMoARcPSD|32583331
Figura 6.14 – Área entre 0 e z.
Agora, basta usarmos a tabela 6.1 para obtermos o valor de z correspondente à área de
0,475. Pesquisando os valores internos da tabela, encontramos que o valor requerido de z é 1,96,
como mostra a figura 6.15.
Figura 6.15 – Valor procurado de z.
Adotaremos a notação z0,025 para indicar o valor de z com área de 0,025 à sua direita, sob
a curva normal padrão. Assim, pelo exemplo anterior, podemos escrever z0,025 = 1,96. Esta
notação é melhor definida como segue.
Definição 6.6
O símbolo zα será usado para indicar o valor de z com área α à sua direita, sob a curva
normal padrão, como mostrado na figura 6.16.
116

lOMoARcPSD|32583331
Figura 6.16 – Notação para zα.
Usando a tabela 6.1 encontrar

a) z0,10
b) z0,05
Solução:
a) O valor da área entre z = 0 e z0,10 é 0,5 – 0,10 = 0,40. Pela tabela, o valor mais próximo
desta área é definido pelo valor z = 1,28. Logo, z0,10 = 1,28.
b) De forma análoga, o valor da área entre z = 0 e z0,05 é 0,5 – 0,05 = 0,45 e, pela tabela 6.1, z
deve valer 1,645(interpolação entre 1,64 e 1,65). Assim, z0,05 = 1,645.
117

lOMoARcPSD|32583331
1) Determine a área sob a curva normal padrão entre z = 0 e

a) z = 1
b) z = 1,28
c) z = 2,5
d) z = -0,46
e) z = -2,12
2) Determine a área sob a curva normal padrão à direita de

a) z = 1
b) z = 1,65
c) z = -2,34
d) z = 3
3) Determine a área sob a curva normal padrão entre

a) z = 1 e z = 2
b) z = 2 e z = 3
c) z = -1 e z = -0,5
d) z = -1 e z = 2
4) Determine a área sob a curva normal padrão à esquerda de

a) z = -1
b) z = - 1,87
c) z = 0,78
5) Use a tabela 6.1 para encontrar as áreas indicadas sob a curva padrão normal abaixo.
118

lOMoARcPSD|32583331
6.6) Curvas normais
Na seção anterior aprendemos como encontrar áreas sob a curva normal padrão. Com este
conhecimento podemos obter áreas sob qualquer curva normal, como será visto nesta seção.
Já vimos no item 6.4 a influência dos parâmetros µ e σ na posição e forma da curva

normal, respectivamente. Alguns fatos importantes sobre curvas normais são apresentados a
seguir.
Fato Importante 6.3 – Propriedades básicas das curvas normais
P1) A área total sob a curva normal é igual a 1.

P2) A curva normal se estende indefinidamente em ambas as direções, se aproximando cada
vez mais do eixo x à medida que os valores de x crescem ou decrescem, tendendo a + ∞
ou -∞, respectivamente.
P3) A curva normal com parâmetros µ e σ é simétrica com relação a µ.
P4) A maior parte da área sob a curva normal com parâmetros µ e σ se encontra entre µ - 3σ
e µ + 3σ.
Desenhando curvas normais
Embora não seja necessário desenhar uma curva normal exata, é bastante útil ser capaz de
esboçá-la rapidamente. Usando a propriedade P3 e a propriedade P4 torna-se fácil fazer um
esboço de uma curva normal. O exemplo seguinte ilustra o procedimento.
Exemplo 6.10 – Ilustra como esboçar uma curva normal
Esboçar uma curva normal com parâmetros µ = 5 e σ = 2
Solução:
Pela propriedade P3, a curva normal com parâmetros µ = 5 e σ = 2 é simétrica com
relação à média µ = 5. Ainda, pela propriedade P4, a maior parte da área se encontra entre
µ - 3σ = 5 – 3.2 = -1 e µ + 3σ = 5 + 3.2 = 11
A curva normal pode ser esboçada centrada em µ = 5 e se aproximando do eixo x nos pontos –1
e 11, como mostra a figura abaixo.
Figura 6.17 – Curva normal com parâmetros µ = 5 e σ = 2.
119

lOMoARcPSD|32583331
Determinando áreas sob uma curva normal
Já aprendemos como determinar a área sob a curva normal padrão. O próximo passo é
aprender como encontrar a área sob uma curva normal qualquer. A idéia básica é relacionar uma
dada curva normal com a curva normal padrão.
Exemplo 6.11 – Ilustra como encontrar a área sob uma curva normal
Determine a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica

a) à direita de 7 b) entre 3 e 8
Solução:
a) Primeiro devemos esboçar a curva normal com parâmetros µ = 5 e σ = 2 e sombrear a área à
direita de 7. Isto pode ser visto na figura 6.18.
Figura 6.18 – Curva normal com parâmetros µ = 5 e σ = 2 e área à direita de 7 sombreada.
Pode ser matematicamente demonstrado que a área sob a curva normal com parâmetros
µ= 5 e σ = 2 que fica à direita de x = 7 é igual à área sob a curva normal padrão que fica à direita
de
x−µ 7−5
z= = =1
σ 2
Esta última área está mostrada na figura 6.19 abaixo. Em outras palavras, as áreas
sombreadas nas figuras 6.18 e 6.19 são iguais. Pela tabela 6.1, a área sombreada na figura 6.19
vale 0,5000 – 0,3413 = 0,1587. Dessa forma, a área da figura 6.18 vale também 0,1587, ou seja,
a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica à direita de 7 é igual a 0,1587.
120

lOMoARcPSD|32583331
Figura 6.19 – Curva normal padrão com área à direita de 1 sombreada.
b) agora queremos determinar a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica
entre 3 e 8(veja figura 6.20)
Figura 6.20 - Curva normal com parâmetros µ = 5 e σ = 2, com área entre 3 e 8 sombreada.
Nós obtemos a área desejada da seguinte maneira: a área sob a curva normal com
parâmetros µ = 5 e σ = 2, que fica entre 3 e 8 é igual à área sob a curva normal padrão que fica
entre
x−µ 3−5
z= = = −1
σ 2
e
x−µ 8−5
z= = = 1,5
σ 2
Esta última área é mostrada na figura 6.21.
121

lOMoARcPSD|32583331
Figura 6.21 – Curva normal padrão com área entre –1 e 1,5 sombreada.
Pela tabela 6.1, a área sombreada na figura 6.21 é igual a 0,3413 + 0,4332 = 0,7745.
Consequentemente, a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica entre 3 e 8
é também igual a 0,7745.
O exemplo anterior permite sumarizar o fato fundamental que nos permite determinar
áreas sob qualquer curva normal, através do uso da tabela 6.1, que nos dá os valores das áreas
sob a curva normal padrão.
Fato importante 6.4
A área sob a curva normal com parâmetros µ e σ que fica entre x = a e x = b é igual à
área sob a curva normal padrão que fica entre
a−µ b−µ
z= e z=
σ σ
Veja a figura 6.22. A área sob a curva normal com parâmetros µ e σ que fica à direita
(ou esquerda) de um dado valor x é encontrada de uma maneira similar, ou seja, primeiro
determinando o valor de z equivalente e então usando a tabela 6.1 para encontrar a área sob a
curva normal padrão que fica à direita (ou esquerda) do valor de z.
122

lOMoARcPSD|32583331
Figura 6.22 – Correspondência entre as áreas da curva normal

e da curva normal padrão.
O exemplo 6.1 e o fato importante 6.4 permitem definirmos um procedimento passo a

passo para determinarmos áreas sob uma curva normal com parâmetros µ e σ.
Procedimento 6.1 – Determinando áreas sob uma curva normal com parâmetros µ e σ
Passo 1. Esboce a curva normal com parâmetros µ e σ.

Passo 2. Indique no gráfico a área a ser determinada.
Passo 3. Calcule os valores requeridos de z e os marque no gráfico, abaixo dos valores de x.
Passo 4. Use a tabela 6.1 para obter a área desejada.
Exemplo 6.12 – Ilustra o procedimento 6.1
Determine a área sob a curva normal com parâmetros µ=100 e σ = 16 que se encontra à
direita de 120.
Solução:
Aplicando o procedimento 6.1, obtemos os resultados mostrados na figura 6.23.
123

lOMoARcPSD|32583331
Cálculo de z: Área entre 0 e z:
120 − 100
x = 120 → z = = 1,25 0.3944
16
Área sombreada = 0,5000 – 0,3944 = 0,1056
Figura 6.23 – Cálculo segundo procedimento 6.1.
124

lOMoARcPSD|32583331
1) Verifique se a afirmação seguinte é verdadeira ou falsa e explique sua resposta. “A curva

normal com parâmetros µ= -4 e σ = 3 e a curva normal com parâmetros µ= 6 e σ = 3 tem a
mesma forma.
2) Esboce a curva normal definida pelos parâmetros

a) µ= 3 e σ = 3
b) µ= 1 e σ = 3
c) µ= 3 e σ = 1
3) Determine a área sob a curva normal com parâmetros µ= 1 e σ = 2,5 que fica
a) à direita de 0
b) à esquerda de –1,5
c) entre –2 e 2
4) Determine a área sob a curva normal com parâmetros µ= 74 e σ = 2 que fica

a) entre 71 e 78
b) à direita de 76,5
5) Para a curva normal com parâmetros µ= 74 e σ = 2, determine

a) O valor de x com área igual a 0,05 à sua direita
b) O valor de x com área igual a 0,10 à sua esquerda
c) Os dois valores de x que dividem a área sob a curva em uma área central igual a 0,95 e
duas áreas laterais iguais a 0,025.
125

lOMoARcPSD|32583331
6.7 – Populações com distribuição normal
Muitas populações têm distribuições que podem ser representadas por curvas normais.
Isto significa que porcentagens para estas populações são iguais, aproximadamente, à áreas sob
uma curva normal adequada. O exemplo seguinte irá tornar esta idéia mais clara.
Exemplo 6.13 – Ilustra uma população normalmente distribuída
Uma universidade tem um total de 3264 estudantes do sexo feminino. Dados mostram
que a altura média da população destas estudantes é 64,4 polegadas, com desvio padrão de 2,4
polegadas, isto é, µ = 64,4 in e σ = 2,4 in.
A distribuição de freqüências e de freqüências relativas é dada na tabela 6.2. Esta tabela

mostra, por exemplo, que 7,35% (0,0735) das estudantes tem altura entre 67 e 68 polegadas.
Tabela 6.2 – Distribuição de freqüências e de freqüências relativas para as alturas.

Altura H Freqüência Freqüência relativa
(polegadas) f
56 ≤ H < 57 3 0.0009
57 ≤ H < 58 6 0,0018
58 ≤ H < 59 26 0,0080
59 ≤ H < 60 74 0,0227
60 ≤ H < 61 147 0,0450
61 ≤ H < 62 247 0,0757
62 ≤ H < 63 382 0,1170
63 ≤ H < 64 483 0,1480
64 ≤ H < 65 559 0,1713
65 ≤ H < 66 514 0,1575
66 ≤ H < 67 359 0,1100
67 ≤ H < 68 240 0,0735
68 ≤ H < 69 122 0,0374
69 ≤ H < 70 65 0,0199
70 ≤ H < 71 24 0,0074
71 ≤ H < 72 7 0,0021
72 ≤ H < 73 5 0,0015
73 ≤ H < 74 1 0,0003
3264 1,000
Um histograma das freqüências relativas das alturas das estudantes é mostrado na figura
6.24.
126

lOMoARcPSD|32583331
Freqüência relativa
Altura
Figura 6.24 – Histograma de freqüências relativas das alturas.
Note que o histograma da figura 6.24 tem a forma de um sino. Por causa disso, nós
podemos aproximar porcentagens(freqüências relativas, probabilidades) para a população das
alturas pelas áreas sob a curva normal adequada. Naturalmente, a curva normal apropriada é
aquela com parâmetros µ = 64,4 e σ = 2,4.
Para entendermos como podemos usar o conceito de distribuição normal, considere a

porcentagem de alunas com altura entre 67 e 68 in. De acordo com a tabela 6.2, a porcentagem
exata é 7,35% ou 0,0735. Note que 0,0735 também é o valor da área do retângulo hachurado da
figura 6.25. Isto porque o retângulo tem altura de 0,0735 e largura 1.
Observe agora que a área sob a curva normal entre 67 e 68 é aproximadamente igual à
área do retângulo, o que significa que o valor da área sob a curva normal é próximo do valor
0,0735 relativo à porcentagem das estudantes com altura entre 67 e 68 in. Consequentemente,
nós podemos aproximar a porcentagem das estudantes com alturas entre 67 e 68 in pela área
sob a curva normal entre 67 e 68.
127

lOMoARcPSD|32583331
Freqüência relativa
Altura
Figura 6.25 – Curva normal superposta ao histograma das alturas.
É interessante efetuar o cálculo da área sob a curva normal com parâmetros µ=64,4 e
σ=2,4 para verificarmos a aproximação com o valor real de 0,0735. Este cálculo é mostrado a
seguir com o auxílio da figura 6.26.
Figura 6.26 – Curva normal e área sob curva normal.
128

lOMoARcPSD|32583331
Cálculo de z Área entre 0 e z
x = 67 → z = (67 – 64,4)/2,4 = 1,08 0,3599
x = 68 → z = (68 – 64,4)/2,4 = 1,50 0,4332
Área sombreada = 0,4332 – 0,3599 = 0,0733
Observemos que o valor 0,0733 é uma excelente aproximação do valor exato 0,0735. O
ponto importante aqui é que para certas populações, as porcentagens são aproximadamente
iguais a áreas sob uma curva normal adequada. Nem todas as populações tem esta propriedade
mas, se a população tiver, então nós dizemos que ela é normalmente distribuída.
Exemplo 6.14 – Ilustra a determinação de porcentagens (probabilidades) para uma população

normalmente distribuída.
Em um estudo de 1905, R. Pearl determinou que os pesos de cérebros de suecos (homens)

são, aproximadamente, normalmente distribuídos com média µ=1,40 Kg e desvio padrão de
σ=0,11 Kg. Determine a porcentagem de suecos possuindo cérebros pesando
a) entre 1,50 e 1,70 Kg.
b) Menos que 1,20 Kg.
Solução: Uma vez que os pesos dos cérebros são normalmente distribuídos, as porcentagens são
iguais às áreas sob uma curva normal adequada. Esta curva normal tem, naturalmente,
parâmetros µ=1,4 e σ=0,11.
a) Para determinar a porcentagem de pessoas do sexo masculino possuindo cérebros pesando
entre 1,50 e 1,70 basta determinar a área sob a curva normal com parâmetros µ=1,4 e
σ=0,11. A figura 6.27 mostra a curva normal e a área a ser determinada.
Figura 6.27 – Curva normal e área a ser determinada.
129

lOMoARcPSD|32583331
x = 1,50 → z = (1,50 – 1,40)/0,11 = 0,91 0,3186
x = 1,70 → z = (1,70 – 1,40)/0,11 = 2,73 0,4968
Área sombreada = 0,4968 – 0,3186 = 0,1782
O cálculo mostra que apenas 17,82% dos suecos do sexo masculino tem peso do cérebro
entre 1,50 e 1,70 Kg.
b) Para obter a porcentagem pedida basta achar a área sob a curva normal mostrada na figura
6.28. Neste caso, o cálculo abaixo mostra que 3,44% dos suecos do sexo masculino tem peso
do cérebro menor que 1,20 Kg.
x = 1,20 → z = (1,20 – 1,40)/0,11 = -1,82 0,4656
Área sombreada = 0,5000 – 0,4656 = 0,0344
Figura 6.28 – Área sob a curva à esquerda de x = 1,20.
130

lOMoARcPSD|32583331
6.8 – Variáveis aleatórias normalmente distribuídas
Analogamente ao conceito de população normal, uma variável aleatória é dita ser

normalmente distribuída, isto é, ter uma distribuição normal de probabilidades, se as
probabilidades para a variável aleatória são (aproximadamente) iguais as áreas sob uma curva
normal. Se a variável aleatória tem média µx e desvio padrão σx , então a curva normal que é
usada é aquela com parâmetros µx e σx .
Exemplo 6.15 – Ilustra a determinação de probabilidades para uma variável aleatória

normalmente distribuída
Uma empresa engarrafadora de bebidas engarrafa latas de refrigerante para distribuição

local. Apesar do volume oficial da lata ser de 354 ml, a máquina engarrafadora é ajustada para
um volume médio de 356 ml. Considerando que o conteúdo de uma lata seja normalmente
distribuído com média igual a 356 e desvio padrão 1,63 ml, determine a probabilidade de que
uma lata aleatoriamente selecionada contenha menos que o conteúdo oficial anunciado.
Solução:
Seja x o conteúdo de uma lata aleatoriamente selecionada. De acordo com os dados
acima, x é uma variável aleatória com média µx = 356 ml e desvio padrão σx = 1,63 ml. Desta
forma, as probabilidades para x são iguais às áreas sob a curva normal com parâmetros µx = 356
e σx = 1,63.
Queremos determinar a probabilidade de que uma lata selecionada aleatoriamente conterá

menos que 354 ml de refrigerante, P(x < 354). Esta probabilidade é igual à área sob a curva
normal com parâmetros µx = 356 e σx = 1,63 que fica à esquerda de 354. Esta área é determinada
da maneira usual, como mostra a figura 6.27.
x = 354 → z = (354 – 356)/1.63 = -1,23 0,3907
Área sombreada = 0,5000 – 0,3907 = 0,1093
131

lOMoARcPSD|32583331
Assim, P(x < 354) = 0,1093. Existe uma chance de aproximadamente 11% de que uma
lata selecionada aleatoriamente conterá menos que o conteúdo anunciado de 354 ml.
1) Se X é normalmente distribuída com µ= 80 e σ = 4, determine:

P(X < 75)
P(X > 86)
P(73 ≤ X ≤ 89)
2) O tempo requerido para uma orquestra sinfônica tocar a Nona Sinfonia de Beethoven tem
uma distribuição normal com média de 64,3 min e um desvio padrão de 1,15 min. Na
próxima vez em que for tocada, qual é a probabilidade de que a duração esteja entre 62.5 e
67.7 minutos?
3) O erro em medições do nível de açúcar no sangue por um determinado instrumento é

normalmente distribuído com uma média µ = 0,05 e desvio padrão σ = 1,5; isto é, em
repetidas medições, a distribuição da diferença (nível registrado – nível real) é N(0,05; 1,5).
a) Qual a porcentagem das medições que superestimam o valor verdadeiro?
b) Suponha que um erro seja considerado sério quando o valor registrado diferir do valor
verdadeiro por mais que 2,8. Qual será a porcentagem das medições que incorrerão em
sério erro?
132

lOMoARcPSD|32583331
Capítulo 7
Intervalo de Confiança para a Média de

uma População
Este capítulo inicia o estudo de estatística inferencial. Aqui examinaremos métodos para
estimar a média de uma população. Como a estimativa está sujeita a um erro, necessitamos
fornecer informações sobre a acuracidade da estimativa. Isto nos leva ao conceito de
intervalos de confiança, que é o tópico principal deste capítulo. Após o término deste
capítulo, você deverá ser capaz de:
1. Entender os termos amostra e amostragem.

2. Entender os termos estatística e parâmetro.
3. Entender e aplicar o teorema do limite central.
4. Estimar a média de uma população.
5. Entender o conceito de erro padrão.
6. Calcular o intervalo de confiança para a média de uma população.
7. Determinar o tamanho da amostra conhecida a precisão.
133

lOMoARcPSD|32583331
7.1 Populações
Como já visto no capítulo 2, uma população inclui todas as possíveis observações que
possam ser feitas sobre uma característica específica, tal como altura de estudantes de uma
universidade ou pressão sanguínea de trabalhadores da construção civil do estado de São Paulo e
assim por diante. No mundo real da pesquisa, uma população é usualmente constituída por um
grupo que é muito grande para permitir uma observação ou medida direta em cada indivíduo.
No exemplo acima dos trabalhadores da construção civil, é obvio que não temos
condições de conhecer a pressão sanguínea exata de cada trabalhador por causa do elevado
número de pessoas trabalhando nesta área. O melhor que nós podemos fazer é estimar a pressão
média sanguínea dos trabalhadores.
Felizmente, existem métodos estatísticos que nos permite fazer afirmações limitadas
porem úteis, sobre uma população a partir de dados derivados de uma porção relativamente
pequena da população em estudo. Esta pequena porção é denominada amostra.
7.2 - Amostras e amostragens
Para que uma amostra possa produzir informações confiáveis sobre uma população da
qual ela é retirada, ela deve representar uma espécie de seção transversal daquela população. Isto
é, a amostra deve ser representativa daquela população.
Suponha, por exemplo, que nós estivéssemos interessados em conhecer a renda média de
pais de alunos cursando o segundo grau. Assuma que os dados coletados fossem relativos a uma
amostra de 500 alunos cursando escolas públicas. Obviamente, esta amostra não é representativa
da população em estudo, pois sabemos que alunos da rede privada de ensino provêm de famílias
com maior poder aquisitivo. Dessa forma, a média calculada com a amostra de 500 alunos não
seria confiável e, neste caso, a amostra é dita tendenciosa.
Logicamente, nós nunca estaremos seguros de que uma amostra retirada de uma
população seja realmente representativa daquela população. Para estar seguro disso, seria
necessário que nós conhecêssemos a natureza exata da população, o que significa que nós não
teríamos um problema para lidar. Na prática, podemos aumentar a probabilidade de obtermos
uma amostra não tendenciosa pela forma que nós a selecionamos.
Embora haja diversos procedimentos para se obter amostras não tendenciosas, para os
nossos propósitos neste estudo introdutório de estatística, consideraremos somente o
procedimento denominado amostragem aleatória simples, ou simplesmente, amostragem
aleatória.
Definição 7.1 – Amostragem aleatória e amostra aleatória simples
Um procedimento de amostragem aleatória é um procedimento de amostragem no

qual cada possível amostra de um dado tamanho tem a mesma probabilidade de ser
selecionada. Uma amostra, obtida pelo procedimento de amostragem aleatória, é denominada
amostra aleatória simples.
134

lOMoARcPSD|32583331
Para ilustrar a definição, tomemos um simples exemplo. Suponha que nós desejamos
obter uma amostra aleatória de 10 pessoas de um grupo de 100 pessoas. Se nós colocarmos o
nome de cada pessoa em um pedaço de papel, colocarmos todos os papéis em uma urna e,
depois, solicitarmos a uma pessoa, com os olhos vendados, que ela retire 10 pedaços de papel da
urna, então teremos obtido uma amostra aleatória. Note que cada pessoa teve igual chance de ser
escolhida.
Outro ponto importante em amostragem refere-se ao tamanho da amostra. Teoricamente,

quanto maior a amostra, mais acurado é o nosso resultado, isto é, mais perto da população
estamos. Assim, quanto maior a amostra melhor, desde que ela seja representativa da população
em estudo. Entretanto, uma amostra pequena pode dar o mesmo resultado que uma amostra
grande desde que ela seja representativa e seja retirada da população utilizando-se um
procedimento aleatório adequado.
7.3 – Estatísticas de amostras como estimativas de parâmetros.
Valores tais como médias, variâncias e desvios padrões que sejam derivados de amostras
são denominados estatísticas da amostra. Valores da população são, por outro lado,
denominados parâmetros. Dessa forma, em inferência estatística nós retiramos amostras da
população, computamos as estatísticas da amostra e, então, as usamos para estimar os parâmetros
desconhecidos da população.
Recordemos que os estatísticos usam letras gregas para designar os parâmetros da

população e letras do nosso alfabeto para designar as estatísticas da amostra. Por exemplo, a
média da população é indicada por µ e o desvio padrão é indicado por σ. A média da amostra
pode ser representada por x e o desvio padrão por s.
Suponha que sejam retiradas aleatoriamente (de uma dada população) todas as possíveis
amostras, cada uma de tamanho n. Se calcularmos a média de cada amostra e, depois
calcularmos a média das médias das amostras, esta será igual à média da população µ. Realmente
nós não necessitamos retirar todas as possíveis amostras para verificar que a média das médias
das amostras se aproxima da média µ da população de onde as amostras foram retiradas. A
tabela 7.1 mostra os resultados de uma simulação por computador onde somente 1000 amostras
(cada uma com n=30) foram retiradas de uma população. Podemos observar que a média da
população de onde as amostras foram retiradas é 67,48 e a média das 1000 médias das amostras
se aproxima fortemente de µ, embora 1000 amostras ainda estejam longe de se aproximar de
“todas as amostras possíveis”.
Fato importante 7.1
Se todas as possíveis amostras de um dado tamanho n são retiradas aleatoriamente de

uma população com média µ, a média das médias das amostras será igual a µ. A média da
amostra x é, então, uma estimativa não tendenciosa de µ.
135

lOMoARcPSD|32583331
Tabela 7.1 – Resultados de seleção aleatória de 1000 amostras retiradas de uma população.
Valores da população
Média → µ= 67,48
Variância → σ2 = 59,77
Desvio padrão → σ = 7,73
Amostra
Número de amostras → t = 1000
Tamanho de cada amostra → n = 30
Média → x = 67,38
Variância da população
Do capítulo 2, recordemos que a variância de uma população é calculada dividindo-se a

soma dos desvios quadráticos por n, como mostrado abaixo.
∑ (x − µ )
2
σ 2
=
n
Observemos também que a variância da amostra é calculada dividindo-se a soma dos

quadrados por (n-1). Nós usamos (n-1) porque a variância da amostra calculada com n no
denominador tende a subestimar σ2. Usando um valor menor no denominador, n-1, nós
aumentamos o valor do quociente obtendo uma estimativa da variância mais próxima do valor
verdadeiro.
7.4 – Distribuição de amostragens
A figura 7.1 mostra a distribuição de uma população com média µ e desvio padrão σ.
Suponha agora que selecionemos, aleatoriamente, todas as possíveis amostras (todas do mesmo
tamanho) desta população. Vamos ainda supor que, para cada amostra, seja calculada a média da
amostra. A distribuição das médias de todas as possíveis amostras é denominada distribuição da
amostragem. Assumindo que o tamanho da amostra seja ≥ 30, e analisando os valores obtidos
para as médias concluiríamos que as médias das amostras seriam normalmente distribuídas,
como mostrado na figura 7.1. Antes de prosseguirmos com a distribuição de amostragens, nós
necessitamos entender um importante conceito conhecido como Teorema do Limite Central
(TLC), que pode ser enunciado como:
Teorema do Limite Central
Se todas as possíveis amostras com n ≥ 30 forem retiradas aleatoriamente de uma

população, a distribuição das médias daquelas amostras será aproximadamente normal,
mesmo quando os dados na população estudada não forem normalmente distribuídos.
136

lOMoARcPSD|32583331
Figura 7.1 – Uma população normalmente distribuída (acima) e a distribuição das médias das
amostras retiradas da população (abaixo).
Note que se os dados da população não forem normalmente distribuídos, então o teorema
do limite central é verdadeiro somente quando n é grande, isto é, quando n ≥ 30. A figura 7.2
ilustra este fato. Em (a), tem-se uma população normalmente distribuída e mesmo para pequenos
tamanhos de amostra a distribuição das médias também é normal. Nos casos (b) e (c) tem-se
duas populações com distribuições não normais. Nestes dois casos, para amostras pequenas, a
distribuição das médias não é normal (veja n=2). Porém, à medida que o tamanho da amostra
cresce, a distribuição das médias se aproxima de uma distribuição normal (veja n=10 e n=30).
Lembre-se, entretanto, que n ≥ 30 não é uma regra rígida. O teorema não deixa de ser
válido se n for 29, 28, etc., contanto que n não se torne muito pequeno. Uma demonstração do
teorema foge do escopo deste curso introdutório de estatística.
137

lOMoARcPSD|32583331
Figura 7.2 - Distribuições de populações e médias das amostras.

(a) população normal (b) e (c) populações não normais
Erro da amostragem
Na seção anterior vimos que a média de todas as médias das amostras possíveis de serem
retiradas da população será igual a µ. Assim, segue-se que a média da população e a média da
distribuição das médias das amostras retiradas daquela população são iguais – isto é µ. Por isso,
o símbolo µ pode se referir à média da população ou à média da distribuição baseada em todas as
amostras retiradas daquela população.
Nós sabemos, entretanto, que não é suficiente descrever uma distribuição em termos da
média somente. Nós também necessitamos conhecer (ou ser capaz de estimar) o grau de
dispersão das médias das amostras em torno de µ. Em outras palavras, se desejamos trabalhar
com a distribuição das médias das amostras, nós devemos nos preocupar com ambos, a média e o
desvio padrão da distribuição.
138

lOMoARcPSD|32583331
Se retirássemos todas as possíveis amostras de uma dada população com média µ, então
cada vez que nós retirássemos uma amostra, seria duvidoso que a média da amostra x fosse
igual a µ. Uma dada amostra teria uma média que provavelmente se desviaria de µ de um certo
valor, por puro acaso. Algumas médias se desviariam mais, enquanto que outras se desviariam
menos. Este possível desvio de uma dada média de uma amostra do valor real µ é
freqüentemente denominado erro da amostragem. Isto não significa que um engano foi
cometido. É simplesmente um fato da estatística que, por acaso apenas, nós podemos retirar uma
amostra cuja média difere, em uma certa extensão, da média real µ.
Conseqüentemente nós podemos esperar que todas as possíveis médias das amostras
retiradas da população sejam distribuídas com uma certa variância denominada variância das
médias e indicada por :
σ2 _
x
A variância das médias pode ser calculada pela fórmula:
σ2
σ = 2
_
x n
onde o numerador, é a variância da população da qual as amostras foram hipoteticamente
retiradas, e n é o tamanho da amostra.
Efeitos de n e de σ2
Vamos observar a fórmula anterior e verificar se podemos entendê-la intuitivamente.

Primeiro, podemos ver que a variância das médias aumenta à medida que a variância da
população σ2 aumenta, assumindo que n seja mantido constante. Isto faz sentido porque uma
população mais variável produzirá uma distribuição mais variável das médias. Podemos também
ver da fórmula que se σ2 for mantido constante, a variância das médias diminuirá à medida que
n crescer. Isto também tem sentido porque se formos aumentando n, nós nos aproximaremos da
própria população. Resumindo, nós temos o seguinte:
Fato Importante 7.2
A variância de uma distribuição de médias de amostras é diretamente proporcional à

variância da população, da qual as médias foram retiradas, e é inversamente proporcional ao
tamanho da amostra n.
139

lOMoARcPSD|32583331
A figura 7.3 mostra como a forma da distribuição das médias difere daquela da
população. A figura 7.3a representa a população com uma certa média µ e uma variância σ2 =
120. A figura 7.3b mostra a forma de uma distribuição de amostragem baseada em todas as
possíveis amostras de tamanho n = 30, retiradas da população. A distribuição da amostragem é
muito mais fechada do que a da população porque a variação das médias das amostras em torno
de µ é menor que aquela da população. O valor da variância das médias pode ser calculado pela
fórmula dada.
σ2 120
σ =2
_ = =4
x n 30
(a) População (b) Distribuição das médias

Figura 7.3 - Variância da população comparada à variância da distribuição das amostras.
Mais uma vez, é aparente pela fórmula que a variância da distribuição da amostragem
diminui à medida que o tamanho da amostra aumenta (assumindo que σ2 permanece constante).
A figura 7.4 abaixo ilustra este fato.
Figura 7.4 – A variância da distribuição da amostragem diminui com o aumento de n.

140

lOMoARcPSD|32583331
7.5 – O erro padrão
Na última seção nós discutimos a variância de uma distribuição de médias de amostras.

Nós já sabemos que a raiz quadrada da variância de uma distribuição é o desvio padrão daquela
distribuição. Assim, o desvio padrão da distribuição das médias é dado por:
σ
σ =
_
x n
Uma vez que o desvio padrão de uma distribuição de amostragens de médias descreve a
extensão com que a média de uma dada amostra pode se desviar de µ, ele é mais comumente
chamado erro padrão da média.
Definição 7.2
O erro padrão da média é o desvio padrão de uma distribuição de amostragens das

médias das amostras
A fórmula acima do erro padrão das médias assume que nós conhecemos o valor do
desvio padrão da população (σ). Na maioria das situações, entretanto, nós não conhecemos σ e
necessitamos substituir σ por s, usando s como uma estimativa (ou estimador) de σ. Neste caso,
devemos deixar claro que estamos usando uma estimativa de σ e não o valor de σ. Para isso,
basta reescrevermos a fórmula de cálculo do desvio padrão como sendo:
s
s_ =
x n
Note que esta fórmula para o desvio padrão é a mesma, exceto que nós estamos indicando
que não conhecemos o valor real de σ e estamos usando uma estimativa s de uma amostra
retirada da população.
Exercícios – Sequência 7.1
1) Suponha que retiremos uma amostra n=36 de uma população. A amostra produz uma
variância de s2 = 49. Calcule uma estimativa do desvio padrão real da distribuição da
amostragem.
2) Uma amostra de tamanho n = 50 produz um desvio padrão da amostra igual a 9 (s=9).

Calcule uma estimativa do verdadeiro desvio padrão da distribuição da amostragem.
3) Uma amostra contendo n=30 elementos é retirada de uma população e outra com n=200 é
retirada da mesma população. Assumindo que os desvios padrões das amostras sejam
similares em valores, como se espera que a forma das duas distribuições de amostragens
difira entre si?
141

lOMoARcPSD|32583331
7.6 – Intervalo de confiança para a média – grandes amostras
Como discutido no item anterior, não é razoável esperar que a média de uma amostra seja
exatamente igual à média da população µ; algum erro deve ser esperado, Assim, além de
calcularmos uma estimativa de µ, nós necessitamos fornecer informações que indiquem a
precisão da estimativa. Isto pode ser feito definindo um intervalo de confiança para µ. Usando a
média da amostra coletada podemos construir um intervalo de números e afirmar com que
confiança a média da população µ estará dentro deste intervalo. Este conceito pode ser resumido
como mostrado abaixo.
Definição 7.3 – Intervalo de confiança e nível de confiança
Um intervalo de confiança de um parâmetro consiste de um intervalo de números,

obtido de uma estimativa de um parâmetro junto com uma porcentagem que especifica a
nossa confiança de que o parâmetro está no intervalo. A porcentagem de confiança é
denominada nível de confiança.
Para facilitar o entendimento do procedimento de determinação do intervalo de confiança

assumiremos que a população em estudo seja normal com média µ e desvio padrão conhecido e
igual a σ e que queremos determinar um intervalo com 95% de confiança para a média.
Assumindo também que estamos trabalhando com amostras aleatórias sabemos que a média da
amostra x é uma variável aleatória com uma distribuição normal com média e desvio padrão
dados por
σ
µ =µ
_ e σ =
_
x x n
Isto implica que a variável z, definida como
_
x− µ
z=
σ n
tem uma distribuição normal, resultado da normalização da variável x. Já havíamos visto que
uma área de 0,95 sob a curva normal padrão corresponde à área entre os valores z = -1,96 e z =
1,96 e nos permite escrever a expressão abaixo.
 _

 x−µ 
P − 1,96 ≤ ≤ 1,96  = 0,95
 σ n 
 
Esta expressão é formada por duas desigualdades simultâneas, com µ figurando no

centro. Queremos obter uma outra desigualdade do tipo A ≤ µ ≤ B onde os extremos são dados
em função dos outros elementos. Aplicando propriedades das desigualdades, a Sequência a
seguir mostra como isto é possível.
142

lOMoARcPSD|32583331
σ _
σ
− 1,96 ⋅ ≤ x − µ ≤ 1,96 ⋅ (após multiplicar os 3 membros por σ n)
n n
_
σ _
σ _
− x − 1,96 ⋅ ≤ − µ ≤ − x + 1,96 ⋅ (após subtrair x de cada termo)
n n
_
σ _
σ
x − 1,96 ⋅ ≤ µ ≤ x + 1,96 ⋅ (após multiplicar tudo por − 1)
n n
Uma vez que as 3 desigualdades acima são equivalentes à desigualdade original, a

probabilidade associada com cada uma delas é igual a 0,95 e, portanto, para a última delas
podemos escrever
_ σ _
σ 
P x − 1,96 ⋅ ≤ µ ≤ x + 1,96 ⋅  = 0,95
 n n
A expressão entre parênteses pode ser interpretada como definindo um intervalo aleatório
com limites:
_
limite inferior = x − 1,96 σ n e
_
limite superior = x + 1,96 σ n
Usando a notação de intervalos, esse intervalo aleatório poderia ser indicado como
 _ _

 x − 1,96 σ n , x + 1,96σ n
 
Observemos que o intervalo é centrado em x e os limites do intervalo são variáveis,

dependendo da amostra coletada, isto é, da média da amostra calculada. O comprimento do
intervalo, por outro lado, é fixo e é calculado por
σ
2 ⋅ 1,96 ⋅
n
mostrando que somente a localização do intervalo é aleatória. O intervalo acima indica que a
existe uma probabilidade de 0,95 de que o intervalo aleatório assim calculado inclua o
verdadeiro valor da média µ.
143

lOMoARcPSD|32583331
Exemplo 7.1 – Ilustra intervalo de confiança
Suponha que uma amostra aleatória de 40 novas casas populares resulte na tabela de
preços abaixo. Determine um intervalo de confiança com nível de confiança de 95,44% para o
preço médio µ de todas as novas casas populares. Assuma que o desvio padrão da população dos
preços seja igual a σ= R$7.200,00 Reais. (Nota: Este valor do desvio padrão pode ser conhecido de estudos
anteriores. O caso mais usual onde o desvio padrão é desconhecido será considerado mais adiante neste capítulo)
Tabela 7.2 – Amostra aleatória de 40 preços de casas populares (x1000).

24,4 30,6 26,4 26,8 33,5 32,2 32,4 13,9
24,4 29,3 26,2 14,1 21,4 20,0 33,0 17,6
24,8 27,0 22,8 18,8 35,1 26,7 22,1 37,2
31,9 24,0 28,4 15,8 29,3 31,4 22,8 8,4
24,7 16,6 31,1 13,9 16,8 29,5 17,0 9,9
Solução:
Podemos estimar a média da população, isto é, o preço médio µ, através da média dos 40
preços coletados na amostra. Assim, o valor médio da amostra será dado por
_
x=
∑ x = 972,2 = 24,31
n 40
Portanto, baseado nos dados da amostra, estimamos que o preço médio de todas as casas
novas é, aproximadamente, R$24.310,00. Se o desvio padrão dos preços de casas novas foi
fornecido como sendo igual a σ=R$7.200,00, então o desvio padrão da distribuição das amostras
de tamanho n=40 pode ser calculado por
σ 7200
σ =
_ = = 1140
x n 40
A figura abaixo mostra a distribuição das médias das amostras de tamanho n = 40 e a

correspondente curva normal padrão.
Figura 7.5 – Correspondência entre a distribuição normal das médias das amostras e a curva
normal padrão.
144

lOMoARcPSD|32583331
Queremos determinar os valores de x1 e x2 que definem uma área sob a curva normal
igual a 0,9544. Para tanto, identificamos na curva padrão à direita, os valores z1 e z2 de modo
que a área seja a mesma, como ilustrado na figura. Como o valor da área entre 0 e z2 é igual a
0,4722 (0,9544/2), pela tabela 6.1, do capítulo 6, o valor de z2 é 2. E, portanto, o valor de z1 é –2.
O cálculo de x1 e x2 pode ser feito como mostrado abaixo.
_
x1 − x _
z1 = ⇒ x1 = x + z1 ⋅ σ _ = 24310 + (− 2 ) ⋅ 1140 = 22030
σ _ x
x
_
x2 − x _
z2 = ⇒ x2 = x + z 2 ⋅ σ _ = 24310 + (2 ) ⋅ 1140 = 26590
σ _ x
x
Assim, o intervalo de confiança com nível de confiança igual a 95,44%, é de 22030 a

26590. Isto significa que temos uma confiança de 95,44% de que o preço médio, µ, de todas as
casas novas é um valor entre 22030 e 26590.
É necessário enfatizar que o intervalo de confiança depende da amostra selecionada

aleatoriamente. Por exemplo, se tivéssemos uma amostra com média igual a 26580, o intervalo
de confiança seria
_
σ 7200
_
σ 7200
x− 2 ⋅ = 26580 − 2 ⋅ = 24300 x+ 2 ⋅ = 26580 + 2 ⋅ = 28860
n 40 n 40
Isto significa que se para cada amostra fosse possível determinarmos um correspondente
intervalo de confiança com nível de confiança de 95,44%, da totalidade desses intervalos
poderíamos afirmar que 95,44% desses intervalos conteriam a média µ da população.
Podemos agora generalizar o procedimento para a determinação de um intervalo de

confiança com nível de confiança igual a 1-α.
Procedimento 7.1 – Intervalo de confiança para uma média de uma população µ

Hipótese: Tamanho da amostra n ≥ 30.
Passo 1 – Para um nível de confiança de 1-α, use a tabela 6.1 para encontrar zα/2.
Passo 2 – O intervalo de confiança para µ é de
_ _
s s
x − z α/2 ⋅ a x + z α/2 ⋅
n n
onde zα/2 é determinado no passo 1, e x e s são computados dos dados da amostra obtida.
145

lOMoARcPSD|32583331
Nota: No passo 2 do procedimento 7.1 nós usamos o desvio padrão da amostra, s, na fórmula do
intervalo de confiança. Teoricamente, deveríamos usar o desvio padrão da população σ.
Entretanto, raramente se conhece σ e assim temos de usar s no lugar de σ. Isto é aceitável porque
para amostras grandes (n ≥ 30), o desvio padrão da amostra s nos dá uma boa aproximação do
desvio padrão da população σ.
O Departamento de Estatística do Trabalho dos EUA coleta informações sobre as idades

de pessoas na força de trabalho civil e publica os resultados no Employment and Earnings.
Suponha que 50 pessoas da força de trabalho civil sejam aleatoriamente selecionadas e que suas
idades sejam as mostradas na tabela abaixo.
Tabela 7.3 – Idades de 50 pessoas selecionadas aleatoriamente.

22 58 40 42 43 32 34 45 38 19
33 16 49 29 30 43 37 19 21 62
60 41 28 35 37 51 37 65 57 26
27 31 33 24 34 28 39 43 26 38
42 40 31 34 38 35 29 33 32 33
Determine um intervalo de 90% de confiança para a idade média µ, de todas as pessoas

na força civil de trabalho.
Solução:
Uma vez que o tamanho da amostra é 50, portanto maior que 30, podemos aplicar o
procedimento 7.1 para obter o intervalo de confiança.
Passo 1 – Para um nível de confiança 1-α, use a tabela 6.1 para obter zα/2.
Nós queremos um intervalo de confiança de 90%. Assim, o nível de confiança é de

0,90=1-0,10. Isto significa que α=0,10. Consultando a tabela 6.1, vemos que
zα/2 = z0,10/2 = z0,05 = 1,645
Passo 2 – O intervalo de confiança para a média é dado por
_
s _
s
x − z α/2 ⋅ a x + z α/2 ⋅
n n
Para calcular x e s com os dados da tabela 7.3, aplicamos as fórmulas usuais:
_
x=
∑ x = 1819 = 36,38
n 50
146

lOMoARcPSD|32583331
s=
( )
n ∑ x 2 − (∑ x )
2
=
50(72179 ) − (1819 )
2
= 11,07
n(n − 1) 50(50 − 1)
Conseqüentemente, o intervalo de confiança de 90% é
11,07 11,07
36,38 − 1,645 ⋅ a 36,38 + 1,645 ⋅
50 50
Ou seja, 33,80 a 38,96
Podemos ter uma confiança de 90% de que a média das idades, µ, de todos os
trabalhadores civis é um valor entre 33,8 e 39,0.
Relação entre o nível de confiança e o tamanho do intervalo de confiança
Para entender a relação entre o nível de confiança e o tamanho do intervalo de confiança

vamos determinar um intervalo de confiança de 95% usando os dados do exemplo 7.2 acima.
Neste caso, se 1-α = 0,95 então α = 0,05 e z0.05/2 = z0.025 = 1,96 (tabela 6.1). O intervalo de
confiança resultante é
11,07 11,07
36,38 − 1,96 ⋅ a 36,38 + 1,96 ⋅
50 50
ou seja, de 33,3 a 39,4 anos. Para uma visão mais clara do que ocorre quando aumentamos o
nível de confiança, desenhamos os dois intervalos na figura 7.6.
Estamos 90% confiantes

de que µ está aqui (Intervalo de confiança de 90%)
33,8 39,0
Estamos 95% confiantes

de que µ está aqui (Intervalo de confiança de 95%)
33,3 39,4
Figura 7.6 – Intervalos de confiança de 90% e 95% para µ usando os dados da tabela 7.3.
147

lOMoARcPSD|32583331
Observamos que aumentando o nível de confiança, o comprimento do intervalo também

aumenta. Isto nos leva à seguinte afirmação:
Fato importante 7.3
Para um tamanho fixado da amostra, quanto maior o nível de confiança, maior o

comprimento do intervalo de confiança.
Máximo erro da estimativa da média
Já vimos que uma estimativa do intervalo de confiança da média de uma população

corresponde a um intervalo de números reais dentro do qual estará a média µ da população.
Portanto devemos assumir que sempre existirá um erro quando estimamos a média da população
µ através da média da amostra x. Este erro varia de zero a um valor máximo que será chamado
erro máximo da estimativa. Este erro máximo depende do nível de confiança com que estamos
trabalhando assim como do tamanho da amostra n.
Isto pode ser facilmente entendido através da figura 7.7. Esta figura se refere ao exemplo
7.2 e corresponde ao intervalo de confiança da média µ para um nível de confiança de 90%.
σ
zα / 2 ⋅
n
2,58 2,58
33,80 36,38 38,96

(36,38 – 2,58) (36,38 + 2,58)
_
σ _
σ
x − zα / 2 ⋅ x + zα / 2 ⋅
n n
Figura 7.7 – Intervalo de confiança de 90% para a idade µ.
148

lOMoARcPSD|32583331
Estudando a figura 7.7, encontramos que o comprimento do intervalo de confiança é

determinado pela quantidade
σ
E = zα / 2 ⋅
n
Que é exatamente a metade do comprimento do intervalo de confiança. Neste caso, E =

2,58. Esta quantidade é denominada máximo erro da estimativa, pois o máximo erro feito,
usando-se x para estimar µ, é E = 2,58.
Assim, se estamos interessados em aumentar a precisão da estimativa, podemos diminuir

o valor de E. Uma vez que o tamanho da amostra n se encontra no denominador da expressão
que define E, podemos diminuir E aumentando o tamanho da amostra n. Isto faz sentido porque
nós esperamos obter informação mais acurada de amostras maiores.
Determinação do tamanho da amostra
Freqüentemente, a precisão (o máximo erro da estimativa) e o nível de confiança do

intervalo são especificados com antecedência. Nós precisamos, então, determinar o tamanho da
amostra que satisfaça as especificações dadas. A fórmula para determinar o tamanho requerido
da amostra pode ser obtida isolando-se n na expressão que define E. Isto nos dá a seguinte
fórmula para o tamanho da amostra n.
σ  z ⋅σ 
2
E = zα / 2 ⋅ ⇒ n =  α /2 
n  E 
Exemplo 7.3 –Ilustra a determinação do tamanho da amostra
Considerando os dados do exemplo 7.2,

a) Determinar o tamanho requerido da amostra para assegurar que, com uma confiança de 95%,
teremos uma estimativa, x, distante no máximo 0,50 de µ.
b) Obtenha um intervalo de confiança de 95% para µ se a amostra determinada em (a) tiver uma
média igual a 37,02.
Solução:
a) Para determinar o tamanho da amostra vamos empregar a fórmula acima. O máximo erro foi
especificado como E = 0,50. Como o nível de confiança desejado é de 0,95 concluímos que
α=0,05 e zα/2 = z0,025 = 1,96(tabela 6.1). Finalmente, como o valor de σ não foi dado,
usaremos uma estimativa de σ calculada com base na amostra selecionada. Este valor
calculado no exemplo 7.2 foi de s = 11,07. Com estes dados, o tamanho da amostra pode ser
calculado.
2 2
 z ⋅s  1,96 ⋅ 11,07 
n =  α /2  =   = 1883
 E   0,5 
149

lOMoARcPSD|32583331
b) O intervalo de confiança é facilmente determinado por
37,02 – 0,5 a 37,02 + 0,5 ou
36,52 a 37,52
1) Um engenheiro do controle de qualidade, de uma fábrica produtos alimentícios, necessita

estimar o peso médio, µ, de saquinhos de batata frita, empacotados por uma máquina. Ele
sabe por experiência que σ = 2,84g para esta máquina. Ele toma uma amostra aleatória de 36
saquinhos e determina a média da amostra como sendo 454g.
a) Determine um intervalo com 99% de confiança para µ.
b) Interprete o resultado da parte (a) em palavras.
2) Uma pesquisa deve ser conduzida no sentido de determinar a idade média de pessoas com
diabetes. Para isso, tomou-se uma amostra de 35 pessoas portadoras da doença e obteve-se a
tabela abaixo.
a) Determine um intervalo de confiança, com nível de confiança de 95%, para a média µ, da
população de idades de pessoas com diabetes.
b) Repita o item (a) para um nível de confiança de 99%.
c) Interprete os resultados obtidos em (a) e (b) em palavras. Qual intervalo de confiança é
maior?
48 41 57 83 41 55 59
61 38 48 79 75 77 7
54 23 47 56 79 68 61
64 45 53 82 68 38 70
10 60 83 76 21 65 47
3) Explique como aplicar a fórmula
 z ⋅σ 
2
n =  α /2 
 E 
se σ é desconhecido.
4) Assuma que em uma pesquisa foi determinado um intervalo de confiança de 90% para a
média µ, da população sob estudo. O intervalo resultante vai de 617,3 a 668,7.
a) Determine o máximo erro E da estimativa da média.
b) Explique o significado de E com relação à estimativa de µ.
c) Determine o tamanho necessário da amostra para ter o mesmo erro máximo da estimativa
como na parte (a) , mas com um nível de confiança de 95%.(Assuma que σ=247).
150

lOMoARcPSD|32583331
7.7 – Intervalo de Confiança para a média de uma população normal
Na seção anterior mostramos como determinar o intervalo de confiança para a média de

uma população, µ, quando o tamanho da amostra é grande (n ≥ 30). O procedimento para se
obter o intervalo de confiança para uma amostra grande é baseado no Teorema do Limite Central
que trata da distribuição das médias para populações genéricas. Esse fato afirma que, para
grandes amostras, a variável aleatória x é normalmente distribuída com parâmetros
σ
µ =µ
_ e σ = _
x x n
Ou ainda, que a variável aleatória normalizada
_
x− µ
z=
σ
n
tem aproximadamente uma distribuição normal padrão, quando o tamanho da amostra é grande.
Entretanto, pode ocorrer que retirar uma amostra grande de uma população seja
inadequado, ou mesmo impossível. Por exemplo, testes de colisão com carros normalmente
resultam em perda do carro e, por isso, é mais adequado utilizar pequenas amostras. Existem
diversos métodos para obtermos um intervalo de confiança com base em pequenas amostras.
Veremos a seguir um desses métodos que pode ser aplicado quando a população em estudo for
normalmente distribuída. O método utiliza a distribuição t de Student proposta por W. S. Gosset
em 1908.
Distribuição t de Student
Substituindo-se σ na expressão acima pelo desvio padrão s da amostra podemos definir

uma nova variável aleatória dada por
_
x− µ
s
n
Gosset mostrou que esta variável aleatória possui uma distribuição de probabilidades que
é muito próxima de uma curva normal para grandes valores de n (n ≥ 30 ) e que se afasta da
curva normal à medida que n se torna pequeno. Em outras palavras, existe uma curva t para cada
tamanho de amostra. Se o tamanho da amostra for n então a curva correspondente será
identificada como uma curva t com (n-1) graus de liberdade. Por simplicidade definiremos
graus de liberdade simplesmente como o número que identifica a curva t ou distribuição t
apropriada.
Da mesma forma que determinamos probabilidades para variáveis aleatórias com

distribuição normal a partir de áreas sob a curva normal, também as probabilidades para
151

lOMoARcPSD|32583331
variáveis com distribuição t são iguais às áreas sob a curva t adequada. Os fatos discutidos até
aqui podem ser resumidos no quadro abaixo.
Fato Importante 7.4
Assuma que uma amostra aleatória com n elementos X1, X2, ..., Xn seja retirada de
uma população normalmente distribuída com média µ resultando em uma média e um desvio
padrão dados por:
2
 −

−
∑X ∑  X i − x
 
x= s2 =
i
e
n n −1
_
x− µ
Então, a distribuição da variável aleatória t=
s
n
é denominada distribuição t de Student com n-1 graus de liberdade. Assim, as probabilidades
para essa variável são iguais às áreas sob a curva t com GL = n-1.
F (0)
A distribuição t é dada por F (t ) = n
 t2 2
1 + 
 n −1
onde F(0) é uma constante que depende de n, de modo que a área sob a curva seja igual a 1. A
figura 7.8 mostra duas curvas t e uma curva normal. Observemos que a curva com GL = 6 é mais
próxima da curva normal que a curva t com GL = 1. Para valores de n próximos de 30 a curva t
e a curva normal padrão praticamente coincidem.
Figura 7.8 – Distribuição de Student t para vários graus de liberdade.
152

lOMoARcPSD|32583331
As propriedades da curva t podem ser resumidas no Fato Importante 7.5 a seguir.
Fato Importante 7.5 – Propriedades básicas das curvas t
P1) A área total sob a curva é igual a 1.

P2) Uma curva t se estende indefinidamente em ambas as direções, se aproximando do eixo
horizontal.
P3) Uma curva t é simétrica em relação ao 0.
P4) À medida que o número de graus de liberdade cresce, a curva t se aproxima da curva
normal padrão.
Cálculo de probabilidades usando uma curva t
A tabela 7.4 fornece os valores de t para cinco valores de áreas, definidas sob a curva, à
direita do valor t. Essas áreas são as mais comumente usadas em estatística para a determinação
de intervalos de confiança e, por isso, não há necessidade de apresentarmos tabelas completas
para cada grau de liberdade.
A coluna da esquerda dá o número de graus de liberdade. O símbolo tα define o valor t

com área α a sua direita, sob a curva. Dessa forma, a coluna identificada por t0,10 contém valores
de t com área 0,10 à sua direita, a coluna t0,05 contém valores de t com área 0,05 à sua direita e
assim por diante. Daremos a seguir um exemplo de uso da tabela.
Exemplo 7.4 – Ilustra como encontrar o valor de t para uma dada área
Determinar o valor t0,05 para uma curva t com 13 graus de liberdade.
Solução:
Determinar t0,05 significa determinar o valor de t de modo que a área à direita de t seja
igual a 0,05. Na tabela 7.4 procuramos na primeira coluna o valor 13 , uma vez que queremos
trabalhar com uma curva com 13 graus de liberdade. Agora, percorrendo a linha correspondente
ao valor 13, vamos até a coluna t0,05 onde encontramos o valor 1,771. A interpretação gráfica é
dada na figura 7.9.
Figura 7.9 – Curva t com 13 GL e valor t0,05.
153

lOMoARcPSD|32583331
Tabela 7.4 - Valores de tα
GL t0,10 t0,05 t0,025 t0,01 t0,005

1 3,078 6,314 12,706 31,821 63,657
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,809
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
∞ 1,282 1,645 1,960 2,326 2,576
Podemos agora discutir o procedimento para determinar um intervalo de confiança para a

média µ de uma população normal. Assumindo que uma amostra aleatória de tamanho n foi
retirada de uma população normal, sabemos que a variável aleatória
_
x− µ
t=
s
n
tem uma distribuição t com n-1 graus de liberdade e que probabilidades para essa variável
aleatória podem ser determinadas com base nas áreas sob a curva t com GL = n-1. A
probabilidade de que t esteja entre dois valores -tα/2 e tα/2 é dada por
154

lOMoARcPSD|32583331
 − 
 x− µ 
P − tα / 2 < < tα / 2  = 1 − α
 s 
 n 
Com uma pequena manipulação algébrica, a expressão acima pode ser reescrita como
− s − s 
P x − tα / 2 ⋅ < µ < x + tα / 2 ⋅  = 1−α
 n n 
Esta última expressão mostra que o intervalo com extremos
− s − s
x − tα / 2 ⋅ e x + tα / 2 ⋅
n n
será o intervalo de confiança para a média com nível de confiança (1-α). Para facilitar e
sistematizar o cálculo, colocamos o procedimento 7.2 abaixo.
Procedimento 7.2 – Determinando um intervalo de confiança para uma média de uma

população µ
Hipótese: População normal.
Passo 1 – Para um nível de confiança de 1-α, use a tabela 7.4 para encontrar tα/2 com
GL=n-1, onde n é o tamanho da amostra.
Passo 2 – O intervalo de confiança para µ é de
_ _
s s
x − tα/2 ⋅ a x + tα/2 ⋅
n n
onde tα/2 é determinado no passo 1, e x e s são computados dos dados da amostra obtida.
O procedimento acima se aplica para qualquer tamanho de amostra, desde que a

população sendo amostrada seja normal.
Exemplo 7.5 – Ilustra como aplicar o procedimento 7.2
Um estudo sobre cães domésticos mostra que os períodos de gestação são normalmente
distribuídos. Para estimar o período médio de gestação, 15 cadelas foram selecionadas
aleatoriamente e seus períodos observados. Os resultados estão na tabela dada abaixo.
155

lOMoARcPSD|32583331
62,0 61,4 59,8 62,2 60,3

60,4 59,4 60,2 60,4 60,8
61,8 59,2 61,1 60,4 60,9
Determine um intervalo de confiança para o período médio de gestação, µ, de cães

domésticos, com nível de confiança de 95%.
Solução:
Para determinar o intervalo de confiança vamos necessitar os valores da média e do

desvio padrão da amostra. Esses valores podem ser obtidos com as fórmulas já vistas no capítulo
2.
−
x=
∑ x = 910,3 = 60,69
n 15
e
s=
( )
n ∑ x 2 − (∑ x )
2
= 0,81 = 0,90
n(n − 1)
Agora, podemos aplicar o procedimento 7.2 na obtenção do intervalo de confiança.
Passo 1 – Para um nível de confiança de 1-α, use a tabela 7.4 para encontrar tα/2 com
GL=n-1, onde n é o tamanho da amostra.
Para um nível de confiança de 0,95 temos um valor de α igual a 0,05 e, portanto α/2 =
0,025. Da tabela 7.4, com GL = 15-1 =14, obtemos t0,025 = 2,145.
Passo 2 - O intervalo de confiança para µ será dado por
0,90 0,90
60,69 − 2,145 ⋅ a 60,69 + 2,145 ⋅
15 15
ou
60,19 a 61,18
156

lOMoARcPSD|32583331
1) Uma marca de computadores de mão funciona com quatro pilhas AAA de 1,5V. Para
estimar a vida média das baterias, 50 computadores são testados. A vida média das
baterias para os 50 computadores foi determinada como sendo igual a 60,1 horas.
Assuma que o desvio padrão seja de 4,3 horas.
a) Obtenha um intervalo com 99% de confiança para a vida média das baterias, µ,
para esta marca de computador.
b) Interprete seu resultado da parte (a) em palavras.
2) Em uma fábrica de automóveis, 38 pessoas foram treinadas por duas semanas e então
testadas para verificar quanto tempo levavam para realizar uma particular operação de
montagem. A média e o desvio padrão dos tempos que eles levaram para realizar a tarefa
foram 68 e 12 segundos, respectivamente. Calcule um intervalo de confiança, com 95%
de nível de confiança, para a verdadeira média dos tempos para trabalhadores com duas
semanas de treinamento.
3) De uma grande amostra de uma população sabe-se que a estimativa da média da

população é x = 126,7 e que o máximo erro da estimativa é de 5,8 para um nível de
confiança de 95%. Usando esses dados determine:
a) O intervalo de confiança com nível igual a 95%.
b) O intervalo de confiança com nível igual a 90%.
4) Para uma curva t com GL = 18, obtenha os seguintes valores de t e ilustre seus resultados
graficamente.
a) O valor de t com área 0,025 à sua direita.
b) t0,05.
c) O valor de t com área 0,10 à sua esquerda
d) Os dois valores de t que dividem a área sob a curva em uma área central de 0,99 e
duas áreas laterais de 0,05.
5) Uma nova liga foi desenvolvida para ser utilizada em veículos espaciais. Testes de
resistência foram feitos em 15 corpos de prova e a média e o desvio padrão das medidas
resultaram em 39,3 e 2,6, respectivamente.
a) Determine um intervalo com 95% de confiança para a resistência média à tração
da liga.
b) A média está incluída neste intervalo?
157

lOMoARcPSD|32583331
Capítulo 8
Teste de Hipótese para a Média
No capítulo anterior foi visto como estimar a média de uma população e como determinar um
intervalo de confiança para um valor do nível de confidência. Neste capítulo será visto como
essa média pode ser usada para se tirar conclusões sobre valores. Ao término deste capítulo,
você deverá ser capaz de:
1. Entender o que é teste de hipótese.

2. Entender o significado dos tipos de erros I e II.
3. Como realizar o teste para grandes amostras.
4. Como realizar o teste para populações com distribuição normal.
5. Discutir as limitações assim como as aplicações dos testes de hipóteses.
159

lOMoARcPSD|32583331
8.1 A natureza do teste de hipótese
O teste de hipótese pode ser empregado para se tomar decisões sobre o valor de um parâmetro de
uma população tal como a média ou uma proporção da população. Por exemplo, pode-se ter uma
situação onde um grupo de consumidores deseja saber se a vida de uma determinada marca de
lâmpada corresponde ao valor de 700 horas anunciado pelo fabricante ou se a idade média, µ,
dos estudantes que entraram em uma universidade pública diminuiu com relação ao valor µo de
10 anos atrás.
Um dos métodos usados para se tomar tais decisões é o método denominado teste de
hipótese. Uma hipótese é simplesmente uma afirmação de que alguma coisa é verdadeira. Por
exemplo, a afirmação “o conteúdo líquido de todas as latas de cerveja da marca Cristal sendo
envasilhadas difere do volume anunciado de 350 ml” é uma hipótese.
Tipicamente existem duas hipóteses em um teste de hipótese. Uma delas é chamada de

hipótese nula e a outra de hipótese alternativa. Elas podem ser definidas como segue.
Definição 8.1 – Hipótese nula e alternativa
Hipótese nula: É a hipótese a ser testada. Usamos a notação Ho para indicar a hipótese nula.
Hipótese alternativa: É a hipótese a ser considerada como uma alternativa à hipótese nula.
Usamos a notação Ha para indicar a hipótese alternativa.
Por exemplo, no caso das latas de cerveja, a hipótese nula poderia ser “o conteúdo médio
de todas as latas de cerveja envasilhadas é igual ao conteúdo anunciado de 350 ml” e a hipótese
alternativa poderia ser “o conteúdo médio de todas as latas de cerveja envasilhadas difere do
conteúdo anunciado de 350 ml”. Isto seria indicado por:
Ho: µ = 350 ml (o envasamento está sendo feito corretamente)

Ha: µ ≠ 350 ml (o envasamento não está sendo feito corretamente)
A hipótese nula, em um teste de hipótese relacionado com a média de uma população, µ,

deve sempre especificar um único valor para aquele parâmetro. Isto significa que a hipótese nula
deveria ser sempre da forma µ = µo, onde µo é algum valor especificado, Em outras palavras, a
hipótese nula deve ser sempre escrita com o sinal de igualdade (=). Assim, a hipótese nula terá
sempre a forma
Ho: µ = µo
A hipótese alternativa, por outro lado, deve refletir o propósito do teste de hipótese em
questão. Existem três possibilidades para a escolha da hipótese alternativa.
160

lOMoARcPSD|32583331
1. Teste bilateral: Se estivermos preocupados em decidir se a média de uma população, µ, é

diferente de um valor especificado µo. Neste caso expressamos a hipótese alternativa
como
Ha: µ ≠ µo
2. Teste unilateral à esquerda: Se estivermos preocupados em decidir se a média de uma

população, µ, é menor que um valor especificado µo. Neste caso expressamos a hipótese
alternativa como
Ha: µ < µo
3. Teste unilateral à direita: Se estivermos preocupados em decidir se a média de uma

população, µ, é maior que um valor especificado µo. Neste caso expressamos a hipótese
alternativa como
Ha: µ > µo
Exemplo 8.1 – Ilustra a escolha das hipóteses nula e alternativa
Uma empresa comercializa café em pó em embalagens de 500 gramas. Uma máquina

automática enche as embalagens segundo uma distribuição normal com média µ = 500 gramas e
desvio padrão de σ = 20 gramas. O controle de qualidade deseja acompanhar a produção da
máquina para saber se o processo está sob controle. Para isso resolveu coletar uma amostra de 30
embalagens a cada meia hora. Uma dessas amostras apresentou uma média igual a 492 gramas.
Identifique as hipóteses nula e alternativa para este caso.
Solução: Ho: µ = 500

Ha: µ < 500
8.2 A lógica do teste de hipótese
Uma vez definidas as duas hipóteses, a questão agora é: Como podemos decidir qual das
duas hipóteses é a verdadeira, isto é, como decidir se devemos rejeitar ou não a hipótese nula em
favor da hipótese alternativa?
De uma forma bastante genérica, o procedimento para decidir é o seguinte: Selecione

uma amostra aleatória da população. Se os dados da amostra forem consistentes com a hipótese
nula então não rejeite a hipótese nula, caso contrário, rejeite-a e conclua que a hipótese
alternativa é verdadeira. Para isso precisamos definir um critério preciso para decidir se devemos
ou não rejeitar a hipótese nula. O próximo exemplo ilustra essa questão.
Exemplo 8.2 – Ilustra o teste de hipótese
Uma companhia produz saquinhos de batata de 454 gramas. Para verificar se a máquina de
empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra aleatória
de 50 saquinhos. Os pesos líquidos, em gramas, dos 50 saquinhos de batata obtidos são
mostrados na tabela abaixo.
161

lOMoARcPSD|32583331
Tabela 8.1 – Pesos dos 50 saquinhos de batata (gramas).
464 442 448 463 468

450 438 450 449 447
450 452 439 447 433
456 447 452 466 464
452 460 459 446 469
433 450 454 447 457
446 453 456 450 454
446 456 454 449 451
450 446 452 457 453
447 433 449 464 443
Os dados recolhidos proporcionam evidência suficiente para concluir que a máquina de

empacotar não está trabalhando adequadamente? Use os seguintes passos para responder à
questão:
a) Escreva as duas hipóteses para o teste de hipótese.
b) Discuta a idéia básica para realizar o teste de hipótese.
c) Obtenha um critério preciso para decidir se rejeitamos ou não a hipótese nula.
d) Aplique o critério e faça a conclusão.
Solução:
Seja µ a média de todos os saquinhos sendo empacotados.
a) As duas hipóteses podem ser escritas como:
Ho: µ = 454 g
Ha: µ ≠ 454 g
b) Basicamente, a idéia de realizar um teste de hipótese é a seguinte: Se a hipótese nula é

verdadeira (isto é, se µ = 454 g), então a média, x, da amostra de 50 pacotes de batatas deve
ser aproximadamente 454 gramas. É natural que nós não esperemos que a média da amostra
seja realmente igual à média da população, algum erro deve ser esperado. Entretanto, se a
média diferir muito do valor 454 então estaremos inclinados a rejeitar a hipótese nula e
concluir que a hipótese alternativa é verdadeira.
Da tabela de valores podemos calcular a média da amostra:
_
x=
∑ x = 22.261 = 451,2 g
n 50
A questão é se a diferença de 2,8g entre a média da amostra e a média hipotética da

população de 454g pode ser atribuída a um erro de amostragem ou se a diferença é grande o
suficiente para indicar que a média da população não é 454g.
162

lOMoARcPSD|32583331
c) Neste item precisamos obter um critério preciso para decidir se rejeitamos ou não a hipótese
nula, em favor da hipótese alternativa. Podemos aplicar o Teorema do Limite Central que nos diz
que se a amostra é grande (n ≥ 30) então a variável aleatória x é aproximadamente normal com
média e desvio padrão dados por:
µ =µ σ
_ σ = _
x x n
A figura 8.1 ilustra a distribuição das médias das amostras.
0,9544
x
µ - 2σx µ µ +2σx
-2 0 2
Figura 8.1 – Distribuição normal das médias das amostras
Com base neste fato, podemos dizer, por exemplo, que a probabilidade da média x estar
em um intervalo de dois desvios padrões da média da população µ é de 0,9544, ou ainda, que a
probabilidade da média da amostra estar fora deste intervalo é de apenas 0,0456 (1-0,9544),
como mostrado na figura 8.1. Podemos usar este fato como um critério para decidir se devemos
ou não rejeitar a hipótese nula. Especificamente, se a média da amostra retirada da população
estiver dentro do intervalo então podemos atribuir a diferença encontrada a um erro de
amostragem e, assim, aceitar a hipótese nula. Por outro lado, se a média da amostra estiver
distante mais de dois desvios padrões da média da população de 454g, então podemos concluir
que a hipótese nula é verdadeira e um evento extremamente improvável ocorreu durante a coleta
da amostra ou que a hipótese nula é falsa (o que é muito mais razoável) e que a hipótese
alternativa é verdadeira.
Em resumo, podemos especificar o seguinte critério:
Se a média x, dos 50 sacos de batata coletados estiver mais de dois desvios padrões distante
da média da população (454g), então rejeite a hipótese nula, µ = 454g, e conclua que a
hipótese alternativa, µ ≠ 454g, é verdadeira. Caso contrário, não rejeite a hipótese nula.
Na figura 8.2, isto é mostrado graficamente através das regiões de rejeição e não rejeição.
163

lOMoARcPSD|32583331
Rejeite Ho Não rejeite Ho Rejeite Ho
0,0228 0,0228
0,9544
x
454 - 2σx 454 454 +2σx
-2 0 2 z
Figura 8.2 – Regiões de rejeição
A probabilidade de rejeitar Ho é de apenas 0,0456, como pode ser visto na figura acima. Esta
probabilidade é denominada nível de significância do teste de hipótese.
d) Finalmente, aplicando o critério da parte (c) aos dados coletados da amostra, podemos colocar
nossa conclusão. Assumiremos que o desvio padrão da população seja conhecido e igual a σ =
7,9 gramas. Para aplicar o critério da parte (c) necessitamos determinar quantos desvios padrões
a média da amostra se desvia da média da população. Isto é feito determinando-se o valor da
variável aleatória padrão
_ _
x − 454 x − 454
z= =
σ _ σ n
x
Sabendo que σ = 7,9 gramas, n = 50 e, da parte (b), que a média da amostra é 451,2 gramas
podemos calcular o valor de z.
_
x − 454 451,2 − 454
z= = = −2,51
σ 7,9
n 50
Uma vez que a média dos 50 saquinhos de batata se encontra a mais de 2 desvios padrões
da média de 454 gramas, decidimos rejeitar a hipótese nula e concluir que a hipótese alternativa,
µ ≠ 454 gramas, é verdadeira. Em outras palavras, os dados proporcionam evidência suficiente
para concluir que a máquina de empacotamento não está trabalhando corretamente.
164

lOMoARcPSD|32583331
Erros tipo I e II
Como pode ser visto do exemplo, uma vez formuladas as hipóteses Ho e Ha, o nosso
objetivo é analisar os dados da amostra para escolher se rejeitamos Ho ou se retemos Ho. A
rejeição de Ho implica em confirmar Ha e a não rejeição de Ho significa que não há evidência de
que Ha seja verdadeira. Porém, o ponto mais importante é que a decisão de rejeitar Ho deve ser
baseada em uma forte evidência senão, a hipótese Ha não poderá ser considerada verdadeira além
de uma certa dúvida. Qualquer que seja a decisão, é sempre possível que ela seja incorreta
devido ao fato de se usar informações obtidas através de uma amostra da população.
Em testes de hipóteses existem quatro possíveis resultados, sendo que dois deles levam a
decisões incorretas, como pode ser visto na tabela abaixo.
Tabela 8.2 – Resultados possíveis de um teste de hipótese.

Situação verdadeira desconhecida
Decisão baseada na amostra Ho é verdadeira Ha é verdadeira
(Ho é falso)
Rejeite Ho Rejeição errada de Ho Decisão correta
(Erro tipo I)
Não rejeite Ho Decisão correta Retenção errada de Ho
(Erro tipo II)
Como pode ser visto da tabela, uma decisão incorreta ocorre se rejeitamos uma hipótese
nula verdadeira ou se não rejeitamos uma hipótese nula falsa. A primeira decisão incorreta é
denominada Erro tipo I e a segunda, Erro tipo II.
A probabilidade de cometermos o Erro tipo I é a probabilidade de rejeitarmos uma

hipótese nula verdadeira. Em outras palavras, é a probabilidade de que a estatística de teste
estará na região de rejeição quando, na verdade, a hipótese nula é verdadeira. Para ilustrar,
vamos determinar a probabilidade de cometer um Erro do tipo I no teste de hipóteses do
exemplo 8.2. A figura 8.2 proporciona uma visão gráfica do critério usado para decidir se
rejeitamos ou não a hipótese nula µ = 454gramas. Podemos observar da figura 8.2 que a
probabilidade é de 0,0456 (0,228 + 0,0228) de que a estatística de teste, z, caia na região de
rejeição quando, de fato, a hipótese nula é verdadeira. Dessa forma, a probabilidade de um Erro
do tipo I para esse teste de hipótese é de 0,0456. Existem apenas 4,56% de chance de concluir
que µ ≠ 454gramas quando, de fato, µ = 454gramas.
A probabilidade de cometer o Erro tipo I é denominada nível de significância do teste de

hipótese e é indicada pela letra grega α. Assim, o nível de significância do teste de hipótese do
exemplo 8.2 é α = 0,0456. Podemos resumir nossa discussão da probabilidade de um Erro do
tipo I com a definição dada a seguir.
Definição 8.2 – Nível de significância
O nível de significância, α, de um teste de hipótese é definido como sendo a

probabilidade de cometer um Erro do tipo I, isto é, a probabilidade de rejeitar uma hipótese
nula verdadeira.
165

lOMoARcPSD|32583331
A probabilidade de cometer o Erro do tipo II é a probabilidade de não rejeitar uma

hipótese nula falsa. Em outras palavras, é a probabilidade da estatística de teste estar na região de
não rejeição mesmo sendo falsa a hipótese nula. A letra grega β é utilizada para indicar a
probabilidade do Erro tipo II.
Idealmente, nós gostaríamos que ambos os tipos de erro tivessem probabilidades

pequenas. Assim, as chances de se fazer uma decisão incorreta seriam pequenas, não importando
se a hipótese nula é verdadeira ou falsa. Entretanto, podemos mostrar que para um tamanho de
amostra fixado, quanto menor a probabilidade do Erro tipo I, α, de rejeitar uma hipótese nula
verdadeira, maior será a probabilidade do Erro tipo II, β, de não rejeitar uma hipótese nula falsa
e, vice-versa. Por isso, é sempre necessário avaliar os riscos envolvidos ao se cometer cada um
dos dois tipos de erro e usar essa avaliação para balancear as probabilidades dos Erros do tipo I e
II.
Assumindo um teste de hipótese unilateral à esquerda, fica fácil mostrar que escolhido
um valor pequeno para α, será improvável que a hipótese nula será rejeitada quando ela de fato
for verdadeira. Na figura 8.3, a probabilidade α é definida pela área hachurada sob a curva
normal com µ = 270. Por outro lado, a probabilidade β de se cometer um Erro tipo II não é
normalmente conhecida e depende do valor de µ que ocorrer quando Ha for verdadeira. Essa
probabilidade é mostrada na figura 8.3 pela área hachurada sob a curva normal com µ = 262
(assumido), considerando que Ha seja verdadeira, ou seja, µ < 270.
x
c µ = 270
x
µ = 262 c
Figura 8.3 – As probabilidades de erro α e β.
Também da figura 8.3 pode-se observar que não existe uma escolha do ponto c (fronteira
das regiões de rejeição e de não rejeição) que minimize ambas as probabilidades de erro. Se c é
deslocado para a esquerda, α fica menor mas β torna-se maior e o oposto ocorre se c é deslocado
para a direita. Em vista desse dilema, e assumindo que uma rejeição errada de Ho seja um erro
mais sério, nós usualmente fixamos α com um valor baixo, como por exemplo α = 0,10 ou α =
0,05 ou, ainda, α = 0,01.
166

lOMoARcPSD|32583331
8.3 Teste de hipótese para média de uma população com base em grandes amostras
No exemplo desenvolvido no item anterior trabalhamos com um nível de significância de

0,0456, porém poderíamos ter adotado um outro nível que julgássemos mais adequado. O nível
de significância é geralmente indicado pela letra grega α e os valores mais comuns de α,
juntamente com os valores críticos zα correspondentes, estão mostrados na tabela 8.3.
Tabela 8.3 – Alguns valores mais usados de α.
α 0,10 0,05 0,025 0,01 0,005

zα z0,10 z0,05 z0,025 z0,01 z0,005
Valores críticos
de zα 1,28 1,645 1,96 2,33 2,575
Podemos agora sugerir um procedimento geral para se aplicar um teste de hipóteses.
Procedimento 8.1- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
Condição: O tamanho da amostra é grande (n ≥ 30)
Passo 1 - Escreva as hipóteses nula e alternativa.

Passo 2 - Defina o nível de significância α.
Passo 3 - Determine o(s) valor(es) crítico(s)
a) Para teste bilateral é ± zα/2
b) Para teste unilateral à esquerda é -zα
c) Para teste unilateral à direita é zα
Use a tabela da distribuição normal padrão.
Rejeite Não rejeite Rejeite Rejeite Não rejeite Ho Não rejeite Ho Rejeite
Ho Ho Ho Ho Ho
α/2 α/2 α α
z z z
- zα/2 0 zα/2 - zα 0 0 zα
Bilateral Unilateral à esquerda Unilateral à direita
Passo 4 – Calcule o valor da estatística de teste

_
x− µ o
z=
s n
Passo 5 – Se o valor da estatística de teste cair na região de rejeição, então rejeite Ho;
caso contrário não rejeite Ho.
Passo 6 – De sua conclusão com palavras.
167

lOMoARcPSD|32583331
Nota: No passo 4 do procedimento nós usamos o desvio padrão da amostra, s, em vez do desvio
padrão da população σ, porque nós raramente conhecemos σ e o desvio padrão s é uma boa
estimativa de σ quando se trabalha com grandes amostras. Nos raros casos onde σ é conhecido,
ele deve ser usado no lugar de s para o cálculo de z no passo 4 do procedimento.
Uma empresa de coleta de informações verificou que em 1986, o preço médio, no varejo, de
todos os livros de capa dura de História era de U$ 28,44 dólares. Os preços de varejo de 40 livros
de História deste ano, aleatoriamente escolhidos, são dados na tabela 8.4 como valores inteiros
em dólares. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço
deste ano de todos os livros de História de capa dura aumentou com relação à média de U$ 28,44
de 1986? Realize o teste apropriado com nível de significância de 1%.
Tabela 8.4 – Preço de 40 livros de história deste ano.
35 37 33 26 50 32 30 39
32 33 48 27 20 24 33 31
39 25 28 31 36 32 26 41
33 25 35 32 41 36 45 27
18 28 32 36 22 34 26 21
Solução:
Uma vez que o tamanho da amostra é grande (n ≥ 30), podemos aplicar o procedimento 8.1.
O teste em questão será do tipo unilateral à direita.
Ho: µ = 28,44 (o preço médio não aumentou)

Ha: µ >28,44 (o preço médio aumentou)
O nível de significância pedido é de 1%. Assim α = 0,01.
Passo 3 - Determine o(s) valor(es) crítico(s).
Para α = 0,01, o valor crítico será z0,01. Da tabela 8.3 (ou tabela 6.1) obtemos z0,01 = 2,33.
Portanto, o valor crítico é 2,33, conforme mostrado na figura 8.4.
168

lOMoARcPSD|32583331
Não rejeite Ho Rejeite Ho
Área de 0,01
z
0 2,33
Figura 8.4 – Valor crítico para α = 0,01
Passo 4 - Calcule o valor da estatística de teste
_
x− µ o
z=
s n
Sabemos que µo = 28,44 e n = 40. Calculando a média e o desvio padrão da amostra

encontramos 31,75 e 7,35, respectivamente. Assim, o valor da estatística de teste é
_
x− µ o 31,75 − 28,44
z= = = 2,85
s n 7,53 40
Este valor de z está marcado na figura 8.4 com uma bolinha preta próxima do valor 2,33.
caso contrário, não rejeite Ho.
O valor da estatística de teste encontrado é de 2,85. Como pode ser visto na figura 8.4,
esse valor cai na região de rejeição e, assim, nós devemos rejeitar Ho.
Os dados proporcionam evidência suficiente para concluir que o preço médio de todos os
livros de história aumentou com relação ao preço médio de 1986.
8.4 Teste de hipótese para uma população normal
Na seção anterior aprendemos como realizar um teste de hipótese relacionado com a

média de uma população, µ, quando trabalhamos com uma amostra grande (n ≥ 30). Entretanto,
em muitos casos não é possível ou não é econômico coletar uma amostra grande. Nesta seção
veremos um método que não requer amostras grandes, porém requer que a população sendo
amostrada seja normalmente distribuída. Assumiremos que o desvio padrão não seja conhecido,
o que ocorre na maioria dos casos.
169

lOMoARcPSD|32583331
Já vimos no capítulo anterior que se tomarmos uma amostra de tamanho n de uma

população normalmente distribuída com média µ, a variável aleatória
_
x− µ
t=
s n
tem uma distribuição t com n-1 graus de liberdade. Em outras palavras, as probabilidades para
aquela variável aleatória são iguais às áreas sob a curva t com GL = n-1. Conseqüentemente,
quando a população sendo amostrada é normalmente distribuída, nós podemos realizar um teste
de hipóteses com a hipótese nula Ho: µ = µo, empregando a variável aleatória acima como nossa
estatística de teste e usando a tabela da distribuição t para obter o valor crítico (ou os valores
críticos).
O procedimento 8.2 fornece os passos necessários para realizar o teste de hipóteses.
Procedimento 8.2- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
Condição: População Normal

a) Para teste bilateral é ± tα/2
b) Para teste unilateral à esquerda é -tα
c) Para teste unilateral à direita é tα
com df = n-1. Use a tabela da distribuição t.
Rejeite Não rejeite Rejeite Rejeite Não rejeite Ho Não rejeite Ho Rejeite
Ho Ho Ho Ho Ho
α/2 α/2 α α
t t t
- tα/2 0 tα/2 - tα 0 0 tα
Bilateral Unilateral à esquerda Unilateral à direita

_
x− µ o
t=
s n
170

lOMoARcPSD|32583331
Assuma que a média de gasto com energia elétrica de todas as famílias de uma certa
região seja de R$ 1123,00 em um determinado ano. Neste mesmo ano, coletando-se uma amostra
aleatória de 15 famílias de classe média alta obteve-se os valores mostrados na tabela abaixo,
arredondados para o inteiro mais próximo. Com um nível de significância de 5%, os dados
indicam que famílias da classe média alta gastam, em média, em energia mais do que a média da
região de R$ 1123,00? (Assuma que a distribuição de gasto com energia das famílias da classe
média alta seja normalmente distribuída).
Tabela 8.5 – Gastos com energia elétrica (R$).

1254 1350 1227 1154 1790
1615 1521 908 1231 1369
1711 1293 1205 1351 1185
Solução:
Uma vez que a população em questão é normalmente distribuída, podemos aplicar o

procedimento 8.2 para realizar o teste de hipóteses.
O teste em questão será do tipo unilateral à direita.
Ho: µ = 1123 (a média não é maior que a média nacional)

Ha: µ > 1123 (a média é maior que a média nacional)
O nível de significância pedido é de 5%. Assim α = 0,05.
Passo 3 - Determine o(s) valor(es) crítico(s).
O valor crítico para um teste unilateral à direita é tα, com GL = n-1. Neste caso, n = 15 e
GL = 15-1 = 14, com α = 0,05. Da tabela 7.4 (capítulo 7, pag. 151) obtemos t0,05 = 1,761. Veja
figura 8.5.
Não rejeite Ho Rejeite Ho
Curva t com
GL = 14
0,05
t
0 1,761
Figura 8.5 – Valor crítico para α = 0,05.

171

lOMoARcPSD|32583331
Passo 4 – Calcule o valor da estatística de teste.
_
x− µ o
t=
s n
Sabemos que µo = 1123 e n = 15. Além disso, a média e o desvio padrão dos dados
constantes na tabela acima são 1344,27 e 231, respectivamente. Conseqüentemente, o valor da
estatística de teste é:
_
x− µ o 1344,27 − 1123
t= = = 3,710
s n 231 15
O valor encontrado é igual a 3,710 e este valor cai dentro da região de rejeição. Assim,
nós rejeitamos Ho.
Os dados proporcionam evidência suficiente para concluir que famílias da classe média
alta gastaram mais do que a média das famílias da região.
172

lOMoARcPSD|32583331
1) Um fabricante de tintas afirma que o tempo médio de secagem de sua nova tinta látex é
de duas horas. Para testar esta afirmação, foram obtidos os tempos de secagem para 20
latas aleatoriamente selecionadas. A média da amostra e o desvio padrão são 123,1 min e
10,0 min, respectivamente. Assumindo que os tempos de secagem sejam normalmente
distribuídos, os dados apresentados proporcionam evidência suficiente para concluir que
o tempo médio de secagem é na verdade maior do que o tempo anunciado de 120 min?
Use α = 0,05.
2) Um revendedor de baterias recebeu um grande carregamento de baterias para automóveis

de um fabricante, que afirma que as baterias tem uma vida média de 36 meses. Um teste
com 10 baterias deste carregamento resultou nas seguintes durações em meses:
27,6 28,7 34,7 29,0 22,9

29,6 29,4 30,2 36,5 34,7
a) Os dados indicam que a vida média das baterias recebidas é menor do que os 36
meses anunciados? Realize o teste com 1% de nível de significância. (Nota: Σx =
303,3 e Σx2 = 9343,85).
b) Qual condição você tem que assumir sobre as vidas das baterias para realizar o teste
de hipóteses que você realizou na parte a?
173

lOMoARcPSD|32583331
8.5 Teste de hipótese para médias de duas populações
Nesta seção examinamos métodos usados para fazer inferência estatística sobre as médias
de duas populações trabalhando com amostras grandes e independentes. Entendemos que duas
amostras são independentes se a amostra retirada de uma população não interfere na amostra
retirada da outra população.
O problema consiste em comparar as médias de duas populações para decidir se existe

alguma diferença entre elas. A lógica para se fazer esta comparação pode ser resumida como
mostrado na figura 8.6. Uma amostra grande (n ≥ 30) é retirada aleatoriamente de cada
população. As médias das amostras são calculadas e comparadas, levando a uma conclusão de
que as médias não são iguais se houver uma diferença significativa entre elas.
População 1 População 2
µ1 µ2
σ1 σ2
n1 Amostra 1 Amostra 2 n2
x1 x2
s1 Calcule média 1 Calcule média 2 s2
Compare a média 1 com a

média 2. Tome uma decisão
Figura 8.6 – Procedimento para comparar duas médias.
O procedimento adotado para realizar um teste de hipóteses, para as médias de duas

populações, é similar ao adotado anteriormente para uma única população e está baseado na
figura 8.6. Os principais pontos do procedimento são discutidos a seguir.
1. Nosso problema é que nós temos duas populações com médias µ1 e µ2 e desejamos saber
se existe diferença entre elas. A hipótese nula é
Ho: µ1 = µ2 (as médias coincidem)
2. Observando a figura 8.6, note que retiramos uma amostra de cada uma das populações e
_ _
calculamos as médias. A diferença observada x1 − x 2 é, agora, a estatística de teste (em
vez de x da seção anterior).
174

lOMoARcPSD|32583331
3. Se retirássemos todas as possíveis amostras de tamanho n1 e n2 das duas populações, nós

teríamos uma distribuição das “diferenças entre as médias das amostras”. Se as amostras
são grandes, o Teorema do Limite Central nos permite assumir que a distribuição da
amostragem é aproximadamente normal.
4. Se a hipótese nula Ho: µ1 = µ2 é verdadeira, então a média da distribuição das diferenças

das médias das amostras deve ser zero, como mostrado na figura 8.7. O próximo passo é
localizar a estatística de teste ( x1 – x2 ) nesta distribuição e verificar onde ela cai relativo
à média zero assumida.
α/2 = 0,025 α/2 = 0,025

_ _
x a − xb
x1 – x2
µ1 - µ2 = 0
Figura 8.7- Distribuição das diferenças das médias.
5. Para localizar a estatística de teste na distribuição necessitamos calcular o desvio padrão

da distribuição. Podemos provar que o desvio padrão é dado por
 2 2   σ 12 σ 22 
σ _ _ =  σ _ + σ _  =  + 
 x1 x2 
x1 − x2
 1
n n 2 
6. Como os valores das variâncias das duas populações são raramente conhecidos, podemos
usar as variâncias das amostras como estimadores ou estimativas das variâncias das
populações para calcular uma estimativa do desvio padrão. Para isso, basta substituir σ
por s na fórmula anterior.
 s12 s 22 
s_ _ =  + 
x1 − x2
 n1 n2 
_ _
7. A localização da estatística da amostra x1 − x 2 , relativa à média da distribuição, pode ser
encontrada calculando-se o valor de z.
_ _ 
 x1 − x 2  − 0
z= 
s_ _
x1 − x2
175

lOMoARcPSD|32583331
8. Se a estatística de teste cair na região de rejeição então rejeite Ho; caso contrário, não
rejeite Ho.
Exemplo 8.5 – Ilustra o procedimento de teste
Deseja-se verificar se existe diferença entre salários pagos a professores de instituições

públicas e instituições privadas através de um teste de hipóteses. Para isso, selecionou-se
aleatoriamente 30 professores da rede pública e, com base em seus salários anuais, determinou-
se a média de seus salários como sendo de R$37.335,20 com desvio padrão de R$13.129,09. O
mesmo procedimento foi adotado para os professores da rede privada. Foram selecionados 35
professores obtendo-se média de R$39.558,97 e desvio padrão de R$14.940,88. O teste de
hipóteses deve ser feito com nível de significância igual a 5%.
Solução:
Passo 1 – Definir as hipóteses nula e alternativa.
Seja µ1 a média salarial dos professores da rede pública e µ2 a média salarial dos
professores da rede privada. As hipóteses nula e alternativa podem ser escritas como
Ho: µ1 = µ2 (as médias salariais coincidem)

Ha: µ1 ≠ µ2 (as médias salariais são diferentes)
Passo 2 – O nível de significância foi definido em 5%.
Passo 3 – Os valores críticos de z para α = 0,05 são definidos como ± zα/2 .

Da tabela 6.1 (áreas para curva normal), determinamos ± z0,05/2 = ± z0,025 = ± 1,96. A
figura abaixo mostra os valores críticos.
Rejeite Ho Não rejeite Ho Rejeite Ho
α/2 = 0,025 α/2 = 0,025
z
0
-1,96 1,96
Passo 4 – Cálculo do valor da estatística de teste.
 s12 s 22   13129,09 2 14940,88 2 

s_ _ 
=  +  =   +  = 3481,92
x1 − x2
 1
n n 2   30 35 
176

lOMoARcPSD|32583331
_ _ 
 x1 − x 2  − 0
37335,20 − 39558,97
z=  = = −0,64
s_ _ 3481,92
x1 − x2
Passo 5 – Pela figura observamos que o valor –0,64 não cai dentro da região de rejeição. Assim,
nós não rejeitamos a hipótese nula Ho.
Passo 6 – Dê sua conclusão

Baseado nos dados da amostra nós não temos evidência suficiente para concluir que
existe uma diferença entre as médias salariais dos professores da rede pública e privada.
Os passos são dados em forma resumida pelo procedimento 8.3.
Procedimento 8.3- Teste de hipóteses para as médias de duas populações com

hipótese nula Ho: µ1 = µ2
Condições: Grandes amostras (n1 ≥ 30, n2 ≥ 30) e amostras independentes.

a) Para teste bilateral é ± zα/2
b) Para teste unilateral à esquerda é -zα
c) Para teste unilateral à direita é zα
Use a tabela da distribuição normal padrão (tabela 6.1).

_ _ 
 x1 − x 2   s12 s 22 
z=   com s _ _ =  + 
s_ _
x1 − x2
x1 − x2
 n1 n2 
177

lOMoARcPSD|32583331
1) Pesquisadores em obesidade desejam comparar a eficácia de uma dieta com exercícios

contra uma dieta sem exercícios. Setenta e três pacientes foram aleatoriamente
selecionados e divididos em dois grupos. O grupo 1, com 37 pacientes, foi colocado no
programa de dieta com exercícios. O grupo 2, com 36 pacientes, foi colocado no
programa com dieta somente. Os resultados com a perda de peso, em Kg, após dois
meses, estão sumarizados na seguinte tabela:
Grupo de dieta com exercícios Grupo de dieta sem exercícios

_ _
x1 = 8 x 2 = 8,12
s1 = 1,66 s 2 = 2,47
Determine, com um nível de significância de 0,05, se existe diferença entre os dois

tratamentos.
2) Um grupo de 141 indivíduos é usado em um experimento para comparar dois

tratamentos. O tratamento 1 é dado a 79 indivíduos escolhidos ao acaso e os 62 restantes
recebem o tratamento 2. As médias e os desvios padrões são os seguintes:
Tratamento 1 Tratamento 2
Média 109 128
Desvio padrão 46,2 53,4
Com base nos dados acima é possível concluir que o tratamento 2 tem uma resposta
maior que o tratamento 1? Adote um nível de significância de 5%.
178

lOMoARcPSD|32583331
Capítulo 9
Análise de Variância - ANOVA
Este capítulo fornece métodos para comparar as médias de mais de duas populações.
Serão estudados dois métodos denominados Análise de variância para 1 fator e
Análise de variância para 2 fatores. Esses métodos utilizam uma distribuição chamada
distribuição F que será vista em primeiro lugar. Após o término deste capítulo, você
deverá ser capaz de:
1. Entender o termo análise de variância.

2. Determinar áreas sob a curva F.
3. Aplicar o procedimento ANOVA para experimentos completamente aleatorizados
4. Verificar validade do modelo estatístico
5. Aplicar o procedimento ANOVA para experimentos blocos aleatorizados
6. Aplicar o procedimento ANOVA para experimentos quadrados latinos
179

lOMoARcPSD|32583331
9.1) Distribuição F
O procedimento de análise de variância utiliza uma classe de distribuição contínua de

probabilidades, denominada distribuição F. As probabilidades para uma variável aleatória que
possui uma distribuição F são iguais às áreas sob a curva F, da mesma forma como definimos
para distribuições normais e distribuições t. Relembremos que uma curva t depende do número
de graus de liberdade (df ou GL). Uma curva F também depende do número de graus de
liberdade, porém existem dois graus de liberdade em vez de um. Na figura 9.1, estão desenhadas
duas curvas F, uma com df = (10,2) e outra com df = (9,50). O primeiro número é denominado
graus de liberdade do numerador e o segundo, graus de liberdade do denominador.
Figura 9.1 – Distribuição F.
Algumas propriedades das curvas F
1. A área total sob a curva é igual a 1.

2. Uma curva F começa no zero e se estende indefinidamente para a direita, se aproximando de
zero à medida que a variável cresce.
3. Uma curva F não é simétrica. Ela sobe rapidamente com F e desce se aproximando do eixo
horizontal mais suavemente.
Usando as curvas F
As áreas sob as curvas F podem ser encontradas em tabelas. Normalmente elas são usadas
para um valor  igual a 0,01 ou 0,05 o que nos conduz à notação F0,01 e F0,05 para indicar os
valores de F que definem uma área de 0,01 ou 0,05 à sua direita, respectivamente. A tabela 9.1
fornece os valores para F0,01. No topo da tabela estão especificados os graus de liberdade para o
numerador e na coluna à esquerda, os graus de liberdade para o denominador. A tabela 9.2 é
similar à tabela 9.1, fornecendo os valores para F0,05.
180

lOMoARcPSD|32583331
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 à direita de F.
Graus de Liberdade para o Numerador
1 2 3 4 5 6 7 8 9
1 4052.00 4999.50 5403.00 5625.00 5764.00 5859.00 5928.00 5981.00 6022.00

2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98
Graus de Liberdade para o Denominador
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72

8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
181

lOMoARcPSD|32583331
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 (continuação).

10 12 15 20 24 30 40 60 120 
1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
182

lOMoARcPSD|32583331
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 à direita de F.

1 2 3 4 5 6 7 8 9
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18

10 4.96 4.10 3.71 3.48 3.33 3.32 3.14 3.07 3.02
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96
 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
183

lOMoARcPSD|32583331
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 (continuação).

10 12 15 20 24 30 40 60 120 
1 241.90 243.90 245.90 248.00 249.10 250.10 251.10 252.20 253.30 254.30
2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.93 1.88 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
184

lOMoARcPSD|32583331
Exemplo 9.1 – Ilustra o uso das tabelas
Para uma curva F com df = (4,12) determine F0,05.
Solução
Determinar F0,05 significa encontrar o valor de F de modo que a área à sua direita seja
igual a 0,05, como mostrado na figura 9.2.
Figura 9.2 – Curva F com df = (4,12).
Para obter o valor de F pedido podemos usar a tabela 9.2. Neste exemplo, o número de
graus de liberdade para o numerador é 4 e para o denominador é 12. Assim, procuramos pela
intersecção da coluna contendo o valor 4 com a linha contendo o valor 12 e encontramos o valor
3,26, que é o valor pedido, ou seja, F0,05 = 3,26.
1) Uma curva F tem df = (12,7). Qual é o número de graus de liberdade para

a) o numerador?
b) o denominador?
2) Para uma curva F com df = (12,5) determine o valor de F com

a) área 0,01 à sua direita
b) área 0,05 à sua direita
185

lOMoARcPSD|32583331
9.2 - Análise de variância para um fator
A análise de variância é um procedimento de inferência que é usado para comparar as

médias de diversas populações. Justifica-se a palavra “variância” no termo análise de variância
pelo fato do procedimento usado para comparar as médias envolver um estudo da variação ou
variabilidade dos dados contidos nas amostras.
A variabilidade que usualmente é encontrada na amostra é chamada variação dentro do

grupo, variabilidade aleatória ou erro. Isto não significa que um engano foi cometido na
coleta dos dados. O termo é um jargão estatístico para designar a variabilidade natural ou
aleatória que ocorre com os dados da amostra coletada. Por exemplo, a variação da vida de uma
ferramenta de corte quando se faz ensaios de corte com um material, ou a resistência à ruptura de
um material quando fazemos testes de tração.
Nesta seção veremos o procedimento adotado para comparar as médias considerando-se

apenas um fator ou tratamento. O termo fator (tratamento) significa a variável que pode estar
influenciando os valores coletados das amostras, ou seja, ele se refere a uma condição ou
estímulo a que um determinado grupo está exposto. Isto poderia ser uma determinada droga, um
novo método de fazer dieta ou um novo método de ensino.
Suponha a existência de três grupos (ou amostras), cada um sujeito a um tratamento,

como mostrado na tabela 9.3. Neste caso, podemos ver que não há variação nos dados dentro dos
grupos. A única variação ocorre entre as médias dos grupos e isto nos permite especular que os
tratamentos aplicados aos grupos têm influência na variação observada.
Estudando agora a tabela 9.4, já vemos uma situação mais comum onde uma variação
aleatória é encontrada dentro dos grupos.Vemos também que existe uma variação entre as
médias dos três grupos. Em virtude da variação dentro dos grupos, não é mais possível tirar
conclusões sobre o efeito dos diferentes tratamentos a que os grupos foram submetidos.
O ponto importante é que qualquer variação observada entre as médias dos grupos
consiste de (1) uma componente que é devido à variação dentro do grupo e (2) uma componente
que é devido a um possível efeito do tratamento.
Tabela 9.3 – Dados relativos a três tratamentos sem variação dentro dos grupos.
Tratamentos
1 2 3
6 9 13
6 9 13
6 9 13
6 9 13
6 9 13
_ _ _
x1 = 6 x1 = 9 x1 = 13
Se a variabilidade total entre os grupos consiste dessas duas componentes então nós
devemos, de alguma maneira, separar, avaliar e comparar essas duas componentes. Neste
processo, se nós encontrarmos que a variação entre os grupos não é maior que a variação
aleatória (ou erro) dentro dos grupos, então a conclusão será que os diferentes tratamentos não
186

lOMoARcPSD|32583331
têm um efeito significativo sobre os resultados e a variabilidade total é devida à variação

aleatória natural dos processos envolvidos na experimentação.
Tabela 9.4 – Dados relativos a três tratamentos com variação dentro dos grupos.
Tratamentos
1 2 3
6 3 5
4 8 6
7 4 4
3 5 6
5 9 3
_ _ _
x1 = 5 x1 = 5,8 x1 = 4,8
Cálculo da variabilidade
O procedimento ANOVA se baseia na determinação da variabilidade total dos dados, na

variabilidade dentro dos grupos e na variabilidade entre os grupos (médias dos grupos). A
variabilidade total, denominada soma de quadrados total (SQT) é dada por:
k n
 _

2
( x ) 2
SQT =   xij − x..  =  x 2 − (9.1)

j =1 i =1   nT
_
1 k n
e x.. =  xij , onde
nk j =1 i =1
(9.2)
_
x.. = média de todas as medidas
k = número de grupos
n = número de medidas (ou dados) por grupo
nT = n  k = número total de medidas ou observações
i = 1, 2, ..., n e j = 1, 2, ..., k
A variabilidade entre os grupos (ou tratamentos), denominada soma de quadrados entre

grupos (SQG) é dada por:
 k n 
  xij 
2
1 k  n
2  
 _ _ 
SQG = n  x j − x..  =    xij  −  
k
j =1 i =1
(9.3)
j =1   n j =1  i =1  n T
_
onde x j é a média do grupo j ( j = 1, 2, .., k)
Obs: se o número de medidas ou observações não for o mesmo para todos os grupos, isto é, se
tivermos n1 medidas no grupo 1, n2 medidas no grupo 2 e assim por diante, até nk medidas no
grupo k, então SQG será calculado de acordo com a expressão
187

lOMoARcPSD|32583331
2
 nj   k nj 
  xij    xij 
 i =1   
  −  j =1 i =1 
k
SQG =  (9.4)
j =1 nj nT
Ou, mais simplificadamente por
( x ) ( x ) 1
2
2
2
( x ) ( x ) 2 2
SQG = + +  + −
k
(9.5)
n1 n2 nk nT
onde
xk = soma das medidas do grupo k

x = soma de todas as medidas
A variabilidade dentro de cada grupo é denominada soma de quadrados dos grupos ou

soma de quadrados dos erros (SQE) e é facilmente calculada por
2
k
 _n

SQE =   xij − x j  (9.6)
j =1 i =1  
_
onde x j é a média das observações do j-ésimo grupo ou amostra.
Se as médias das k populações forem iguais então toda a variabilidade medida pela
expressão (9.1) é devida ao acaso. Porém, se forem diferentes então parte da variabilidade é
proveniente da variabilidade natural dentro do grupo e parte devido à aplicação dos diferentes
tratamentos. Podemos demonstrar que a variabilidade total é igual à soma das variabilidades
dentro dos grupos e entre os grupos, ou seja,
SQT = SQG + SQE
2 2 2
k n
 _
 k
 _ _ k n
 _

  ij
j =1 i =1 
x − x .. 

= n   j ..    xij − x j 
j =1 
x − x

+
j =1 i =1  
(9.7)
Cada uma das somas de quadrados tem um grau de liberdade associado a ela, conforme
mostrado na tabela 9.5.
Tabela 9.5 – Graus de liberdade das somas de quadrados.

Graus de liberdade
Termo Amostras de mesmo tamanho n Amostras de tamanhos diferentes
SQT nT –1 = nk -1 nT -1
SQG k-1 k-1
SQE (nk – 1) – (k – 1) = k(n-1) nT – k
188

lOMoARcPSD|32583331
Dividindo cada uma das somas de quadrados SQT, SQG e SQE pelos respectivos graus
de liberdade, obtemos os quadrados médios, que são então dados por:
SQG
Quadrado médio entre grupos = QMG =
k −1
SQE
Quadrado médio dos erros = QME =
nT − k
Conforme mencionado, nós decidiremos se a variação entre as médias das amostras

(QMG) é grande o bastante para concluir que existe alguma diferença entre elas, pela
comparação com a variação existente dentro das amostras (QME). Portanto, a idéia é a seguinte:
QME é uma estimativa da variância comum das populações em estudo. Assim, se QMG é grande
relativo a QME, então podemos inferir que a variação entre as médias das amostras é devida a
diferenças entre as médias das populações e não da variação dentro das populações. Desta forma,
usamos a variável aleatória
QMG
F=
QME
como a estatística de teste. Grandes valores de F indicam que QMG é grande relativo a QME e
assim, que a hipótese de médias de populações iguais deve ser rejeitada. O procedimento de
análise de variância será explicado com base no exemplo a seguir.
Exemplo 9.2 – Ilustra ANOVA com um fator
Um fisioterapeuta deseja comparar os efeitos de três diferentes técnicas de fisioterapia no

progresso de pacientes idosos, que sofreram paralisia parcial devido a um ataque do coração de
média intensidade. Um total de 18 pacientes foi selecionado procurando manter constantes
parâmetros como idade, condição física, motivação, etc.. Esses pacientes foram divididos
aleatoriamente em três grupos e, após um período de seis meses, eles foram avaliados por um
especialista que não tinha conhecimento a que grupo pertencia cada paciente. Os dados obtidos,
juntamente com algumas estatísticas, estão resumidos na tabela 9.5.
Tabela 9.5 – Dados da avaliação dos pacientes.

Grupos de Terapia
Terapia A Terapia B Terapia C
80 56 97
73 72 90
79 61 75
88 64 87
68 80 88
75 74 83
_ 2 _ 2 _ 2
x A = 77,17 ; s A = 46.97 x B = 67,83 ; s B = 80,97 xC = 86,67 ; sC = 53,87
xA = 463 ; nA = 6 xB = 407 ; nB = 6 xC = 520; nC = 6
x = 109312
2
x = 1390 nT = 18 k=3
189

lOMoARcPSD|32583331
Com um nível de significância de 5%, existe alguma diferença nas médias dos três
tratamentos?
Solução
1) Queremos saber se há alguma diferença entre as médias das populações representadas por
cada um dos três grupos. Assim a hipótese nula é
Ho: A = B = C
2) A Hipótese alternativa será escrita da seguinte forma
Ha: Ao menos uma diferença existe entre as médias das populações
3) O nível de significância será definido em 5% conforme o enunciado.

4) Cálculo das somas dos quadrados (SQT, SQG E SQE).
( x ) 2
1390 2
SQT =  x − 2
= 109312 − = 1973,11
n T 18
( x ) ( x ) ( x ) ( x )
2 2 2 2
SQG = + + −
A B C
nA nB nC nT
SQG =
(463)2 + (407)2 + (520)2 − 107338,89 = 1064,11
6 6 6
SQE = SQT – SQG = 1973,11 – 1064,11 = 909
5) Graus de liberdade
GLT = nT – 1 = 18 – 1 = 17
GLG = k – 1 = 3 – 1 = 2
GLE = GLT – GLG = 17 – 2 = 15
6) Cálculo da estatística
Dividindo-se a soma dos quadrados pelos respectivos graus de liberdade obtém-se as

estimativas das variâncias (quadrados médios).
SQG 1064 ,11

QMG = = = 532 ,06
GLG 2
SQE 909
QME = = = 60 ,60
GLE 15
190

lOMoARcPSD|32583331
7) Cálculo de F e tabela ANOVA
QMG 532,06
F2,15 = = = 8,78
QME 60,60
Um resumo dos valores obtidos até agora pode ser mostrado na tabela 9.6.
Tabela 9.6 – Exemplo de uma tabela ANOVA.
Fonte GL SQ MQ F[2,15]
Grupos 2 1064,11 532,06 8,78
Erro 15 909,00 60,60
Total 17 1973,11
8) Rejeite ou deixe de rejeitar Ho
Da tabela 9.2, no cruzamento da coluna 2 com linha 15 obtemos o valor F 0,05 igual a 3,68,
para um nível de confiança de 5%. Como o valor de F obtido no passo anterior foi de
8,78, portanto maior que 3,68, concluímos que podemos rejeitar Ho. Isto significa que
temos evidências de que existe pelo menos uma diferença estatisticamente significativa
entre os três pares do grupo de médias.
A tabela mostrada no exemplo acima pode ser generalizada como mostrado na tabela 9.7.
Tabela 9.7 – Formato da tabela para análise de variância.

Fonte GL SQ QM=SQ/GL Estatística F
Tratamento ou k-1 SQG SQG QMG
Grupo QMG = F=
k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT
O procedimento completo para a aplicação de análise de variância é dado a seguir com

fórmulas simplificadas a fim de facilitar sua aplicação.
191

lOMoARcPSD|32583331
Procedimento 9.1 – Aplicar ANOVA para k médias de populações

Amostras independentes
Populações normais
Populações com mesmo desvio padrão
Passo 1 – Escreva as hipóteses nula e alternativa

Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k), onde n é o número total de dados
Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas
( x ) 2
SQT =  x − 2
n T
( x ) ( x )
1
2
2
2
( x ) ( x ) 2 2
SQG = + +  + −
k
n1 n2 nk nT
SQE = SQT - SQG
onde, j =1, 2, 3, ..., k e

nj = tamanho da amostra para a população j
xj = soma dos valores da amostra j
Passo 5 – Construa a tabela ANOVA

QMG = F=
Grupo k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
Passo 7 – Escreva sua conclusão.
192

lOMoARcPSD|32583331
Os tempos requeridos por três trabalhadores para realizar uma tarefa em uma linha de montagem
foram cronometrados em cinco ocasiões aleatoriamente escolhidas. Os tempos são dados na
tabela abaixo, aproximados para o inteiro mais próximo.
José Marcos Pedro

8 8 10
10 9 9
9 9 10
11 8 11
10 10 9
Com um nível de significância de 5% podemos afirmar que existe uma diferença na

média dos tempos dos três trabalhadores?
Solução
Passo 1 – Hipóteses
Ho: 1 = 2 = 3
Ha: Ao menos uma diferença existe entre as médias das populações
Passo 2 – Nível de significância  = 0,05
Passo 3 – Valor crítico F0,05 = 3,89, pois GL = (2, 12)
Passo 4 – Cálculo das somas de quadrados
( x ) 2
SQT =  x − 2
= 1339 – (141)2/ 15 = 1339 – 1325,4 = 13,6
n T
( x ) ( x )
1
2
2
2
( x ) ( x )
2 2
SQG = + +  + − = (48)2/5 + (44)2/5 + (49)2/5 – 1325,4

k
n1 n2 nk nT
SQG = 460,8 + 387,2 + 480,2 – 1325,4 = 1328,2 – 1325,4 = 2,8
SQE = SQT – SQG = 13,6 – 2,8 = 10,8
Passo 5 – Tabela ANOVA

Tratamento ou 2 2,8 1,4 1,55
Grupo
Erro 12 10,8 0,9
Total 14 13,6
193

lOMoARcPSD|32583331
Passo 6 – O valor da estatística (1,55) é menor que o valor crítico (3,74) e, portanto, não
devemos rejeitar Ho.
Passo 7 – Os dados obtidos não fornecem evidências para concluir que o tempo médio gasto
pelos funcionários, para desempenhar a tarefa de montagem, sejam diferentes.
1) Um criador de porcos deseja testar três diferentes dietas desenvolvidas para maximizar o
ganho de peso. O criador seleciona aleatoriamente 12 porcos e os divide em três grupos,
também de maneira aleatória. A cada um dos grupos é aplicado um dos programas de dieta.
O ganho de peso para cada porco, em Kg, após um período de seis semanas é dado pela
tabela abaixo.
Dieta A Dieta B Dieta C

10,5 11,5 9,8
10,9 10,9 10,5
10,7 11,8 10,4
10,3 11,8 10,5
Com um nível de significância de 5% podemos afirmar que existe uma diferença na média
dos pesos das três dietas aplicadas?
2) As tabelas abaixo são tabelas ANOVA parcialmente preenchidas. Complete os dados

faltantes.
a)

Tratamento ou 2 21,652
Grupo
Erro 84,400 7,03
Total 14
b)

Tratamento ou 2,124 0,708 0,75
Grupo
Erro 20
Total
3) O gerente geral de uma grande cadeia de lojas de conveniência deseja testar os efeitos de três
estratégias de propaganda. As estratégias são:
Estratégia 1 : nenhuma propaganda
Estratégia 2: distribuir panfletos na vizinhança da loja
Estratégia 3: distribuir panfletos e anunciar em jornais
Foram escolhidas aleatoriamente 18 lojas divididas em 3 grupos. Cada grupo usou uma das
três estratégias. A tabela abaixo apresenta valores arrecadados com vendas em um período de
194

lOMoARcPSD|32583331
1 mês. Os dados coletados proporcionam evidência de que existem diferenças entre as

médias de vendas das três estratégias?
Estratégia 1 Estratégia 2 Estratégia 3

22 21 29
20 25 24
21 25 31
21 20 32
24 22 26
22 26 27
195

lOMoARcPSD|32583331
9.3 – Adequabilidade do modelo
Como já foi dito, o procedimento ANOVA consiste em comparar a variabilidade

existente dentro das amostras com a variabilidade existente entre as amostras. É usual descrever
as observações por um modelo linear estatístico
xij =  + j + ij (9.8)
onde xij é o valor da i-ésima observação do j-ésimo tratamento,  é a média global, j representa
o efeito do tratamento j e ij é o erro aleatório associado aos xij.
Para o teste de hipóteses, assumimos que os erros ij sejam variáveis aleatórias
independentes e normalmente distribuídas, com média zero e variância 2. A variância 2 é
considerada constante para todos os tratamentos ou níveis do fator em estudo. Como estamos
trabalhando com um único fator, o modelo apresentado acima é denominado modelo de análise
de variância para um fator. Se assumirmos que as observações são feitas de uma forma
completamente aleatória então o planejamento experimental é dito experimento completamente
aleatorizado com um único fator.
O modelo (9.8) pode ainda ser classificado em modelo de efeitos fixos ou modelo de
efeitos aleatórios. O modelo de efeitos fixos ocorre quando fixamos a priori os níveis do fator
estudado. Por exemplo, se queremos analisar o efeito de três técnicas de aprendizado somente,
então os níveis do fator estarão automaticamente fixados. No modelo de efeitos fixos são
testadas hipóteses sobre as médias dos diversos níveis ou tratamentos e as conclusões são válidas
apenas para os níveis escolhidos para análise.
Porém, se dispomos de mais de três técnicas e escolhemos de forma aleatória apenas três
entre as diversas técnicas disponíveis, isto é, se escolhemos uma amostra aleatória da população
de técnicas (níveis do fator) então estaremos tratando com o modelo de efeitos aleatórios. Neste
caso, as conclusões obtidas serão estendidas a todos os níveis do fator e não apenas àqueles
níveis selecionados.
9.3.1 – Verificação da adequação do modelo
O modelo (9.8) assume que os erros ij sejam variáveis aleatórias independentes e
normalmente distribuídas, com média zero e variância 2. Podemos verificar se essas hipóteses
estão satisfeitas através da análise dos resíduos, que são definidos por
_
eij = xij − x j (9.9)
Isto é, os resíduos para o j-ésimo tratamento são determinados subtraindo-se de cada

observação a média correspondente do tratamento. A verificação da adequabilidade do modelo
consiste em construir gráficos onde os resíduos são plotados contra alguns parâmetros. Isto será
mostrado através do exemplo abaixo.
196

lOMoARcPSD|32583331
Exemplo 9.4 – Ilustra os procedimentos de teste do modelo
Um certo fabricante tem interesse na resistência à tração de uma fibra sintética usada na
fabricação de tecidos para camisas masculinas. Ele suspeita que a resistência é afetada pela
porcentagem de algodão contida na fibra. Cinco níveis de porcentagem de algodão são de
interesse, 15 %, 20 %, 25%, 30% e 35%. Para cada nível, devem ser feitas 5 observações,
perfazendo um total de 25 observações. Um procedimento ANOVA com um único fator deve ser
adotado para testar se a resistência é realmente afetada pela quantidade de algodão presente na
fibra.
Solução
a) Aplicação do procedimento ANOVA
Inicialmente devemos nos preocupar em garantir que o experimento seja completamente

aleatorizado. Para obter uma ordem aleatória das observações suponha que nós numeremos as
observações como mostrado na tabela abaixo.
Tabela 9.8 – Número de ordem das observações

Número de ordem
15 1 2 3 4 5
Porcentagem
de Algodão
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Podemos agora selecionar um número, aleatoriamente, entre 1 e 25. Suponha que este
número seja 8. Então o experimento é realizado, para as condições da observação de número 8
(20% de algodão), obtendo-se em primeiro lugar o valor para esta observação. Repetindo esta
escolha aleatória de números entre 1 e 25 definimos a ordem em que observações serão
coletadas. Isto nos leva à tabela abaixo.
Tabela 9.9 – Sequência de teste.

Sequência Número da % de Sequência Número da % de
de teste observação Algodão de teste observação Algodão
1 8 20 14 7 20
2 18 30 15 1 15
3 10 20 16 24 35
4 23 35 17 21 35
5 17 30 18 11 25
6 5 15 19 2 15
7 14 25 20 13 25
8 6 20 21 22 35
9 15 25 22 16 30
10 20 30 23 25 35
11 9 20 24 19 30
12 4 15 25 3 15
13 12 25
197

lOMoARcPSD|32583331
As 25 observações são feitas nesta seqüência e os dados obtidos são mostrados na tabela
seguinte.
Tabela 9.10 – Resistência à tração das fibras (lb/in2).

Porcentagem de Algodão
15 20 25 30 35
1 7 12 14 19 7
Observações
2 7 17 18 25 10
3 15 12 18 22 11
4 11 18 19 19 15
5 9 18 19 23 11
Totais 49 77 88 108 54 376
A tabela ANOVA é mostrada abaixo. O valor crítico de F para  = 0,01, com GL =

(4,20), é 4,43. Como podemos ver da tabela ANOVA, o valor da estatística de teste é 14,76 o
que nos leva a rejeitar a hipótese nula e concluir que a porcentagem de algodão na fibra afeta a
resistência.
Tabela 9.11 – ANOVA para os dados de resistência à tração.

Fonte GL SQ QM F[4,20]
Grupos 4 475,76 118,94 14,76
Erro 20 161,20 8,06
Total 24 636,96
b) Verificação da adequação do modelo
b1) Histograma dos resíduos - normalidade
Uma verificação da hipótese de normalidade pode ser feita construindo um histograma

dos resíduos. Se os erros seguirem a hipótese de normalidade então o histograma deve ser
aproximadamente simétrico e centrado no valor zero, que é a média esperada dos erros.
6
5
Frequência
4
3
2
1
0
-3 -2 -1 0 1 2 3 4 5 6
Resíduos
Figura 9.3 – Histograma dos resíduos.
198

lOMoARcPSD|32583331
Infelizmente, com amostras pequenas pode ocorrer uma flutuação considerável de modo
que uma fuga moderada da normalidade não necessariamente implica em uma violação séria e
pode requer uma análise mais profunda. Isto claramente está ocorrendo na figura acima.
b2) Gráfico de resíduos contra ordem de coleta - independência
Construindo um gráfico dos resíduos versus a ordem em que as observações foram

coletadas nos auxilia na detecção da correlação entre os resíduos. O gráfico deve apresentar os
resíduos espalhados em torno da média, de uma maneira aleatória, sem que um determinado
padrão fique configurado para que a hipótese de independência fique configurada. A tabela
abaixo sintetiza as informações necessárias para construir o gráfico. Em cada célula da tabela, o
valor superior se refere ao resíduo e os dois valores na linha inferior se referem ao valor da
observação e da ordem em que foi ela foi coletada (entre parênteses), respectivamente.
Tabela 9.12 – Dados e resíduos para as resistências à tração das fibras.

Porcentagem de Algodão
15 20 25 30 35
1 -2,8 -3,4 -3,6 -2,6 -3,8
7 (15) 12 (8) 14 (18) 19 (22) 7 (17)
2 -2,8 1,6 0,4 3,4 -0,8
7 (19) 17 (14) 18 (13) 25 (5) 10 (21)
Observações
3 5,2 -3,4 0,4 0,4 0,2

15 (25) 12 (1) 18 (20) 22 (2) 11 (4)
4 1,2 2,6 1,4 -2,6 4,2
11 (12) 18 (11) 19 (7) 19 (24) 15 (16)
5 -0,8 2,6 1,4 1,4 0,2
9 (6) 18 (3) 19 (9) 23 (10) 11 (23)
_
xj 9,8 15,4 17,6 21,6 10,8
O gráfico pode ser visto na figura 9.4 abaixo. Os resíduos representados pelos pontos do
gráfico não formam um padrão específico. Eles apresentam um espalhamento aleatório em torno
da média. Não há razão para suspeitar de qualquer violação de independência.
9.4 – Blocos Aleatorizados
Em muitos casos de pesquisa aplicada é necessário delinear o experimento de modo que a

variabilidade proveniente de fontes estranhas possa ser sistematicamente controlada. O exemplo
abaixo ilustra um desses casos.
Três analgésicos devem ser testados com o objetivo de determinar diferenças entre eles.
Poderíamos delinear o experimento como um experimento completamente aleatorizado. Para isto
teríamos que escolher aleatoriamente, digamos 18 pacientes, e dividi-los em três grupos de seis
pessoas cada. Em seguida, os elementos de cada grupo tomariam o analgésico especificado para
aquele grupo e teríamos as dezoito observações desejadas.
199

lOMoARcPSD|32583331
6
5
4
3
Resí duos ei j
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5
Ordem
Figura 9.4 – Gráfico dos resíduos versus ordem de coleta.
O perigo com tal procedimento está na possível diferença de metabolismo das pessoas
escolhidas para participar do experimento. Uma variabilidade muito grande dentro dos grupos
poderia mascarar os efeitos dos analgésicos, isto é, a variabilidade entre os tratamentos poderia
não ser detectada e assim concluirmos que os dados não apresentam suficiente evidências de que
as médias sejam diferentes (a hipótese Ho não seria rejeitada quando deveria ser).
No nosso exemplo, para controlar a fonte estranha (diferenças de metabolismo), e

remover a variabilidade entre os pacientes, utilizamos um delineamento de experimento
denominado Blocos Aleatorizados que requer que o pesquisador teste os três analgésicos em
cada paciente. Cada paciente constituirá um bloco do experimento. Os dados de tempo até o
alívio da dor de cabeça são então analisados com o procedimento da análise de variância.
Exemplo 9.5 – Ilustra o procedimento ANOVA para blocos aleatorizados
Deseja-se comparar três analgésicos com relação ao tempo requerido para aliviar uma dor
de cabeça. Um delineamento baseado em blocos aleatorizados deve ser usado. Para isso, seis
pessoas foram selecionadas com cada pessoa tomando os três comprimidos em diferentes
ocasiões. Os tempos para os medicamentos surtirem efeito são dados na tabela 9.13 abaixo. Ao
nível de 5% de significância, os dados obtidos permitem concluir que existe uma diferença entre
as médias dos tempos até o alívio da dor de cabeça?
Solução
a) As hipóteses neste exemplo podem ser escritas como
Ho: 1 = 2 = 3 (tempos médios de alívio são iguais)

Ha: existem diferenças entre as médias
200

lOMoARcPSD|32583331
Tabela 9.13 – Tempo até alívio da dor de cabeça (min).

Analgésico (Tratamentos ou Níveis do fator)
A B C Bi
1 18 22 25 65
Pessoas (Blocos)
2 14 23 13 50
3 21 19 23 63
4 20 29 24 73
5 12 19 13 44
6 13 20 20 53
Tj 98 132 118 348
b) O nível de significância é  = 0,05
c) Valor crítico F
Neste problema sabemos que
Número de tratamentos → k = 3
Número de blocos → m = 6
Número total de observações → n = km = 18
O número de graus de liberdade é dado por GL = (k-1, n-k-m+1) = (2, 10) e o valor
crítico, dado pela tabela, é F0,05 = 4,10.
d) Soma dos quadrados
Podemos calcular as diversas somas de quadrados de acordo com as fórmulas dadas

anteriormente.
A soma dos quadrados total SQT é dada por:
( x )2
(348)
2
SQT =  x 2
− = 7118 − = 7118 − 6728 = 390
n 18
A soma dos quadrados dos tratamentos ou grupos SQG representa a variação entre as
médias dos tempos até o alívio da dor para os tratamentos (analgésicos) e é dada por:
1  k 2  ( x ) (348)
2
2
SQG =   T j  −
m  j =1  n
1 2
= 98 + 132 + 118 −
6
2 2
18
(
= 6825,333 − 6728 = 97,333 )
A soma dos quadrados dos blocos SQB representa a variação entre as médias dos tempos
até o alívio da dor para os blocos (pessoas) e é dada por:
201

lOMoARcPSD|32583331
 ( x )
2
1 m
SQB =   Bi2  −
k  i =1
1
(
= 65 2 + 50 2 + 632 + 732 + 44 2 + 532 −
3
348 2
18
= 194,667 )
 n
Finalmente, a soma dos quadrados dos erros SQE é dada pela diferença
SQE = SQT – SQG – SQB = 390 – 97,333 – 194,667 = 98
Ela representa a variação entre os tempos de alívio dentro das amostras para os
tratamentos com a variação devido aos blocos removida.
A tabela ANOVA pode agora ser construída. Para isso basta calcular os quadrados
médios QMG, QMB e QME.
QMG = SQG/(k-1) = 97,333/2 = 48,667

QMB = SQB/(m-1) = 194,667/5 = 38,933
QME = SQE/(n-k-m+1) = 98/10 = 9,800
Tabela 9.14 – Tabela ANOVA para o exemplo.

Fonte GL SQ QM F
Grupos ou Tratamentos 2 97,333 48,667 4,97
Blocos 5 194,667 38,933
Erro 10 98,000 9,8
390
Total 17
O valor crítico de F0,05 com GL = (2,10) é igual a 4,10. Desta forma, o valor da estatística
F cai na região de rejeição (4,97 > 4,10) e podemos concluir que os dados fornecem evidência
suficiente para rejeitar a hipótese nula e que existe diferenças entre as médias nos tempos de
alívio para os três analgésicos.
9.4.1 - Procedimento ANOVA para blocos aleatorizados
Através do exemplo foi possível observarmos que existem quatro somas dos quadrados como
mostrado na figura 9.5. A variabilidade total dos dados é dividida em uma componente
representando a variabilidade entre as médias das amostras para os tratamentos, uma componente
representando a variabilidade entre as médias das amostras para os blocos e uma componente
representando a variabilidade dentro das amostras para os tratamentos com a variabilidade
devida aos blocos removida.
202

lOMoARcPSD|32583331
Soma dos Quadrados dos tratamentos

SQG
Soma dos Quadrados Total Soma dos Quadrados dos Blocos

SQT SQB
Soma dos Quadrados dos Erros

SQE
Figura 9.5 – Partição da soma dos quadrados total.
Os valores das somas dos quadrados, dos graus de liberdade associados a cada um e os
respectivos quadrados médios são dispostos na tabela ANOVA de modo similar ao do
experimento completamente aleatorizado, como mostrado abaixo.
Tabela 9.15 – Tabela ANOVA genérica.

Fonte GL SQ QM F
Grupos ou Tratamentos k-1 SQG QMG = SQG/(k-1) QMG/QME
Blocos m-1 SQB QMB = SQB/(m-1)
Erro n-k-m+1 SQE QME = SQE/(n-k-m+1)
Total n-1 SQT
Os passos adotados para análise estatística de um delineamento com blocos aleatorizados

são descritos no procedimento 9.2 a seguir. Observemos que o teste de hipóteses é sempre
unilateral à direita uma vez que a hipótese nula é rejeitada somente quando a estatística de teste F
é muito grande.
203

lOMoARcPSD|32583331
Procedimento 9.2 – Aplicar ANOVA para k médias de populações

Blocos aleatorizados e amostras independentes
Populações normais
Populações com mesmo desvio padrão
Passo 1 – Escreva as hipóteses nula e alternativa

Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k-m+1), onde m é o número de blocos e n
é o número total de dados
Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas
( x )2
( x ) 2
SQT =  x 2
−
n
1
(
SQG = T12 + T22 + ... + Tk2 −
m n
)
( x ) 2
1
(
SQB = B12 + B22 + ... + Bm2 −
k
)
n
SQE = SQT – SQG –SQB , onde, x = soma dos valores de todas as observações
Passo 5 – Construa a tabela ANOVA

Grupo
QMG = F=
k −1 QME
Bloco m-1 SQB SQB
QMB =
m −1
Erro n–k–m+1 SQE SQE
QME =
n − k − m +1
Total n -1 SQT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
Passo 7 – Escreva sua conclusão.
204

lOMoARcPSD|32583331
1) A tabela abaixo é uma tabela ANOVA incompleta de um experimento com blocos

aleatorizados. Preencha os espaços em branco de acordo com a teoria vista.
Fonte GL SQ QM F
Grupos ou Tratamentos 2 21,667
Blocos 55,060
Erro 8
Total 14 127,733
2) Quatro marcas de gasolina devem ser testadas para se comparar o consumo. Para o teste seis
carros foram selecionadas. Cada carro percorreu uma distância de 480 Km, em rota
especificada, com cada uma das quatro marcas de gasolina. O consumo resultante, dado em
Km/l, é mostrado na tabela abaixo. Ao nível de 1% de significância, os dados obtidos
implicam que existe uma diferença no consumo médio entre as quatro marcas de gasolina?
Marca da Gasolina
A B C D
1 8 7 7 8
2 7 6 5 7
3 9 9 8 10
Carro
4 12 12 10 13
5 12 11 10 11
6 7 6 5 6
3) Discuta dois casos (não relatados neste texto) onde seria indicado usar um delineamento
baseado em blocos aleatorizados.
205

lOMoARcPSD|32583331
9.5 – Quadrados latinos
Na seção anterior nós introduzimos o delineamento com blocos aleatorizados como sendo
uma maneira de reduzir o erro residual em um experimento através da remoção da variabilidade
devido a fatores estranhos. Existem diversos outros tipos de delineamento que utilizam o
princípio dos bloqueios. Por exemplo, suponha que um pesquisador esteja estudando o efeito de
cinco diferentes formulações de uma mistura explosiva, usada na fabricação de dinamite, na
força de explosão. Cada formulação é obtida de um lote de matéria prima que é suficiente apenas
para cinco formulações serem testadas. Além disso, as formulações são preparadas por diferentes
operadores e pode haver diferenças substanciais nas habilidades e experiências dos operadores.
Dessa forma, dois fatores estranhos podem contribuir para uma maior variabilidade do erro
residual; lotes de matéria prima e operadores.
O delineamento adequado para este caso consiste em testar cada formulação exatamente
uma vez em cada lote de matéria prima de maneira que cada operador prepare uma única
formulação por lote. Assim, para cada lote, as cinco formulações serão preparadas pelos cinco
operadores, cada um deles preparando uma determinada formulação. O delineamento resultante,
mostrado na tabela 9.16, é denominado Quadrado Latino. Observemos que o delineamento é um
arranjo quadrado e que as cinco formulações (tratamentos) são identificadas pelas letras latinas
A, B, C, D e E, daí o nome Quadrado latino.
Tabela 9.16 – Quadrado latino para o problema de formulações de dinamite.

Lotes de Operadores
matéria prima 1 2 3 4 5
1 A = 24 B = 20 C = 19 D = 24 E = 24
2 B = 17 C = 24 D = 30 E = 27 A = 36
3 C = 18 D = 38 E = 26 A = 27 B = 21
4 D = 26 E = 31 A = 26 B = 23 C = 22
5 E = 22 A = 30 B = 20 C = 29 D = 31
O delineamento Quadrado latino é usado para eliminar duas fontes estranhas de

variabilidade; isto é, para bloquear sistematicamente duas direções. Em geral, um quadrado
latino para p fatores (ou tratamentos) é um quadrado contendo p linhas e p colunas. Cada uma
das p2 células ocorre uma e somente uma vez em cada linha e coluna.
O modelo estatístico para o Quadrado latino é
xijk =  + i + j + k + ijk , com
i = 1, 2, ... , p
j = 1, 2, ... , p
k = 1, 2, ... , p
xijk = observação na i-ésima linha e k-ésima coluna para o j-ésimo tratamento,
 = média global,
i = é o efeito da i-ésima linha,
k = é o efeito da k-ésima coluna,
ijk = erro aleatório.
206

lOMoARcPSD|32583331
A análise de variância consiste em partir a soma dos quadrados total das p2 observações
em componentes para as linhas, colunas, tratamentos e erros, como se segue.
SQT = SQlinhas + SQcolunas + SQtratamentos + SQE
( x ) 2
SQT =  x 2
−
n
( x ) 2
1
(
SQlinhas = L12 + L22 + ... + L2p −
p n
)
( x ) 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
)
( x ) 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
)
Os termos L1, L2, ... , Lp correspondem aos totais das linhas e C1, C2, ... , Cp aos totais das
colunas.
Os termos T1, T2, ... , Tp correspondem, no exemplo dado, às diversas formulações sob
teste, isto é, às formulações A, B, C, D e E.
O número de graus de liberdade para cada soma de quadrados é
Total Linhas Colunas Tratamentos Erro
p2 -1 p-1 p-1 p-1 (p - 2)(p – 1)
Dividindo-se cada soma de quadrados acima pelo seu número de graus de liberdade
obtém-se os quadrados médios. A estatística de teste é, novamente, o quociente de QMG por
QME, ou seja:
F = QMG/QME
O número de graus de liberdade do numerador e do denominador pode ser indicado por

GL = [p-1, (p-2)(p-1)]. A tabela 9.17 mostra um resumo para o procedimento de análise de
variância para os Quadrados latinos.
Podemos observar que a análise é uma simples extensão do delineamento para blocos
aleatorizados. O exemplo anterior das formulações de dinamite será usado para mostrar como os
cálculos podem ser facilitados mediante uma simples codificação.
207

lOMoARcPSD|32583331
Tabela 9.17 – ANOVA para o delineamento por Quadrado latino.

Fonte GL SQ QM F
Grupos ou p-1 SQG QMG = SQG/(p-1) QMG/QME

Tratamentos
Linhas p-1 SQlinhas QML = SQlinhas/(p-1)
Colunas p-1 SQcolunas QMC =SQcolunas/(p-1)
Erro (p – 2)(p –1) SQE QME = SQE/(p-2)(p-1)
Total p2-1 SQT
Exemplo 9.6 – Ilustra o procedimento Quadrado Latino
Os dados da tabela 9.16 representam os resultados dos ensaios realizados com as

diferentes formulações de dinamite. Verificar se existem evidências suficientes para afirmarmos
que as diferentes formulações possuem efeitos diferentes com um nível de significância de 1%.
Solução
Os passos a serem seguidos são exatamente os mesmos mostrados nos procedimentos 9.1
e 9.2. Entretanto, para facilitar os cálculos vamos subtrair 25 de cada valor da tabela obtendo a
tabela abaixo. Podemos mostrar que as somas dos quadrados não se alteram quando subtraímos
um mesmo valor de cada uma das observações.
Lotes de Operadores Li
matéria prima 1 2 3 4 5
1 A = -1 B = -5 C = -6 D = -1 E = -1 -14
2 B = -8 C = -1 D=5 E=2 A = 11 9
3 C = -7 D = 13 E=1 A=2 B = -4 5
4 D=1 E=6 A=1 B = -2 C = -3 3
5 E = -3 A=5 B = -5 C=4 D=6 7
Cj -18 18 -4 5 9 x = 10
Passo 1 – Hipóteses
Ho: 1 = 2 = 3 = 4 = 5
Ha: pelo menos uma diferença existe
Passo 2 – Nível de significância  = 0,01
Passo 3 – Valor crítico F0,01 = 5,41 pois GL = (4,12)
208

lOMoARcPSD|32583331
Passo 4 – Soma dos quadrados
( x ) 2
10 2
SQT =  x 2
− = 680 − = 676,00
n 25
( x ) 1 2
1 2
p
(
SQlinhas = L1 + L2 + ... + L p −
2 2
n 5
)
= (−14) + 9 + 5 + 3 + 7 −
2 2 2 2 2
(
10 2
25
= 68,00 )
( x ) 1 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
) (
= (−18) 2 + 18 2 + (−4) 2 + 5 2 + 9 2 − 4 = 150,00
5
)
Os totais para os tratamentos são dados por
Tratamento Total do tratamento

(ou letra)
A 18
B -24
C -13
D 24
E 5
( x) 1 2 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
) (
= 18 + (−24) 2 + (−13) 2 + 24 2 + 5 2 − 4 = 330,00
5
)
A soma dos quadrados dos erros é determinada por subtração.
SQE = SQT – (SQlinhas + SQcolunas + SQtratamentos )
SQE = 676,00 – 68,00 – 150,00 – 330,00 = 128,00
Passo 5 – Tabela ANOVA
Fonte GL SQ QM F
Grupos ou Tratamentos 4 330,00 QMG = 82,50 7,73

Linhas 4 68,00 QML = 17,00
Colunas 4 150,00 QMC = 37,50
Erro 12 128,00 QME = 10,67
Total 25 676,00
209

lOMoARcPSD|32583331
Passo 6 – Como O valor crítico é de 5,41, verificamos que o valor calculado da estatística cai na
região de rejeição, portanto devemos rejeitar a hipótese nula Ho.
Passo 7 – Os dados obtidos mostram evidências suficientes para concluirmos que existem
diferenças entre as diversas formulações.
1) Um engenheiro industrial está conduzindo uma experiência do efeito de quatro diferentes

métodos de montagem sobre tempo de montagem de um componente de uma televisão.
Quatro operadores são selecionados para o estudo. O engenheiro sabe que cada método de
montagem produz uma fadiga tal que o tempo requerido para a última montagem
possivelmente será maior que o requerido pela primeira, qualquer que seja o método usado.
Para levar em conta essa fonte de variabilidade, o engenheiro usou o delineamento Quadrado
latino obtendo os dados abaixo. Existe evidência de que os métodos de montagem produzam
efeitos diferentes a um nível de significância de 5%?
Ordem de Operador
montagem 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14
210

Estatistica Universidade de Sao Paulo Dep Engenharia Mecanica Eesc

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatistica Universidade de Sao Paulo Dep Engenharia Mecanica Eesc

Enviado por

Direitos autorais:

Formatos disponíveis

lOMoARcPSD|32583331

Estatística - Universidade de São Paulo - Dep. Engenharia

A Studocu não é patrocinada ou endossada por nenhuma faculdade ou universidade

Universidade de São Paulo

Prof. Dr. Eduardo Vila Gonçalves Filho

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

1.1 O que é estatística ...........................................................................................2

2 ESTATÍSTICA DESCRITIVA ................................................................................................................................. 5

2.1 Dados ..............................................................................................................6

3.1 Gráfico de barra .............................................................................................34

4.1 Técnicas de contagem ...................................................................................44

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

5 VARIÁVEIS ALEATÓRIAS DISCRETAS .............................................................................................................. 69

5.1 Variáveis aleatórias discretas .........................................................................70

6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS E A DISTRIBUIÇÃO NORMAL ........................................................ 101

6.1 Variáveis aleatórias contínuas ......................................................................102

7 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA POPULAÇÃO ......................................................... 133

7.1 Populações ..................................................................................................134

8 TESTE DE HIPÓTESE PARA A MÉDIA ........................................................................................................... 159

8.1 A natureza do teste de hipótese ..................................................................160

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

9 ANÁLISE DE VARIÂNCIA - ANOVA............................................................................................................. 179

9.1 Distribuição F ..............................................................................................180

10 PLANEJAMENTO DE EXPERIMENTOS ......................................................................................................... 211

10.1 O que é um planejamento de experimentos ..............................................212

RESPOSTAS DE EXERCÍCIOS SELECIONADOS ................................................................................................... 247

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

O termo “estatística” é amplamente usado, às vezes sem muito rigor, em inúmeros

1. Distinguir entre os significados das frases “a estatística é” e “as estatísticas são”.

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

1.1 – O que é estatística?

A palavra estatística tem dois significados. Se dissermos “a estatística é”, estaremos

É difícil conseguir uma definição concisa de estatística porque é um assunto que

Definição 1.1 - A estatística é uma coleção de métodos para o planejamento de

Estatística é uma importante ferramenta de pesquisa. Ela é aplicada em praticamente

1.2 – Tipos de estatística

Existem dois tipos de estatística: estatística dedutiva (ou descritiva) e estatística

Definição 1.2 - A estatística descritiva trata da organização, sumário e apresentação

Definição 1.4 - Uma amostra é um subconjunto de uma população de interesse.

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

Exemplo 1.1 – Ilustra os conceitos de população e amostra

Se estivermos interessados em determinar a idade média dos alunos de uma

Figura 1.1 – População e amostra

Quando a população de interesse é muito grande, torna-se economicamente inviável

A definição da população é uma etapa importante de um estudo estatístico. A escolha

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

Exemplo 1.2 – Ilustra os conceitos de população e amostra

Exercícios – Seqüência 1.1

2) Defina os seguintes termos:

3) Qual a diferença entre se dizer “a estatística é” e “as estatísticas são”?

4) Quais são os dois tipos de estatística? Descreva cada um deles em detalhes.

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

Neste capítulo serão discutidos os modos de apresentação de dados que permitam

1. Definir as quatro categorias de dados que serão aqui discutidas.

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

Dados são definidos como informações coletadas de um experimento. Existem vários

Definição 2.1 – Dados qualitativo, ordinal e métrico

Outro tipo importante de dado é o dado de freqüência. Contando o número de

Definição 2.2 – Dados de freqüência são dados sobre o número de indivíduos

Exemplo 2.1 – Ilustra os tipos de dados

Baixado por Ana Carolina Barros Messias (carol.barros.messias@gmail.com)

Exemplo 2.2 – Ilustra tipos de dados

Nos cursos de pós-graduação da maioria das universidades, o aluno, ao completar uma

Exemplo 2.3 – Ilustra tipos de dados