Escolar Documentos
Profissional Documentos
Cultura Documentos
Probabilidade e Estatistica ESTACIO PDF
Probabilidade e Estatistica ESTACIO PDF
ESTATÍSTICA APLICADA À
ENGENHARIA
autora do original
PAULA MARINHO
1ª edição
SESES
rio de janeiro 2016
Conselho editorial regiane burger, luiz gil guimarães, roberto paes, gladis linhares
Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrônico ou mecânico, incluindo fotocópia e gravação) ou arquivada em
qualquer sistema ou banco de dados sem permissão escrita da Editora. Copyright seses, 2016.
isbn: 978-85-5548-269-4
Prefácio 9
1. Introdução à Estatística 11
1.1 Estatística 13
1.2 Conceitos básicos 15
1.2.1 Unidade experimental 15
1.2.2 – População ou universo estatístico 16
1.2.3 Amostra 17
1.2.3.1 Técnicas de amostragem 17
1.2.3.2 Técnicas de amostragem probabilística (aleatória) 18
1.2.3.2.1 Amostragem aleatória simples 18
1.2.3.2.2 Amostragem sistemática 18
1.2.3.2.3 Amostragem por conglomerados (clusters) 19
1.2.3.2.4 Amostragem estratificada 19
1.2.3.3 Técnicas de amostragem não probabilística (não aleatória) 20
1.2.3.3.1 Amostragem a esmo ou sem norma 20
1.2.3.3.2 Amostragem intencional 20
1.2.4 Variáveis quantitativas e qualitativas 20
1.2.5 Estatística descritiva 21
1.2.6 Estatística indutiva 21
1.3 Fases do método estatístico descritivo 22
1.3.1 Definição do problema 22
1.3.2 Planejamento 22
1.3.3 Coleta de dados 22
1.3.4 Apuração dos dados 23
1.3.5 Apresentação dos dados 23
1.4 Arredondamento de dados 25
2. Distribuição de Frequências
Representação Tabular e
Representação Gráfica 31
4. Medidas de Dispersão 95
Estatística é uma palavra de origem latina, que significou por muito tem-
po ciência dos negócios do Estado. Ela pode ser vista como uma Matemática
Aplicada, uma disciplina da área das ciências exatas que tem aplicação em pra-
ticamente todas as áreas de estudo.
A disciplina Probabilidade e Estatística está hoje presente na grande maio-
ria dos cursos. Qualquer profissional do ramo, para tomar uma decisão, pre-
cisará apoiar-se em indicadores que representem o atual estado do fenômeno
objeto de seu estudo. Isto só é possível com o suporte dado pelas metodologias
propostas pela Estatística.
Uma empresa pública ou privada que pretende inovar precisará investir em
pesquisa e desenvolvimento de novos projetos e produtos. Se esta mesma em-
presa planeja competir globalmente, será preciso aumentar e garantir a quali-
dade dos seus produtos e serviços. Todas estas situações necessitarão de supor-
te estatístico para viabilizar suas propostas e concretizar suas ações.
O avanço tecnológico, o crescente volume de dados e a complexidade das re-
lações impõem a necessidade do conhecimento de ferramentas estatísticas por
parte dos profissionais das mais diversas áreas de atuação. Esta disciplina tem
seu foco no profissional da engenharia, aquele a quem por definição compete a
identificação, a formulação e a resolução de problemas técnicos.
Procuramos aqui apresentar a disciplina de forma prática e clara, não com o
intuito de formar especialistas nesta área, mas sim de proporcionar-lhe, futuro
engenheiro, a compreensão dos elementos que compõem essa ciência, visando
à aplicação desses instrumentos na sua área de atuação. Nossa intensão não é
esgotar o assunto, mas sim apresentar os elementos necessários para que você
faça uma leitura satisfatória da realidade que o cerca e das informações que
têm à sua volta.
Estudaremos a Estatística Descritiva e parte da Indutiva ou Inferencial.
Vamos nos apoiar fortemente no uso do software EXCEL para resolver cál-
culos e fazer simulações. Esta é uma ferramenta indispensável para o futu-
ro engenheiro.
Bons estudos!
9
1
Introdução à
Estatística
O interesse por levantamento de dados não surgiu recentemente; há indícios
de que por volta de 3000 a.C. já se faziam censos na Babilônia, China e Egito.
Informações sobre as populações e suas riquezas tinham particular importân-
cia para os governantes das grandes civilizações antigas, que as utilizavam para
a taxação de impostos e para o alistamento militar. A palavra estatística surgiu,
pela primeira vez, no século XVIII. Na sua origem, a estatística estava ligada ao
Estado, já, na atualidade, a estatística não se limita apenas ao estudo de dados
demográficos e econômicos, sendo empregada em praticamente todas as áreas
do conhecimento onde estão envolvidas coleta e análise de dados.
Abra um jornal ou uma revista como Exame ou Veja. Assista a um jornal ou
documentário na TV. Verifique as avaliações dos funcionários da empresa onde
você trabalha, o relatório de peças fabricadas com defeitos no último mês ou
os registros de acidentes com afastamento. Pesquise na Internet informações
sobre os índices pluviométricos dos últimos 12 meses ou os valores da tarifa e
do consumo de energia do último ano. Ao coletar e analisar esses dados, você
perceberá que convivemos diariamente com um mar de números, de tabelas e
gráficos. Eles constituem-se em dados estatísticos que, após organizados, de
alguma forma influenciarão pessoas nas decisões que irão tomar.
O que iremos aprender aqui será usado por você ao longo de todo seu curso
e, com certeza, será muito útil na sua trajetória profissional. Sempre que você
se deparar com a necessidade de fazer uma pesquisa e de tratar seus dados,
você usará a metodologia e os conceitos estatísticos estudados nessa disciplina.
OBJETIVOS
Você deverá ser capaz de enunciar as etapas da estatística descritiva e da estatística indutiva,
compreendendo a que se destina cada uma dessas áreas, identificar situações nas quais se
deve trabalhar com uma população ou uma amostra para coleta de dados, diferenciar os tipos
de variáveis presentes em cada pesquisa e calcular arredondamentos.
12 • capítulo 1
1.1 Estatística
Inicialmente vamos analisar três definições de estatística:
Indica uma atividade humana especializada ou um corpo de técnicas ou, ainda, uma
metodologia desenvolvida para a coleta, a classificação, a apresentação, a análise e a
interpretação de dados quantitativos e sua utilização para a tomada de decisões.
capítulo 1 • 13
2. Resumo e organização dos dados coletados em tabelas de frequências e/
ou gráficos para, posteriormente, encontrar as medidas de posição e variabi-
lidade, que serão vistos no capítulo 2. Esta etapa também é conhecida como
estatística descritiva ou dedutiva.
3. Escolha de um modelo que explique o comportamento dos dados para que
seja possível fazer a inferência dos dados para a população de interesse. Esta eta-
pa também é chamada de estatística inferencial ou indutiva. Nesta etapa, faz-
-se necessário o conhecimento de técnicas de probabilidades, que serão apre-
sentadas no capítulo 5. A probabilidade fornece métodos para quantificar a in-
certeza existente em determinada situação, usando ora um número ora uma
função matemática.
Tratamento
Quantitativo
Observação
Mensuração
Análise
Resultados
Generalização
individuais
14 • capítulo 1
riscos em investimentos e projetos, estudo de tempos e movimentos, entre ou-
tros, e aplicadas às ciências humanas e tecnológicas. É a base para a realização
de qualquer pesquisa.
Podemos citar inúmeros exemplos de aplicação da estatística em várias
áreas do conhecimento. Vamos observar alguns deles:
Uma grande rede de supermercados tem interesse em abrir uma nova uni-
dade. Fatores sobre a população que frequenta o local onde essa unidade será
inaugurada, como sexo, grau de escolaridade, idade, estado civil, renda fami-
liar, entre outros, interferem nos tipos de produtos que devem ser disponibi-
lizados nesse estabelecimento, além de definir as estratégias de marketing
mais eficientes.
Antes de se lançar um novo medicamento no mercado farmacêutico, é ne-
cessária a realização de várias experiências. O medicamento deve ser testado
quanto à sua eficiência no tratamento a que se destina e quanto aos efeitos co-
laterais que pode causar.
Quando uma empresa está interessada em lançar um novo produto no mer-
cado, é necessário saber as preferências dos consumidores, por isso é muito
importante fazer previsões de demanda do consumo. Para isso, é necessário
realizar uma pesquisa de mercado
Controles estatísticos de qualidade (ou controles estatísticos do processo)
também são indispensáveis em todos os tipos de empresa. Eles são realizados
por meio de um conjunto de técnicas estatísticas, geralmente aplicadas por en-
genheiros de produção e administradores, para garantir o nível de qualidade
exigido para a produção (ou serviço) dentro de uma indústria.
São inúmeras e diversificadas as aplicações de técnicas estatísticas que um
profissional pode utilizar. Apresentaremos os conceitos básicos e principais
técnicas que, quando utilizados, podem auxiliar na tomada de decisões.
capítulo 1 • 15
veis tipos de objeto: eleitores da cidade de São Paulo são pessoas; carros
produzidos em determinado ano por uma montadora são objetos; ven-
das realizadas durante um mês numa loja de departamento são transa-
ções; acidentes ocorridos em determinada extensão de uma rodovia durante
um feriado são eventos.
16 • capítulo 1
1.2.3 Amostra
Quando selecionamos uma amostra, devemos garantir que esta seja represen-
tativa da população. Isso quer dizer que, no processo de amostragem, a amos-
tra selecionada deverá possuir as mesmas características básicas da população.
Temos dois tipos de amostragem: a probabilística (ou aleatória) e a não pro-
babilística (ou não aleatória). A amostragem será probabilística se todos os ele-
mentos da população tiverem probabilidade de pertencer à amostra conhecida
e diferente de zero. Caso contrário, a amostragem será não probabilística.
capítulo 1 • 17
Independentemente do tipo de amostragem, podemos trabalhar com
amostragem com reposição ou sem reposição. Na amostragem com reposição,
é permitido que uma unidade experimental seja sorteada mais de uma vez e,
na amostragem sem reposição, a unidade experimental sorteada é removida da
população. Devemos ter em mente os seguintes itens:
• Os cálculos estatísticos são os mesmos para as duas formas de amostragem.
• Em geral, as amostragens são realizadas sem reposição.
• Se o tamanho da população for suficientemente maior que o tamanho da
amostra (mais de vinte vezes), os resultados estatísticos das amostras com e
sem reposição não serão muito diferentes. Deve-se tomar cuidado com popula-
ções pequenas quando comparadas com o tamanho da amostra a ser extraída.
18 • capítulo 1
Usando o exemplo do item anterior, em que a população é composta de 500
elementos ordenados, poderemos utilizar a amostragem sistemática primeira-
mente determinando o “salto” que deverá ser dado. Para isto, fazemos a divisão
do tamanho da população pelo tamanho da amostra desejada: N/n = 500/50 = 10.
Em seguida, podemos iniciar a amostragem com qualquer indivíduo esco-
lhido de forma aleatória entre os 10 primeiros. Após essa escolha, seleciona-
mos os demais sempre “saltando” de 10 em 10.
capítulo 1 • 19
1.2.3.3 Técnicas de amostragem não probabilística (não aleatória)
20 • capítulo 1
como, por exemplo, número de filhos por casal, número de livros em uma bi-
blioteca, número de carros vendidos, número de acidentes, número de defei-
tos etc.
Variáveis qualitativas são as variáveis cujas respostas são expressas por um
atributo. Podemos distinguir dois tipos de variáveis qualitativas: nominal e
ordinal. Variáveis qualitativas nominais definem-se como aquelas em que as
respostas são expressas por um atributo (nome) e esse atributo não pode ser or-
denado, por exemplo: tipo sanguíneo, religião, estado civil, cor dos olhos, raça
etc. As variáveis qualitativas ordinais têm suas respostas expressas por um atri-
buto (nome) e esse atributo pode ser ordenado, por exemplo: grau de instrução,
classe social, nível de satisfação etc.
Estatística indutiva é a parte que se destina a encontrar métodos para tirar con-
clusões (ou tomar decisões) sobre a população de interesse, geralmente basea-
dos em informações retiradas de uma amostra dessa população. Refere-se a
um processo de generalização calcado em resultados particulares. Consiste em
inferir (induzir, concluir, deduzir) propriedades para o todo com base na parte.
A generalização está associada a uma margem de incerteza que é tratada com
técnicas e métodos da teoria da probabilidade.
capítulo 1 • 21
1.3 Fases do método estatístico descritivo
A seguir, listaremos etapas do método estatístico descritivo. São ações geral-
mente executadas quando se decide coletar dados com a finalidade de extrair
informações relevantes que influenciarão os processos decisórios.
1.3.2 Planejamento
Nessa fase, definem-se quais dados deverão ser obtidos, a forma de levantar
informações sobre o objeto do estudo e o procedimento necessário para resol-
ver o problema. A escolha das perguntas que serão feitas e sua formulação são
foco de preocupação nessa etapa. É na fase de planejamento que ainda se esco-
lhe o tipo de levantamento: censitário (contagem completa, englobando todo o
universo ou população) ou por amostragem (contagem parcial), ou seja, como
serão escolhidos os dados. Define-se, ainda, o cronograma para prazos, fases
e custos.
22 • capítulo 1
• Especificar os objetivos gerais.
• Conhecer o uso das respostas obtidas para melhor elaboração
das perguntas.
• Planejar, se possível, os tipos de tabela.
• Certificar-se de que todas as informações podem ser obtidas (cuidado
com idade/renda/datas/gastos passados – garanta o sigilo dos dados).
• Elaborar perguntas claras e precisas.
• Não sugerir respostas.
• Evitar redações longas.
• Seguir alguma ordem lógica (mais simples → mais complexa).
• Incluir as instruções, se necessárias, no corpo do questionário.
• Ter cuidado com a aparência gráfica e com o material utilizado
para preenchimento.
A exposição dos dados pode ser feita de duas formas que não se excluem: tabu-
lar ou gráfica. A tabular é uma apresentação numérica dos dados em linhas e
colunas. As tabelas expõem sinteticamente os resultados, permitindo uma vi-
são global do fenômeno. A gráfica permite uma visão rápida, fácil e clara do fe-
nômeno e de sua variação. O gráfico torna compreensível a tabela. Não há uma
única maneira de representar graficamente uma série estatística. A escolha do
gráfico mais apropriado ficará a critério do analista.
Vamos ver a seguir alguns exemplos de tabelas e gráficos:
capítulo 1 • 23
Gráficos extraídos da tabela 1.1:
10
8
6 5
4 3
2 0
0
Casado Solteiro Divorciado Viúvo
Estado civil
0%
15%
25% Casado
Solteiro
Divorciado
Viúvo
60%
NÚMERO DE
RENDA MENSAL $
FUNCIONÁRIOS
0 -| 1 000 8
1 000 -| 2 000 5
2 000 -| 3 000 4
3 000 -| 4 000 3
TOTAL 20
Tabela 1.2 – Renda mensal de 20 funcionários da empresa XXX.
24 • capítulo 1
Gráfico extraído da tabela 1.2:
6 5
5 4
4 3
3
2
1
0
1000 2000 3000 4000
–I –I –I –I
0 1000 2000 3000
Renda mensal $
capítulo 1 • 25
ATIVIDADES
01. Classifique cada item a seguir como dado qualitativo (nominal ou ordinal) ou dado quan-
titativo (discreto ou contínuo):
05. Faça o arredondamento para duas casas decimais dos valores a seguir:
567,999
1 000,001
26,234
26,236
26 • capítulo 1
07. As seguintes informações foram coletadas de alunos que saíam da livraria do seu cam-
pus universitário ao longo da primeira semana de aula. Classifique cada uma dessas variáveis
como qualitativa nominal, qualitativa ordinal, quantitativa discreta ou quantitativa contínua:
a) Tempo gasto para fazer a compra
b) Número de livros didáticos comprados
c) Área de especialização do aluno
d) Sexo do aluno
08. Suponha que o diretor de pesquisa de mercado de uma loja de departamentos de uma
região metropolitana deseje conhecer o perfil de compras de mulheres que trabalham fora,
determinando a quantidade de tempo que elas gastam por mês comprando roupas em um
mês típico.
a) Descreva a população e a amostra de interesse para este caso, indicando quais variáveis
ou tipos de dados seriam necessários coletar para atingir o objetivo da pesquisa.
b) Desenvolva 3 perguntas que retornem respostas qualitativas e 3 preguntas que retor-
nem respostas quantitativas para atingir o objetivo desta pesquisa.
09. A guerra das ´Colas´ é o termo popular para a intensa competição entre Coca-Cola
e Pepsi mostrada em suas campanhas de marketing. As campanhas têm estrelas de ci-
nema e televisão, vídeos de rock, apoio de atletas e afirmações das preferências dos
consumidores com base em testes de sabor. Como parte de uma campanha de mar-
keting da Pepsi, supo
nha que 1.000 consumidores de refrigerante cola submetam-
-se a um teste cego de sabor (isto é, as marcas estão encobertas). Cada consumidor é ques-
tionado quanto à sua preferência em relação à marca A ou à marca B.
a) Descreva a população.
b) Descreva a variável de interesse.
c) Descreva a amostra.
d) Descreva a inferência.
capítulo 1 • 27
c) Qual é a amostra?
d) Qual é o interesse da inferência para o pesquisador?
e) Qual método de coleta de dados foi empregado?
f) A amostra em estudo é representativa?
11. Uma população se encontra dividida em quatro estratos. O tamanho de cada estrato é:
N1 = 80, N2 = 120, N3 = 60 e N4 = 60 Sabe-se que uma amostragem proporcional foi
realizada e dezoito elementos da amostra foram retirados do segundo estrato. Qual o número
total de elementos da amostra?
12. Uma pesquisa precisa ser realizada em uma determinada cidade. A amostragem propos-
ta para este problema é a seguinte: dividir a cidade em bairros (pelo próprio mapa da cidade);
em cada bairro, sorteia-se certo número de quarteirões proporcional à área do bairro; em
cada quarteirão, serão sorteadas quatro residências e, nestas quatro residências, todos os
moradores serão entrevistados.
a) Essa amostra será representativa da população ou poderá apresentar algum vício
(não confiável)?
b) Quais tipos de amostragem foram utilizados no procedimento?
REFLEXÃO
Estamos encerrando nosso primeiro capítulo. Vimos, aqui, alguns conceitos que serão fun-
damentais na compreensão dos outros conteúdos abordados no livro. Já deve ter dado para
perceber que, mesmo estando no início da disciplina, as aplicações práticas que você poderá
fazer na sua área de atuação serão muitas. A compreensão e interpretação das mais varia-
das informações, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do
conhecimento de certos elementos estatísticos.
Estamos apenas no começo. Muitas técnicas ainda serão abordadas. Lembre-se de que
o conhecimento e o domínio da estatística certamente levarão você, futuro engenheiro, a
tomar as decisões mais acertadas.
28 • capítulo 1
LEITURA
Consulte os links a seguir para conhecer mais sobre os assuntos abordados nesse capítulo:
REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatística aplicada à
administração e economia. São Paulo: Pioneira Thomson Learning, 2003.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro:
LTC, 2014.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. São Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatística. São Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à estatística.
Rio de Janeiro: LTC, 2003.25 Conceitos introdutórios e técnicas de amostragem
FONSECA, Jairo Simon; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano. Estatística
aplicada. São Paulo: Atlas, 1985.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora Ltda.,
2000.
LEVIN, Jack; FOX, James Alan. Estatística para ciências humanas. São Paulo: Prentice Hall, 2004.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
capítulo 1 • 29
MARTINS, Gilberto de Andrade. Estatística geral e aplicada. São Paulo: Atlas, 2002.
McClave, James T.; BENSON P. George.; SINCICH, Terry. Estatística para administração e
economia. São Paulo: Pearson Prentice Hall, 2009.
MEMÓRIA, José M. P. Breve História da Estatística. Disponível em: <http://www.im.ufrj.
br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.
MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Pioneira Thomson Learning, 2004.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.
VIEIRA, Sonia. Elementos de estatística. São Paulo: Atlas, 2003. Disponível em: <http://www.
ufrgs.br/mat/graduacao/estatistica/historia-da-estatistica>. Acesso em: 25 set. 2014
30 • capítulo 1
2
Distribuição
de Frequências
Representação
Tabular e
Representação
Gráfica
Nesse capítulo, vamos trabalhar os conceitos da estatística descritiva. Quando
realizamos uma coleta de dados, geralmente estamos lidando com uma quan-
tidade muito grande de informações, por isso torna-se imprescindível a utili-
zação de certas técnicas visando simplificar sua leitura. Saber organizar dados
brutos e extrair informações deles é um dos objetivos da estatística descritiva.
Para que se tenha uma visão do todo ( o fenômeno que está sendo estudado)
precisamos, por exemplo, dispor as informações em tabelas ou apresentá-las
em gráficos, que é exatamente o que será apresentado agora.
Observe o artigo “Manutenção centrada em confiabilidade (MCC): análise
quantitativa de um forno elétrico a indução”, O(deletar O) extraído da Revista
Produção Online, vinculada à Abepro (CERVEIRA, 2015). Para que os autores
chegassem a um diagnóstico para a melhor estratégia de manutenção a ser
aplicada em um forno elétrico instalado em uma fundição de aços especiais,
foi necessária a coleta de dados numéricos referentes, entre outros, ao tempo
que o equipamento demorava para apresentar uma falha e ao tempo de dura-
ção da manutenção no equipamento. Baseada na coleta e na organização de
dados históricos e simples como estes, uma eficiente estratégia de manutenção
centrada na confiabilidade foi definida.
Note o quanto é importante o que estamos estudando. Provavelmente na
sua trajetória profissional, você terá de lidar com situações como esta. Vamos
aos estudos!
OBJETIVOS
Ao final deste capítulo você deverá ser capaz de organizar, resumir e apresentar as informa-
ções contidas em grandes conjuntos de dados por meio da criação de tabelas simples, nas
quais os dados não estarão agrupados em classes, e de tabelas com dados agrupados em
classes, inserindo as frequências simples, relativas e acumuladas. Ainda será possível cons-
truir gráficos calcados nas tabelas e identificar o gráfico mais indicado para representar uma
determinada frequência ou um tipo de dado.
32 • capítulo 2
2.1 Representação Tabular de Dados
Uma das vantagens da apresentação tabular dos dados é a de condensar, de
forma consistente, as informações necessárias ao estudo desejado. Surgem ge-
ralmente valores que se repetem e a representação em tabelas só mostra os
valores diferentes entre eles ou, então, aparece um número muito grande e va-
riado de dados e só uma tabela permitirá o agrupamento desses valores. Isso
favorece uma análise e uma interpretação mais rápida e clara da natureza e do
comportamento do fenômeno estudado.
EXEMPLO
Exemplo 1 – Número mensal de acidentes de trabalho não fatais nos últimos 60 meses, na
empresa ABC:
3 3 3 3 3 7 6 8 2 8 4 4
4 4 4 5 6 5 5 5 4 6 6 6
6 6 6 4 4 8 8 7 5 4 4 7
6 7 9 4 4 7 8 9 8 4 4 5
5 5 5 5 6 6 6 5 4 6 8 5
Note que, como esses valores estão desordenados, fica difícil fazer qualquer tipo de
inferência sobre as observações.
capítulo 2 • 33
2.1.2 Rol
EXEMPLO
Exemplo 2 – Número mensal, em ordem crescente, de acidentes de trabalho não fatais, nos
últimos 60 meses, na empresa ABC:
2 3 3 3 3 3 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 5 5 5 5 5 5 5
5 5 5 5 5 6 6 6 6 6 6 6 6 6
6 6 6 6 7 7 7 7 7 8 8 8 8 8
8 8 9 9
34 • capítulo 2
compreensão da variável em estudo. A esta tabulação dá-se o nome de distribui-
ção de frequências (ou tabela de frequências).
Distribuição de frequências é uma tabela que resume grandes quantidades
de dados, determinando o número de vezes em que eles ocorrem (frequência)
e a porcentagem com que aparecem (frequência relativa). Para facilitar a con-
tagem do número de vezes que cada dado ocorre, podemos ordenar os dados
brutos em um rol, conforme visto no item anterior.
Os tipos de frequência com os quais iremos trabalhar são:
• Frequência simples ou absoluta ou simplesmente frequência (fi): é o nº de
vezes que cada dado aparece na pesquisa.
• Frequência relativa ou percentual (fr): é o quociente da frequência absolu-
ta pelo número total de dados. Esta frequência pode ser expressa em porcenta-
gem. O valor de (fr x 100) é definido como fr (%).
• Frequência acumulada (Fi): é a soma de cada frequência com as que lhe
são anteriores na distribuição.
• Frequência relativa acumulada (Fr): é o quociente da frequência acumula-
da pelo número total de dados. Esta frequência também pode ser expressa em
porcentagem. O valor de (Fr x 100) é definido como Fr (%).
capítulo 2 • 35
EXEMPLO
Exemplo 3 – Utilizando os dados do exemplo 2, vamos descrever um esquema “passo a
passo” para a construção de uma tabela sem dados agrupados em classe.
2 3 3 3 3 3 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 5 5 5 5 5 5 5
5 5 5 5 5 6 6 6 6 6 6 6 6 6
6 6 6 6 7 7 7 7 7 8 8 8 8 8
8 8 9 9
36 • capítulo 2
FI
XI FI REPETIÇÃO FR
FREQUÊNCIA
I Nº DE ACIDEN- DOS ACIDENTES FREQUÊNCIA
SIMPLES
TES MENSAIS (MESES) RELATIVA
ACUMULADA
1 2 1 1,67% 1
2 3 5 8,33% 6
3 4 15 25,00% 21
4 5 12 20,00% 33
5 6 13 21,67% 46
6 7 5 8,33% 51
7 8 7 11,67% 58
8 9 2 3,33% 60
--- TOTAL 60 100,00% ---
k
n = ∑ fi ou simplesmente n = ∑ fi
i =1
k
n = ∑ fi = f1 + f2 + ... + fk
i =1
n = 1 + 5 + 15 + 12 +13 + 5 + 7 + 2 = 60
Frequência Relativa
Como visto no item anterior, a frequência relativa é calculada sobre a divisão de cada
valor de frequência simples pelo tamanho da amostra:
fi fi
fr = = k
n
∑ fi
i =1
capítulo 2 • 37
Geralmente, é mostrada em porcentagem com duas casas decimais. Para isso, faça a
divisão, multiplique por 100 e coloque o símbolo %. Atenção para o arredondamento, pois a
soma das frequências relativas deve totalizar 1 ou 100%.
Frequência Acumulada
Quando falamos apenas em frequências acumuladas, estamos nos referindo à frequên-
cia acumulada simples abaixo, mas podemos ter frequências acumuladas simples e relativas,
abaixo e acima, portanto podemos ter 4 colunas para representar as frequências acumuladas:
1 – Frequência acumulada abaixo: soma de todas as frequências simples ou relativas
até um dado valor, inclusive esse valor.
2 – Frequência acumulada acima: soma de todas as frequências simples ou relativas
além de um dado valor, inclusive esse valor.
FI
XI FI FI
REPETI- FR
NÚMERO DE FREQUÊNCIA SIM- FREQUÊNCIA SIM-
I ÇÃO DOS FREQUÊNCIA
ACIDENTES PLES ACUMULADA PLES ACUMULADA
ACIDENTES RELATIVA
MENSAIS ABAIXO (MESES) ACIMA (MESES)
(MESES)
1 2 1 1/60 x 100%= 1,67% 1 59+1=60
2 3 5 5/60 x 100%= 8,33% 1+5=6 54+5=59
15/60 x 100%=
3 4 15 6+15=21 39+15=54
25,00%
12/60 x 100%=
4 5 12 21+12=33 27+12=39
20,00%
13/60 x 100%=
5 6 13 33+13=46 14+13=27
21,67%
6 7 5 5/60 x 100%= 8,33% 46+5=51 9+5=14
7 8 7 7/60 x 100%= 11,67% 51+7=58 2+7=9
8 9 2 2/60 x 100%= 3,33% 58+2=60 2
--- TOTAL 60 100,00% ---
38 • capítulo 2
Vamos analisar o que está representado na terceira linha da tabela:
Identificou-se a ocorrência de 4 acidentes não fatais mensais, em 15 meses, dos 60 ob-
servados. Isto representou 25% dos meses observados. Em 21 meses, dos 60 observados,
tivemos 4 ou menos acidentes mensais. Em 54 meses, dos 60 observados, tivemos 4 ou
mais acidentes mensais.
Agora veremos como construir uma tabela onde os valores observados apare-
cem agrupados em classes ou faixas. Ela deverá ser usada quando a variável do
estudo for quantitativa contínua ou quando a variável do estudo for quantitati-
va discreta e a dispersão (variação) desses valores for muito grande.
Seu uso visa evitar inconvenientes como:
• a grande extensão de uma tabela;
• o aparecimento de valores com frequência nula;
• a dificuldade de visualização do comportamento como um todo.
Para construir uma tabela com classes calcada em dados brutos, podemos
seguir estes passos:
capítulo 2 • 39
Passo 2 – Escolher o número de classes K que será usado:
É cada um dos grupos de valores em que se subdivide a amplitude total.
Você pode usar uma das 4 sugestões de cálculo a seguir (em que n = quantidade
total de valores observados):
a) K = n ou
b) k ≅ 1 + 3,32 log n ou
c) Escolher k com base na tabela:
ou
c) Escolher um número entre 5 e 20.
Use seu bom senso para determinar o número de classes, ressaltando que,
quanto maior o número de observações, maior deverá ser o número de classes.
A definição do número de classes tem um pouco de tentativa e erro na procura
da melhor distribuição que represente os valores da variável. Este deverá ser
sempre um número inteiro.
Passo 3 – Calcular a amplitude h de cada intervalo de classe:
AT
h=
k
Os limites de classes são seus valores extremos. Sua escolha deve ser feita de
forma que, dentro do possível, seus pontos médios coincidam com a concen-
tração dos valores reais. É recomendável que sejam números inteiros. Como
40 • capítulo 2
padrão, o limite inferior da primeira classe é escolhido ligeiramente inferior
que o menor valor da amostra e, da mesma maneira, o limite superior da última
classe ligeiramente excede o maior valor da amostra, entretanto nada impede a
utilização dos valores extremos como limites.
( L i + Ls )
O ponto médio de classe é dado por: PM =
2
3 19 25 28 32 35
8 20 25 28 33 36
11 20 26 28 33 36
12 20 26 28 33 36
12 23 26 28 34 41
13 23 26 29 34 41
14 24 26 29 35 41
16 24 26 30 35 41
17 25 26 30 35 42
19 25 26 31 35 43
capítulo 2 • 41
Passo a passo dos cálculos das classes:
n= 60
X mínimo = 3
X máximo = 43
At = Xmín. – Xmáx. = 40
h = At/k = 5,714286
Vamos usar h = 6
42 • capítulo 2
Como calcular cada frequência inserida na tabela? Vamos ao passo a passo.
Frequência simples
Vimos no item anterior que a frequência simples é dada por:
k k
n = ∑ fi ou simplesmente n = ∑ fi ou n = ∑ fi = f1 + f2 + ... + fk
i =1 i =1
Frequência relativa
É calculada com a divisão de cada valor de frequência simples pelo tamanho
fi fi
da amostra, assim como visto no item anterior: fr = = k
n
∑ fi
i =1
FI
FR
REPETIÇÃO
2 2/60 x 100% =3,33%
60 100,00%
capítulo 2 • 43
Frequência acumulada
DIAS DE AFASTAMENTO FI
FR FI ABAIXO FI ACIMA
K (CLASSES) REPETIÇÃO
1 3 |---| 9 2 3,33% 2 58+2=60
2 9 ---| 15 5 8,33% 2+5=7 53+5=58
3 15 ---| 21 7 11,67% 7+7=14 46+7=53
4 21 ---| 27 16 26,67% 14+16=30 30+16=46
5 27 ---| 33 14 23,33% 30+14=44 16+14=30
6 33 ---| 39 10 16,67% 44+10=54 6+10=16
7 39 ---| 45 6 10,00% 54+6=60 6
2 – Representação gráfica
A partir de agora, aprenderemos a construir gráficos para as tabelas e frequên-
cias que estudamos até aqui. Veremos que alguns gráficos têm mais afinida-
de com certas frequências, isto é, são mais adequados a representar algumas
frequências e tipos de dados. Lembre-se de quantos relatórios, pesquisas e re-
portagens que você já leu ou preparou que continham gráficos. Gráficos são
usados para resumir informações extraídas de dados coletados em pesquisas.
São mais uma opção para representar as informações que extraímos de dados
brutos.
Apresentação gráfica:
• É um complemento da apresentação tabular.
• É usada para apresentar visualmente dados qualitativos (texto) ou quanti-
tativos (números), propiciando mais facilidade e rapidez para sua compreensão.
• Serve para apresentar conclusões ou resultados de uma análise.
• Permite a visualização imediata da distribuição dos valores observados.
• Propicia uma ideia mais satisfatória da concentração e da dispersão
dos valores.
44 • capítulo 2
• Mostra mais claramente os fatos essenciais e as relações mais difíceis de
reconhecer em massas de dados estatísticos.
Por proporcionar uma visualização rápida e clara do fenômeno observado,
o gráfico deve ser o mais completo possível. Deve conter título, data e fonte de
origem. As legendas podem ser omitidas, desde que as informações estejam
presentes nos eixos do gráfico. A representação gráfica geralmente apresenta
dados dispostos em duas dimensões: eixos X e Y. No eixo X, está representada
a variável observada, a variável xi ou as classes presentes nas tabelas. No eixo Y,
fica representada a frequência que se deseja indicar.
A seguir, mostraremos os principais tipos de gráficos que usaremos na esta-
tística. Cada um será construído com o apoio do Excel. Aprenderemos a cons-
truir gráficos de colunas e barras, gráficos de setores, histogramas e polígonos
de frequências, gráficos de linha ou ogiva de Galton, gráfico de Pareto, cartas de
controle e gráficos de dispersão. Tenha em mente que serão necessários régua,
compasso, transferidor, esquadros, papel milimetrado ou, melhor, no lugar de
tudo isto, basta o Excel!
capítulo 2 • 45
dois terços da largura de suas colunas. Ao ser usado para representação de
séries relacionadas com o tempo, as colunas devem estar dispostas em or-
dem cronológica.
200
mil toneladas
150
100
50
0
Jan Fev Mar Abr Mai Jun Jul Ago
250
200
150
100
50
0
França Itália Chile
Países
Champanhe Vinho
46 • capítulo 2
2.1.4.3 Gráfico de colunas agrupadas
200
Valores em 100 dólares
150
100
50
0
França Portugal Itália Espanha Chile Argentina
Países
Champanhe Vinho
2,50%
2,00%
1,50%
Taxa Bm %
1,00%
0,50%
0,00%
São Paulo
Argentina
México
Paris
Frankfurt
Londres
Tóquio
Down Jones (NY)
Nasdaq (NY)
–0,50%
–1,00%
–1,50%
capítulo 2 • 47
2.1.4.5 Gráfico de barras (horizontais)
0 10 20 30 40
Vendas anuais
Argentina
Chile
Espanha
Países
Itália
Portugal
França
48 • capítulo 2
2.1.4.7 Gráfico de barras agrupadas
Argentina
Chile
Espanha
Países
Itália
Portugal
França
Frankfurt
México
Nasdaq (NY)
São Paulo
–1,50% –1,00% –0,50% 0,00% 0,50% 1,00% 1,50% 2,00% 2,50% 3,00%
Taxa em %
capítulo 2 • 49
2.1.4.9 Gráfico em setores ou de porcentagens
6%
8% Café
28%
Açúcar
13%
Milho
Feijão
19% Soja
26%
Laranja
50 • capítulo 2
2.1.5 Principais tipos de gráficos que representam frequências em
tabelas com classes
São utilizados para representar tabelas compostas por variáveis quantitativas dis-
cretas (que apresentem grande dispersão nos dados) ou quantitativas contínuas.
2.1.5.1 Histograma
9
8
8
7
Frequência absoluta fi
6
6
5
4 4
4
3
3
2
1
0
310 340 370 400 430
–I –I –I –I –I
capítulo 2 • 51
2.1.5.2 Polígono de frequências
É baseado na união dos pontos médios das bases superiores dos retângulos do
histograma. Refere-se às frequências simples absolutas ou relativas. É repre-
sentado por um gráfico de área no Excel.
6
6
5 4 4
4 3
3
2
1
0
310 340 370 400 430
–I –I –I –I –I
52 • capítulo 2
Gráfico de setores - Percentual de vendas diárias
em milhares $
12% 16%
280 -I 310
310 -I 340
24% 16%
340 -I 370
370 -I 400
400 -I 430
32%
25 25
22
Frequência absoluta fi
20
16
15
10
8
5
4
0
310 340 370 400 430
–I –I –I –I –I
capítulo 2 • 53
2.1.6 Gráficos Especiais
54 • capítulo 2
dicando o valor médio das observações feitas e outras duas indicando o limite
superior de controle – LSC e o limite inferior de controle – LIC, calculados
de acordo com o desvio padrão dessas medidas (aprenderemos a calcular o
desvio padrão no capítulo 4). Com ele, podemos visualizar qualquer desvio
no desempenho do processo monitorado. Constitui-se em mais uma ferra-
menta para a gestão da qualidade. No Excel, usamos o gráfico de linha com
marcadores.
25,3
25,2
Peso do saco de farinha em Kg
25,1
25
24,9
24,8
24,7
24,6
24,5
24,4
8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17
Horas
capítulo 2 • 55
Renda anual X Anos de estudo do
chefe da família
20
18
y = 0,146x + 2,6578
16
14
Anos de estudo
12
10
8
6
4
2
0
0 10 20 30 40 50 60 70 80 90 100 110
Renda anual R$ mil
ATIVIDADES
01. A tabela a seguir indica o número mensal de aparelhos de TV de 20’’ defeituosos, rejei-
tados pelo controle de qualidade da empresa Panasonic durante os últimos 4 anos.
• Organize a tabela de frequências dos aparelhos defeituosos.
• O quanto representou o número de meses com 6 ou mais aparelhos defeituosos em rela-
ção ao total de meses observados, Isto é, qual a sua frequência relativa?
• Ao longo desses 4 anos, em quantos meses a empresa teve 8 ou mais aparelhos com
defeito por mês?
MÊS
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
ANO
1998 6 2 5 6 0 8 7 6 3 4 5 8
1999 10 9 7 6 3 4 6 4 5 4 0 1
2000 3 6 7 9 3 1 4 6 5 3 5 4
2001 7 2 5 8 6 4 2 5 1 6 5 2
02. A tabela a seguir indica as medidas de altura de alunos de uma classe de 1ª série do
ensino médio.
a) Organize a tabela de frequências de alturas.
56 • capítulo 2
b) Qual a porcentagem de alunos com altura maior ou igual a 170 cm, Isto é, qual a fre-
quência acumulada para a altura de 170 cm?
ALTURA EM CENTIMETROS
163 168 168 170 170 166
03. Considere a tabela de frequências a seguir, que representa o peso de atletas participan-
tes de uma competição de judô. Com base na tabela, responda ao que se pede.
a) Quantos atletas participaram da competição?
b) Quantos tinham menos de 70 kg?
PESO EM KG 66 67 68 69 70 71 72 73 74
FREQUÊNCIA 6 7 10 9 9 8 12 10 11
04. Vamos medir a audiência de canais de TV. A tabela a seguir mostra o número de TVs
sintonizadas em certo canal num mesmo horário durante 100 dias consecutivos, em um bair-
ro com aproximadamente 5 000 televisores. Agrupe estas medidas em intervalos de classes
Calcule a frequência simples, a relativa e a acumulada para a relativa. Interprete os dados da
última classe.
433 508 520 603 532 673 480 592 565 662
712 415 595 580 643 542 470 743 608 503
566 493 635 780 537 622 463 613 502 577
618 581 644 605 588 695 517 537 552 682
340 537 370 745 605 673 487 412 613 470
548 627 576 637 787 507 566 628 676 750
442 591 735 523 518 612 589 648 662 512
663 588 627 584 672 533 738 455 512 622
544 462 730 567 588 705 695 541 537 563
capítulo 2 • 57
05. Em um exame de vestibular, foi cronometrado o tempo, em minutos, gasto por cada um
dos 50 alunos para entregar a prova. Use K igual a 7. Obteve-se a tabela de dados brutos a
seguir. Faça a tabela de frequências e de frequência relativa para este caso. Imagine os inter-
valos abertos na esquerda e fechados na direita. Qual a maior frequência relativa observada?
TEMPO EM MINUTOS
61 65 43 53 55 51 58 55 59 56
52 53 62 49 68 51 50 67 62 64
53 56 48 50 61 44 64 53 54 55
48 54 57 41 54 71 57 53 46 48
55 46 57 54 48 63 49 55 52 51
06. Monte a distribuição de frequências e de frequência relativa para esta lista de notas
obtidas em um concurso para polícial federal. Use K igual a 8.
6 63 69 69 68 68 68 65
64 64 71 75 67 67 68 67
67 66 65 66 61 68 68 69
67 60 65 68 67 71 71 70
74 72 66 63 62 61 61 69
69 74 69 69 69 67 66 67
63 66 67 68 68 67 66 64
64 68 68 69 69 67 67 66
64 71 72 73 72 66 66 65
68 65 68 64 68 64 68 61
64 64 65 70 70 70 70 70
71 68 70 67 68 69 70 71
70 69 67 67
58 • capítulo 2
7 11 6 6 10 6 31 28 13 19
6 18 9 7 5 5 9 8 10 6
10 3 4 6 7 9 9 19 7 9
17 33 17 12 7 5 7 10 7 9
18 17 4 6 11 13 7 6 10 7
7 9 8 15 16 11 10 7 5 14
12 10 6 7 7 13 10 5 6 4
10 6 7 11 19 17 6 9 6 5
6 13 4 7 6 12 9 14 9 7
18 5 12 8 8 8 13 9 13 15
XI FI FR FA XI FI FR FA
1 10% 200 2
2 40% 300 0,1 6
3 20% 400 6
4 20% 500 0,25
5 10% 600 38
TOTAL
FI
XI FI FA FR XI FR FA
FI
10 2 10 5% 1
11 6 20 4
12 12 30 11
13 24 40 8 40%
14 26 50 1
capítulo 2 • 59
09. Uma agência de turismo está interessada em conhecer o perfil de seus clientes com
relação à variável estado civil. Para isso, o gerente desta agência pediu ao funcionário do
setor de vendas que fizesse um gráfico que resumisse estas informações. Construa o gráfico
e interprete-o com base nos dados coletados:
10. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava
em um determinado supermercado no primeiro sábado após receber o pagamento (salário).
Para isso, ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h e anotou
os valores gastos por cada um deles. Estes valores estão listados a seguir:
4,89 – 11,00 – 5,60 – 73,85 – 24,83 – 98,00 – 186,00 – 234,87 – 58,00 – 198,65
223,86 – 341,42 – 94,76 – 445,76 – 82,80 – 35,00 – 455,00 – 371,00 – 398,60 – 234,00 –
64,90 – 54,98 – 48,80 – 68,90 – 120,32 – 126,98 – 76,43 – 6,35 – 9,98 – 12,68 – 243,00
– 18,65 – 134,90 – 11,10 – 321,09 – 290,76 – 74,00 – 48,80 – 74,52 – 138,65 – 26,00 –
210,13 – 15,78 – 197,45 – 75,00 – 76,55 – 32,78 – 166,09 – 105,34 – 99,10
11. Construir a tabela (sem classe) de frequências indicando as frequências simples (ou
absolutas), relativa e acumulada da amostra a seguir. Faça também os gráficos para cada
uma das frequências.
10 9 9 9 10 11 8 8
10 11 12 13 10 11 12 7
60 • capítulo 2
12. A amostra seguinte refere-se ao tempo dispendido em minutos pelos gerentes das em-
presas de uma cidade no trajeto matutino entre a residência e o local de trabalho. Construir
a tabela de frequências com classes. Calcule as frequências simples, relativa e relativa acu-
mulada. Faça os gráficos para cada uma dessas 3 frequências calculadas.
28 25 48 37 41 19 32 26 16 23 23 29 36
31 26 21 32 25 31 43 35 42 38 33 28
13. Para os dados brutos a seguir, construa a tabela de frequências com classes. Calcule a
frequência simples. Faça o histograma.
As 50 primeiras das 500 maiores empresas privadas por vendas – Ano anterior
capítulo 2 • 61
REVISTA XXXXXX – MELHORES E MAIORES – REVISTA XXXXXX – MELHORES E MAIORES –
JULHO XXXX JULHO XXXX
VENDAS EM US$ VENDAS EM US$
EMPRESA EMPRESA
MILHÕES MILHÕES
Pão de Açúcar $ 3.353,4 Ipiranga $ 4.669,7
14. Com os retornos mensais do ativo XXX registrados na tabela seguinte, construir a tabela
de frequências com 5 classes, o gráfico de setores para a frequência relativa e o gráfico de
linha para a frequência relativa e acumulada.
MÊS RETORNO %
mai/12 –2,44%
jun/12 –3,15%
jul/12 7,61%
ago/12 11,17%
set/12 8,34%
out/12 –11,60%
nov/12 6,06%
dez/12 –1,82%
jan/13 19,83%
fev/13 –3,76%
mar/13 –0,06%
abr/13 4,22%
mai/13 10,92%
jun/13 5,52%
jul/13 1,31%
ago/13 2,22%
set/13 2,99%
out/13 1,34%
nov/13 2,03%
dez/13 5,61%
jan/14 13,14%
fev/14 10,85%
62 • capítulo 2
mar/14 2,44%
abr/14 10,37%
mai/14 13,64%
jun/14 10,78%
jul/14 2,43%
ago/14 –17,58%
set/14 11,20%
out/14 –23,83%
nov/14 4,54%
dez/14 8,54%
jan/15 –4,67%
fev/15 8,74%
mar/15 13,02%
abr/15 –2,25%
REFLEXÃO
Neste capítulo, aprendemos a identificar dados brutos e rol, assim como a construir tabelas
com e sem classes e a simplificar a análise desses dados por meio de sua representação
nos gráficos Como engenheiro, você certamente precisará ter conhecimentos em gestão da
qualidade total. Um método bastante usado pelos gerentes da área da qualidade é o MASP:
método de análise e solução de problemas. Veja no arquivo anexo 03 MASP.docx como o
uso de gráficos é essencial para se fazer análise de situações e processos. Perceba que as
ferramentas da qualidade têm seu uso baseado na metodologia estatística de representação
de dados e cálculo de indicadores estatísticos.
LEITURA
Recomendamos a leitura do texto “Como analisar de forma simples um grande número de
dados?”, que aborda de maneira clara alguns procedimentos que podem ser utilizados quan-
do nos deparamos com situações em que se precisa resumir as informações de grandes
conjuntos de dados.
Disponível em:
<http://www.klick.om.br/materia/20/display/0,5912,POR-20-91-931-,00.html>.
capítulo 2 • 63
REFERÊNCIAS BIBLIOGRÁFICAS
CERVEIRA, Diego; SELLITTO, Miguel. Manutenção centrada em confiabilidade (MCC): análise
quantitativa de um forno elétrico a indução. Revista Produção Online v. 15, n. 2 (2015). Disponível em:
<http://producaoonline.org.br/rpo/article/ view/1615/1266>.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I. ; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.
64 • capítulo 2
3
Medidas de
Posição Medidas
de Tendência
Central e Medidas
Separatrizes
Nesse capítulo, aprenderemos como caracterizar um conjunto de dados com
medidas numéricas que sejam representativas de todo o conjunto. As medidas
de posição têm o objetivo de representar o ponto central de um conjunto de
dados. As mais conhecidas são a média, a mediana e a moda. Além dessas me-
didas, podemos citar outras medidas de posição importantes, que não as cen-
trais, chamadas de medidas separatrizes. São elas os quartis, os decis e os per-
centis. Vamos estudar cada uma dessas medidas de posição. Primeiramente,
vamos fazer um estudo para os dados não tabulados, ou seja, quando os dados
não estiverem na forma de distribuição de frequência. Em seguida, as mesmas
medidas serão calculadas com base em dados tabulados.
OBJETIVOS
Ao final deste capítulo, esperamos que você seja capaz de calcular e de interpretar as medi-
das de posição aplicadas a conjuntos de dados; calcular a média, a moda e a mediana para
dados brutos e para tabelas com e sem classes; selecionar a melhor medida de posição e
tendência central para um conjunto numérico; comparar as características de cada medi-
da estudada; calcular as medidas separatrizes: quartil, decil e percentil; construir o gráfico
boxplot e identificar valores outliers em um conjunto numérico. Efetuar os cálculos usando
o Excel.
66 • capítulo 3
3.1 Medidas de tendência central
As medidas de tendência central ou promédias são assim denominadas em vir-
tude da tendência mostrada pelos dados observados de se agruparem em torno
desses valores centrais. São medidas que sumarizam certas características im-
portantes da distribuição de frequências. As mais usadas são a média aritméti-
ca, a mediana e a moda.
n
∑ Xi
X = i =1 onde
n
capítulo 3 • 67
EXEMPLO
Exemplo 1 – Dados brutos
Calcule o salário médio mensal pago a 5 contínuos de uma empresa, que receberam:
R$ 800,00, R$ 780,00, R$ 820,00, R$ 810,00 e R$ 790,00.
n
∑ Xi 800 + 780 + 820 + 810 + 790 4000
X = i =1 = = = 800
n 5 5
É obtida pelo quociente entre o produto dos valores da variável pelos respecti-
vos pesos e a soma dos pesos e usada para calcular a média de dados tabelados
ou ponderados. Nesse caso, a frequência simples fi é o peso, a repetição de cada
valor da variável.
K
∑ X i fi ∑ X f soma do (produto dos valores da variavel pelos respectivos pesos)
X = i =1K = i i
=
n soma dos pesos
∑ fi
i =1
onde
• Σ ⇒ letra grega sigma – indica o somatório de diversas parcelas, neste
caso a soma da multiplicação de cada valores observados pela sua repetição (fi)
do primeiro ao enésimo;
• Xi ⇒ são os valores da variável x ou o ponto médio (para tabela agrupada
em classes);
• fi ⇒ são as frequências de cada valor da variável observada;
• n ⇒ o número total dos valores observados;
• K ⇒ número de classes ou de valores individuais diferentes da variável.
68 • capítulo 3
EXEMPLO
Exemplo 2 – Tabela sem classes
As notas de 20 alunos são as seguintes:
4 5 5 5 5
5 6 6 6 6
6 6 7 7 7
7 7 8 8 8
I NOTAS XI FREQUÊNCIA FI
1 4 1
2 5 5
3 6 6
4 7 5
5 8 3
TOTAL 20 = N
X=
∑ Xifi = (4X1) + (5X5) + (6X6) + (7X5) + (8X3) = 6, 2
n 1+ 5 + 6 + 5 + 3
n
∑ Xi 4 + 5 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 124
i =1
X= = = = 6,, 2
n 20 20
capítulo 3 • 69
Exemplo 3 – Tabela com classes
Para o cálculo da média ponderada para a tabela com classes, você deverá proceder da
seguinte forma:
• Calcule o ponto médio PM de cada classe.
• Multiplique cada ponto médio PM pela frequência simples fi correspondente.
• Some todos os produtos encontrados e divida pelo tamanho da amostra n.
XI
CLASSES FI PONTO MÉDIO DE XI*FI
CADA CLASSE
10 |- 20 5 (10+20)/2=15 15x5=75
20 |- 30 10 (20+30)/2=25 25x10=250
30 |- 40 15 (30+40)/2=35 35x15=525
40 |- 50 10 (40+50)/2=45 45x10=450
50 |- 60 5 (50+60)/2=55 55x5=275
TOTAL 45 ----- 1575
K
∑ Xifi ∑ X f 75 + 250 + 525 + 450 + 275 1575
Média = X = i=1K = ii
= = = 35
n 45 45
∑i f
i =1
70 • capítulo 3
2ª – Somando-se ou subtraindo-se uma constante a cada valor do conjunto,
a nova média será a original aumentada ou diminuída do valor dessa constante.
3ª – Multiplicando-se ou dividindo-se cada valor do conjunto por uma
constante, a nova média será a original multiplicada ou dividida do valor des-
sa constante.
4ª – A média de um conjunto de números pode ser sempre calculada.
5ª – Para um dado conjunto de números, a média é única.
6ª – A média é sensível a (ou afetada por) todos os valores do conjunto.
3.1.2 Moda
É o valor da variável que mais se repete, que se destaca em relação aos outros
valores, ou seja, é o valor mais frequente quando comparamos sua frequência
com a dos outros valores do conjunto. A moda é o valor da variável que ocorre
com a maior frequência simples em um conjunto de números.
A moda pode não existir (amodal – caso em que todos os valores da variável
em estudo ocorrem com a mesma intensidade) e, mesmo que exista, pode não
ser única (quando houver mais de um valor predominante). Pode ser unimodal,
bimodal, trimodal e assim por diante.
A mudança de um valor no conjunto observado pode não mudar a moda,
pois, ao contrário da média, a moda é uma medida resistente. Características
da moda:
• Não é afetada pelos valores extremos.
• É a única medida que pode ser determinada para uma variável qualitativa.
capítulo 3 • 71
EXEMPLO
Exemplo 4 – Encontre o valor da moda para os conjuntos a seguir:
X = {4,5,5,6,6,6,7,7,8,8} A moda Mo = 6, pois é o valor quer aparece mais vezes.
Y = {4,4,5,5,6,6} Não tem moda, amodal, pois todos os valores aparecem com a mes-
ma frequência.
Z ={1,2,2,2,3,3,4,5,5,5,6,6} Bimodal, pois o 2 e o 5 aparecem em igual intensidade
Mo =2 e Mo = 5.
W = {1,2,3,4,5} Trata-se de outro conjunto amodal.
Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo moda, como fazer
este cálculo no Excel.
EXEMPLOS
Exemplo 5 – Qual a temperatura mínima diária mais comum medida no mês abaixo?
TEMPERATURA FI
0 oC 3
1 oC 9
2 oC 12
3 oC 6
Total 30
O valor da moda para a tabela é 2 °C. Basta olhar a tabela e identificar o valor da variável
observada que mais se repete. O valor 2 °C se repete 12 vezes, portanto o valor da moda é
2 °C.
Exemplo 6 – Encontre a moda para a tabela que representa o número de peças defei-
tuosas devolvidas mensalmente pelo controle de qualidade.
72 • capítulo 3
NÚMERO DE PEÇAS DEFEITUOSAS XI NÚMERO DE MESES FI
0 2
1 4
2 6
3 8
4 4
5 2
6 1
TOTAL 27
O valor da moda é 3. Três peças defeituosas devolvidas mensalmente é o valor que mais
se repete, ou seja, ele aparece oito vezes.
Para uma tabela com classes, podemos usar dois métodos para determinar o
valor da moda: moda bruta ou moda czuber. Eles estão descritos a seguir:
∆1
X = li + ⋅h
∆1 + ∆ 2
onde:
li ⇒ limite inferior da classe modal
D1 ⇒ diferença entre a frequência simples da classe modal e a imediatamen-
te anterior = frequência da classe modal menos frequência da classe anterior
D2 ⇒ diferença entre a frequência simples da classe modal e a imediatamen-
te posterior = frequência da classe modal menos frequência da classe posterior
h ⇒ amplitude do intervalo da classe modal = limite superior menos limi-
te inferior
capítulo 3 • 73
EXEMPLO
Exemplo 7 – Determine a moda bruta e a moda de Czuber para os dados abaixo:
CLASSES FI
10 |- 20 2
20 |- 30 3
30 |- 40 10
40 |- 50 9
50 |- 60 4
TOTAL 28
Moda bruta: a classe modal que mais se repete é a classe 30|-- 40. Seu ponto médio é
igual a (30+40)/2 =35, portanto a moda bruta é igual a 35.
Moda de Czuber: a classe modal que mais se repete é a classe 30|– 40.
• Limite inferior da classe modal li = 30
• Delta 1 é a frequência simples da classe modal menos a frequência simples
anterior D1 =10-3= 7
• Delta 2 é a frequência simples da classe modal menos a frequência simples
posterior D2 =10 – 9= 1
• Amplitude da classe modal é h = 40 – 30= 10
• Aplicando a fórmula, temos que a moda é:
Mo= li + h (D1 /(D1 + D2)) = 30 + (10(7/(7+1))10 = 38,75
3.1.3 Mediana
74 • capítulo 3
Se, por exemplo, o maior valor da variável for duplicado, a mediana não se
alterará: é uma medida resistente. Seu resultado não é afetado pelos valores ex-
tremos. Certas pesquisas de preço e salários preferem usar a mediana em vez
da média pelo fato de ela não ser influenciada por valores pequenos ou grandes
demais, ditos fora do padrão.
EXEMPLO
Exemplo 8 – Calcule a mediana para os valores abaixo:
A = {2, 3, 6, 12, 15, 23, 30)
n=7 è ímpar
Md = 12, pois é o elemento que ocupa a quarta posição, em que EMd = (n+1)/2 =
(7+1)/2 = 4ª posição.
B = {3, 6, 9, 12, 14, 15, 17, 20}
N=8 è par
Md = (12+14)/2 = 13
Mediana é a média entre o elemento do meio, de ordem EMd =(n/2)=4º, com o
elemento seguinte, o 5º.
capítulo 3 • 75
3.1.3.2 Mediana para dados tabulados não agrupados em classes
EXEMPLO
Exemplo 9 – Calcule a mediana para as tabelas a seguir:
VALORES XI FREQUÊNCIA FI
VALORES XI FREQUÊNCIA FI
2 5
3 10
3 3
4 15
4 6
5 12
5 9
6 5
6 8
7 3
7 6
TOTAL =N = 50
8 4
TOTAL =N = 36
VALORES XI FREQUÊNCIA FI
3 3
4 6
5 9
6 8
7 6
8 3
TOTAL =N = 35
76 • capítulo 3
Resolução:
Para cada uma das 3 tabelas, calcule a frequência simples acumulada abaixo Fa. Na
coluna da Fa encontre a posição da media observando se n é par ou ímpar. Selecione o valor
do x correspondente.
capítulo 3 • 77
3.1.3.3 Mediana para dados tabulados agrupados em classes
Para uma tabela com classes, o cálculo da mediana é feito usando a fórmu-
la abaixo:
1o – Verificar se a coluna das classes está ordenada.
n
2o – Calcular a posição da mediana dada por EMd = , não se fazendo distin-
2
ção entre número par ou ímpar de observações.
3o – Identificar o intervalo que contém a mediana localizando o EMd na colu-
na das frequências simples acumuladas abaixo Fa.
4o – Aplicar a fórmula da interpolação para o cálculo da mediana:
EMd − Faa
Md = X = li + .h
fi
MEDIANA
Onde:
• li ⇒ limite inferior da classe mediana
• EMd ⇒ posição da mediana = n/2
• Faa ⇒ frequência acumulada anterior à classe mediana
• fiMEDIANA ⇒ frequência simples da classe mediana
• h ⇒ amplitude do intervalo da classe mediana
EXEMPLOS
Exemplo 10 – Calcule a mediana para a tabela a seguir:
CLASSES FI
10 |- 20 10
20 |- 30 20
30 |- 40 35
40 |- 50 40
50 |- 60 25
60 |- 70 15
70 |- 80 5
TOTAL 150
78 • capítulo 3
Resolução
Resolução
capítulo 3 • 79
Exemplo 12 – Calcular a mediana para a tabela com classes a seguir.
CLASSES FI
3 |--- 6 2
6 |--- 9 5
9 |--- 12 8
12 |--- 15 3
15 |--- 18 1
TOTAL 19
Resolução
80 • capítulo 3
3.1.4 Comparações entre média, moda e mediana
A moda tem existência real (exceção para dados agrupados) e pode ser cal-
culada, na maioria dos casos, para classes ou limites abertos.
capítulo 3 • 81
3.2 Medias separatrizes
São medidas de posição que dividem um conjunto de valores ordenados em
partes iguais, portanto o conjunto de valores deve estar ordenado para se efe-
tuar o cálculo das separatrizes. O cálculo das medidas separatrizes não segue
um padrão muito rígido, por isso costuma-se encontrar diferenças nas fórmu-
las de interpolação usadas por diferentes softwares estatísticos. De forma geral,
podemos usar as fórmulas a seguir.
82 • capítulo 3
EXEMPLO
Exemplo 13
Um escritório que presta consultoria em administração levantou o tempo de espera de
pacientes que chegam a uma clínica de ortopedia para atendimento de emergência. Foram
coletados os seguintes dados, em minutos, durante uma semana: 2, 5, 10, 11, 3, 14, 8, 8, 7,
12, 3, 4, 7, 3, 4, 2, 6, 7. Encontre os quartis.
Resolução:
Para encontrar os quartis, precisamos ordenar o conjunto de dados. Então: 2, 2, 3, 3, 3,
4, 4, 5, 6, 7, 7, 7, 8, 8, 10, 11, 12, 14
• Posição do primeiro quartil (Q1): n/4 = 18/4 = 4,5
Como a divisão resultou em um valor fracionário, ela será arredondada para 5. Assim, o
primeiro quartil é o valor que está na quinta posição: Q1 = 3
Então, pelo menos 25% das observações são menores ou iguais a 3 minutos.
capítulo 3 • 83
onde
• i = número do percentil a ser calculado
• n = número de observações
Da mesma forma que nos quartis, o conjunto de dados deve estar ordenado.
Quando dividimos o conjunto de dados em 100 partes, obtemos 99 percentis.
Adotaremos a seguinte convenção para o cálculo dos percentis:
EXEMPLO
Exemplo 14 – Calcule o P60 da sequência x={2;8;7,5;6;10;12;2;9}
EP60 = (60. 8 )/100 = 4,8 è é o elemento de ordem 4,8
Este valor não inteiro indica que o P60 é um valor situado entre o quarto e o quinto
elemento da sequência.
P60= (7,5 + 8 )/2 = 7,75
60% dos valores estão abaixo de 7,75.
40% dos valores estão acima de 7,75.
Os decis, por sua vez, dividem a distribuição dos dados em 10 partes iguais (Di,
i = 1, 2, ..., 9). O quinto decil é a mediana.
n.i
Cada decil é determinado por: EDi =
10
84 • capítulo 3
onde
• i = número do decil a ser calculado
• n = número de observações
Para dados brutos, encontre a posição dada por EDi e determine o valor da
mediana. Caso EDi resulte em um valor não inteiro (com casas decimais), o de-
cil será a média dos dois inteiros mais próximos (anterior e posterior).
EXEMPLO
Exemplo 15 – Calcule o D4 da série abaixo:
2 5 8 5 5 10 1 12 12 11 13 15
1 2 5 5 5 8 10 11 12 12 13 15
D4 = (5+5)/2 = 5
40% dos valores estão abaixo de 5.
60% dos valores estão acima de 5.
capítulo 3 • 85
ATIVIDADES
01. Calcule o consumo médio ponderado para a tabela a seguir que representa o consumo
de energia em kW de 80 usuários:
NÚMERO
CLASSES CONSUMO
DE USUÁRIOS
EM KW
FI
5 |- 25 4
25 |- 45 6
45 |- 65 14
65 |- 85 26
85 |- 105 14
105 |- 125 8
125 |- 145 6
145 |- 165 2
TOTAL 80
02. Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13,
15, 16, 18 e 12 quilos, qual a venda média diária na semana?
03. O exame final, em um curso, tem peso 3 e as provas correntes peso 1. Um estudante
tem grau 85 naquele exame final e 70 e 90 nas provas, então seu grau médio é:
04. Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino. Calcular a quantidade média de meninos por família.
86 • capítulo 3
05. Calcular a estatura média de bebês conforme a tabela a seguir.
Determine:
a) a média dos salários.
b) o limite inferior da sexta classe.
c) o limite superior da quarta classe.
d) o ponto médio da terceira classe.
e) a amplitude do quinto intervalo de classe.
f) a frequência relativa da terceira classe.
g) a porcentagem de empregados que ganham R$ 80,00 ou menos.
h) a percentagem de empregados que ganham desde R$ 60 e até R$ 100 por semana.
capítulo 3 • 87
07. Os tempos de reação de um indivíduo a determinados estímulos foram medidos por um
psicólogo como sendo 0,53; 0,46; 0,50; 0,49; 0,52; 0,53; 0,44 e 0,55 segundos, respectiva-
mente. Determinar o tempo médio de reação do indivíduo a esses estímulos.
09. A tabela mostra a distribuição, em toneladas, das cargas máximas suportadas por certos
cabos fabricados por uma companhia. Determinar a média das cargas máximas:
TOTAL 60
10. Calcule a moda para os seguintes valores: X = { 7, 8, 9, 10, 10, 10, 11, 12 }
88 • capítulo 3
15. Considere as distribuições a seguir. Determine a moda.
XI FI XI FI XI FI
0 2 1 2 4 3
2 5 2 5 5 3
3 8 3 4 8 3
4 3 4 5 10 3
5 1 5 1 Total
TOTAL TOTAL
CLASSES FI
54 ---| 58 9
58 ---| 62 11
62 ---| 66 8
66 ---| 70 5
TOTAL
XI FI XI FI
2 1 0 3
5 4 1 5
8 10 2 8
10 6 3 10
12 2 5 6
TOTAL TOTAL
capítulo 3 • 89
20. Calcular a mediana.
CLASSES FI
3 ---| 6 2
6 ---| 9 5
9 ---| 12 8
12 ---| 15 3
15 ---| 18 1
TOTAL
21. Em uma série ordenada, qual é o percentual de elementos que ficam à esquerda de cada
uma das medidas separatrizes: D1, Q3, P70?
22. Em uma série ordenada, qual é o percentual de elementos que ficam à direita de cada
uma das medidas separatrizes: D4, Q1, P20?
17 17 17 18 18 18 18 18 18 18
18 18 18 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19 19 19
20 20 20 20 20 20 20 20 20 19
21 21 21 21 21 18 18 19 19 19
25. A distribuição das frequências na tabela representa o consumo por nota de 50 notas
fiscais emitidas durante um dia em uma loja de departamentos. Calcule D7, Q3, P90. Interprete
cada valor obtido. Tomando como amostra esta tabela, o gerente desta loja decidiu, numa
promoção, premiar com um brinde 10% dos fregueses que mais consumirem nos próximos
30 dias. A partir de qual valor de consumo de nota fiscal os clientes serão premiados?
90 • capítulo 3
11 106 141 163 204
0 109 143 165 227
15 109 144 166 233
16 114 146 174 248
29 115 148 175 258
49 121 148 177 262
59 123 154 182 269
65 138 157 187 274
92 139 157 191 282
99 141 162 195 307
26. Uma empresa estabeleceu o salário de seus vendedores com base na produtividade.
Desta forma, 10% é fixo e 90% são comissões sobre vendas. Uma amostra de salários
mensais nesta empresa revelou o quadro a seguir. Se uma empresa decidir, como incentivo,
fornecer uma cesta básica para 5% dos vendedores que tiverem desempenho ruim durante o
próximo mês, com base nesta amostra qual será o maior salário que receberá a cesta básica?
capítulo 3 • 91
27. A tabela representa o número de faltas semestrais dos funcionários de uma empresa.
Determine: D3, Q3, Q1, P10, P90. Interprete cada valor obtido.
3 5 3 4 7 5
3 4 7 5 5 3
5 4 3 5 6 3
3 2 6 3 4 3
5 7 3 5 2 2
28. Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição. Se
o produtor desejar estabelecer uma garantia mínima para o número de horas de vida útil de
uma peça, trocando a peça que não apresentar este número mínimo de horas, qual é a ga-
rantia, se ele está disposto a trocar 8% das peças?
29. Os valores a seguir representam os valores de notas fiscais, em R$, emitidas por 3 filiais
da loja de departamentos QWE. Construa o gráfico de boxplot para cada filial e interprete os
valores encontrados:
A B C
18 191 232 280 326 23 164 218 252 303 103 181 226 270 338
75 192 235 283 335 28 164 219 255 304 103 190 228 279 339
78 195 235 285 351 45 166 220 257 305 103 193 230 281 340
89 196 236 287 354 46 172 222 258 309 103 194 230 283 341
102 197 239 288 358 65 175 224 261 311 113 195 230 283 344
109 200 243 290 363 67 183 224 264 311 119 195 240 287 346
111 200 251 291 373 87 183 227 265 313 120 196 242 289 350
125 204 252 298 380 99 186 227 271 320 133 200 245 290 351
157 205 252 301 380 102 191 230 271 325 141 201 247 290 351
163 205 255 301 386 106 192 231 273 325 142 206 247 291 357
92 • capítulo 3
166 206 258 303 388 109 194 234 273 326 143 210 249 302 365
172 206 259 306 389 148 194 234 273 330 143 211 251 316 373
174 207 260 306 390 149 195 235 274 338 149 212 251 318 401
177 216 260 306 390 152 196 236 274 345 150 212 253 319 408
178 221 261 314 412 155 198 237 277 353 152 213 256 319 409
183 225 261 315 412 160 200 238 291 383 155 217 264 320 411
184 226 266 315 418 161 202 241 292 390 174 218 264 321 417
186 228 269 321 419 163 206 241 297 402 176 221 267 323 424
186 229 269 322 426 163 207 244 298 431 178 223 267 330 488
188 230 275 323 427 163 216 250 298 528 178 225 268 335 533
REFLEXÃO
Que a média é a medida de posição mais utilizada em nosso dia a dia talvez nem seja neces-
sário dizer, mas é preciso tomar certo cuidado quando a utilizamos como parâmetro de um
conjunto de dados. Você sabe que, se a média de sua turma em Estatística for igual a 7,0 (por
exemplo), não quer dizer que toda ela ou a maioria teve bom desempenho nem que metade
da turma teve desempenho igual ou superior a 7,0.
Outras medidas, como vimos, podem complementar as informações dadas pela média.
LEITURA
Veja o texto da recente reportagem que trata do aquecimento global, disponível em:
<http://g1.globo.com/natureza/noticia/2015/07/junho-bate-recorde-de-calor-no-pla-
neta-desde-fim-do-seculo-19.html>.
Perceba que os indicadores para a temperatura global estão todos baseados na média
das temperaturas medidas ao longo do último século. Como a média é uma medida descritiva
muito utilizada no dia a dia, sugerimos que você ouça o áudio “Médias que interessam”, da
Série: Problemas e Soluções. Há dois módulos, cujos conteúdos alertam para o cuidado que
se deve ter na interpretação da média, que mostram uma aplicação da média ponderada e
fazem uma análise crítica da utilização da média como uma informação única. O endereço
para acesso é: <http://m3.ime.unicamp.br/recursos/1315>.
capítulo 3 • 93
REFERÊNCIAS BIBLIOGRÁFICAS
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L.. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S.; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.
94 • capítulo 3
4
Medidas de
Dispersão
Nesse quarto capítulo, estudaremos as medidas de dispersão, que servem para
indicar o quanto os dados se apresentam dispersos em torno da região central.
Fornecem, portanto, o grau de variação existente no conjunto de dados. Dois
conjuntos de dados podem ter a mesma média, porém os valores poderão estar
muito mais dispersos em um conjunto do que em outro, apresentando graus de
homogeneidade diferentes.
Veja a seguinte situação: supondo que a temperatura máxima durante os
três últimos dias na cidade de São Paulo tenha sido de 27°, 28° e 29°, podemos
afirmar que a temperatura média foi de 28°. Em Porto Alegre, nestes mesmos
dias, a temperatura máxima foi de 22°, 28° e 34°, então a média de Porto Alegre
também foi de 28°. Percebemos que São Paulo passou por 3 dias de calor e Porto
Alegre passou por dois dias de calor e um de temperatura amena. Observamos
que a temperatura de Porto Alegre variou muito mais. A amplitude das tempe-
raturas nesta cidade foi acentuada. Como quantificar esta variação? Que con-
clusões se pode tirar dessas observações? Como interpretar estes valores?
Você se lembra de, após ter feito uma prova bimestral, algum professor ter
informado que o desempenho médio da turma ficou em torno de 7,2? Para efei-
to de comparação, ele também pode ter calculado a média de outra turma e
verificado que o desempenho médio também ficou em torno de 7,2. Surgem
os seguintes questionamentos: será que as notas das duas turmas foram
iguais? Será que as notas das turmas estão próximas da média ou dispersas?
Utilizaremos os conceitos deste capítulo para responder a estas perguntas.
Aprenderemos a calcular e aplicar a diversas situações de apoio à decisão
as medidas de dispersão que são: variância, desvio padrão e coeficiente de
variação.
OBJETIVOS
Ao final deste capítulo, você deverá ser capaz de calcular o desvio padrão, a variância
e o coeficiente de variação para dados brutos e para tabelas com e sem classes, assim
como selecionar a melhor medida para descrever um conjunto numérico. Saberá ainda
interpretar e comparar as características de cada medida estudada.
96 • capítulo 4
4.1 Medidas de dispersão
As medidas de dispersão proporcionam um conhecimento mais completo do
fenômeno a ser analisado, permitindo estabelecer comparações entre fenôme-
nos de mesma natureza e mostrando até que ponto os valores se distribuem
acima ou abaixo do valor de tendência central, no caso a média, como será vis-
to. Antes, porém, vamos analisar os exemplos abaixo.
EXEMPLOS
Exemplo 1 – Imagine que as duas amostras a seguir representem o tempo, em minutos, de
atendimento em um call center telefônico. Estes números se referem aos 11 últimos atendi-
mentos dos funcionários A e B.
A B
9,14 6,56
8,14 6,1
8,74 7,71
8,77 8,84
9,26 8,47
8,1 7,04
6,13 5,27
3,1 5,26
9,13 7,91
7,26 6,89
4,74 12,5
A B
MÉDIA = 7,50 7,50
Observe que os resultados são iguais, porém, mesmo assim as amostras são bem
diferentes.
Veja outros indicadores destes dois conjuntos:
A B
MEDIANA= 8,14 7,04
MÍNIMO= 3,1 5,26
MÁXIMO= 9,26 12,5
AMPLITUDE = 6,16 7,24
capítulo 4 • 97
A amplitude da amostra B é maior que a da amostra A, mas o valor mínimo da amostra A
é menor, enquanto o valor máximo da amostra B é maior. Conforme visto no capítulo anterior,
com base na mediana, podemos afirmar que, na amostra A, 50% dos valores são maiores
que 8,14 e, na amostra B, 50% dos valores são maiores que 7,04.
Agora, observe um gráfico de dispersão para estas amostras. Também com base na
mediana, podemos afirmar que existe uma assimetria à direita para a amostra B e uma assi-
metria à esquerda para a amostra A.
Gráfico de dispersão
2,5
1,5
A
1 B
0,5
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Exemplo 2
X = { 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 }
Y = { 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 }
Z = { 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 }
Observe que todos os resultados são iguais a 13, porém, mais uma vez, observamos que
as variações desses conjuntos diferem bastante. O conjunto X apresenta a maior variação ou
dispersão dos dados, seguido pelo conjunto Y e pelo conjunto Z, que não varia. Dessa forma,
vemos que para caracterizar estes conjuntos, o cálculo da média não basta.
98 • capítulo 4
Exemplo 3 – Suponha que se deseje comparar a performance de dois empregados com
base na produção diária de peças:
A = 70, 71, 69, 70, 70 – Média A = 70 peças por dia
B = 60, 80, 70, 62, 83 – Média B = 71 peças por dia
Obs.: veja os cálculos do exemplo 3 na planilha 05dispersao.xls na aba A.
capítulo 4 • 99
Ao trabalhar com dados brutos (não tabelados), usaremos as fórmulas
a seguir:
2 2
σ=
∑ ( Xi − X) S=
∑ ( Xi − X)
n n −1
2 2
σ=
∑ ( Xi − X) fi S=
∑ ( Xi − X) fi
n n −1
100 • capítulo 4
4. Na prática, queremos encontrar um desvio padrão pequeno que im-
plica uma homogeneização do comportamento. Este é o fundamento da
Metodologia de gestão de qualidade seis sigma (leitura recomendada no final
desse capítulo).
4.2 Variância
Variância é a média dos quadrados dos desvios. É uma medida de dispersão
absoluta igual ao quadrado do desvio padrão.
Ao trabalhar com dados brutos (não tabelados), usaremos as fórmulas
a seguir:
σ2 =
∑ ( Xi − X ) S2 =
∑ ( Xi − X)
n n −1
Para dados brutos (não tabelados), podemos usar as funções no Excel
VAR.P VAR.A
capítulo 4 • 101
DADOS TABULADOS – XI É O VALOR DA VARIÁVEL OU SEU PONTO MÉDIO
(QUANDO TABULADOS POR CLASSES)
PARA DADOS POPULACIONAIS PARA DADOS AMOSTRAIS
2 2
σ2 =
∑ ( Xi − X) fi S2 =
∑ ( Xi − X) fi
n n −1
102 • capítulo 4
4.3.1 Cálculo do desvio padrão para dados brutos de uma amostra
EXEMPLO
Exemplo 4 – Para esta pequena amostra, X = {5;10;12}, calcule o desvio padrão e a variância.
2
XI XI -MÉDIA (XI-MEDIA)²
5 (5–9)=-4 (5–9)²=16
10 (10–9)=1 (10–9)²=1
12 (12–9)=3 (12–9)²=9
TOTAL 27 0 26
Média = 27/3 = 9
Variância = 26/2 = 13
capítulo 4 • 103
4.3.2 Cálculo do desvio padrão para dados brutos de uma
população
EXEMPLO
Exemplo 5 – Para esta pequena população, X = {5;10;12}, calcule o desvio padrão e
a variância.
2
XI XI -MÉDIA (XI-MÉDIA)²
5 (5–9)=-4 (5–9)²=16
10 (10–9)=1 (10–9)²=1
12 (12–9)=3 (12–9)²=9
TOTAL 27 0 26
Média = 27/3 = 9
104 • capítulo 4
4.3.3 Cálculo do desvio padrão para dados tabelados sem classes
de uma amostra
EXEMPLO
Exemplo 6 – Para a tabela a seguir, calcule o desvio padrão e a variância:
XI FI
10 4
12 10
14 6
Total 20
Siga os passos:
1. Calcule a média ponderada dos valores.
2. Subtraia a média de cada um dos valores da amostra. Eleve cada resultado ao quadra-
do. Multiplique-o pelo valor da frequência simples correspondente.
3. Some todos eles.
4. Como estamos trabalhando com uma amostra, dividiremos este resultado por n –1.
Este é o valor da variância.
5. Tire a raiz quadrada deste resultado e encontre o desvio padrão.
XI FI XI. FI (XI-MÉDIA)²FI
10 4 (10x40)=40 (10–12,2)².4=19,36
12 10 (12x10)=120 (12–12,2)².10=0,4
14 6 (14x6)=84 (14–12,2)².6=19,44
capítulo 4 • 105
4.3.4 Cálculo do desvio padrão para dados tabelados sem classes
de uma população
∑ ( X i − X ) fi
2
σ=
n
EXEMPLO
Exemplo 7 – Para a tabela a seguir, calcule o desvio padrão e a variância:
CLASSES FI
2 ---| 4 9
4 ---| 6 15
6 ---| 8 11
TOTAL 35
2
Siga os passos:
1. Calcule a média ponderada dos valores. Como estamos trabalhando com classes, será
preciso calcular o ponto médio de cada classe. Este será usado como xi na fórmula da média
e do desvio padrão.
2. Subtraia a média de cada um dos valores da amostra. Eleve cada resultado ao quadra-
do. Multiplique-o pelo valor da frequência simples correspondente.
3. Some todos eles.
4. Como estamos trabalhando com uma amostra, dividiremos este resultado por n –1.
Este é o valor da variância.
5. Tire a raiz quadrada deste resultado e encontre o desvio padrão.
106 • capítulo 4
4.3.6 Cálculo do desvio padrão para dados tabelados com classes
de uma população
∑ ( X i − X ) fi
2
σ=
n
σ
CV = ⋅ 100% ⇒ Para dados populacionais
X
S
CV = ⋅100% ⇒ Para dados amostrais
X
capítulo 4 • 107
EXEMPLO
Exemplo 8 – Um teste foi aplicado a dois grupos de 50 alunos e apresentou os seguin-
tes resultados:
108 • capítulo 4
68% das medidas estão entre x±s
1
e−(1 2 ) ( x −µ )
2
f (x) = σ
σ 2π
EXEMPLOS
Exemplo 9 – Para entender melhor a regra empírica, aqui está uma curva normal. Supondo
a curva simétrica, com média igual a 60 e desvio padrão igual a 10, segue:
• Entre 50 e 60, temos 68% dos valores observados.
• Entre 40 e 80, temos 95% dos valores observados.
• Entre 30 e 90, temos 99,7% dos valores observados.
• Como a curva é simétrica, temos 50% dos valores acima da média e 50% dos valores
abaixo da média.
• Entre 30 e 40, temos 2,5% das observações.
capítulo 4 • 109
• Entre 40 e 50, temos 13,5% das observações.
• Entre 50 e 60, temos 34% das observações.
• O mesmo raciocínio se repete à direita da média.
Histograma
7
fi
6
5
4
3
2
1 34% 34%
2,5%13,5% 13,5% 2,5%
0
0 10 20 30 40 50 60 70 80 90 100
xi
68%
2,5% 95% 2,5%
99,7%
Exemplo 10 – Uma pesquisa feita com jovens de 25 anos na cidade de Brasília mostrou que
eles têm em média 1,76 m de altura com 8 cm de desvio padrão. Supondo esta distribuição
em formato de um monte, use a regra empírica do desvio padrão e calcule a probabilidade
de um jovem ter:
a) mais de 1,92 m de altura.
b) menos de 1,52 m de altura.
c) altura entre 1,68 e 1,84 m.
d) altura entre 1,92 e 2,00 m.
e) menos de 1,76 m de altura.
Solução: construindo o gráfico da curva normal para média igual a 176 cm e desvio
padrão de 8 cm, temos:
110 • capítulo 4
fi
8
7
6
5
4
3
2
1
0
152 160 168 176 184 192 200
68%
95%
99,7%
ATIVIDADES
01. Numa família de 7 pessoas (pai, mãe, quatro filhos e avó), a variável X representa a idade
em anos completos dessa família. As idades são: 45, 44, 21, 18, 16, 10 e 70. Calcule a média
aritmética, a mediana, a moda, o desvio padrão e a variância.
capítulo 4 • 111
03. Na tabela, estão as quantidades de telefonemas recebidos por um médico durante uma
semana. Calcule a média, a mediana, a moda e o desvio padrão da variável X = número de
chamadas por dia recebidas pelo médico naquela semana.
04. A idade dos 6 jogadores de uma equipe de vôlei é, individualmente,:28, 27, 28, 31, 25 e
28 anos. Calcule a média, a mediana, a moda e o desvio padrão dessa variável.
112 • capítulo 4
08. Dados os conjuntos de números:
A = { 1 000; 1 001; 1 002; 1 003; 1 004; 1 005 }
B = { 0; 1; 2; 3; 4; 5 }
podemos afirmar:
a) O desvio padrão de A é igual a 1 000 vezes o desvio padrão de B.
b) O desvio padrão de A é igual ao desvio padrão de B.
c) O desvio padrão de A é igual ao desvio padrão de B multiplicado pelo quadrado de
1 000.
d) O desvio padrão de A é igual ao desvio padrão de B dividido por 1 000.
e) O desvio padrão de A é igual ao quadrado do desvio padrão de B.
10. A distribuição de frequências dos pesos de cem operários de uma fábrica é a seguinte:
capítulo 4 • 113
13. Examinando a figura, podemos afirmar que:
B
A
0 xa xb x
14. Numa classe de 25 alunos, há 2 que não tem irmãos, 8 que tem 1 irmão cada um, 11 que
tem 2 irmãos cada um, 2 que tem 3 irmãos cada um, um com 4 irmãos e um com 5 irmãos.
A distribuição de frequência da variável él X = número de irmãos. Calcule a média, a moda,
a mediana o desvio padrão.
16. As notas dos alunos de uma classe, em um teste que valia 4 pontos, foram: 3, 2, 2, 1,
4, 1, 0, 4, 3, 2, 3, 3, 4, 1, 1, 2, 2, 2, 0, 4, 1, 2, 3, 3, 3, 3, 1, 4, 0, 2, 2, 4, 3, 0, 2. Faça a tabela
de distribuição de frequências e calcule a média, a mediana, a moda e o desvio padrão das
notas, sendo X a nota dos alunos.
N.º DE
SALÁRIOS
EMPREGADOS
8.000 12
12.000 5
20.000 3
114 • capítulo 4
a) a) Qual é o salário médio dos empregados dessa empresa?
b) b) A empresa vai contratar um diretor geral e não gostaria de que a nova média salarial
superasse R$12.000. Qual é o salário máximo que ela pode oferecer ao diretor?
c) c) calcule o desvio padrão incluindo o salário deste novo diretor.
18. Num feriado prolongado, 200 000 mil carros desceram para as praias do litoral. Sabendo
que 10% dos carros tinham só o motorista, 20% tinham 2 pessoas, 20% tinham 3 pessoas,
30% tinham 4 pessoas e 20% tinham 5 pessoas, em média quantas pessoas havia por carro?
19. Numa classe, 45% dos alunos são rapazes que pesam em média 52 Kg. Sabendo que
as moças pesam em média 42 Kg, qual o peso médio de todos os alunos da classe?
20. Consideremos a tabela a seguir e vamos calcular a média, a mediana, a moda e o desvio
padrão da variável X = peso em gramas de cada criança. Calcule o desvio padrão, a mediana
e a moda.
CLASSES FI
2460 –| 2580 2
2580 –| 2700 5
2700 –| 2820 7
2820 –| 2940 10
2940 –| 3060 12
3060 –| 3180 6
3180 –| 3300 5
3300 –| 3420 3
21. O professor de Estatística de uma faculdade experimentou dar uma prova sem limite de
tempo para os alunos. Os alunos gastaram os minutos indicados na tabela. Calcule a media-
na, a moda, o desvio padrão e o coeficiente de variação.
capítulo 4 • 115
22. Dados os conjuntos A={10,11,12,13} B={9,8,11,15} e C={6,8,10,12}, faça o que se
pede. Qual conjunto possui maior desvio padrão? Qual é esse valor? (R=2,68). Se aumen-
tarmos cada elemento do conjunto A em 2 unidades, os do conjunto B em 1 unidade, o
conjunto C permanecendo fixo, qual deles terá a menor variância e qual seu valor? (R=1,25).
Tomando todos os números dos conjuntos A, B e C e formando um único conjunto, determine
a mediana e a moda.
23. Uma empresa tem suas faixas salariais conforme a tabela a seguir. Deseja-se contratar
dois gerentes pagando salários iguais para ambos, mas a média da folha de pagamento
não pode ultrapassar R$1.000. Qual deve ser o salário máximo oferecido aos gerentes?
(R= R$ 7.055,00). Calcule o desvio padrão incluindo os dois gerentes.
24. Aplicou-se uma prova a certa turma em que a média final foi 6,5. Sabendo que a média
dos rapazes foi de 4,5 e das moças foi 8, pergunta-se: qual é a porcentagem de moças que
fizeram a prova?
25. O Condomínio Novo Mundo tem 20 apartamentos com 4 quartos, 35 com 3 quartos,
40 com 2 quartos e 85 com 1 quarto. Calcule a média, a moda, a mediana e o desvio padrão
para a situação, considerando a variável como o número de quartos.
26. Uma empresa dividiu seus funcionários em classes de idade em que o intervalo de cada
classe era 4 anos. Sabendo-se que o mais jovem possuía 21 anos e o mais velho 60 anos e
a frequência de classes da menor idade para a maior era 3, 8, 4, 6, 10, 5, 3, 8, 4, 1, calcule a
mediana e o desvio padrão.
27. Para conhecer o número de horas por semana que os principais executivos das maiores
empresas trabalham, a empresa de consultoria realizou uma pesquisa com 12 executivos
116 • capítulo 4
escolhidos aleatoriamente dentre as quinhentas maiores empresas. Calcular a média e o
desvio padrão da seguinte amostra.
60 66 64 62 58 62 62 60 62 60 64 66
28. A seguir, está o tempo, em segundos, medido em 5 testes para dois nadadores em
100 metros nado livre. Calcule o tempo médio, o desvio padrão e o coeficiente de varia-
ção para cada atleta. Baseando-se no CV, qual deles demonstrou um comportamento
mais constante?
29. Supondo duas ações – Petrobrás e Natura – com retornos médios iguais a 32,5% e
28,7% ao ano respectivamente e desvios iguais a 5% e 4% ao longo dos últimos 5 anos,
encontre a ação de maior risco.
31. Ao comparar os retornos anuais de duas ações, a que apresentar maior coeficiente de
variação apresentará maior risco. A tabela a seguir registra o retorno da ação A e da ação
B durante 5 anos. Calcule o coeficiente de variação para cada ação. Determine a ação de
maior risco.
AAÇÃO A AAÇÃO B
9% 12%
10% 10,5%
12% 9,5%
10,5% 11%
9,5% 12,5%
capítulo 4 • 117
32. Os valores abaixo representam o lucro em % de 50 empresas no ano passado. Calcule
a média e o desvio padrão. Encontre a quantidade de valores que estão entre os intervalos
x ± s , x ± 2s e x ± 3s . Indique-os em forma de porcentagem. Compare esses resultados
com os obtidos pela regra empírica.
33. Um fabricante de baterias de automóvel diz que a média de tempo de vida de suas bate-
rias tipo A é de 60 meses. A garantia é dada para 36 meses. Supondo um desvio padrão de
10 meses e a distribuição de frequências em formato de um monte, responda às questões.
• Qual porcentagem de baterias irá durar mais de 50 meses?
• Qual porcentagem de baterias irá durar menos de 40 meses?
• Supondo que sua bateria dure 37 meses, o que você poderia inferir sobre os parâmetros
divulgados pelo fabricante?
34. O comprador de uma fábrica de tábuas de madeira precisa decidir-se sobre a compra
de um pedaço de terra contendo 5.000 pinheiros. Se, pelo menos, 1.000 árvores possuírem
40 pés de altura, a terra será comprada; caso contrário, não haverá compra. O proprietário
relata que as árvores têm em média 30 pés com desvio padrão de 3 pés. Baseado nesta
informação, qual será a decisão do comprador?
35. O número de veículos que passam por um cruzamento foi registrado durante um ano
por um engenheiro de trânsito. O objetivo deste estudo é determinar a porcentagem de dias
que passam mais de 425 veículos. Suponha a média igual a 375 veículos por dia e o desvio
padrão de 25 veículos. O que se pode dizer da porcentagem de dias em que passam mais
de 425 veículos?
36. Quando está trabalhando corretamente, a máquina que enche sacos de 25 libras de fari-
nha coloca uma média de 25 libras por saco, com desvio padrão de 0,1 libra. Para monitorar a
118 • capítulo 4
performance da máquina, o inspetor pesa um saco cheio a cada meia hora durante todo o dia.
Se dois sacos consecutivos apresentarem pesos maiores que 2 desvios padrões acima
da média, a máquina será considerada fora de controle e será mandada para um ajuste.
Os dados da tabela abaixo são os pesos medidos ontem. Assumindo que cada parada não
demore mais que 15 minutos, em quais momentos ontem a máquina foi parada para ajuste?
REFLEXÃO
Vimos, nesse capítulo, que tão importante quanto conhecer a média de um conjunto de da-
dos, por exemplo, é determinar o seu grau de variabilidade (ou dispersão). Na maioria dos
estudos que realizamos, deparamo-nos com conjuntos que podem apresentar maior ou me-
nor grau de homogeneidade.
Conjuntos com características de maior homogeneidade tendem a fornecer informações
mais precisas e confiáveis. Imagine, por exemplo, um estabelecimento que diariamente pres-
ta atendimento a seus clientes. Se a quantidade desses clientes variar muito de um dia para
outro, ficará mais difícil determinar o número de funcionários necessários para realizar o
atendimento. Se esse número, no entanto, variar pouco (apresentar-se mais homogêneo) de
um dia para o outro, ficará muito mais fácil montar uma estrutura adequada de atendimento.
LEITURA
Vejam os arquivos anexos, 05curso3seissigma.pdf e 05RISKforSixSigma_PT.pdf , que
tratam da metodologia de controle de qualidade chamada Lean Seis Sigma. Esta é uma me-
capítulo 4 • 119
todologia de melhoria de qualidade e produtividade, mundialmente usada por empresas. Suas
ferramentas baseiam-se em conceitos de média e desvio padrão. O Seis Sigma pretende
identificar e reduzir processos com alta variabilidade. Processos com alta variabilidade têm
grande probabilidade de gerarem produtos fora da especificação do cliente. Um profissional
que atue na área de qualidade pode certificar-se no uso e implantação desta metodologia,
tornando-se um black-belt (faixa preta) no assunto. Também existem no mercado ferramen-
tas de software desenvolvidas para apoiar a implantação desta metodologia, como o software
@Risk.
Sugerimos também a leitura do artigo “E se todos fossem ao cinema ao mesmo tempo?”
do professor Luiz Barco, disponível em:<http://super.abril.com.br/ciencia/lei-regularida-
de-estatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml>. Ele
retrata, de forma bem interessante, a questão da regularidade dos fenômenos relacionados
ao comportamento social.
REFERÊNCIAS BIBLIOGRÁFICAS
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A Estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 2013.
120 • capítulo 4
5
Introdução à
Probabilidade
Nos capítulos anteriores, conhecemos as ferramentas da estatística descritiva
e vimos como organizar e descrever conjuntos de dados por meio de gráficos,
tabelas e medidas resumo, tais como: medidas de posição e dispersão. Obser-
vamos que os resultados obtidos auxiliam na análise e interpretação dos dados.
Neste capítulo, estudaremos conceitos básicos de probabilidade, dando início
ao estudo das ferramentas da estatística indutiva.
Você, certamente, já deve ter feito perguntas cujas respostas dependiam do
cálculo de probabilidades, por exemplo: Qual a probabilidade de chover no pró-
ximo final de semana prolongado? Qual a probabilidade de se acertar a Mega
Sena jogando um cartão com seis números? Qual a probabilidade de as vendas
de determinado produto decrescerem se aumentarmos o preço do produto?
O cálculo destas e de outras probabilidades nos auxiliam na tomada de de-
cisões. Nesse capítulo, introduziremos inicialmente alguns conceitos básicos
da probabilidade. Em seguida, será realizada uma revisão sobre as técnicas de
contagem e, na sequência, aprenderemos a aplicar a regra da soma, da pro-
babilidade condicional e da multiplicação. Por fim, estudaremos o teorema
de Bayes.
OBJETIVOS
Com o estudo dos conceitos abordados neste capítulo, você será capaz de identificar experi-
mentos aleatórios e calcular probabilidades de ocorrência de determinados eventos, usando
as técnicas de contagem e a definição de probabilidade. Deverá também saber aplicar as
regras de adição, multiplicação e probabilidade condicional no cálculo de probabilidades e
ainda a utilizar o teorema de Bayes.
122 • capítulo 5
5.1 Experimentos aleatórios
Acredita-se que a história da probabilidade tenha se iniciado na Idade Média
em função das apostas efetuadas em jogos de azar, por isso, ao procurar expli-
cações sobre o tema, invariavelmente vamos nos deparar com exemplos ligados
a jogos com dados, roletas e cartas de baralho.
A probabilidade lida essencialmente com as chances de ocorrência de dife-
rentes resultados em eventos, apresentando técnicas para o calculá-las.
Por exemplo, compare esses dois eventos:
I – O resultado do lançamento de uma moeda pode ser cara ou coroa.
II – Em uma pesquisa de intenção de voto, 43% dos eleitores preferem o can-
didato A, 37% dos eleitores preferem o candidato B e os restantes 20% dos elei-
tores não sabem em quem votar.
capítulo 5 • 123
5.1.2 Experimento
EXEMPLO
Exemplo 1 – Lançamento de duas moedas
O espaço amostral será: S = {CaCa, CaCo, CoCa, CoCo} em que Ca=Cara e Co=Coroa.
5.1.5 Evento
EXEMPLO
Exemplo 2 – Ao se jogarem duas moedas, este é o evento dos resultados que têm exata-
mente apenas uma cara: A = {CaCo, CoCa}.
124 • capítulo 5
5.1.7 Evento composto
EXEMPLO
Exemplo 3 – O complemento de A é o conjunto B = {CaCa,CoCo}.
capítulo 5 • 125
5.1.11 Eventos coletivamente exaustivos
Ocorre quando a união dos eventos forma o espaço amostral, no qual cada
evento pode ter elementos repetidos no outro. A união deles é 1.
EXEMPLO
Exemplo 4 – Analisar os resultados do lançamento de uma moeda.
Solução: como o espaço amostral do lançamento de uma moeda tem apenas dois even-
tos, os eventos elementares Ca e Co são mutuamente excludentes, complementares e co-
letivamente exaustivos.
EXEMPLO
Exemplo 6 – A árvore de possibilidades do lançamento de uma moeda três vezes segui-
das será:
126 • capítulo 5
Ca Ca Ca Evento 1
Co Evento 2
Co Ca Evento 3
Co Evento 4
Co Ca Ca Evento 5
Co Evento 6
Co Ca Evento 7
Co Evento 8
5.1.13 Probabilidade
0 ≤ P( A ) ≤ 1
P(S) = 1
→ onde S é o espaço amostral
Se, A ∩ B = ϕ ⇒ P( A ∪ B) = P( A ) + P(B)
capítulo 5 • 127
5.2 Técnicas de contagem
O cálculo efetivo de uma probabilidade depende frequentemente do uso dos
resultados da análise combinatória. A análise combinatória é a parte da mate-
mática que desenvolve técnicas e métodos de contagem. Apresentaremos, nos
itens a seguir, um resumo dos principais resultados dessa área da matemáti-
ca elementar.
Listar ou contar eventos elementares só é um procedimento simples para ex-
perimentos com espaço amostral pequeno, como o lançamento de uma moeda
2 vezes seguidas. Para eventos mais numerosos, precisamos de outras técnicas.
As técnicas de contagem (também conhecidas como análise combinatória)
determinam, sem enumeração direta, o número de resultados possíveis de um
espaço amostral. Observe os exemplos a seguir:
EXEMPLOS
Exemplo 7 – Determinar o número de resultados possíveis do lançamento de um dado 3
vezes seguidas.
Solução: para contar os resultados possíveis, procederemos como segue:
Cada lançamento do dado tem 6 resultados possíveis.
Cada resultado dos 6 resultados do segundo lançamento poderá ser combinado com os
6 do primeiro lançamento, totalizando 36 resultados possíveis.
Cada resultado dos 6 resultados do terceiro lançamento poderá ser combinado com os
36 do segundo lançamento, totalizando 216 resultados.
6 x 6 x 6 = 63 = 216
128 • capítulo 5
5.2.1 Princípio fundamental da contagem
EXEMPLO
Exemplo 9 – Se, em um restaurante, encontrarem-se no cardápio 3 tipos de saladas, 4
pratos quentes e 2 sobremesas, de quantas maneiras diferentes é possível montar uma re-
feição completa?
Solução: 3 x 4 x 2 = 24 maneiras
EXEMPLO
Exemplo 10 – Quantos são os anagramas (diferentes disposições das letras de uma pala-
vra) da palavra ANEL?
capítulo 5 • 129
Solução:
4
3 2 1
possibilidades
possibilidades possibilidades possibilidade
A, N, E ou L
Esses grupamentos ordenados que diferem pela ordem recebem o nome de permuta-
ções simples. Indica-se por Pn o número de permutações simples de n elementos:
Pn = n · (n – 1) · (n – 2) · ... · 3 · 2 · 1
Resumindo:
130 • capítulo 5
No arranjo a ordem em que os objetos aparecem é importante, definem um
novo e distinto objeto. A ordem diferencia o elemento, assim como na permuta-
ção. Dessa forma abc é diferente de bac e de cba e assim por diante.
EXEMPLOS
Exemplo 11 – Usando os algarismos 2, 3, 5, 7, 8 e 9, quantos números naturais de 4 alga-
rismos distintos podemos formar?
Solução:
6 5 4 3
A (n,p ) = n ⋅ (n − 1) ⋅ (n − 2) ⋅ ... ⋅ (n − p + 1)
p ⋅ fatores
capítulo 5 • 131
Usando a notação fatorial:
n!
A ( n,p ) =
(n − p)!
n! n! n!
A n, n = = = = n! = Pn
(n − n)! 0 ! 1
4 4 4
AR4,3= 4 · 4 · 4=43 = 64
Distintos → 4 x 3 x 2 = 24
132 • capítulo 5
Solução:
2 2 2
AR2,3= 2 · 2 · 2 = 23
Assim, podemos generalizar → arranjo com repetição = ARn,p=np
5.2.4 Combinações
EXEMPLO
Exemplo 15 – Ana, Elisa, Rosana, Felipe e Gustavo formam uma equipe. Apenas 2 deles irão
representar a equipe em uma apresentação. Quantas são as possibilidades de representação?
Solução:
As 5 pessoas formam um conjunto. Quantos subconjuntos de 2 pessoas podemos
formar?
Nesse caso, a ordem dos elementos não importa, pois Ana e Elisa é a mesma dupla
que Elisa e Ana.
Então, os subconjuntos de 2 elementos são:
{A; E}, {A; R}, {A; F}, {A; G}, {E; R}, {E; F}, {E; G}, {R; F}, {R; G}, {F; G}
O número total de combinações é 10.
C5, 2 = 10
capítulo 5 • 133
O número total de combinações é 3.
C3,2=3
Seu resultado também pode ser obtido com a seguinte fórmula:
n! A n,p
Cn,p = =
p !(n − p)! p!
Como são subconjuntos de um conjunto, a ordem dos elementos não importa. Só consi-
deramos subconjuntos distintos os que diferem pela natureza dos seus elementos.
Resumindo:
10 ! 10.9.8.7!
Solução: C10,3 = = = 120 = (10 · 9 · 8)/(3 · 2 · 1)=1 · 3 · 4
3!(10 − 3)! 3.2.7!
134 • capítulo 5
5.3.1 Frequência relativa
50,00%
48,00%
Zeros
46,00%
44,00%
42,00%
40,00%
0 200 400 600 800 1000 1200 1400 1600
Lançamentos
Zeros
capítulo 5 • 135
Assim, embora os resultados de um experimento aleatório sejam incertos,
em longo prazo os resultados têm uma distribuição de frequências definida.
Previsões de tempo, resultados eleitorais, mortalidade causada por doenças,
entre outras, são probabilidades calculadas usando-se frequências relativas de
pesquisas estatísticas. Nesses casos, quanto maior for o histórico de dados ana-
lisados, melhor será a previsão.
Depois de se repetir um experimento aleatório um número muito grande de
vezes, a proporção de ocorrência de um dos resultados é denominada probabi-
lidade. Isso é chamado de lei dos grandes números.
Ao aumentar o número de experimentos a frequência relativa de cada even-
to se aproximará do seu valor teórico, de sua probabilidade de ocorrer.
Essa probabilidade é calculada da seguinte forma:
136 • capítulo 5
EXEMPLOS
Exemplo 19 – No lançamento de uma moeda, o espaço amostral tem apenas dois eventos
elementares mutuamente excludentes: cara e coroa. Estes são igualmente prováveis e não
existem condições que estabeleçam preferências ou dependências. A probabilidade de sair
cara é então ½ = 50%.
Exemplo 22 – Qual a probabilidade de sair um “dois”, ao retirar, por acaso, uma carta de um
baralho de 52 cartas?
Num baralho, há 4 cartas “dois”.
capítulo 5 • 137
Usando o diagrama de árvore, temos:
CA CA CA EVENTO 1
CA CA Co EVENTO 2
CA Co CA EVENTO 3
Ca Co Co EVENTO 4
Co CA CA EVENTO 5
Co Ca Co EVENTO 6
Co Co Ca EVENTO 7
Co Co Co EVENTO 8
Seja um espaço amostral finito S={a1, a2 ..., an}. Considere o evento formado por
um simples resultado A={ai}.
A cada evento simples está associada uma probabilidade pi que satisfaz às
seguintes condições:
pi ≥ 0
p1 + p2 + ... + pn = 1
138 • capítulo 5
Aplicando as regras das operações de união e interseção de conjuntos, os
eventos de um mesmo espaço amostral podem ser combinados. Assim, a pro-
babilidade de uma combinação de eventos pode ser obtida das probabilidades
dos eventos, como mostra a seguir a regra da soma de eventos:
26 4 2 28
P( V ∪ A ) = + − = = 0, 5384 = 53, 84%
52 52 52 52
capítulo 5 • 139
Exemplo 26 – Calcular a probabilidade de ocorrer apenas uma cara nos três lançamento
seguidos de uma moeda.
Analisando na árvore de possibilidades apenas os eventos elementares E4, E6 e E7, há
uma cara.
P(E4 ou E6 ou E7) = P(E4) + P(E6) + P(E7) = 1/8 + 1/8 + 1/8 = 3/8 = 0,375 = 37,5%
Exemplo 27 – Continuando com os três lançamentos seguidos de uma moeda. qual a pro-
babilidade de ocorrerem duas ou mais caras?
Analisando na árvore de possibilidades apenas os eventos elementares E1, E2, E3 e E5,
há uma cara.
P(E1 ou E2 ou E3 ou E5) = P(E1) + P(E2) + P(E3) + P(E5) = 1/8+1/8+1/8+1/8
=4/8= 0,5 = 50%
EVENTO
EVENTO TOTAL
C D
A 4 2 6
B 1 3 4
TOTAL 5 5 10
P(A)=
P(D)=
P(C∩B)=
P(A∪D)=
P(B∩D)=
P(B∪C)=
Solução:
P(A)= 6/10
P(D)= 5/10
P(C∩B)= 1/10
P(A∪D)= P(A) + P(D) – P(A∩D) = 6/10 + 5/10 – 2/10 = 9/10
P(B∩D)= 3/10
P(B∪C)= P(B) + P(C) – P(B∪C) = 4/10 + 5/10 – 1/10 = 8/10
140 • capítulo 5
5.4.2 Probabilidade condicional
NCF( X ∩ Y )
P( X ∩ Y ) NTC NCF( X ∩ Y )
P( X / Y ) = = =
P( Y ) NCF( Y ) NCF( Y )
NTC
NCF( X ∩ Y )
P( X / Y ) =
NCF( Y )
EXEMPLOS
Exemplo 29 – Em um baralho, tiramos uma carta preta. Qual a probabilidade de que esta
carta seja um ás?
Solução:
Lê-se da seguinte forma: dado que saiu uma carta preta, qual a chance de elal ser um ás?
P(ás/Preta) = P(ás ∩ Preta) / P(Preta) = (2/52) / (26/52) = 2/26 = 7,69%
capítulo 5 • 141
Exemplo 30
Dada a tabela de ocorrências, qual a probabilidade de os seguintes eventos ocorrerem?
EVENTO
EVENTO TOTAL
C D
A 4 2 6
B 1 3 4
TOTAL 5 5 10
P(A/D)=
P(C/B)=
Solução:
NCF( X ∩ Y )
P( X ∩ Y ) NTC NCF( X ∩ Y )
P( X / Y ) = = =
P( Y ) NCF( Y ) NCF( Y )
NTC
P( X ∩ Y )
P( X / Y ) =
P( Y )
P( X ∩ Y ) = P( X / Y ) ⋅ P( Y )
142 • capítulo 5
P(X e Y) = P(X/Y) . P(Y)
Um evento X é considerado independente de outro evento Y, se a probabi-
lidade de X for igual à probabilidade condicional de X dado Y, isto é, se P(X/Y)
= P(X).
Para eventos independentes então:
P(X e Y) = P(X) · P(Y)
EXEMPLOS
Exemplo 31 – Nos dez lançamentos seguidos de uma moeda honesta, ocorreram dez co-
roas. Se a moeda for lançada mais uma vez, qual a probabilidade de que seja cara?
A probabilidade de o evento X = ser cara continua sendo 50%, pois são eventos
independentes.
Exemplo 32 – Num lote de 12 peças, 4 são defeituosas. Duas peças são retiradas uma após
a outra sem reposição. Qual a probabilidade de ambas serem boas?
A={a primeira peça é boa}
B={ a segunda peça é boa}
8 7 14
P ( A ∩ B ) = P ( A ) ⋅ P (B / A ) = ⋅ = = 0, 424242
12 11 33
2 × 2 × 2 = 8
= 8 possibilidades
3 caras é apenas uma das 8 possibilidades è 1 em 8 è 1/8 = 0,125
capítulo 5 • 143
5.5 Teormea de Bayes
Agora que já estudamos a probabilidade condicional, podemos utilizar o teore-
ma de Bayes, uma importante ferramenta que relaciona a probabilidade condi-
cional com a sua inversa. É também conhecido como o teorema da probabili-
dade a posteriori.
Vemos assim que o teorema de Bayes estabelece a razão entre uma das par-
celas da probabilidade total com a probabilidade total.
A melhor forma de entendê-lo é por meio de um exemplo prático.
EXEMPLOS
Exemplo 34 – Suponha que a previsão do tempo para o próximo feriado seja anunciada em
um jornal:
60% (ou 0,6) de probabilidade de chover;
30% (ou 0,3) de probabilidade de formação de neblina;
10% (ou 0,1) de probabilidade de fazer sol;
e que estudos tenham sido feitos a respeito do número de acidentes nas estradas em
diversas condições climáticas:
30% (0,3) de chance de ocorrerem acidentes em dias de chuva;
20% (ou 0,2) de chance de ocorrerem acidentes em dias com formação de neblina;
10% (ou 0,1) de chance de ocorrerem acidentes em dias de sol.
144 • capítulo 5
Você está programando uma viagem e resolve verificar qual a maior probabilidade de
ocorrerem acidentes nas estradas. Nesse momento, obviamente, lembra-se do teorema
de Bayes.
Inicialmente você calcula a probabilidade total. Para isso, multiplica a probabilidade a
priori de cada situação pela probabilidade condicional:
Imagine agora que você é o engenheiro responsável por uma linha de produção e está
avaliando o desempenho de três máquinas:
Máquina X, responsável por 50% da produção, fornece 1% das peças com defeito.
Máquina Y, responsável por 40% da produção, fornece 2% das peças com defeito.
Máquina Z, responsável por 10% da produção, fornece 3% das peças com defeito.
A empresa comprou uma máquina nova para substituir uma das três antigas e você pre-
cisa dizer qual delas deverá ser substituída. Na mesma hora, lembra-se do teorema de Bayes
e corre para sua mesa:
Inicialmente calcula a probabilidade total:
capítulo 5 • 145
Em seguida, calcula a probabilidade posteriori de cada evento:
Máquina X; 0,005/0,0016 = 0,3125 ou 31,25%
Máquina Y: 0,008/0,016 = 0,5000 ou 50,00%
Máquina Z: 0,003/0,016 = 0,1875 ou 18,75%
Note que a máquina Y, que deverá ser substituída, não era uma opção óbvia, mas, graças
a Bayes, você garantiu o seu emprego.
ATIVIDADES
01. Considere todos os números naturais de 4 algarismos distintos (não pode repetir) que
se pode formar com os algarismos 1,3,4,7,8 e 9. Escolhendo um deles ao acaso, qual é a
probabilidade de sair um número que comece por 3 e termine por 7?
02. Num grupo de 75 jovens, 16 gostam de música, esporte e leitura; 24 gostam de música
e esporte; 30 gostam de música e leitura; 22 gostam de esporte e leitura; 6 gostam somente
de música, 9 gostam somente de esporte; 5 gostam somente de leitura.
a) Qual a probabilidade de, ao apontar ao acaso um desses jovens, ele gostar de música?
b) Qual a probabilidade de, ao apontar ao acaso um desses jovens, ele não gostar de ne-
nhuma dessas atividades?
04. Escolha aleatoriamente (a expressão aleatório indica que os espaços são equiprováveis
– que cada ponto amostral tem a mesma probabilidade) uma carta do baralho com 52 cartas.
Seja A={a carta é de ouros} e B={a carta é uma figura}. Calcular:
a) P(A)
b) P(B)
146 • capítulo 5
05. Três cavalos A, B e C estão em uma corrida. A tem duas vezes mais probabilidade de
ganhar que B; B tem duas vezes mais probabilidade de ganhar que C. Quais são as probabi-
lidades de vitória de cada um? Qual seria a probabilidade de B ou de C ganhar? Não existe
a possibilidade de empate.
06. O quadro abaixo representa a classificação por sexo e por estado civil de um conjunto
de 50 deputados presentes em uma reunião:
07. O quadro abaixo representa a classificação por sexo e por estado civil de um conjunto
de 50 deputados presentes em uma reunião:
capítulo 5 • 147
08. Sabendo que no lançamento de 3 moedas não aconteceram 2 nem 3 coroas, qual a
probabilidade de que as 3 moedas sejam caras?
09. Uma urna contém 3 bolas, duas verdes e uma branca. Duas bolas são retiradas em
sequência, uma por vez com reposição. Calcular a probabilidade de que a segunda bola seja
verde, sabendo que a primeira também foi verde.
11. Em um colégio, os estudantes presentes em uma reunião foram classificados por sexo
e por opção de área de formação segundo o quadro a seguir:
SEXO
OPÇÃO
MASCULINO FEMININO
ADM 10 8
CC 6 5
ECO 8 4
12. Em uma caixa, temos 10 peças das quais 4 são defeituosas. São retiradas duas peças,
uma após a outra, com reposição. Calcular a probabilidade de ambas serem boas.
13. Num grupo de 100 pessoas da zona rural, 25 estão afetadas pela gripe A e 11 pela
gripe B, não se verificando nenhum caso de incidência conjunta de A e B. Duas pessoas
desse grupo são escolhidas aleatoriamente, uma após a outra, sem reposição. Determine a
probabilidade de que, dessa dupla, a primeira pessoa esteja afetada por A e a segunda por B.
Qual a probabilidade de a primeira ter gripe A e a segunda ter gripe B?
148 • capítulo 5
14. Uma urna contém 3 bolas pretas e 5 bolas brancas. Quantas bolas azuis devem ser
colocadas nessa urna de modo que, retirando-se uma bola ao acaso, a probabilidade de que
ela seja azul é igual a 2/3?
15. Considere agora que outra urna contenha 1 bola preta, 4 bolas brancas e x bolas azuis.
Uma bola é retirada ao acaso dessa urna, a sua cor é observada e a bola é devolvida à urna.
Em seguida, retira-se novamente, ao acaso, uma bola dessa urna. Para que valores de x a
probabilidade de que as duas bolas sejam da mesma cor vale ½?
16. Num lote de 12 peças 4 são defeituosas. Duas peças são retiradas aleatoriamente.
Calcule:
a) probabilidade de ambas serem defeituosas.
b) a probabilidade de ambas não serem defeituosas.
c) a probabilidade de ao menos uma ser defeituosa.
17. Uma máquina produziu 50 parafusos dos quais 5 ficaram defeituosos. Ao pegar, ao
acaso, 3 parafusos, qual é a probabilidade de que:
a) os três sejam perfeitos?
b) os 3 sejam defeituosos?
c) pelo menos dois sejam defeituosos?
d) pelo menos 1 seja defeituoso?
18. Um certo programa pode ser usado com uma entre duas sub-rotinas A e B, dependendo
do problema. A experiência tem mostrado que a sub-rotina A é usada em 40% das vezes e
B é usada em 60% das vezes. Se a sub-rotina A for usada, haverá 75% de chance de que o
programa chegue a um resultado dentro do limite de tempo. Se a sub-rotina B for usada, a
chance será de 50%. Considerando que o programa foi realizado dentro do limite de tempo,
qual a probabilidade de que a sub-rotina A tenha sido escolhida?
REFLEXÃO
O estudo de probabilidades que iniciamos neste capítulo tem muitas aplicações no dia a
dia do engenheiro. Até o momento, a nossa preocupação foi apresentar a teoria referente
ao assunto, no entanto as aplicações que podemos fazer do cálculo de probabilidades são
muito diversificadas: determinar a margem de erro e o grau de confiança de uma pesquisa,
capítulo 5 • 149
fazer previsões (com certo grau de confiança) de eventos futuros, auxiliar na tomada de
decisões, calcular riscos de certos investimentos, entre outros. Procure assimilar bem todos
os procedimentos e conceitos apresentados neste capítulo para que possa acompanhar o
desenvolvimento dos métodos que serão apresentados mais adiante.
LEITURA
Recomendamos a leitura do texto “É possível quantificar o acaso?”, disponível no endereço:
<http://www.klick.com.br/materia/20/display/0, 5912,POR-20-89-957-,00.html>, que
apresenta uma interessante situação sobre o estudo de probabilidades.
REFERÊNCIAS BIBLIOGRÁFICAS
DEVORE, Jay L. Probabilidade e estatística: para engenharia e ciências. São Paulo: Pioneira
Thomson Learning, 2006.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 2013.
150 • capítulo 5
6
Distribuições de
Probabilidade
Quando o espaço amostral de um experimento não é constituído por números,
não podemos usar os recursos da estatística descritiva (vimos na última aula
que espaço amostral é o conjunto formado por todos os possíveis e diferen-
tes resultados de um experimento aleatório.) Para resolver este caso, precisa-
mos estabelecer uma função que transforme o espaço amostral não numérico
em numérico.
Por exemplo, ao se lançar uma moeda e registrar a face superior, teremos
um espaço amostral S = {ca; co} não numérico.
Neste capitulo, veremos como transformar um espaço amostral não numé-
rico em numérico, estudando as variáveis aleatórias e suas funções de probabi-
lidade. Aprenderemos também a calcular a esperança matemática e a variância
de variáveis aleatórias.
Quando aplicamos a estatística na resolução de problemas, é comum veri-
ficar que algumas situações têm características semelhantes que se repetem.
Nesses casos, podemos estabelecer modelos matemáticos que nos ajudarão
nas soluções.
1. Os modelos trabalham com os seguintes componentes:
2. Os possíveis valores que a variável aleatória pode assumir.
3. A função de probabilidade associada a ela.
4. O valor esperado
5. A variância e o desvio padrão estimados
152 • capítulo 6
OBJETIVOS
Ao final deste capitulo, você deverá ser capaz de:
• Definir uma variável aleatória.
• Associar funções de probabilidade a variáveis aleatórias.
• Calcular a esperança matemática e a variância de variáveis aleatórias.
• Utilizar as propriedades e operações inerentes às variáveis aleatórias.
• Aplicar modelos discretos de probabilidade.
• Utilizar a distribuição de Benoulli para solucionar problemas.
• Tomar decisões baseadas na aplicação da distribuição binomial para a resolução
de problemas.
• Identificar o momento em que a distribuição de Poisson deve ser usada.
• Calcular probabilidades baseadas na distribuição de Poisson.
• Aplicar o modelo contínuo de probabilidade: distribuição normal.
• Resolver problemas de probabilidade que envolvem a distribuição normal.
• Interpretar o gráfico da distribuição normal.
capítulo 6 • 153
6.1 Variável Aleatória Discreta
Quando o espaço amostral S de um experimento não é constituído por núme-
ros, não podemos usar os recursos da estatística descritiva. Para resolver este
caso, estabelecemos uma função que transforme o espaço amostral não numé-
rico em numérico.
EXEMPLOS
Exemplo 1: ao lançarmos uma moeda e registrar a face superior, geramos um espaço amos-
tral S = {ca; co} → não numérico.
Criamos, então, uma função de x, representada por f(x), em que a variável aleatória x
assumirá valores numéricos correspondentes a cada ocorrência do espaço amostral.
S ___________ R
ca ___________ x(ca) = 0
co ___________ x(co) = 1
Exemplo 2: no lançamento de dois dados, a observação das faces superiores cria o espaço
amostral S={(1,1), (1,2), ... , (3,1), (3,2), ..., (6,5), (6,6)}, que não é representado por um número
real. Para isso, estabelecemos a variável aleatória x que anota a soma das faces superiores
dos dois dados gerando o seguinte espaço amostral S = {2, 3, 4, 5 ,6, 7, 8, 9, 10, 11, 12}.
154 • capítulo 6
Muitas variáveis aleatórias podem ser definidas para um mesmo experimento. A definição
da variável aleatória deve ser aquela que interessa à solução do problema abordado. No ex-
perimento anterior, poderíamos ter estabelecido, por exemplo, que x é a variável que anota o
produto das faces dos dois dados ou a diferença das faces ou quantas faces pares aparecem
e assim por diante.
Para cada variável aleatória, podemos definir uma função de probabilidade as-
sociada a ela.
EXEMPLOS
Exemplo 3: no lançamento de uma moeda, x é a variável aleatória que anota o número de
coroas obtidas. A função de probabilidade para esta variável é:
X P(X)
CA 0 0,5
CO 1 0,5
TOTAL 1
Exemplo 4: no lançamento de dois dados, a variável x anota a soma das faces superiores.
Sua função de probabilidade é:
FREQUÊNCIA
X FREQ. RELATIVA P(X)
SIMPLES
2 1 0,027778
3 2 0,055556
4 3 0,083333
5 4 0,111111
6 5 0,138889
7 6 0,166667
8 5 0,138889
9 4 0,111111
10 3 0,083333
11 2 0,055556
12 1 0,027778
TOTAL 36 1
capítulo 6 • 155
Sua representação gráfica é:
p(x)
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
2 3 4 5 6 7 8 9 10 11 12
em que
E(x) = expectativa de média = esperança matemática da variável x
156 • capítulo 6
Fazendo uma analogia com a fórmula da média de amostra e lembrando
que p(x) = número de casos favoráveis / número total de casos , temos:
∑ x i ⋅ fi = x ⋅ fi ⇒ x ⋅ p( x ) = µ
x= ∑ i n ∑ i i
∑ fi
Observe que:
A mesma analogia feita no item anterior para a média vale para a variância e
para o desvio padrão. Assim:
∑ ( x i − x )2 ⋅ fi → σ2 =
s2 =
n
∑ ( x i − µ)2 ⋅ p( x i ) = Variância
Para o desvio padrão a fórmula é: σ = ∑ ( x i − µ)2 ⋅ p( x i )
EXEMPLOS
Exemplo 5: no lançamento de uma moeda, a variável aleatória x anota o número de caras
obtidas. Calcule a média, a variância e o desvio padrão da variável aleatória x.
capítulo 6 • 157
Exemplo 6: no lançamento de dois dados, a variável aleatória x anota a soma dos pontos da
face superior. Calcule a média, a variância e o desvio padrão da variável aleatória x.
µ = ∑ x i ⋅ p( x i ) = K ⋅ 1 = K
O valor esperado de x é K.
3 – Se uma variável aleatória y for dada por y = ax+b, onde a e b são números
reais e x é outra variável aleatória, então: µ( y ) = a ⋅ µ( x ) + b
158 • capítulo 6
6.2.4 Propriedades da Variância
σ2 = ∑ (k − k )2 ⋅ p(k ) = ∑ 02 ⋅ 1
σ2 = 0
3 – Se uma variável aleatória y for dada por y = ax+b, em que a e b são núme-
ros reais e x é outra variável aleatória, então:
σ2 ( y ) = a 2 σ2 ( x )
µx± y = µx ± µ y
e
σ2 x ± y = σ2x + σ2y
σ x ± y = σ2x + σ2y
capítulo 6 • 159
EXEMPLO
Exemplo 7– Se a variável aleatória x apresentar µ( x ) = 10 e σ( x ) = 3 calcule:
µ( 3x )
µ(2x + 1)
µ(5x − 3)
3 4
µ( − x + )
5 3
µ( 3x ) = 3µ( x ) = 3.10 = 30
µ(2x + 1) = 2µ( x ) + 1 = 2.10 + 1 = 21
µ(5x − 3) = 5µ( x ) − 3 = 5.10 − 3 = 47
3 4 ( −18 + 4)
µ( − x + ) = −3 / 5µ( x ) + 4 / 3 = −3.2 + 4 / 3 = = −14 / 3
5 3 3
σ2 (2x )
σ2 (5x − 10)
σ2 ( −3x + 200)
2
σ2 ( x − 4)
5
EXERCÍCIOS RESOLVIDOS
01. (MEDEIROS – v. 1, pág. 153, ex. 3) O experimento consiste no lançamento de duas
moedas e na observação do número de caras obtidas neste lançamento. Determine o espaço
amostral do experimento e a função de probabilidade.
160 • capítulo 6
02. (MEDEIROS – v. 1, pág. 154, ex. 4) O experimento consiste no lançamento de dois da-
dos e na observação da soma dos pontos das faces superiores. Determine o espaço amostral
do experimento e a função de probabilidade.
03. (MEDEIROS – vol. 1, pág. 156, ex. 8) O experimento consiste em lançar 3 moedas e ob-
servar a diferença entre o número de caras e o número de coroas obtidos neste lançamento.
Determine a função de probabilidade.
04. (MEDEIROS – vol. 1, pág. 156, ex. 9) O experimento consiste em retirar ao acaso uma
bola de uma urna que contém 20 bolas iguais em peso e volume, sendo 5 bolas brancas, 8
pretas e 7 amarelas, e anotar sua cor. Determine a função de probabilidade.
05. (MEDEIROS – vol 1, pág. 156, ex. 10) O espaço amostral de um experimento é
S={1,2,7,10}. Sabendo que as probabilidades de ocorrência destes valores são diretamente
proporcionais aos respectivos valores, determine a função de probabilidade associada a este
espaço amostral.
06. (Ex. 4 Medeiros 2 – pág. 16) No lançamento de dois dados, a variável aleatória x anota,
em módulo, a diferença dos pontos das faces superiores. Determine os valores de x e a fun-
ção de probabilidade associada.
07. (Ex. 6 Medeiros 2 – pág. 16) Uma carta é retirada aleatoriamente de um baralho comum
de 52 cartas e a variável X anota o número de damas obtidas nesta retirada. Determine os
valores de x e a função de probabilidade associada.
08. (Ex. 7 Medeiros 2 – pág. 17) Duas cartas são retiradas aleatoriamente, sem reposição,
de um baralho comum de 52 cartas e a variável X anota o número de valetes obtidos nesta
retirada. Determine os valores de x e a função de probabilidade associada.
09. (Ex. 8 Medeiros 2 – pág. 17) Uma urna A contém 3 bolas brancas e 2 pretas. A urna
B contém 5 bolas brancas e 1 bola preta. Uma bola é retirada ao acaso de cada urna e a
variável aleatória x anota o número de bolas brancas obtidas. Determine os valores de x e a
função de probabilidade associada.
10. (Ex. 9 Medeiros 2 – pág. 17) Uma urna A contém 3 bolas brancas e 4 pretas. A urna
B contém 2 bolas brancas e 3 bolas vermelhas. Uma bola é retirada ao acaso da urna A e
capítulo 6 • 161
colocada na urna B. Em seguida, retira-se ao acaso uma bola da urna B. A variável aleatória
x anota o número de bolas brancas obtidas nesta última extração. Determine os valores de x
e a função de probabilidade associada.
11. (Ex. 10 Medeiros 2 – pág. 17) Uma urna contém 3 peças boas e duas defeituosas.
Uma a uma as peças são retiradas da urna, sem reposição e analisadas. O experimento se
encerrará quando a segunda peça defeituosa for analisada. A variável aleatória x anota o
número de peças retiradas da urna ao se encerrar o experimento. Determine os valores de x
e a função de probabilidade associada.
12. (Ex. 1 Medeiros 2 – pág. 24) Calcule a média, a variância e o desvio padrão para a va-
riável aleatória x a seguir:
R: E(x)=5,2; Variância=6,96; Desvio padrão=2,64
X P(X)
2 0,3
5 0,4
8 0,2
10 0,1
Total
13. (Ex. 2 Medeiros 2 – pág. 24) Calcule a média, a variância e o desvio padrão para a va-
riável aleatória x a seguir:
R: E(x)=0,4m; Variância=2,24; Desvio padrão=1,5
X P(X)
–1 0,4
0 0,2
1 0,2
3 0,2
Total
14. (Ex. 4 Medeiros 2 – pág. 24) Uma confeitaria produz cinco bolos em determinado dia.
As probabilidades de não se vender nenhum e de se vender(em) um, dois, três, quatro ou
cinco valem respectivamente 1%, 5%, 20%, 30%, 29% e 15%. O custo total de cada bolo
162 • capítulo 6
é de 10 u.m. e o preço unitário de venda é de 20 u.m. Calcule o lucro médio, a variância e o
desvio padrão.
15. (Ex. 5 Medeiros 2 – pág. 24) Um negociante espera vender um automóvel até sexta
feira. A expectativa de que venda na segunda é de 50%, na terça de 30%, na quarta feira é
de 10%, na quinta é de 5% e na sexta é de 5%. Seu lucro é de 3 mil u.m. se vender na se-
gunda e diminui 40% a cada dia. Calcule o valor esperado de lucro nesta venda, a variância
e o desvio padrão.
R: E(x)=2.199,84 um; Variância=777.897,44 um²; Desvio padrão=881,98 um.
16. (Ex. 6 Medeiros 2 – pág. 24) Um produto deverá ser lançado no mercado no próximo
ano. A expectativa do departamento de marketing de que o projeto seja bem-sucedido é de
80%. Neste caso, o retorno esperado em sua vida útil é de 100 mil u.m. Se isto não acontecer,
o prejuízo deverá chegar a 50 mil u.m. Calcule o lucro médio, a variância e o desvio padrão.
R: E(x)=70.000,00 um Variância=3.600.000.000,00 um² Desvio padrão=60.000,00 um
17. (Ex. 7 Medeiros 2 – pág. 24) O trem do metrô para no meio do túnel. O defeito pode ser
na antena receptora ou no painel de controle. Se o defeito for na antena receptora o conserto
poderá ser feito em 5 minutos. Se o defeito for no painel, o conserto poderá ser feito em 15
minutos. O encarregado da manutenção acredita que a probabilidade do defeito ser no painel
é de 60%. Qual a expectativa do tempo de conserto?
R: E(x)=11 min.
18. (Ex. 8 Medeiros 2 – pág. 24) Um vendedor prepara quatro visitas e espera vender 1000
u.m. em cada uma delas. A expectativa de vendas em cada cliente é de 80%, independente-
mente. Qual o valor esperado de vendas deste vendedor?
R: E(x) = 3.200,00 u.m.
19. (Ex. 9 Medeiros 2 – pág. 24) Uma máquina fabrica placas de papelão que podem apre-
sentar nenhum, um, dois, três ou quatro defeitos, com probabilidade de 90%, 5%, 3%, 1% e
1% respectivamente. O preço de venda de uma placa perfeita é de 10 u.m. e, à medida que
apresente defeitos, seu preço cai 50% para cada defeito apresentado. Qual é o preço médio
de venda dessas placas?
R: E(x) = 9,34 u.m.
capítulo 6 • 163
20. (Ex. 10 Medeiros 2 – pág. 25) Uma prensa de fraldas descartáveis produz quatro mode-
los: A, B, C e D. A tabela a seguir anota as proporções fabricadas, a expectativa de vendas
de cada tipo, os lucros correspondentes e as peças vendidas. A peça não comercializada é
reaproveitada com um custo adicional. Qual o retorno esperado por unidade?
21. (Ex. 1 Medeiros 2 – pág. 30) Uma variável aleatória x assume os valores 2; 3 e 5 com
probabilidades 0,30, 0,50, e 0,20 respectivamente. Calcule o valor esperado e o desvio
padrão de y = 2x +5.
(Ex. 2 Medeiros 2 – pág. 30) Dada a variável aleatória
X P(X)
–1 0,2
2 0,3
5 0,4
8 0,1
4
calcule a média e o desvio padrão da variável y = x−3
3
µ( 2 x )
σ2 (2x )
µ( 3x − 2)
σ(4x − 3)
23. (Ex. 4 Medeiros 2 – pág. 30) Um produto é embalado em caixas de papelão que pesam
em média 200 gramas com desvio padrão de 10 gramas. Cada caixa contém seis unidades
do produto. O peso médio de cada unidade é 1 kg, com desvio padrão de 5 g. Calcule o peso
médio e o desvio padrão de uma caixa cheia.
164 • capítulo 6
24. (Ex. 5 Medeiros 2 – pág. 30) O custo fixo de produção de um bem é de 10.000 u.m. O
custo unitário variável de produção é uma variável aleatória com média de 5 u.m. e desvio
padrão de 0,2 u.m. O preço unitário de venda do bem é outra variável aleatória com média de
20 u.m e desvio padrão de 1,5 u.m. Determine:
a) o custo médio de produção para 1 000 unidades e o desvio padrão correspondente.
b) a receita média e o desvio padrão para 1 000 unidades vendidas.
c) o lucro médio e o desvio padrão para 1 000 unidades vendidas.
m(x) = p
capítulo 6 • 165
Lembre que p = 1–q e que p+q = 1
σ² (x) = p²·(1-p) + (1-p)²·p =
σ² (x) = p(1–p) (p+(1–p)) =
σ² (x) = pq (p+q) = pq(1) =
A variância é σ²(x) = p · q
e o desvio padrão é: σ( x ) = p ⋅ q
EXEMPLOS
Exemplo 9 – No lançamento de uma moeda, a variável aleatória x anota o número de caras
obtidas. Determine a média, a variância e o desvio padrão da variável aleatória x.
Se a variável se interessar por caras, então sair cara é sucesso e está associado ao valor
1 com probabilidade p. Sair coroa é fracasso e está associado ao valor 0 e à probabilidade
q. Como só temos duas possibilidades igualmente prováveis, p e q assumirão o valor 05 ou
½. Este é um caso em que se pode aplicar o modelo de Bernoulli. É a única repetição de um
experimento que só pode assumir dois resultados: ou é cara ou não é cara. Então:
E( x ) = µ = p = 0, 5
σ2 ( x ) = p ⋅ q = 0, 5.0, 5 = 0, 25
σ( x ) = pq = 0, 25 = 0, 5
166 • capítulo 6
O problema informa que a variável registra o número de faces 3 obtidas. No lançamento
de um dado, podemos obter ou não a face 3. Os possíveis resultados de x são: 0 para não ser
cara com probabilidade q = 5/6 e 1 para ser cara com probabilidade p =1/6. Este é um
caso em que se pode aplicar o modelo de Bernoulli. Então:
E( x ) = µ = p = 1
6
1 5 5
σ ( x) = p ⋅ q = ⋅ =
2
6 6 36
5 5
σ( x ) = pq = =
36 6
Exemplo 11 – Uma carta é retirada ao acaso de um baralho com 52 cartas. A variável alea-
tória x anota o número de damas obtidas nesta retirada. Determine a média, a variância e o
desvio padrão da variável aleatória x.
A variável x se interessa por damas na extração de uma carta de um baralho. Esta carta
poderá então ser ou não ser dama. Os possíveis resultados de x são 1 ou 0 respectivamente,
com probabilidades de sucesso p =4/52 ou probabilidade de fracasso q=48/52 . Este é um
caso em que se pode aplicar o modelo de Bernoulli. Então:
E( x ) = µ = p = 4
52
4 48 1 12 12
σ2 ( x ) = p ⋅ q = ⋅ = ⋅ =
52 52 13 13 169
12 12
σ( x ) = pq = = = 26, 65%
169 13
capítulo 6 • 167
P[(4 ∩ 4 ∩ n) ∪ (4 ∩ n ∩ 4) ∪ (n ∩ 4 ∩ 4)] =
1 1 5 1 5 1 5 1 1
= ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ =
6 6 6 6 6 6 6 6 6
2 1
1 5
= 3⋅ ⋅ = 0, 069 = 6, 9%
6 6
n!
Cnx =
(n − x )! x !
3!
C32 = =3
(3 − 2)!2!
Descrição:
x : 0,1, 2,3,..., n
P( x = K ) = Cnk pk qn −k onde K = 0,1,..., n
µ( x ) = np
σ2 ( x ) = n ⋅ p ⋅ q
σ( x ) = n ⋅ p ⋅ q
0 ″ x″ n
168 • capítulo 6
EXEMPLOS
Exemplo 12 – O gerente de uma loja estima que, de dez vendas realizadas, três são micro-
computadores e sete são equipamentos eletrônicos em geral. Qual a probabilidade de que
uma das quatro próximas vendas seja um microcomputador?
4!
P( x = 1) = C14 0, 310, 73 = ⋅ 0, 31 ⋅ 0, 73 = 0, 4116 = 4116
, %
3!.1!
Chegamos ao mesmo resultado de maneira mais rápida, pois não foi preciso determinar
todas as combinações possíveis. Bastou calcular quantas eram as combinações possíveis.
Exemplo 13 – Uma prova é constituída de 20 questões, cada uma com cinco alternativas,
das quais apenas uma é correta. Se um estudante responder às questões ao acaso, qual a
probabilidade de acertar exatamente 10 questões?
capítulo 6 • 169
O experimento consiste em responder a uma questão.
Pode ter dois resultados:
x : 0, 1, 2, 3, ..., 20
10 20 −10 10 20 −10
20 1 4
p( x = 10) = Cnkpk qn−k = C10 =
20 ! 1 4
⋅
5 5 10 !.10 ! 5 5
p( x = 10) = 184756.10 , 24 ⋅10−7 ⋅ 0,1073742 = 0, 2031%
Exemplo 14 – Uma empresa produz 10% de peças defeituosas. As peças são embaladas
em caixas que contêm 12 peças. Calcule a probabilidade de um cliente comprar uma caixa:
a) sem nenhuma peça defeituosa;
b) com uma peça defeituosa.
x : 0,12
, , 3,...,12
12 !
0 ( 0,1) ( 0, 9 ) . ( 0,1) ( 0, 9 )
0 12 0 12
P( x = 0) = Cnkpk qn−k = C12 =
0 !.12 !
P( x = 0) = 28, 24295%
ou
p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B)) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) = 0, 912
170 • capítulo 6
b) Queremos uma peça defeituosa:
x : 0,12
, , 3,...,12
12 !
1 ( 0,1) ( 0, 9 ) = . ( 0,1) ( 0, 9 )
1 11 1 11
P( x = 1) = Cnkpk qn−k = C12
1!.11!
P( x = 1) = 37, 65727%
ou
12.[p(D) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B)] =
= 12.0,1.0, 911
a) Estamos interessados em sucesso = com atraso. No máximo, dois títulos sejam pagos
com atraso, isto é, 0, 1 ou 2 títulos pagos com atraso em 20 títulos.
x : 0,12
, , 3,..., 20
P( x ≤ 2) = P( 0) + P(1) + P(2) =
= C20 0
0 0, 2 .0, 8
20 + C20 0, 21.0, 819 + C20 0, 22.0, 818 =
1 2
20 ! 20 ! 20 !
. ( 0, 2 ) ( 0, 8 ) + . ( 0, 2 ) ( 0, 8 ) + . ( 0, 2 ) ( 0, 8 ) =
0 20 1 19 2 18
=
0 !.20 ! 1!.19 ! 2 !.18 !
= 0, 0115292 + 0, 0576461+ 0,1369094 =
P( x ≤ 2) = 20, 6085%
capítulo 6 • 171
b) Considerando sucesso = sem atraso. Estamos interessados em que, no mínimo, três
títulos sejam pagos sem atraso. Neste caso, p=0,8 e q=0,2. Atenção, pois a situação se
inverteu.
x : 0,12
, , 3,..., 20
P( x ≥ 3) = 1− P( x ≤ 2) =
= 1− ( C20 0
0 0, 8 .0, 2
20 + C20 0, 81.0, 219 + C20 0, 82.0, 218 ) =
1 2
20 ! 20 ! 20 !
. ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) ) =
0 20 1 19 2 18
= 1− (
0 !.20 ! 1! .19 ! 2 !.18 !
= 1− (1.10−14 + 8, 4.10−131+ 3, 2.10−11) = 1− ( 0 + 0 + 0) =
P( x ≥ 3) = 1
c) Mais de 70% sejam pagos sem atraso! Considerando sucesso = sem atraso, estamos
interessados em 15 ou mais títulos sem atraso.
x : 0,12
, , 3,..., 20
p( x ≥ 15) = p( x = 15) + p( x = 16) + p( x = 17) + p( x = 18) + p( x = 19) + p( x = 20) =
20 0, 815.0, 25 + C20 0, 816.0, 24 + C20 0, 817.0, 23 + C20 0, 818.0, 22 + C20 0, 819.0, 21 + C20 0, 820.0, 20 ) =
= ( C15 16 17 18 19 20
20 ! 20 ! 20 ! 20 ! 20 !
. ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 )
15 5 16 4 17 3 18 2 19 1
=
15!.5! 16 !.4 ! 17!.3! 18 !.2 ! 19 !.1!
20 !
. ( 0, 8 ) ( 0, 2 ) =
20 0
+
20 !.0 !
= 0,1746 + 0, 2182 + 0, 2054 + 0,1369 + 0, 0576 + 0, 0115 = 80, 42%
ATIVIDADES
Todos os exercícios propostos estão resolvidos na planilha anexa.
01. No lançamento de um dado, a variável aleatória x anota o número de face 4 obtido. De-
termine a média, a variância e o desvio padrão da variável aleatória x.
02. Uma urna contém 15 bolas brancas e 25 bolas vermelhas. Uma bola é retirada ao acaso
e a variável x anota o número de bolas brancas obtidas. Determine a média, a variância e o
desvio padrão da variável aleatória x.
172 • capítulo 6
03. Uma caixa contém 12 canetas das quais 5 são defeituosas. Uma caneta é selecionada
ao acaso e a variável x anota o número de canetas defeituosas obtidas. Determine a média,
a variância e o desvio padrão da variável aleatória x.
04. Um lote contém 50 peças boas e 5 defeituosas. Uma peça é retirada deste lote e a variá-
vel aleatória x anota o número de peças defeituosas obtidas. Determine a média, a variância
e o desvio padrão da variável aleatória x.
05. Uma variável aleatória admite distribuição de Bernoulli com variância 0,24. Sabendo que
a média da variável aleatória x é maior que 0,5, determine esta média.
06. Uma empresa contratou uma agência de publicidade para fazer dois anúncios. A empre-
sa definiu critérios para aferir o sucesso de cada anúncio. Desta forma, o resultado de cada
anúncio poderá ser o fracasso ou o sucesso. Para cada anúncio com sucesso, a agência
receberia R$ 100.000,00. A agência nada receberia no caso de fracasso. A empresa quer
planejar o gasto com esta agência de publicidade. Acredita que a probabilidade de sucesso
em cada anúncio é de 1/6 e que há independência entre os sucessos dos anúncios.
a) Encontre a função de probabilidade (distribuição de probabilidades) do gasto com
a agência.
b) Calcule o gasto médio esperado com a agência.
c) Calcule a variância e o desvio-padrão do gasto no dia com a agência.
07. Uma das maiores frustrações do comércio varejista norte-americano é o abuso de clien-
tes em relação a políticas de troca e devolução de mercadorias. Em um ano recente, as
devoluções de mercadorias representaram 13% das vendas em lojas de departamento. Con-
sidere uma amostra de 20 consumidores que tenham feito compras em uma loja de departa-
mentos. Utilize o modelo binomial para responder às seguintes perguntas:
a) Qual é o valor esperado, ou a média aritmética, da distribuição binomial?
b) Qual é o desvio padrão da distribuição binomial?
c) Qual é a probabilidade de que nenhum dos 20 consumidores venha a efetuar devolução
de mercadoria?
d) Qual é a probabilidade de que não mais de 2 consumidores venham a efetuar devolução
de mercadoria?
capítulo 6 • 173
e) Qual é a probabilidade de que 3 ou mais dos consumidores venham a efetuar devolução
de mercadoria?
10. Uma firma exploradora de petróleo acha que 5% dos poços que perfura acusam depo-
sito de gás natural. Se ela perfurar 6 poços, determine a probabilidade de:
a) nenhum poço ter gás natural.
b) dois poços terem gás natural.
c) dois ou menos poços terem gás natural.
11. Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam pedi-
dos sem mostarda. Se 7 pessoas pedem cachorro-quente, determine a probabilidade de que:
a) todos queiram mostarda.
b) 5 pessoas queiram mostarda.
c) 5 ou mais pessoas queiram mostarda.
174 • capítulo 6
6.3.3 Distribuição de Poisson
capítulo 6 • 175
A distribuição de Poisson fica completamente caracterizada por um único
parâmetro: a média do processo. Se uma variável aleatória VA mostrar resulta-
dos distribuídos segundo Poisson e conhecendo a média de ocorrências por
unidade de tempo ou espaço, podemos determinar a probabilidade de qual-
quer resultado usando as tabelas ou as fórmulas a seguir.
Uma variável aleatória x admite distribuição de Poisson se:
x : 0,1, 2,3,..., n
e − λ λ k e − λt ( λ t )k
p( x = K ) = =
k! k!
onde.K = 0,1,..., n
µ(( x ) = E( x ) = λ = np
σ2 ( x ) = λ
σ( x ) = λ
e− λ λ k
Cnk pk qn −k ≈
k!
Onde:
• x é o número de ocorrências (sucessos).
• l – lambda – é a taxa média por unidade de medida, ou seja, é a taxa de
frequência por unidade de tempo ou área.
• t é o número de unidades, tempo ou área.
• l t – a quantidade l t representa o número médio de ocorrências no in-
tervalo t.
176 • capítulo 6
Vejamos os exemplos a seguir:
EXEMPLOS
Exemplo 16 – Uma máquina produz nove peças defeituosas a cada 1 000 peças produzidas.
Calcule a probabilidade de que em um lote que contém:
a) 200 peças, sejam encontradas oito peças defeituosas;
b) 500 peças, não haja nenhuma peça defeituosa.
Solução:
Experimento = examinar um peça.
Pode ter dois resultados: p = 1 – q
Defeituosa = sucesso = com probabilidade p(D) = 9 / 1 000 = 0,009 = 0,9%= p
Normal = fracasso = com probabilidade p(N) = 1 – 0,009 = 0,991 = q
λ = np = 200.0, 009 = 18
,
e − λ λk 2, 718281−18
, .18
, 8
p( x = 8) = = = 0, 00045 = 0, 045%
k! 8!
λ = np = 500.0, 009 = 4, 5
e − λ λk 2, 718281−4,5.4, 50
p( x = 0) = = = 0, 0111 = 111
, %
k! 0!
Exemplo 17 – Supondo que o número de carros que chegam a uma fila do guichê de um pe-
dágio tenham distribuição de Poisson a uma taxa de três por minuto, calcule a probabilidade
de que cheguem cinco carros nos próximos dois minutos.
Solução:
Calcule a taxa lambda para os dois minutos solicitados no problema. Depois, calcule a
probabilidade de que ocorram 5 sucessos nos próximos 2 minutos.
λ = np = 3carros/minutos= 6carros/2minutos
e − λ λk 2, 7182
281−6.65
p( x = 5) = = = 0,1606 = 16, 06%
k! 5!
capítulo 6 • 177
Exemplo 18 – Um tear produz um defeito a cada 200 m de tecido produzido. Se o número
de defeitos admitir a distribuição de Poisson, calcule a probabilidade de:
a) uma peça com 20 m não apresentar defeitos;
b) um lote de 10 peças de 20 m cada apresentar exatamente um defeito.
Solução:
a–
λ = np = 1defeito / 200metros = 0,1defeito / 20metros = 0,1defeito / pe a
e − λ λk 2, 718281−0,1.0,10
p( x = 0) = = = 0, 9048 = 90, 48%
k! 0!
b–
λ = np=10.0,1defeito/20metros=1defeito/pe a
e − λ λk 2, 718281−1.11
p( x = 1) = = = 0, 3679 = 36, 79%
k! 1!
Exemplo 19 – Um processo mecânico produz tecido para tapetes com uma média de dois
defeitos por metro. Determine a probabilidade de um metro quadrado ter exatamente um
defeito, admitindo que o processo possa ser bem aproximado pela distribuição de Poisson.
Solução:
l = 2, então:
e − λ λk 2, 718281−2.21
p( x = 1) = = = 0, 270 = 27%
k! 1!
e − λ λk 2, 718281−1.10
p( x = 0) = = = 0, 368 = 36, 8%
k! 0!
e − λ λk 2, 718281−1.13
p( x = 3) = = = 0, 061 = 6,1%
k! 3!
178 • capítulo 6
Exemplo 21 – Suponhamos que os defeitos em fios para tear possam ser aproximados pelo
processo de Poisson com média de 0,2 defeitos por metro (l=0,2). Inspecionando-se peda-
ços de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 defeitos
(isto é, 0 ou 1).
Solução:
l = 0,2 /metro = 1,2/6 metros = 1,2/peça, então:
2, 718281−12 , 0 2, 718281−12
, .12 , .12
, 1
p( x ≤ 1) = p( 0) + p(1) = + = 0, 301+ 0, 301.12
, = 66, 22%
0! 1!
e − λ λk 2, 718281−8.85
p( x = 5) = = = 0, 0916 = 9,16%
k! 5!
5 5
e − λ λk e −8 8k
p( x ≤ 5) = ∑ =∑ = 0,1912
k =0 k ! k =0 k !
e − λ λk 2, 718281−0,35.0, 352
p( x = 2) = = = 0, 04316 = 4, 316%
k! 2!
capítulo 6 • 179
ATIVIDADES
12. O gerente de controle de qualidade da Nestlé está inspecionando um lote de biscoitos
com gotas de chocolate que acabou de ser assado. Se o processo de produção estiver sob
controle, a média aritmética do número médio de gotas de chocolate por biscoito será 6,0.
Qual é a probabilidade de que em um determinado biscoito que está sendo inspecionado:
a) sejam encontradas menos de cinco gotas de chocolate?
b) sejam encontradas exatamente cinco gotas de chocolate?
c) sejam encontradas cinco ou mais gotas de chocolate?
d) sejam encontradas quatro ou cinco gotas de chocolate?
14. A caxumba é uma infecção viral suave e assintomática em até 20% dos indivíduos in-
fectados, no entanto podem surgir complicações que provocam até a surdez e a infertilidade.
Por isso, a vacinação é muito importante. No estado do Ceará, o número médio de casos
mensais relatados é de cerca de 0,1 no mesmo período. Em relação a esses casos mensais,
de acordo com a distribuição de Poisson, qual a probabilidade de que em um mês não haja
mais que um caso de caxumba?
15. Em um período recente de 100 anos, houve 93 terremotos de pelo menos 6° na escala
Richter. Suponha que a distribuição de Poisson seja um modelo adequado para esta variável.
a) Calcule o número médio de terremotos com grau maior que 6 por ano.
b) Se P(x) é a probabilidade de x grandes terremotos por ano, calcule P(0), P(1), P(2),
P(3), P(4), P(5), P(6) e (7).
180 • capítulo 6
6.4 Modelo Contínuo de Probabilidade
Frequência
(Valor, frequência)
f(x)
x
a
Valor
capítulo 6 • 181
6.4.2.2 Cálculo da Probabilidade
I
x
a c d
f(x)
Média
Moda
Mediana
182 • capítulo 6
À direita da posição central, onde é marcado o valor da média, encontra-se
o desvio padrão e somado a ela, à esquerda, encontra-se o desvio padrão sub-
traído da média.
Média (µ)
Desvio - Padrão (σ)
σ σ
x
µ–σ µ µ+σ
f(X)
B
A C
capítulo 6 • 183
Como vimos no item anterior, a probabilidade de uma distribuição contí-
nua é obtida pelo cálculo da área sob a curva definida por sua função densida-
de, cálculo esse efetuado com auxílio de integrais. Para facilitar esse processo,
foi criada uma tabela onde pode-se encontrar valores já calculados para essas
probabilidades.
Você deve estar se perguntando como isso é possível, pois, se para cada
par de valores de média e de desvio padrão existe uma curva diferente, teriam
de existir infinitas tabelas com diferentes resultados para a área sob cada cur-
va. A solução encontrada para esse problema foi a utilização de uma fórmula
para transformar qualquer curva normal em uma curva normal padronizada,
com média igual a zero e desvio padrão igual a 1, resultando em uma única
tabela com as probabilidades referentes a essa distribuição padronizada. A
esta fórmula usada para calcular o valor de Z damos o nome de transformada
Z. Desta forma, para qualquer valor de x, média e desvio padrão, a informação
resultante de Z informa quantos desvios padrões existem entre a média e o
valor de x.
X − µx
Z=
σx
Distribuição Distribuição
normal normal padronizada
σx σz = 1
x z
µx µz= 0
Uma tabela!
184 • capítulo 6
X − µx 6 ⋅2 − 5
Z= = = 12
σx 10
Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
x z
µx = 5 6.2 µz= 0 .12
A nova área a ser calculada estará compreendida entre 0 e 0,12, mas, na ver-
dade, não precisará ser calculada, pois o resultado já se encontra na tabela. Veja
como encontrar o valor dessa probabilidade na próxima figura:
Tabela de probabilidade
normal padronizada
O valor encontrado para z foi 0,12. Esse número deve ser desmembrado, fa-
zendo-se um corte após o primeiro algarismo à direita da vírgula: 0,12 = 0,1 +
0,02. Toma-se, então, a primeira parte do número, nesse caso 0,1, e percorre-se
a primeira coluna até encontrá-lo. Ao chegar à linha onde está localizado 0,1,
caminhe sobre ela até chegar à direção do 0,02. O valor aí encontrado represen-
ta a área sob a curva entre 0 e 0,12 ou a probabilidade de se obter um valor entre
0 e 0,12, correspondentes a 5 e 6,12 no problema inicial. Na tabela, as probabi-
lidades são dadas em decimal, nesse exemplo, o resultado foi 0,0478 ou 4,78%.
É importante aqui destacar que mesmo se o valor de z for um número nega-
tivo, a área sob a curva será positiva e encontrada da mesma maneira que acaba-
mos de ver. Ainda no exemplo anterior, caso você quisesse calcular a probabili-
dade de se encontrar um valor entre 3,8 e 5, ao substituir os dados na fórmula,
capítulo 6 • 185
encontraria z = – 0,12, mas você iria utilizar apenas o módulo desse resultado
para consultar a tabela: 0,12 e acabaria encontrando a mesma probabilidade
de 0,0478.
X − µx 3 ⋅8 − 5
Z= = = 12
σx 10
Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.478
x z
3.8 µx = 5 –.12 µz= 0
P ( 2 .9 ≤ X ≤ 7 .1 )
X − µx 2, 9 − 5
Z= = = −21
σx 10
X − µx 7,1 − 5
Z= = = −21
σx 10
Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.1664
x z
2.9 5 7.1 –.21 0 .21
Vamos a mais um caso que ainda pode ser estudado no mesmo exemplo.
Vamos supor que seja necessário calcular a probabilidade de obter valores
maiores que 8 nessa distribuição. Lembrando que os valores da tabela são
186 • capítulo 6
referências ao centro da curva, calcula-se primeiramente a probabilidade de se
obter um valor entre 5 e 8, para depois então subtrair esse valor de 0,5, corres-
pondente à metade da área sob a curva.
P ( X ≥ 8)
X − µx 8−5
Z= = = 30
σx 10
Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.5000
.1179
.3821
x z
µx = 5 8 µz = 0 .30
P ( 2.000 ≤ X ≤ 2.400 )
X − µx 2.400 − 2.000
Z= = = 2, 0
σx 200
Distribuição Distribuição
normal normal padronizada
σx = 200 σz = 1
.4772
x z
µx = 2000 2400 µz= 0 2.0
capítulo 6 • 187
b) Já para a probabilidade de a vida útil da lâmpada ser menor que 1.470
horas, devemos inicialmente fazer o cálculo em relação à média (2.000 horas) e
depois subtrair o resultado de 50%.
P ( X ≤ 1.470 )
X − µx 1.470 − 2.000
Z= = = −2,65
σx 200
Distribuição Distribuição
normal normal padronizada
σx = 200 σz = 1
.5000
.0040 .4960
x z
1470 µx = 2000 –2.65 µz = 0
Tabela de probabilidade
Qual é o Z dado normal padronizada
P(Z) = .1217?
σz = 1 z .00 .01 .02
.1217
0.0 .0000 .0040 .0080
Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.1217
x z
µx = 5 ? µz= 0 .31
188 • capítulo 6
ATIVIDADES
Todos os exercícios propostos estão resolvidos na planilha anexa. Atente para a re-
solução das fórmulas, para o uso da tabela normal e para o uso das funções DISTNOM
E DISTNORMP.
• DISTNOM – usa as informações de média e desvio padrão.
• DISTNORMP – é a normal padronizada, trabalha com o valor de Z.
16. A duração de certo componente eletrônico pode ser considerada normalmente distri-
buída com média de 850 dias e desvio padrão de 45 dias. Calcular a probabilidade de um
componente durar:
a) entre 700 e 1.000 dias.
b) mais que 800 dias.
c) menos que 750 dias.
d) exatamente 1.000 dias.
17. Os pesos de 600 estudantes são normalmente distribuídos com média de 65,3 kg e
desvio padrão de 5,5 kg. Encontrar o número de alunos que pesam:
a) entre 60 e 70 kg
b) mais de 63,2kg.
18. Suponha que as notas de uma prova sejam normalmente distribuídas com média de
73 e desvio padrão 15. Quinze por cento dos alunos mais adiantados receberam a nota A e
12% dos mais atrasados receberam nota F. Encontrar:
a) o mínimo para receber A.
b) o mínimo para passar e não receber F.
19. Uma fábrica de pneus fez um teste para medir o desgaste de seus pneus e verificou que
ele obedecia a uma distribuição normal de média 48.000 km e desvio padrão de 2.000 km.
Calcular a probabilidade de um pneu escolhido ao acaso:
a) durar mais que 46.000 km.
b) durar entre 45.000 e 50.000 km.
20. O salário semanal dos operários industriais é distribuído normalmente em torno de uma
média de $ 180 com desvio padrão de $ 25. Pede-se:
capítulo 6 • 189
• encontrar a probabilidade de um operário ter salário semanal situado entre $ 150 e
$ 178. b) para responder, dentro de que desvio, de ambos os lados da média, cairão 96%
dos salários.
21. Um certo produto tem peso médio de 10 g e desvio padrão de 0,5 g. É embalado em
caixas de 120 unidades que pesam em média 150 g e têm desvio padrão de 8 g. Qual a
probabilidade de que uma caixa cheia pese mais de 1.370 g?
22. Um avião de turismo de 4 lugares pode levar uma carga útil de 350 hg. Supondo que
os passageiros tenham peso médio de 70 kg, com distribuição normal e desvio padrão de
20 kg, e que a bagagem de cada passageiro pese em média 12 kg com desvio padrão de 5
kg e distribuição normal de peso, calcule a probabilidade de:
a) haver sobrecarga se o piloto não pesar os quatro passageiros e as respectivas bagagens.
b) que o piloto tenha de tirar pelo menos 50 kg de gasolina para evitar sobrecarga.
23. Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores
a 19. Encontrar a média e a variância da distribuição.
24. O peso de um item produzido por uma empresa tem distribuição normal com media de
230 g e desvio padrão de 3 g. Este produto é embalado em caixas com 20 unidades cada
uma. A caixa vazia tem peso distribuído normalmente com media 30 e desvio 5 g. Calcule a
probabilidade de uma caixa cheia pesar mais que 4.660 g.
25. Uma fábrica de elevadores estabelece que a carga máxima permitida é de 10 pessoas.
Sabe-se que o peso das pessoas é normalmente distribuído com média de 70 kg e desvio
padrão de 15 kg.
a) Se o elevador opera sem problemas com carga máxima de 880 kg, qual é a probabilida-
de de ele apresentar problemas em uma operação com 10 pessoas?
b) Se a probabilidade de apresentar problemas em uma operação com 10 pessoas
deve ser no máximo 0,025%, qual deverá ser a carga máxima suportável para operar
sem problemas?
190 • capítulo 6
a empresa pretende colocar no mercado 1 000 unidades por semana, qual é a probabilidade
de o lucro ser:
a) pelo menos 25,5% do valor médio das vendas?
b) pelo menos 50% do valor médio dos custos?
c) negativo, isto é, haver prejuízo nesta operação?
27. Dados a média e o desvio das variáveis aleatórias X1 e X2, calcule a média e o desvio
da variável aleatória h = 5.X1 + 2.X2.
28. Considere as variações anuais de duas ações. Calcule a média, o desvio e o coeficiente
de variação de cada uma. Depois crie uma carteira com 30% do capital em ações A e mais
70% do capital em ações B. Calcule a nova média, o novo desvio e o novo CV. O que é pos-
sível perceber? Considere as variáveis independentes.
30. Calcular a média e o desvio padrão da variável aleatória H=10+5X, considerando que a
média e a variância de X são respectivamente 0,124 e 0,0454.
REFLEXÃO
Nesta aula:
• Definimos uma variável aleatória;
• Associamos funções de probabilidade a variáveis aleatórias;
• Calculamos a esperança matemática e a variância de variáveis aleatórias;
• Utilizamos as propriedades e operações inerentes às variáveis aleatórias;
• Aprendemos a trabalhar e aplicar modelos discretos de probabilidade;
capítulo 6 • 191
• Estudamos a distribuição de Bernoulli e suas aplicações;
• Estudamos a distribuição binomial e suas aplicações;
• Aprendemos a trabalhar com a distribuição de Poisson;
• Calculamos a distribuição de Poisson com base na aproximação da distribuição binomial;
• Aprendemos a trabalhar com a distribuição normal.
• Aprendemos a usar a tabela normal;
• Aprendemos a usar as fórmulas e funções do Excel para a distribuição normal;
• Aplicamos os conhecimentos de soma e multiplicação de variáveis aleatórias em situações
de cálculo de risco e de cálculo de lucro.
REFERÊNCIAS BIBLIOGRÁFICAS
DEVORE, Jay L. Probabilidade e estatística: para engenharia e ciências. São Paulo: Pioneira
Thomson Learning, 2006.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.
192 • capítulo 6