Escolar Documentos
Profissional Documentos
Cultura Documentos
PROBABILIDADE E ESTATÍSTICA
Batatais
Claretiano
2013
© Ação Educacional Claretiana, 2012 – Batatais (SP)
Versão: dez./2013
519 M289p
ISBN: 978-85-8377-042-8
CDD 519
Preparação Revisão
Aline de Fátima Guedes Cecília Beatriz Alves Teixeira
Camila Maria Nardi Matos Felipe Aleixo
Carolina de Andrade Baviera Filipi Andrade de Deus Silveira
Cátia Aparecida Ribeiro Paulo Roberto F. M. Sposati Ortiz
Dandara Louise Vieira Matavelli Rodrigo Ferreira Daverni
Elaine Aparecida de Lima Moraes Sônia Galindo Melo
Josiane Marchiori Martins
Talita Cristina Bartolomeu
Lidiane Maria Magalini
Vanessa Vergani Machado
Luciana A. Mani Adami
Luciana dos Santos Sançana de Melo
Luis Henrique de Souza Projeto gráfico, diagramação e capa
Patrícia Alves Veronez Montera Eduardo de Oliveira Azevedo
Rita Cristina Bartolomeu Joice Cristina Micai
Rosemeire Cristina Astolphi Buzzelli Lúcia Maria de Sousa Ferrão
Simone Rodrigues de Oliveira Luis Antônio Guimarães Toloi
Raphael Fantacini de Oliveira
Bibliotecária Tamires Botta Murakami de Souza
Ana Carolina Guimarães – CRB7: 64/11 Wagner Segato dos Santos
Todos os direitos reservados. É proibida a reprodução, a transmissão total ou parcial por qualquer
forma e/ou qualquer meio (eletrônico ou mecânico, incluindo fotocópia, gravação e distribuição na
web), ou o arquivamento em qualquer sistema de banco de dados sem a permissão por escrito do
autor e da Ação Educacional Claretiana.
CRC
Ementa––––––––––––––––––––––––––––––––––––––––––––––
Noções de teoria de conjuntos. Técnicas de contagem e análise combinatória.
Probabilidade frequentista. Probabilidade condicional e independência. Popula-
ção e amostra. Distribuições e gráficos de frequências. Medidas de tendência
central. Medidas de posição e de ordem. Medidas de dispersão. Excel e calcu-
ladoras científicas.
––––––––––––––––––––––––––––––––––––––––––––––––––––
1. INTRODUÇÃO
O Caderno de Referência de Conteúdo Probabilidade e Esta-
tística é subdividido em quatro partes, apesar de ser constituído
por cinco unidades. A primeira destina-se a uma visão conceitual
sobre Estatística; a segunda está focada no estudo das técnicas e
ferramentas de tabulação de dados; as Unidades 3 e 4 tratam das
medidas de Estatística Descritiva; e a Unidade 5 aborda estudos de
probabilidades.
Os estudos realizados sobre o que chamamos de "Estatísti-
ca Descritiva" são de fundamental importância em qualquer área
10 © Probabilidade e Estatística
Abordagem Geral
Aqui, você entrará em contato com os assuntos principais
deste conteúdo de forma breve e geral e terá a oportunidade de
aprofundar essas questões no estudo de cada unidade. Desse
modo, esta Abordagem Geral visa fornecer-lhe o conhecimento
básico necessário a partir do qual você possa construir um
referencial teórico com base sólida – científica e cultural – para
que, no futuro exercício de sua profissão, você a exerça com
competência cognitiva, ética e responsabilidade social.
Você pode estar pensando: Estatística serve para quê?
Quais são os motivos para estudá-la? Considerando os cenários
administrativos e gerenciais; situações de análises contábeis;
problemas de gestão de pessoas e de materiais; casos de logística
e de transportes; análise de cenários econômicos; experimentos
médicos, biológicos e agronômicos em geral; entrevistas; estudos
sociológicos; enfim, situações relacionadas com a prática de quase
© Caderno de Referência de Conteúdo 11
Glossário de Conceitos
O Glossário de Conceitos permite a você uma consulta rá-
pida e precisa das definições conceituais, possibilitando-lhe um
bom domínio dos termos técnico-científicos utilizados na área de
conhecimento dos temas tratados em Probabilidade e Estatística.
Veja, a seguir, a definição dos principais conceitos:
1) Amostra: subconjunto da população. Por possuir um
número reduzido de elementos, é mais viável de ser
pesquisada do que a população, mas, em compensação,
gera um erro maior na análise. Deve satisfazer algumas
propriedades, e a principal delas é ser aleatória.
2) Ciência: conjunto de conhecimentos exatos e racionais
relativos às causas das realizações deduzidas pela de-
monstração.
3) Coeficiente de Variação: ferramenta que permite anali-
sar comparativamente a variabilidade entre dois ou mais
conjuntos. É, também, referência para avaliar o grau de
variabilidade de uma variável.
4) Conjunto: união de elementos que possuem, pelo me-
nos, uma característica em comum. Em Probabilidade,
toda teoria e aplicações são definidas pela utilização de
conjuntos e subconjuntos, e um importante conjunto
utilizado nessa área é o chamado "espaço amostral".
5) Distribuição de frequências: ferramenta de tabulação
de dados que corresponde a uma ordenação dos dados
segundo um agrupamento por frequência de ocorrên-
cia, que pode ser absoluta ou relativa.
6) Espaço Amostral: conjunto formado por todos os possí-
veis resultados de um fenômeno aleatório.
7) Evento Aleatório: resultado particular do espaço amos-
tral; representa o resultado de interesse sobre o qual se
quer calcular a probabilidade de ocorrência.
8) Eventos complementares: eventos que, além de serem
mutuamente exclusivos, se unidos, reproduzem exata-
mente os resultados do espaço amostral.
Questões Autoavaliativas
No final de cada unidade, você encontrará algumas questões
autoavaliativas sobre os conteúdos ali tratados, as quais podem ser
de múltipla escolha, abertas objetivas ou abertas dissertativas.
Responder, discutir e comentar essas questões, bem como
relacioná-las com a prática da Probabilidade e da Estatística, pode
ser uma forma de você avaliar o seu conhecimento. Assim, me-
diante a resolução de questões pertinentes ao assunto tratado,
você estará se preparando para a avaliação final, que será disser-
tativa. Além disso, essa é uma maneira privilegiada de você testar
seus conhecimentos e adquirir uma formação sólida para a sua
prática profissional.
Você encontrará, ainda, no final de cada unidade, um gabari-
to, que lhe permitirá conferir as suas respostas sobre as questões
autoavaliativas de múltipla escolha.
Bibliografia Básica
É fundamental que você use a Bibliografia Básica em seus
estudos, mas não se prenda só a ela. Consulte, também, as biblio-
grafias complementares.
© Caderno de Referência de Conteúdo 27
Dicas (motivacionais)
O estudo deste Caderno de Referência de Conteúdo convida
você a olhar, de forma mais apurada, a Educação como processo
de emancipação do ser humano. É importante que você se atente
às explicações teóricas, práticas e científicas que estão presentes
nos meios de comunicação, bem como partilhe suas descobertas
com seus colegas, pois, ao compartilhar com outras pessoas aqui-
lo que você observa, permite-se descobrir algo que ainda não se
conhece, aprendendo a ver e a notar o que não havia sido perce-
bido antes. Observar é, portanto, uma capacidade que nos impele
à maturidade.
Você, como aluno do curso de Graduação na modalidade
EaD, necessita de uma formação conceitual sólida e consistente.
Para isso, você contará com a ajuda do tutor a distância, do tutor
presencial e, sobretudo, da interação com seus colegas. Sugeri-
mos, pois, que organize bem o seu tempo e realize as atividades
nas datas estipuladas.
É importante, ainda, que você anote as suas reflexões em
seu caderno ou no Bloco de Anotações, pois, no futuro, elas pode-
rão ser utilizadas na elaboração de sua monografia ou de produ-
ções científicas.
Leia os livros da bibliografia indicada, para que você amplie
seus horizontes teóricos. Coteje-os com o material didático, discuta
a unidade com seus colegas e com o tutor e assista às videoaulas.
3. REFERÊNCIAS BIBLIOGRÁFICAS
BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
4. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
EAD
A Natureza dos Dados
Estatísticos
1
1. OBJETIVOS
• Conhecer a origem e a história da Estatística.
• Entender o que é população e amostra, bem como as
suas relações.
• Aplicar as fases de desenvolvimento de um trabalho es-
tatístico.
• Compreender a metodologia da coleta de dados.
2. CONTEÚDOS
• Origem e história da Estatística.
• População e amostra.
• Fases de um trabalho estatístico.
• Coleta, crítica, apuração e exposição de dados.
30 © Probabilidade e Estatística
4. INTRODUÇÃO À UNIDADE
Nesta unidade, vamos estudar um pouco sobre a origem e a
evolução da Estatística. Além disso, compreenderemos a inclusão
dos tratamentos da informação nos Parâmetros Curriculares
Nacionais (PCNs), bem como sua importância.
Ainda, abordaremos a Fundação IBGE, que é a responsável
por todas as estatísticas no Brasil, fornecendo dados importantes
para as tomadas de decisão de nossos governantes.
Além de tratar do aspecto histórico, veremos nessa unidade
que a Estatística, na grande maioria dos casos, trabalha com
dados originários de pesquisas e coleta de dados. Desse modo,
discutiremos um pouco sobre a metodologia envolvida nesses
eventos e como se processa a análise estatística dos dados,
pensando nas principais fases, de coleta, crítica, apuração e
exposição dos resultados. Vamos lá.
© U1 – A Natureza dos Dados Estatísticos 31
8. MÉTODOS DE AMOSTRAGEM
Para cada pesquisa realizada, devemos utilizar métodos
científicos adequados, pois o pesquisador tem como principal
preocupação verificar se os elementos da amostra são
suficientemente representativos de toda a população, de forma a
generalizá-la.
Assim, cada elemento da população deve ter uma
probabilidade conhecida para fazer parte da amostra, sendo esta
denominada "amostra aleatória", ou "amostra probabilística".
9. A COLETA DE DADOS
Como todas as análises serão feitas com base nos dados co-
letados, é importante que a metodologia utilizada na coleta seja
cientificamente correta e que os instrumentos ou questionários
utilizados sejam eficientes.
Assim, é fundamental que se conheça com detalhes os obje-
tivos da pesquisa ou o objetivo que se deseja atingir com os dados,
quais as hipóteses de interesse e o que se deseja testar e investigar.
Com base nos objetivos definidos, podemos pensar, de for-
ma geral, nos seguintes procedimentos metodológicos:
• Identificar a população de interesse e estruturar como
será o procedimento amostral.
• Construir os instrumentos para a coleta dos dados (ques-
tionários, formulários, roteiros etc.).
Para a elaboração dos instrumentos de coleta dos dados, de-
vemos considerar os aspectos a seguir:
1) Questionário de dados: essa fase é a "espinha dorsal"
de qualquer levantamento. Trata-se de reunir as infor-
mações necessárias para avaliar os objetivos definidos,
utilizando uma linguagem adequada e de fácil compre-
ensão, sem induzir a uma resposta. Podem-se mesclar
questões abertas (dissertativas) e questões fechadas
(múltipla escolha).
2) Pré-pesquisa de dados: nessa fase, realiza-se uma pré-
-pesquisa, tendo como propósito avaliar a eficácia dos
instrumentos de coleta ou mesmo do processo amostral.
Feita a pré-pesquisa, os resultados nela obtidos devem
ser utilizados para efetuar as correções necessárias tan-
to nos instrumentos quanto no perfil da amostragem.
3) Coleta de dados: essa é a fase da obtenção de dados e
deverá ser feita com muito cuidado, pois dela depende-
rá a veracidade dos resultados obtidos. Basicamente, é a
aplicação dos instrumentos, já revisados, nos elementos
selecionados na amostragem, que deve ser probabilísti-
© U1 – A Natureza dos Dados Estatísticos 43
12. CONSIDERAÇÕES
Estudamos, nesta primeira unidade, alguns conceitos im-
portantes para o bom entendimento da Estatística. Vimos que,
em geral, trabalhamos com uma amostra dos dados e que, para
13. E-REFERÊNCIAS
IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Home page. Disponível em:
<http://www.ibge.gov.br/home/>. Acesso em: 7 fev. 2012.
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
2
1. OBJETIVOS
• Representar os dados coletados em tabelas e gráficos.
• Conhecer e compreender a construção das tabelas e grá-
ficos.
• Analisar e interpretar os resultados.
2. CONTEÚDOS
• Tabelas de frequências simples.
• Tabelas de frequências em intervalos.
• Gráficos de frequências.
• Gráficos de séries.
48 © Probabilidade e Estatística
4. INTRODUÇÃO À UNIDADE
Nesta segunda unidade, vamos compreender como pode-
mos descrever e analisar os dados estatísticos resultantes de variá-
veis qualitativas (não numéricas) e quantitativas (números inteiros
ou fracionários) por meio da construção de tabelas e gráficos de
frequências.
Para conceituarmos os dados brutos (ou tabela primitiva), o
ROL, bem como as tabelas e os gráficos de frequências, nos servi-
remos de exemplos de coletas de dados já realizadas, relacionadas
a um determinado contexto. Para a construção dos gráficos de fre-
quências, adotaremos a planilha eletrônica do Excel.
5. OS DADOS BRUTOS
De acordo com Toledo (2008), os dados brutos, ou tabela
primitiva, podem ser definidos como a relação inicial, o resultado
da coleta dos dados de interesse de uma determinada pesquisa,
sejam eles numéricos, sejam não numéricos. Lembre-se de que,
quando realizamos uma coleta de dados, as questões ou variáveis
devem se relacionar com os objetivos da pesquisa. Assim, às ve-
zes, teremos variáveis qualitativas (não numéricas) e/ou variáveis
quantitativas (numéricas).
© U2 – Tabulação de Dados 49
PREÇO
PESSOA MARCA Nº DE COPOS
(R$)
15 C 6 4,10
16 B 6 2,85
17 D 7 2,90
18 A 7 3,15
19 A 8 3,80
20 C 9 4,15
Marca Preferida
Marca A
Marca B
Marca C
Marca D
Marca Preferida fa
Marca A 9
Marca B 4
Marca C 4
Marca D 3
Total 20
5 6 30,0
6 5 25,0
7 3 15,0
8 4 20,0
9 2 10,0
Total 20 100,0
Preço Justo
2,85 |— 3,13
3,13 |— 3,41
3,41 |— 3,69
3,69 |— 3,97
3,97 |— 4,25
Total
7. GRÁFICOS DE FREQUÊNCIAS
Utilizar tabelas de frequências para a representação dos re-
sultados de pesquisas e estudos de uma determinada variável é
bastante comum. Contudo, muitas vezes, as tabelas não conse-
guem, sozinhas, apresentar os resultados de forma clara, rápida e
simplificada, já que exigem algum conhecimento de leitura de ta-
belas. Por esse fato, é comum a utilização de uma ferramenta que
simplifica a informação das tabelas, mostrando-as em forma de
figuras e/ou diagramas. Essas ferramentas são conhecidas como
gráficos de frequências, os quais iremos conhecer e estudar neste
tópico.
Gráficos de colunas
O gráfico de colunas é utilizado apenas para as tabelas sim-
plificadas, sendo que, no eixo horizontal, são representadas as ca-
tegorias, e, no eixo vertical, as porcentagens. Observe, na Figura 1,
um exemplo desse tipo.
Marca
Marcapreferida
preferidade
decafé
café
45
40
35
30
opiniões
deopiniões
25
20
%de
15
%
10
0
Marca A Marca B Marca C Marca D
Marcas
Marcas
Gráficos de barras
O gráfico de barras (Figura 2) é utilizado apenas para as tabelas
simplificadas, sendo que, no eixo horizontal, são representadas as
porcentagens, e, no eixo vertical, as categorias.
Marca
Marcapreferida de de
preferida café
café
Marca D
Marca C
Marcas
Marcas
Marca B
Marca A
0 5 10 15 20 25 30 35 40 45
%%de
deopiniões
opiniões
Gráficos de setores
O gráfico de setores é popularmente conhecido como
"gráfico de pizza" e é utilizado para qualquer tipo de tabela. Aqui, os
percentuais são convertidos em medidas de graus e representados
em uma circunferência (Figura 3).
© U2 – Tabulação de Dados 59
Marca
Marcapreferida
preferidade
decafé
café
15%
15%
45%
45%
20%
20%
20%
20%
Assistente de Gráfico
Com os dados selecionados, você deverá acessar a opção As-
sistente de Gráfico para confeccionar um gráfico, o que pode ser
feito de duas maneiras:
• entrando em Inserir e selecionando Gráfico;
• selecionando o ícone referente ao Assistente de Gráfico
(Figura 6).
Gráfico de colunas
Vamos iniciar nosso pequeno "guia" pelo gráfico de colunas.
Ao selecionar a opção Colunas, aparecerá uma tela com os tipos
de gráficos de colunas que o Excel pode desenhar (Figura 11). Note
que a única diferença está na forma de expor as colunas (em 2D
ou em 3D, utilizando retângulos ou outra forma geométrica). Para
ilustrar, vamos utilizar a primeira opção, em 2D.
Figura 13 Layout.
e
r 25
p
m 20
E
e 15
d
% 10
5
0
12 14 15 17 21
Número de Funcionários
Gráfico de barras
Para criar um gráfico de barras, utilizaremos tudo o que
foi discutido anteriormente no gráfico de colunas. Então, para
selecionar o gráfico de barras, acesse Inserir e, depois, Barras,
selecionando, em seguida, o modelo de sua preferência. Em nosso
caso, continuaremos optando pelo modelo 2D (Figura 16).
Vestuários
Petrolífera
s Naval
o
ic Armamentos
Setores Econômicos
m
ô Tecnologia
n
o
cE Eletro-eletrônicos
s Bebidas
e
r
o
t Transportes
e
S Siderurgico
Alimentos
Automotivo
Gráfico de setores
O gráfico de setores é chamado de Pizza no Excel. Para a sua
construção, retornamos ao passo de escolha do gráfico.
Depois de selecionar as informações da planilha, acesse o
menu Inserir. Observe, na Figura 18, os gráficos que o Excel pode
inserir na planilha com base na seleção feita. Selecione a opção
Pizza e escolha a primeira opção em 3D.
Automotivo
Alimentos
Siderurgico
Transportes
12.7 45.9
45.9 Transportes
12.7
d
i 20,00
C
e 15,00
d
% 10,00
5,00
0,00
Arroz Feijão Macarrão Carne de Açúcar Sal
Segunda
Produto com maior variação de preço no mês
o
ç Sal
re
Produto com maior variação de preço
p Açúcar
e
d
o Carne de Segunda
çãa
ir Macarrão
av
r Feijão
o
ai
m Arroz
m
co
o
t 0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00
u
d
o
r % de Cidades
P
36,64
s 40,00
e
d
% de cidades
a 30,00
d
ic
e 20,00
d
%
10,00
0,00
5 7 8 10 11
Número de Produtos com aumento de preço
5
7
38,17 8
10
46,56
11
Variação % no preço
Número de Cidades % de Cidades
da cesta básica
1,22 |— 1,31 77 58.78
1,32 |— 1,41 23 17.56
1,42 |— 1,51 17 12.98
1,52 |— 1,61 9 6.87
1,62 |— 1,71 5 3.82
Total 131 100.00
12.98
1,22 |-- 1,31
1,32 |-- 1,41
1,42 |-- 1,51
58.78 1,52 |-- 1,61
17.56
1,62 |-- 1,71
9
a3
a1
a5
a7
a9
a1
a1
a1
a1
a1
an
an
an
an
an
an
an
an
an
an
m
m
m
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
160
140
120
100
Número de Casos
Cidade 1
80
Cidade 2
60
40
20
0
1
10
11
12
13
14
15
16
17
18
19
20
a
a
an
an
an
an
an
an
an
an
an
a
an
an
an
an
an
an
an
an
an
an
an
m
m
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Se
Semanas
Por meio dos exemplos, foi possível notar que os gráficos são
ferramentas amplamente utilizadas nos meios de comunicação
em geral. Portanto, é preciso ficar atento às situações ideais para
a representação de dados via gráficos e saber utilizar recursos
tecnológicos para a sua construção.
CHO MOR MOR CHO CHO LEI CHO CHO MOR MOR
MOR LEI CHO CHO LEI CHO CHO MOR CHO CHO
LEI CHO MOR MOR CHO CHO MOR MOR LEI MOR
MOR LEI CHO LEI MOR MOR LEI CHO MOR CHO
23 21 25 20 22 20 25 21 25 23
22 23 25 23 19 19 19 23 25 25
19 22 19 22 19 23 19 22 22 22
19 21 23 25 21 20 25 21 23 21
2,35 2,45 2,41 2,40 2,33 2,29 2,55 2,48 2,47 2,51
2,15 2,45 2,45 2,64 2,58 2,61 2,49 2,22 2,24 2,20
2,47 2,59 2,60 2,41 2,49 2,44 2,19 2,22 2,23 2,55
2,55 2,56 2,57 2,45 2,46 2,59 2,64 2,63 2,15 2,18
Com base nos dados anteriores, construa uma tabela de frequências para
cada conjunto de dados e, depois, represente cada uma das tabelas por
meio de um gráfico de frequências da seguinte forma:
Gabarito
Confira, a seguir, a resposta correta para a questão
autoavaliativa proposta:
1)
a) Primeira tabela: Distribuição dos supermercados em relação aos
sabores mais vendidos.
Quantidade (mil
fa fr%
unidades)
19 8 20,0
20 3 7,5
21 6 15,0
© U2 – Tabulação de Dados 91
Quantidade (mil
fa fr%
unidades)
22 7 17,5
23 8 20,0
25 8 20,0
Total 40 100,0
Fazemos:
• At = 2, 64 − 2,15 = 0, 49
• K =+
1 3,3 ⋅ Log10 40 =+
1 3,3 ⋅1, 6 =6, 28
0, 49
• Ti= = 0, 082 → Ti= 0, 09
6
27,5
13. CONSIDERAÇÕES
Nesta unidade, discutimos dois importantes instrumentos
de tabulação de dados: as tabelas e os gráficos de frequências,
que, apesar de não exigirem muito esforço para sua construção,
exigem rigor quanto às normas de montagem.
Podemos, no dia a dia, identificar muitas situações nas quais
as tabelas e os gráficos são utilizados, inclusive exemplos estuda-
dos nesta unidade. Por isso, é importante saber construir e tam-
bém interpretar os resultados de uma tabela ou gráfico.
Na próxima unidade, vamos evoluir na representação e
análise dos dados coletados e/ou pesquisados, introduzindo as
medidas de tendência central, ou medidas de posição, entre elas a
média, que é uma unidade muito utilizada.
14. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
© U2 – Tabulação de Dados 93
2. CONTEÚDOS
• Médias aritméticas e Média Geométrica.
• Mediana e Moda.
• Medidas de ordem.
4. INTRODUÇÃO À UNIDADE
O objetivo principal de uma medida de posição é representar,
de forma resumida, um conjunto de dados gerado pelo estudo
de uma variável quantitativa, ou seja, um conjunto de dados
numéricos. Esse resumo é definido de maneira que todos os dados
presentes no conjunto sejam transformados em apenas um valor
típico, que representa, de modo significativo (que posicione), os
valores da variável.
Existem muitas formas de transformar um conjunto com n
elementos em apenas um valor representativo. Discutiremos duas
abordagens: as medidas de tendência central e as medidas de
ordem.
© U3 – Medidas Estatísticas de Posição 97
Médias aritméticas
Temos dois tipos principais de média aritmética: a Média
Aritmética Simples e a Média Aritmética Ponderada. Você se lem-
bra do conceito de "média"? Já viu sua utilização nas reportagens
que aparecem na televisão e nos jornais? Lembra-se de que é por
meio de médias que as escolas avaliam seus alunos? Pois bem.
Essa é a média que estudaremos.
Média Aritmética Simples
A Média Aritmética Simples, que denotaremos por X , de
um conjunto com n valores observados de uma variável quantita-
tiva X é obtida dividindo-se a soma de todos os valores de X pelo
total n de valores, ou seja, se considerarmos o conjunto com n
valores de X : X = { X 1 , X 2 , X 3 ,..., X n } , então, a Média Aritmética
Simples dos valores de X será igual a:
X 1 + X 2 + X 3 + ... + X n
X=
n
EXEMPLO 1
Em um levantamento dos últimos sete dias em uma
empresa, foram anotadas as quantidades de pedidos (X) efetuados
pelo serviço de e-commerce (comércio eletrônico) dessa empresa,
chegando-se aos seguintes dados: X = {12, 23, 11, 54, 34, 21, 10}.
Assim, a Média Aritmética Simples diária de pedidos é:
12 + 23 + 11 + 54 + 34 + 21 + 13 168
X
= = = 24
7 7
Para facilitar a notação, utilizaremos a indicação de somatório
para representar o numerador da fórmula da seguinte maneira:
n
∑X 1
X= i =1
n
A Média Aritmética Simples é uma medida que transforma
todos os dados da variável, de forma que todos fiquem iguais à
média calculada. Assim, em um problema prático, a média torna-
se o valor de referência para cada valor ou, então, todos ficam
iguais em média.
EXEMPLO 2
Em uma pesquisa, foram avaliadas as rendas (X), em número
de salários mínimos, de dez empregados do setor terciário,
obtendo-se os seguintes resultados: X = {12,3; 11,4; 13,2; 10,1;
8,5; 11,9; 22,1; 15,7; 10,7; 6,7}. Então, qual a renda média para
esses dez empregados?
Calculando, temos:
n
∑X
i
12,3 + 11, 4 + 13, 2 + 10,1 + 8,5 + 11,9 + 22,1 + 15, 7 + 10, 7 + 6, 7
=X = i =1
n 10
122, 6
=X = 12, 26
10
XP =
( X 1 ⋅ p1 ) + ( X 2 ⋅ p2 ) + + ( X k ⋅ pk )
p1 + p2 + + pk
∑( X i ⋅ pi )
XP = i =1
k
∑p i
EXEMPLO 1 i =1
∑( X ⋅ pi )
i
( 9, 0 ⋅1) + (8,5 ⋅ 4 ) + ( 7,5=
⋅ 5) 9 + 34 + 37,5 80,5
XP
= i =1
k
= = = 8, 05
1+ 4 + 5 10 10
∑ i
p
i =1
EXEMPLO 2
O uso de ponderação é um dos principais componentes dos
cálculos de inflação. Para ilustrar, vamos considerar quatro dife-
rentes produtos da cesta básica, com seus respectivos pesos de
importância: arroz, com peso igual a 4; feijão, com peso 2,5; sabo-
nete, com peso igual a 2; e detergente, com peso igual a 1,5. Se,
em um determinado mês, cada um dos produtos apresentou uma
determinada variação percentual de preço – o arroz subiu 2%, o
feijão subiu 3%, o sabonete subiu 15% e o detergente subiu 9% –,
então, qual o índice de variação média de preço?
k
∑( X ⋅ pi ) i
( 2 ⋅ 4 ) + ( 3 ⋅ 2,5) + (15 ⋅ 2 ) + ( 9 ⋅1,5=) 59
X=
P
i =1
k
= = 5,9
4 + 2,5 + 2 + 1,5 10
∑ pi
i =1
∑( X i ⋅ fi )
XP = i =1
k
∑f
i =1
i
EXEMPLO 3
Tomemos como exemplo uma tabela construída na unidade
anterior, a qual reapresentamos a seguir, que representava o nú-
mero de copos de café que as 20 pessoas pesquisadas consumiam
por dia. Com base nela, vamos calcular a média diária de copos de
café que são consumidos.
∑( X i ⋅ fi )
( 5 ⋅ 6 ) + ( 6 ⋅ 5) + ( 7 ⋅ 3) + ( 8 ⋅ 4 ) + ( 9 ⋅=
2) 131
X
= P
i =1
k
= = 6,55
6+5+3+ 4+ 2 20
∑
i =1
fi
EXEMPLO 4
Continuando com o exemplo da unidade anterior, porém,
desta vez, não o que representava o número de copos de café,
mas o que representava o preço sugerido para o quilo do pó de
café preferido, qual o preço médio que as pessoas indicam como
justo a pagar?
∑( X i ⋅ fi )
( 2,99 ⋅ 5) + ( 3, 27 ⋅ 6 ) + ( 3,55 ⋅1) + ( 3,83 ⋅ 3) + ( 4,11 ⋅ 5) 70,16
XP
= i =1
=
k
= = 3,508
6+5+3+ 4+ 2 20
∑ fi
i =1
PROPRIEDADE 1
Se somarmos uma mesma constante W a todos os elemen-
tos de uma variável X, a média aritmética dessa variável também
fica somada da constante W.
∑ X i ∑ ( X i + W ) ∑ X i + ∑W ∑ X i + n ⋅W ∑X i
n ⋅W
X=
=i 1 =i 1
= =
=i 1 =i 1 =i 1
= =
=i 1
+ X W
=+
n n n n n n
PROPRIEDADE 2
Se multiplicarmos uma mesma constante W por todos os
elementos de uma variável X, a média aritmética dessa variável
também fica multiplicada pela constante W.
Fazendo X como sendo X ⋅ W , teremos:
n n n n
∑ X i ∑ ( X i ⋅W ) =
W ⋅ ∑ Xi ∑ Xi
X= =
=i 1 =i 1
= i 1
W⋅
=
=i 1
W⋅X
=
n n n n
PROPRIEDADE 3
A média aritmética pode ser interpretada como o ponto de
equilíbrio da variável. Isso pode ser demonstrado pelo cálculo da
soma das diferenças entre cada valor de X e a média, que resultará
sempre em zero, ou seja, o montante de informação à esquerda
da média (valores negativos) sempre será igual ao montante de
informação ao lado direito da média (valores positivos).
Fazendo a subtração X − X e somando as diferenças,
teremos:
n n n n
=i 1
∑( X i − X
= ) ∑ X − ∑=
i X ∑X
=i 1 =i 1 =i 1
i − n⋅ X
∑X 1 n
Simples, ou seja, X = i =1 =n ⋅ X =∑ X 1 .
n i =1
∑( X
=i 1
1− X
= ) ∑X
=i 1
1 − n ⋅=
X ∑ Xi − ∑=
Xi 0 ,
i −1 =i 1
que era o
resultado esperado.
© U3 – Medidas Estatísticas de Posição 105
EXEMPLO 1
A seguir, temos três diferentes conjuntos de dados.
Calcularemos a Média Aritmética Simples de cada um deles e
observaremos o que acontece com o resultado.
• X = {2, 4, 7, 8, 10}
2 + 4 + 7 + 8 + 10 31
X
= = = 6, 2
5 5
Veja que, no cálculo apresentado, o valor 6,2 está razoavel-
mente no centro dos dados e que é um valor relativamente pró-
ximo dos demais. Isso significa que temos uma média aritmética
representativa.
• X = {2, 14, 37, 68, 91}
2 + 14 + 37 + 68 + 91 212
X
= = = 42, 4
5 5
Nesse caso, apesar de o valor 42,4 estar razoavelmente pró-
ximo do centro dos dados, é um valor muito diferente dos demais,
o que significa que não temos uma média aritmética representa-
tiva. Isso ocorre pelo fato de termos alta variação nos dados, ou
seja, existe muita diferença entre eles.
• X = {2, 4, 7, 8, 100}
2 + 4 + 7 + 8 + 100 121
X
= = = 24, 2
5 5
O valor 24,2 não está se posicionando onde poderíamos con-
siderar como o centro dos dados e é um valor muito diferente dos
demais, o que significa que não temos uma média aritmética re-
presentativa. Isso ocorreu pela presença de um valor extremo, o
valor 100.
Assim, podemos considerar que a média aritmética (simples
ou ponderada) tem sua representatividade associada ao compor-
tamento dos dados. É desejado que exista pouca variação entre os
dados, ou seja, que eles sejam os mais próximos possíveis entre si
e, de preferência, sem valores extremos.
EXEMPLO 1
Quatro amigos trabalham em um supermercado por tempo
parcial com os seguintes salários/horário: Paulo, com R$2,20; José,
com R$2,40; Antônio, com R$2,50; e Manuel, com R$ 2,10. Então:
• Qual será o salário/horário médio entre os quatro?
2, 20 + 2, 40 + 2,50 + 2,10 9, 20
X
= = = 2,30 .
4 4
EXEMPLO 2
Um produto é acondicionado em lotes, contendo, cada um
deles, 10 unidades. O lote só é aprovado se apresentar um peso (X)
médio superior a 4kg. Se as unidades que compõem um determi-
nado lote pesam: X = {3,0; 4,0; 3,5; 5,0; 3,5; 4,0; 5,0; 5,5; 4,0; 5,0},
esse lote será aprovado?
3 + 4 + 3,5 + 5 + 3,5 + 4 + 5 + 5,5 + 4 + 5 42,5
X
= = = 4, 25
10 10
Como o peso médio dos pacotes é de 4,25kg, o lote será
aprovado.
EXEMPLO 3
Uma empresa que produz e comercializa um determinado
tipo de bebida à base de soja, com a finalidade de aumentar suas
vendas, estruturou um plano de marketing, aproveitando a atual
importância que as pessoas estão dando para a melhoria da qua-
lidade de vida. Nos meses anteriores ao início do plano, as vendas
registradas foram as seguintes: {564, 589, 578, 568, 554, 579, 549,
567, 568, 577, 567, 587}.
Após a execução da estratégia de marketing da empresa, as
vendas foram registradas para um período de 12 meses, obtendo-
-se os dados: {584, 615, 610, 599, 588, 564, 610, 605, 587, 598,
601, 615}.
Para avaliar a eficiência ou não do plano de marketing, es-
tabeleceremos uma análise comparativa entre o consumo médio
antes e depois dele. Qual o risco nesse tipo de análise?
• Antes do plano:= 6847
X = 570, 6 unidades vendidas
em média. 12
7176
• Depois do plano:=X = 598 unidades vendidas em
média. 12
Média Geométrica
A Média Geométrica, que indicaremos por G, é muito
interessante quando os dados são resultados de uma análise
que considera o crescimento temporal de uma variável, como
a evolução da rentabilidade de uma aplicação financeira ou a
variação percentual de preço em períodos diferentes, ou quando
temos uma variável que apresenta alto grau de variação. Nesses
casos, a Média Geométrica funciona melhor, pois o cálculo é feito
na escala logarítmica da variável.
Antes da apresentação da Média Geométrica, avaliaremos o
impacto da escala logarítmica no conjunto de dados a seguir.
Ln(1) = 0
Ln(12) = 2, 48
Ln(56) = 4, 025
Ln(199) = 5, 293
Ln(367) = 5,905
Ln(987) = 6,895
Ln(1223) = 7,109
Ln(5555) = 8, 622
Ln(10000) = 9, 210
G= n X 1 ⋅ X 2 ⋅ ... ⋅ X n
EXEMPLO 1
Em uma determinada construtora, a principal equipe de pe-
dreiros foi avaliada em sua eficiência para futuros serviços. Nos
primeiros sete dias de avaliação, os pedreiros construíram 215m²
de parede. Nos 15 dias subsequentes, construíram 352m² de pa-
rede e, nos últimos 30 dias, 615m² de parede. Então, qual a média
diária de m² de parede da equipe de pedreiros?
Resolução:
Para calcular a média diária, basta somar a quantidade de
parede e dividir o resultado pela quantidade de dias, da seguinte
forma: n
EXEMPLO 2
Os dados a seguir foram obtidos na medição do diâmetro
(X) de tubos de PVC utilizados em sistemas de saneamento de
X 12,06 12,04 12,11 11,97 12,03 12,09 12,05 12,01 12,10 12,09
={
12,10 12,06 12,03 12,00 12,01 12,06 12,07 12,05 12,08 12,03
12,01 12,05 12,09 12,11 12,15 12,01 11,99 11,98 12,05 12,01 }
∑X 1
361, 49
=X =
i −1
= 12, 0497
n 30
Como a média está acima da tolerância fixada, o lote de pe-
ças não satisfaz a exigência.
Diâmetro fa fr%
11,97 |— 12,02 9 30,0
12,02 |— 12,07 11 36,7
12,07 |— 12,12 9 30,0
12,12 |— 12,17 1 3,3
Total 30 100,0
∑( X i ⋅ fi )
Xp = i =1
k
∑f
i =1
i
Xp =
(11,995 ⋅ 9 ) + (12, 045 ⋅11) + (12, 095 ⋅ 9 ) + (12,145 ⋅1)
9 + 11 + 9 + 1
361, 45
Xp
= = 12, 04833
30
Como a média ficou abaixo da tolerância fixada, o lote foi
aprovado, isto é, satisfez a tolerância.
EXEMPLO 3
Em estudos de Microeconomia relacionados com as teorias
do consumidor, é comum o relacionamento entre a demanda e a
oferta de um produto em função do preço de mercado dele. Em
um estudo envolvendo demanda e preços, foram coletadas, em
abril de 2006, informações sobre a quantidade vendida e o preço
de um dado produto em dez diferentes estabelecimentos repre-
sentativos de uma determinada cidade, obtendo-se os seguintes
dados:
• Demanda: {123; 145; 176; 165; 177; 143; 165; 188; 155;
142}.
• Preço: {12,33; 13,55; 12,66; 11,76; 10,99; 11,33; 12,98;
12,98; 11,90; 12,59}.
Os mesmos estabelecimentos foram visitados novamente,
em julho de 2006, obtendo-se os seguintes dados:
• Demanda: {112; 125; 146; 135; 161; 132; 154; 166; 145;
112}.
• Preço: {13,33; 13,85; 14,66; 12,76; 11,89; 12,13; 13,38;
14,18; 13,70; 14,89}.
1) Com base nos dados apresentados, calcule o preço e a
demanda média aritmética para cada um dos meses e
interprete os resultados.
2) Em uma situação em que a variação percentual de que-
da da demanda é maior que a variação percentual do
aumento dos preços, dizemos que o produto não é im-
portante economicamente; caso contrário, o produto é
importante. Com base nas médias obtidas no Item (1),
calcule as variações percentuais e verifique se o produto
pesquisado é ou não é economicamente importante.
© U3 – Medidas Estatísticas de Posição 115
EXEMPLO 4
A fim de detectar relações entre consumo de água e produ-
ção de resíduos sólidos poluentes, um estudo foi montado com
13,46 —— 4,39
13,7 —— Y
EXEMPLO 5
Em um estudo de composição de custo de vida, um instituto
de pesquisas econômicas considerou uma cesta com dez produ-
tos, sendo quatro do gênero alimentação (arroz, feijão, macarrão e
batata), três do gênero higiene pessoal (sabonete, pasta de dente
e papel higiênico) e três do gênero limpeza (detergente, sabão em
pó e amaciante). De posse da cesta, foram efetuadas coletas de
preços em dois períodos diferentes, obtendo-se os dados referen-
tes à seguinte variação percentual do preço:
Mediana
A Mediana, que denotaremos por Md, é definida como o va-
lor que ocupa a posição central dos dados ordenados. Pela sua de-
finição, notamos que, para calculá-la, é importante saber quantos
elementos temos no conjunto para determinar o seu centro. Além
disso, não podemos nos esquecer de ordenar os dados.
Exemplo 1
Quando a quantidade de elementos n for ímpar, para
determinarmos a Mediana, basta localizarmos o elemento da
posição Po = n + 1 .
2
Por exemplo, vamos determinar a Mediana do conjunto X =
{1, 4, 7, 10, 11, 20, 21}. Temos que a posição de interesse é:
n +1 7 +1 8
Po= = = = 4º posição
2 2 2
A Mediana é o valor que ocupa a 4ª posição; então, Md = 10.
Exemplo 2
Quando a quantidade de elementos n for par, para
determinarmos a Mediana, basta localizarmos os elementos das
n n
posições centrais Po1 = e Po2= + 1 e, depois, calcularmos
2 2
a Média Aritmética Simples dos valores que se encontram nas
posições centrais.
Exemplo 3
Uma boa qualidade da Mediana é que ela é uma medida que
não é afetada por valores extremos como é a média aritmética.
Seja o conjunto de dados X = {10, 20, 30, 40, 50}, podemos
observar que tanto a média aritmética quanto a Mediana são
iguais a 30. Entretanto, se alterarmos os dados para X = {10, 20,
30, 40, 5000}, qual será a média e qual será a Mediana?
Calculando a média, obteremos um valor igual a 1.020, que
aumentou muito devido ao aparecimento do valor extremo 5.000,
mas a Mediana continuará igual a 30.
Isso nos mostra que a Mediana é uma medida preferível
quando temos variáveis com valores extremos.
Além da Mediana, outra medida considerada de tendência
central é a Moda. Vamos conhecê-la?
© U3 – Medidas Estatísticas de Posição 121
Moda
A Moda, que denotaremos por Mo, é definida como o valor
que possui maior frequência, ou seja, o que aparece mais vezes no
conjunto de dados.
Vejamos um exemplo de aplicação dessa medida de
tendência central nos conjuntos a seguir:
• X = {2, 2, 3, 3, 3, 4, 4}. Então, Mo = 3, que é o valor que
mais vezes se repete.
• X = {3, 3, 4, 4, 4, 5, 5, 5, 6}. Nesse caso, temos dois valores
que mais se repetem; assim, Mo = 4 e Mo = 5. Esse caso é
chamado de "bimodal".
• X = {2, 4, 6, 7, 8}. Como todos os valores aparecem com
frequências iguais, todos aparecem apenas uma vez. En-
tão, podemos dizer que, nesse caso, não existe Moda,
sendo chamado de "amodal".
Você deve estar pensando: Quando posso utilizar a Moda?
A resposta para essa pergunta é que, raramente, a Moda será uti-
lizada isoladamente na prática, diferentemente das médias e da
Mediana. Contudo, ela tem um papel importante na interpretação
do conceito de simetria, que veremos mais adiante.
Antes de avançarmos, devemos chamar a atenção para um
importante detalhe: tanto a Mediana quanto a Moda são medidas
que podem ser calculadas com base em tabelas de frequências,
desde que não tenhamos as informações em intervalos. Nesse
caso, as medidas possuem uma imprecisão muito grande e não
apresentam bons resultados, como já pudemos comprovar.
Sem dúvida, dentre as medidas anteriores, as que mais pos-
suem aplicação prática são as médias aritméticas, mas elas depen-
dem muito da variabilidade dos dados. Para ilustrar essa situação,
vejamos, a seguir, uma relação interessante entre as medidas es-
tudadas até aqui.
∑X i
63
X
• Média: = i =1
= = 3.
n 21
n + 1 21 + 1 22
• Mediana: Po
= = = = 11ª posição , então
2 2 2
Md = 3.
• Moda: Mo = 3 (possui maior frequência igual a 7).
Representando os dados em um gráfico de colunas e apontan-
do os valores da Média, da Mediana e da Moda, teremos um gráfico
em formato simétrico, como podemos observar na Figura 1.
© U3 – Medidas Estatísticas de Posição 123
Gráfico Simétrico
8
Média Aritmética = Mediana = Moda = 3
7
5
Frequência
1 2 3 4 5
Valores de X
7. MEDIDAS SEPARATRIZES
Além das medidas de tendência central, cujo objetivo é
avaliar, de forma integral, a variável por meio de uma medida
local, temos um grupo de medidas cujo objetivo é estabelecer
uma relação de ordem na variável, com muita aplicação na
criação de cenários de classificação. Essas medidas são chamadas
de estatísticas de ordem, ou medidas separatrizes. Devido à
similaridade de procedimentos, discutiremos, neste material,
apenas as medidas de quartil.
Medidas de quartil
As medidas de quartil servem para dividir os dados ordenados
em quatro partes, equivalentes a 25%, 50% e 75% dos dados.
Vejamos o esquema representado na Figura 2.
© U3 – Medidas Estatísticas de Posição 125
0,22 0,52 0,63 0,69 0,75 0,89 0,95 1,15 1,25 1,35
1,45 1,49 1,52 1,58 2,33 2,65 2,78 3,02 3,15
9. QUESTÕES AUTOAVALIATIVAS
Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) A Média de um conjunto numérico pode ser igual a zero? Pode ser um
número negativo? Explique.
Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) Sim, pode ser zero, bastando que a soma dos números seja igual a zero. Sim,
pode ser negativa, bastando que a soma dos números seja negativa. Como
exemplo, considere o saldo bancário (X) de três pessoas:
Caso 1: X = {100,00; -80,00; -20,00}. Nesse caso, o saldo médio será igual a
zero.
Caso 2: X = {100,00; -180,00; -20,00}. Nesse caso, o saldo médio será igual a
-100,00.
4)
a) O tempo médio será igual a 25 meses. Assim, cada loja apresentou
um tempo de retorno do investimento igual a 25 meses em média.
b) Ordenando os dados, veremos que Md = 24 meses. Assim, 50% das
lojas apresentou um tempo de retorno menor ou igual a 24 meses,
e 50% das lojas, um tempo maior ou igual a 24 meses.
c) Verificando a repetição dos números, temos que Mo = 24 meses.
Assim, a maior parte das lojas registrou um tempo de retorno de
24 meses.
d) Como os dados não apresentam uma variação muito elevada e
também não possuem um valor extremo, a melhor medida é a
10. CONSIDERAÇÕES
Podemos dizer que, dentre as medidas discutidas nesta uni-
dade, a média aritmética (simples ou ponderada) é a mais utiliza-
da, devido às suas propriedades matemáticas e à sua facilidade de
cálculo.
Contudo, há duas considerações importantes a serem feitas.
A primeira é que, como a Média provoca uma alteração nos da-
dos, "substituindo-os" pela Média calculada, ela tende a ignorar a
variabilidade natural dos dados. A segunda é que diferentes con-
juntos numéricos podem possuir a mesma Média. Nesses casos,
é importante conhecer a dispersão, ou variabilidade, dos valores
para uma análise mais correta da Média, utilizando, para isso, as
medidas de dispersão, que estudaremos na próxima unidade.
Hoje, podemos utilizar calculadoras científicas e planilhas
eletrônicas para o cálculo de algumas medidas estatísticas. Isso
também será discutido na próxima unidade.
Vamos lá?
11. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004.
MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson,
2009.
NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson
Prentice Hall, 2003.
SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo:
Atlas, 2002.
SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e
estatística. 2. ed. Porto Alegre: Bookman, 2004.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São
Paulo: Pearson, 2008.
4
1. OBJETIVOS
• Classificar as principais medidas de dispersão.
• Aplicar e interpretar as medidas de dispersão.
• Relacionar as medidas de dispersão.
• Aplicar os cálculos das medidas estatísticas em calculado-
ras científicas e na planilha do Excel.
2. CONTEÚDOS
• Variância Amostral e Desvio Padrão Amostral.
• Coeficiente de Variação.
• Índice de Assimetria.
138 © Probabilidade e Estatística
4. INTRODUÇÃO À UNIDADE
As medidas de dispersão também são conhecidas como
"medidas de variabilidade". O grau de diferença existente entre
os dados de uma variável quantitativa, ou seja, o quanto os dados
numéricos tendem a dispersar-se em torno da média aritmética,
são chamados de "variação", ou "dispersão", de dados.
Essa análise é importante para avaliarmos o quanto que a
média aritmética possui de capacidade para representar os dados
de uma variável. Apenas para ilustrar, vejamos o exemplo a seguir.
• Seja um grupo de funcionários com os seguintes salários em
reais: X = {1260,00; 1275,00; 1265,00; 1260,00; 1270,00}.
Calculando o salário médio desse grupo, teremos:
n
i ∑X
6330
=X
= = 1266, 00
i =1
n 5
• Seja um segundo conjunto de funcionários, com os se-
guintes salários: X = {1535,00; 1000,00; 1755,00; 1100,00;
© U4 – Medidas Estatísticas de Dispersão 139
∑ Xi
6330
= X = = 1266, 00
i =1
n 5
Como podemos notar, os dois conjuntos de funcionários re-
sultaram na mesma Média, mas os funcionários do primeiro grupo
apresentaram salários mais próximos da Média (um desvio menor
em relação à Média), enquanto os funcionários do segundo grupo
apresentaram salários mais distantes da Média (um desvio maior
em relação à Média).
Por isso, é importante que a aplicação tanto da Média Arit-
mética Simples quanto da Média Aritmética Ponderada seja acom-
panhada de alguma medida que indique de quanto é a variação
dos dados.
5. MEDIDAS DE DISPERSÃO
Como vimos no exemplo anterior, o cálculo da média arit-
mética não consegue diferenciar o grau de variação (de desvio)
dos dados, uma vez que considera os dados homogêneos, ou seja,
para a Média, os dados são iguais. Vejamos o esquema da Figura 1.
∑X i
2 + 6 + 12 + 20 40
X
= i =1
= = = 10
n 4 4
A Média transforma os dados; cada valor passa a ser exa-
tamente igual à Média, ou seja, o conjunto X pode ser inter-
pretado como um novo conjunto de dados transformados:
X T = {10,10,10,10} .
Sendo assim, é importante questionar o seguinte: Os dados
observados (reais e verdadeiros) são próximos o suficiente da Mé-
dia para validarem a aproximação, ou, então, os desvios dos valo-
res em relação à Média são baixos?
Isso vem ao encontro das análises feitas na Unidade 3, em
que dissemos que a Média funciona melhor quando os dados pos-
suem pouca variação, ou seja, pouca diferença entre si. Se isso
ocorre, certamente, a aproximação será adequada.
Para responder a essas perguntas, devemos calcular o grau
de variação dos dados, que é o mesmo que avaliar a distância de
cada valor em relação à Média, o que chamaremos de "desvio".
Mas como poderemos medir esse desvio? Se você respondeu que
devemos subtrair cada valor X da Média X , está com a razão!
Para mensurar a variabilidade existente nos dados, teremos
de subtrair cada um dos valores X observados na Média, ou seja,
( X − X ) . Como temos vários valores, ao final das subtrações, vamos
somar essas diferenças da seguinte forma:
n
∑( X
i −1
i −X)
∑( X
i =1
i − X ) =(2 − 10) + (6 − 10) + (12 − 10) + (20 − 10) =
= ( −8 ) + ( −4 ) + 2 + 10
( 12 ) + 12 =0
=−
∑( X −X)
2
i
i −1
n
∑( X −X) =
2
i (2 − 10) 2 + (6 − 10) 2 + (12 − 10) 2 + (20 − 10) 2 =
i =1
Variância Amostral
A Variância Amostral, que denotaremos por VAR(X), é
definida como a Média dos desvios ao quadrado e é calculada da
seguinte forma:
n
∑( X −X)
2
i
VAR ( X ) = i =1
n −1
∑( X −X)
2
i
184 184
VAR (=
X) i =1
= = = 61,3
n −1 4 −1 3
∑( X −X)
2
i
S= i =1
n −1
Demonstraremos o cálculo do Desvio Padrão Amostral
utilizando os mesmos dados dos exemplos anteriores. Vejamos,
então, o cálculo a seguir.
n
∑( X −X)
2
i
184 184
=S i =1
= = = 61,3 7,8
=
n −1 4 −1 3
n
2 + 2 + 4 + 6 + 7 + 15 36
X
= ∑ X=
i =1
i
6
= = 6
6
n
∑(X − X )2 i
=S =
i =1
n −1
( 2 − 6 ) + ( 2 − 6 ) + ( 4 − 6 ) + ( 6 − 6 ) + (15 − 6 )
2 2 2 2 2
=
6 −1
( −4 ) + ( −4 ) + ( −2 ) + ( 0 ) + (1) + ( 9 )
2 2 2 2 2 2
=
5
16 + 16 + 4 + 0 + 1 + 81
=
5
118
= 23, 6 4,86
=
5
∑( X )
2
−X i
=S =
i =1
n −1
(1,5 − 2, 2) 2 + ( 2,5 − 2, 2 ) + ( 3, 7 − 2, 2 ) + (1,1 − 2, 2 )
2 2 2
=
4 −1
(−0, 7) 2 + ( 0,3) + (1,5 ) + ( −1,1)
2 2 2
=
3
0, 49 + 0, 09 + 2, 25 + 1, 21
=
3
4, 04
= 1,35 1,16
=
3
© U4 – Medidas Estatísticas de Dispersão 145
∑( X −X)
2
i
S =
i =1
n −1
(10 − 12, 4) 2 + (12 − 12, 4) 2 + (15 − 12, 4) 2 + (11 − 12, 4) 2 + (14 − 12, 4) 2
5 −1
(−2, 4) 2 + (−0, 4) 2 + (2, 6) 2 + ( −1, 4) 2 + (1, 6) 2
=
4
5, 76 + 0,16 + 6, 76 + 1,96 + 2,56
=
4
17, 2
= 4,3 2, 07
=
4
© U4 – Medidas Estatísticas de Dispersão 147
∑(X − X )2
1
=S =
i =1
n −1
(12 − 14, 6) 2 + (11 − 14, 6) 2 + (15 − 14, 6 ) + (16 − 14, 6 ) + (19 − 14, 6 )
2 2 2
=
5 −1
( −2, 6 ) + ( −3, 6 ) + ( 0, 4 ) + (1, 4 ) + ( 4, 4 )
2 2 2 2 2
=
4
6, 76 + 12,96+, 016 + 1,96 + 19,36
=
4
41, 2
= 10,3 3, 21
=
4
∑( X )
2
i + X
=S =
i =1
n −1
n
∑ ( X i (
+W ) − X +W
)
i =1
=
n −1
n
∑( X 1 +W − X −W )
i =1
=
n −1
n
∑( X )
2
1 +X
i =1
=S
n −1
Como vemos, somando W, o desvio padrão não se altera.
Agora, analisando o Coeficiente de Variação, teremos:
© U4 – Medidas Estatísticas de Dispersão 149
S S
CV
= =
X X +W
Assim, se W for maior que zero, o CV será menor; logo, a
propriedade será verdadeira.
Propriedade 2
Ao multiplicarmos todos os elementos de uma variável X por
uma mesma constante W, o desvio padrão ficará multiplicado por
W e o coeficiente de variação não se alterará.
Na Propriedade 2, devemos nos lembrar de que a Média da
variável fica multiplicada pela constante (como demonstrado na
Unidade 3), ou seja, X= X ⋅ W . Assim, temos:
n
∑( X )
2
+X i
=S =
i =1
n −1
n
( )
2
∑ ( X i ⋅W ) − X ⋅W
i =1
=
n −1
n
∑ W ⋅ ( X )
2
−X
i
i =1
=
n −1
n n
∑W ⋅ ( X ) ∑( X )
2 2
2
i −X i −X
2 i 1
=i 1 =
= W ⋅
n −1 n −1
n
∑( X )
2
i − X
W2 ⋅ i =1
=
n −1
n
∑( X )
2
i −X
W⋅ i =1
W ⋅S
=
n −1
3 ⋅ ( X − Md )
IA =
S
Você se lembra de que a simetria ocorre quando a Média é
igual à Mediana e à Moda? Pois bem. Se os dados forem simétri-
cos, então X = Md , e dá para perceber que IA será igual a zero.
Assim, quanto mais o valor de IA se afastar de zero, maior será a
assimetria dos dados, lembrando que IA pode ser positivo ou ne-
gativo, dependendo dos valores da Média e da Mediana.
© U4 – Medidas Estatísticas de Dispersão 151
∑( X −X)
2
i
3,16 3,16
=S i =1
= = = 0,
= 632 0, 795
n −1 6 −1 5
Então:
∑( X −X)
2
i
13, 068 13, 068
=S i =1
= = = = 2, 614 1, 617
n −1 6 −1 5
Então:
3 ⋅ ( X − Md ) 3 ⋅ (6,12 − 5,55) 3 ⋅ (0,57) 1, 71
IA
= = = = = 1, 057
S 1, 617 1, 617 1, 617
Por meio dos cálculos realizados, podemos concluir que o Ín-
dice de Assimetria do setor metalúrgico é menor (ignore o sinal de
negativo para realizar a comparação) que o do setor alimentício.
No setor metalúrgico, a produção mensal está mais concentrada,
mais próxima da média mensal, enquanto, no setor alimentício, a
produção mensal se distancia mais da produção média, com possí-
veis picos de produção.
7. RECURSOS TECNOLÓGICOS
O cálculo do desvio padrão e da Média Aritmética Simples
são, como bem sabemos, trabalhosos de serem resolvidos. Por
isso, existem alguns recursos tecnológicos que favorecem a reali-
zação desses cálculos. Vamos conhecê-los?
Inicialmente, conheceremos os procedimentos para o cálcu-
lo da Média Aritmética Simples e do desvio padrão em alguns mo-
© U4 – Medidas Estatísticas de Dispersão 153
5) Média Geométrica
=MÉDIAGEOMÉTRICA (selecionar as células que contêm os
dados)
6) Mediana
=MED (selecionar as células que contêm os
dados)
7) Moda
=MODO (selecionar as células que contêm os
dados)
8) Primeiro Quartil
=QUARTIL (selecionar as células que contêm os da-
dos; 1)
9) Segundo Quartil
=QUARTIL (selecionar as células que contêm os da-
dos; 2)
Exemplo 1
Em uma situação de entusiasmo financeiro, uma usina de
beneficiamento de algodão está ampliando seu setor produtivo,
devendo contratar mais uma equipe de 13 funcionários. O anúncio
de contratação atraiu muitos candidatos, que, ao final do processo
seletivo, foram reduzidos a apenas 39, os quais foram divididos em
três equipes de 13 pessoas. Cada uma das equipes passou por um
treinamento e um processo de experiência, no qual os responsá-
veis pelo setor de RH observaram a eficiência de suas tarefas por
meio do tempo gasto na execução delas. Os tempos observados
(em minutos) para cada candidato de cada uma das equipes foram:
• Equipe 1: X = {23,1; 24,2; 21,3; 24,2; 23,1; 23,2; 23,4;
21,3; 21,7; 23,6; 25,7; 21,3; 22,5}.
• Equipe 2: X = {23,8; 24,9; 22,0; 24,9; 23,8; 23,9; 24,1;
22,0; 22,4; 24,3; 26,4; 22,0; 23,2}.
• Equipe 3: X = {21,5; 20,3; 24,7; 22,6; 20,7; 20,3; 22,4;
22,2; 22,1; 23,2; 20,3; 23,2; 22,1}.
Para definir a contratação, os responsáveis vão considerar a
equipe mais homogênea, ou seja, a equipe em que os tempos são
mais parecidos entre si, com menor grau de variabilidade. Consi-
derando o exposto, estabeleça uma análise que identifique a equi-
pe a ser contratada.
Resolução: como o interesse é determinar a equipe com me-
nor grau de variabilidade, devemos comparar os valores dos Coefi-
cientes de Variação das equipes.
© U4 – Medidas Estatísticas de Dispersão 159
• Equipe 1:
n
∑X i
298, 6
=X =
i =1
= 22,97
2 13
n
∑( X )
2
−X 1
21,345
=S i =1
= = = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0581
= 5,81%
X 22,97
• Equipe 2:
n
∑X i
307, 7
=X =
I =1
= 23, 67
n 13
n
∑(X
− X )2
21,345 1
=S =i =1
= = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0564
= 5, 64%
X 23, 67
• Equipe 3:
n
∑X i
285, 6
=X =
I =1
= 21,97
n 13
n
∑(X
− X )2
21,345 1
=S = i =1
= = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0607
= 6, 07%
X 21,97
Exemplo 2
O gráfico de linhas da Figura 2 representa a evolução do
número de pisos com defeito produzidos por hora em uma
indústria de cerâmica.
Figura 2 Gráfico de linhas do número de pisos produzidos com defeito por hora.
∑X i
365
X
= I =1
= = 15, 208
n 24
n
∑( X −X)
2
i
411,9583
=S i =1
= = 17,911 4, 232
=
n −1 23
© U4 – Medidas Estatísticas de Dispersão 161
Exemplo 3
Sabe-se que uma variável numérica Z tem Média igual a 100
e uma variância igual a 50. Considerando duas outras variáveis X
Z
e Y, tais que: X = 4 ⋅ Z + 19 e Y= + 15 , determine qual das três
3
variáveis possui a maior variabilidade.
Resolução: como a variância da variável Z é igual a 50, seu
desvio padrão será=S = 50 7, 07 e seu Coeficiente de Variação
7, 07
CV = 0, 0707 . Para efetuarmos os cálculos para X e Y,
será =
100
devemos nos lembrar das propriedades da Média e do desvio pa-
drão, quando somamos e multiplicamos constantes. Assim, temos:
Para a variável X:
• Sua Média será: X =4 ⋅ Z + 19 =4 ⋅100 + 19 =400 + 19 =419 .
• Seu desvio padrão será: S X =4 ⋅ S Z =4 ⋅ 7, 07 =28, 28 .
28, 28
• Seu Coeficiente de Variação será:= CV = 0, 0675 .
419
Para a variável Y:
Z 100
• Sua Média será: Y = + 15 = + 15 = 33,33 + 15 = 48,33 .
3 3
S Z 7, 07
• Seu desvio padrão será: S=
Y = = 2,36 .
3 3
2,36
• Seu Coeficiente de Variação será:= CV = 0, 0488 .
48,33
Conclusão: temos, então, CVX = 0, 0675 , CVY = 0, 0488 e
CVZ = 0, 0707 ; portanto, a variável com maior variabilidade é a Z,
pois o seu CV é o maior.
Exemplo 4
Considerando o problema de operação de uma catapulta ro-
mana (máquina de guerra), o objetivo de lançar projéteis a uma
determinada distância depende de três fatores, que são pontos
que podem ser variados pelo operador: altura do pivô, compri-
mento do braço e ângulo de parada. Um experimento foi planeja-
do para determinar a distância média que o projétil poderia alcan-
çar variando as condições da catapulta. A seguir, reproduzimos um
dos experimentos, com duas condições fixadas:
• Condição 1: altura do pivô = 1,30m; comprimento do braço
= 0,90m; e ângulo de parada = 30º
• Distâncias observadas (em m) em dez lançamentos:
• {20,5; 21,5; 21,6; 20,7; 21,3; 20,5; 21,1; 21,6; 20,9; 20,4}.
• Condição 2: altura do pivô = 1,30m; comprimento do bra-
ço = 0,90m; e ângulo de parada = 45º
• Distâncias observadas (em m) em dez lançamentos:
• {22,9; 23,7; 24,6; 23,1; 24,8; 25,1; 26,7; 26,7; 25,9; 24,7}
Calcule a distância média atingida pelo projétil em cada con-
dição e admita um intervalo com, mais ou menos, dois desvios pa-
drão. Pode-se dizer que o aumento de 50% no ângulo de parada
provocou um aumento na distância do projétil? Em qual das duas
condições mais oscilaram as distâncias registradas?
Resolução: para a primeira questão, deveremos calcular a
Média, o desvio padrão e o intervalo com dois desvios, comparan-
do os intervalos em seguida.
• Condição 1:
n
∑X i
210,1
=X =
I =1
= 21, 01
n 10
© U4 – Medidas Estatísticas de Dispersão 163
∑( X−X)
2
i
2, 029
= S i =1
= = = 0, 2254 0, 4748
n −1 9
a) Limite inferior do intervalo =
X − 2=
⋅ S 21, 01 − 2 ⋅ 0, 4748
= 21, 01 − 0,95
= 20, 06
• Condição 2: n
∑X i
248, 2
=X =
I =1
= 24,82
n 10
n
∑( X −X)
2
i
16, 276
=S i =1
= = 1,8084 1,345
=
n −1 9
a) Limite inferior do intervalo =
X − 2=
⋅ S 24,82 − 2 ⋅1,345
= 24,82 − 2,=
69 22,13
Exemplo 5
Para avaliar o impacto da manipulação genética em uma
determinada fruta tropical quanto à quantidade de vitaminas por
unidade da fruta, dois canteiros foram cultivados, sendo o primei-
ro (C1) contendo 10 plantas sem modificação genética e o segundo
(C2) contendo 10 plantas modificadas geneticamente. A seguir, es-
tão os valores obtidos na pesquisa, sendo que cada número repre-
senta a contagem das vitaminas (em mg) por kg de fruta em cada
planta do canteiro:
• C1 = {5,8; 4,8; 5,1; 4,9; 5,2; 4,7; 4,8; 5,1; 5,2; 4,9}.
• C2 = {5,9; 5,3; 4,9; 5,5; 5,1; 5,9; 4,7; 4,2; 5,4; 5,5}.
Com base nos dados anteriores, construindo um intervalo
com a média mais ou menos 1,5 desvios padrão, o que pode ser
dito sobre a modificação genética das plantas?
Resolução:
• Canteiro (C1):
n
∑X i
50,5
X
= I =1
= = 5, 05
n 10
n
∑( X −X)
2
i
0,905
=S i =1
= = 0,10056
= 0,317
n −1 9
a) Limite inferior do intervalo =
X − 1,5 ⋅ S = 5, 05 − 1,5 ⋅ 0,317= 5, 05 − 0, 48= 4,57 .
• Canteiro C2:
n
∑X i
52, 4
X
= I =1
= = 5, 24
n 10
n
∑( X −X)
2
i
2,544
=S i =1
= = 0,=
28267 0,532
n −1 9
a) Limite inferior do intervalo =
X − 1,5 ⋅ S = 5, 24 − 1,5 ⋅ 0,532= 5, 24 − 0,80= 4, 44 .
Exemplo 6
A fim de avaliar a influência do aumento da densidade de-
mográfica na dispersão de colônias de formigas, um pesquisador
efetuou um estudo comparativo da realidade atual de uma locali-
dade, com resultados de pesquisas passadas. Na localidade, foram
consideradas 10 áreas de mesmo tamanho, e, em cada uma delas,
foi contado o número de formigueiros em atividade, resultando
em: {0, 1, 4, 10, 15, 0, 2, 1, 10, 7}. No estudo passado, consideran-
do-se as mesmas áreas, foi detectado um número médio de 6 for-
migueiros por área, com um desvio padrão igual a 1 formigueiro.
O pesquisador, durante seu estudo, verificou que, com o au-
mento na densidade demográfica, os formigueiros migraram, causan-
do uma concentração em algumas áreas e esvaziamento em outras,
aumentando, assim, a variabilidade no número de formigueiros.
∑X i
50
X
= I =1
= = 5
n 10
n
∑( X −X)
2
i
246
=S i =1
= = 27,33
= 5, 23
n −1 9
5, 23
CV
= = 1, 046
5
Considerando os dados do passado informados no enun-
ciado, ou seja, X = 6 e S = 1 , temos que o CV do passado era
1
CV= = 0,17 . Assim, a afirmação está correta; no presente, a
6
variabilidade é bem maior que no passado.
Exemplo 7
Para fins de aproveitamento de solo, a vegetação lenhosa
pode ser eliminada por corte sem queima ou por corte seguido
de queima dos galhos. Uma pesquisa foi conduzida para avaliar
a diferença entre a limpeza com a queima e sem a queima,
considerando o nível de chumbo presente no solo após um período
de tempo. Na pesquisa, foram encontrados resultados referentes à
quantidade de chumbo no solo (em partes por milhão – ppm) em
amostras de solos de uma mesma área:
• Corte sem queima: X = {9,5; 9,3; 8,9; 9,1; 8,8; 9,4; 9,1}.
• Corte com queima: X = {8,5; 9,1; 8,8; 9;0; 8,7; 9,4; 9,0}.
Calcule a média de chumbo no solo (em ppm) para os dois
casos e, também, o desvio padrão para cada caso, obtendo um
© U4 – Medidas Estatísticas de Dispersão 167
∑X i
64,1
X
= I =1
= = 9,157
n 7
n
∑( X −X)
2
i
0,3971
=S i =1
= = 0, 0662 0, 257
=
n −1 6
a) Limite inferior do intervalo =
X − 2=
⋅ S 9,157 − 2 ⋅ 0, 257
= 9,157 − 0,514
= 8, 643
• Com a queima:
n
∑X i
62,5
X
= I =1
= = 8,923
n 7
n
∑( X −X)
2
i
0,514
=S i =1
= = 0,
= 0857 0, 293
n −1 6
Exemplo 8
Para medir a variabilidade de uma variável, utilizamos o Des-
vio Padrão Amostral. Demonstre, detalhadamente, que essa medi-
da também pode ser calculada por:
1 n 2
S
= ⋅ ∑ X i − n ⋅ X 2
n − 1 i =1
i − X) ∑ ( X i2 − 2 ⋅ X i ⋅ X + X 2 )
∑( X
2
=S =
=i 1 =i 1
=
n −1 n −1
n n n
i
2
∑ X − ∑(2 ⋅ X
i ⋅X )+∑ X
2
=i 1 =i 1
= =i 1
n −1
n n
∑ X i2 − 2 ⋅ X ⋅ ∑ X i + n ⋅ X 2
=i 1 =i 1
=
n −1
n
∑X 2
− 2⋅ X ⋅n⋅ X + n⋅ X 2
i
=
i =1
n −1
n
∑X i
2
− 2⋅n⋅ X 2 + n⋅ X 2
i =1
=
n −1
© U4 – Medidas Estatísticas de Dispersão 169
∑X 2
− n⋅ X 2
i
= =
i =1
n −1
1 n 2
⋅ ∑ X i − n ⋅ X 2
n − 1 i =1
Conclusão: desse modo, a fórmula está deduzida.
Exemplo 9
Utilizando o conjunto de dados X= {5, 7, 9, 11, 13, 15}, calcu-
le o desvio padrão por meio de suas duas fórmulas (vistas no início
desta unidade).
Calculando a Média dos dados, temos:
n
∑X i
60
X
= i =1
= = 10
n 6
Calculando o desvio padrão pela sua fórmula tradicional,
temos:
n
∑( X −X)
2
i
S= i =1
n −1
(5 − 10) 2 + (7 − 10) 2 + (9 − 10) 2 + (11 − 10) 2 + (13 − 10) 2 + (15 − 10) 2
=
6 −1
∑X
i =1
i
2
= 52 + 7 2 + 92 + 112 + 132 + 152
1 n 2 2 1 1
S
= ⋅ ∑ X i − n ⋅ X= ⋅ 670 − 6 ⋅10=
2
.[ 670 − 6 ⋅100
= ]
n − 1 i =1 6 −1 5
1 1 70
= ⋅ [ 670 − 600] = ⋅ 70 = = 14 = 3, 74
5 5 5
9. QUESTÕES AUTOAVALIATIVAS
Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) Qual o menor valor que o desvio padrão pode assumir? Explique o significado
desse valor.
Grupo 1
123,56 115,45 117,89 121,46 122,22 121,33 118,06
123,00 122,47 121,56 121,33 120,44 116,99 117,45
118,52 121,01 119,99 120,99 125,77 119,66
Grupo 2
125,45 126,33 119,55 124,50 121,89 118,66 117,54
122,35 123,65 124,56 122,21 121,02 120,45 120,36
115,22 119,32 121,55 123,66 124,77 119,50
Grupo 3
119,55 118,54 118,77 117,55 116,23 115,45 114,56
117,00 116,59 122,02 122,99 121,45 120,33 119,58
121,56 122,02 119,58 119,11 118,55 117,44
Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) O menor valor que o desvio padrão pode assumir é zero, e ele ocorre quan-
do todos os valores são exatamente iguais entre si e iguais à média, signifi-
cando que não existe variação nos dados.
2)
a) No Conjunto 1, temos: X = 7 , Mo= 7 e Md= 7, sendo ele, então, simétrico.
Ainda para esse conjunto, temos S = 1,2536 e CV = 0,1791.
Assim, o Conjunto 1, que é simétrico, possui menor variação (menor CV) que
o Conjunto 2, que é assimétrico, confirmando a teoria.
Assim, será escolhido o Grupo 3, pois, como ele tem menor CV, é o que tem,
também, menor variabilidade.
10. CONSIDERAÇÕES
Considerando as formas de tabulação, as medidas de
posição e de tendência central e as medidas de dispersão, temos
instrumentos mais do que suficientes para caracterizar os dados
amostrais.
É importante salientar que existem outras medidas
descritivas da amostra, e você poderá aprofundar seus estudos
sobre elas consultando as referências indicadas.
Dando continuidade aos nossos estudos, na próxima unidade,
estudaremos um pouco sobre as teorias da probabilidade.
Vamos lá?
© U4 – Medidas Estatísticas de Dispersão 173
11. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
5
1. OBJETIVOS
• Trabalhar os princípios elementares das probabilidades.
• Compreender as relações matemáticas das probabilida-
des.
2. CONTEÚDOS
• Conceitos de conjuntos e eventos e suas relações.
• Formulação básica da Probabilidade Frequentista.
• Principais axiomas e teoremas das probabilidades.
• Aplicação das técnicas de contagem nas probabilidades.
• Dependência e independência entre eventos.
176 © Probabilidade e Estatística
4. INTRODUÇÃO À UNIDADE
Qual a importância de se estudar Probabilidade? Para res-
ponder a essa pergunta, devemos pensar que, infelizmente, gran-
de parte dos fenômenos naturais e envolvidos nos cenários em-
presariais é caracterizada por variáveis aleatórias. Podemos dizer
que fenômenos aleatórios são aqueles rodeados por incertezas, o
que, de forma geral, é uma característica inerente aos estudos que
envolvem Estatística. Assim, para avançarmos nas análises estatís-
ticas, é necessária a incorporação de componentes probabilísticos.
Nesta unidade, estudaremos os princípios elementares e
compreenderemos as relações matemáticas das probabilidades.
Mas, antes de aprofundarmos nossos estudos nesses objetivos,
conheceremos um pouco mais sobre a origem da Probabilidade.
Bons estudos!
© U5 – Teoria Elementar de Probabilidade 177
Fenômenos aleatórios
Os fenômenos aleatórios são todos aqueles fenômenos que
podem ser infinitamente repetidos sob as mesmas condições, cujo
resultado só é conhecido com certeza após a sua finalização, ou
seja, não temos certeza do resultado final. Por exemplo, se jogar-
mos uma pedra para o alto em direção a um pátio contendo 100
baldes cheios de água, podemos perguntar: a pedra cairá dentro
de algum dos baldes? Em qual balde ela cairá? Não podemos afir-
mar o que vai acontecer, pois o resultado é aleatório.
© U5 – Teoria Elementar de Probabilidade 179
Fenômenos determinísticos
Outro conceito importante é o dos fenômenos determinísti-
cos, que, ao contrário dos fenômenos aleatórios, se repetidos infi-
nitas vezes sob as mesmas condições, sempre produzirão o mesmo
resultado, que é conhecido previamente, ou seja, é pré-determi-
nado. Por exemplo, se jogarmos uma pedra dentro de um balde
cheio de água, podemos perguntar: ela afundará? Provavelmente,
você respondeu que sim, mesmo sem ter feito o experimento, cer-
to? Mas por quê? Essa resposta é simples: sua percepção e visua-
lização do fenômeno, bem como a intuição física, já anteciparam
o resultado certo.
Espaço Amostral
O Espaço Amostral também é um dos conceitos importantes
em Probabilidade, pois, em se tratando de fenômenos aleatórios,
para lidar com a incerteza via medidas de Probabilidade, somos
obrigados a definir o conjunto de possibilidades. Como não temos
certeza do resultado final, devemos, pelo menos, listar todos os
possíveis resultados, em um conjunto chamado de "Espaço Amos-
tral", denotado por S ou Ω. Por exemplo, no lançamento de um
dado honesto, o Espaço Amostral será: Ω = {1, 2, 3, 4, 5, 6}.
Dependendo do tipo de Fenômeno Aleatório, podemos ter
um Espaço Amostral discreto, finito, bem definido e equiprovável,
sendo que todos os resultados possuem a mesma probabilidade
de ocorrência, o que é o cenário ideal para se trabalhar com as
probabilidades frequentistas. Contudo, nem todos são assim. Para
entendermos melhor, vejamos, a seguir, três exemplos:
• Ilustração 1: suponhamos que, em uma caixa, existam 10
bolas numeradas de 1 a 10 e que essas bolas sejam exa-
tamente iguais em tamanho e peso. A ação aleatória será
sortear uma das bolas e verificar o seu número. Para esse
caso, temos um Espaço Amostral Ω = {1, 2, 3, 4, 5, 6, 7,
8, 9, 10}, e, como as bolas são idênticas, a chance de sair
Evento Aleatório
Considerando a execução de um Fenômeno Aleatório e a exis-
tência do Espaço Amostral W associado, qualquer resultado de inte-
resse associado ao fenômeno e que esteja contido em W é chamado
de Evento Aleatório, que expressa o(s) particular(es) resultado(s)
que será(ão) objeto(s) de determinação de probabilidades.
Em geral, os eventos são denotados por uma letra, em mai-
úsculo, de nosso alfabeto (A, B, C,...) e devem ser descritos como
um conjunto bem definido.
Considerando um Espaço Amostral qualquer, podemos ter
interesse em avaliar apenas um Evento Aleatório ou, em alguns
casos, dois ou mais eventos aleatórios. Nesses casos, como um
Evento Aleatório possui as mesmas propriedades dos conjuntos,
temos algumas relações possíveis entre eles.
7. PROBABILIDADE FREQUENTISTA
Uma probabilidade pode assumir qualquer valor entre zero
e 1. Ainda, as probabilidades podem ser representadas em valores
fracionários ou em valores percentuais, ou seja, uma probabilida-
de igual a 1 pode ser escrita como 0,50 ou como 50%.
2
© U5 – Teoria Elementar de Probabilidade 185
n( A)
P( A) =
n (W)
Ou
#( A)
P( A) =
#(W)
Exemplo 1
Jogando-se uma moeda, qual a probabilidade de sair cara?
Resolução: o Espaço Amostral (Ω) é: Ω = {cara, coroa}. O
evento de interesse A é: A= {sair cara}. Devemos calcular P(A). Note
que temos dois resultados possíveis (cara ou coroa), então, n(Ω) =
2, e, dos casos possíveis, apenas um deles é favorável ao evento de
interesse A (temos uma cara apenas), então, n(A) = 1. Logo:
n( A) 1
P( A)= = = 0,50= 50%
n (W) 2
Exemplo 2
Jogando-se um dado comum, qual a probabilidade de sair
um número menor que 3?
Resolução: temos seis resultados possíveis (os números 1, 2,
3, 4, 5 e 6) e, desses resultados, dois são favoráveis (os números 1
e 2). Logo:
n( A) 2 1
P ( A)= = = = 0,3333= 33,33%
n (W) 6 3
Exemplo 3
Jogando-se um dado, qual a probabilidade de sair um núme-
ro par?
Resolução: temos seis resultados possíveis e, desses resulta-
dos, três são favoráveis (os números 2, 4 e 6). Logo:
n( A) 3 1
P( A)= = = = 0,50= 50%
n (W) 6 2
Exemplo 4
Retirando-se uma carta qualquer de um baralho, qual a pro-
babilidade de sair um ás?
Resolução: temos 52 casos possíveis (no baralho, há 52 car-
tas) e, dos casos possíveis, temos quatro favoráveis (no baralho, há
quatro ases). Logo:
n( A) 4 1
P ( A=
) = = = 0, 0769... ≅ 7, 69%
n(W) 52 13
Exemplo 5
Uma pessoa possui três pares de meias, de cores diferentes,
todos colocados em uma mesma gaveta. Se a pessoa escolher ale-
atoriamente duas meias, qual a probabilidade de formar um par
correto?
© U5 – Teoria Elementar de Probabilidade 187
n( A) 3 1
P( A)= = = = 0, 20= 20%
n(W) 15 5
Exemplo 6
Considere um baralho comum, com quatro diferentes nai-
pes e 13 cartas em cada naipe, totalizando 52 cartas. Se uma carta
for retirada aleatoriamente do baralho, qual a probabilidade de
ela trazer um número par? Qual será a probabilidade de ser uma
letra?
Resolução: veja que, para esse exemplo, o Espaço Amostral
corresponde a todas as possibilidades de retiradas de uma carta
do baralho, ou seja, n(Ω) = 52. Para calcular a probabilidade de a
carta ser um número par, temos de considerar todos os eventos
dessa natureza, ou seja, sair o número 2, 4, 6, 8 ou 10 de cada um
dos naipes, isto é, cinco diferentes números pares em cada um dos
quatro naipes. Assim, n(A) = 20. Então, a probabilidade é:
n( A) 20 5
P ( A=
) = = = 0,3846... ≅ 38, 46%
n(W) 52 13
n( A) 16 4
P( A=
) = = = 0,30769... ≅ 30, 77%
n(W) 52 13
Exemplo 7
Considere o lançamento de dois dados honestos, gerando o
Espaço Amostral de 36. Qual é a probabilidade de termos número
par nos dois dados ou de saírem dois números cuja soma seja igual
a cinco?
Resolução: analisando o Evento A= {sair número par nos dois
dados}, podemos verificar que, dos 36 resultados possíveis, em
apenas 9 deles teremos dois números pares, a saber: {(2,2) (2,4)
(2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6)}:
n( A) 9
P=
( A) =
n(W) 36
n( B ) 4
P=
( B) =
n(W) 36
9 4 13
P( A ∪ B ) = P ( A) + P ( B ) = + = = 0,3611 = 36,11%
36 36 36
Exemplo 8
Considere o lançamento de dois dados honestos, gerando o
Espaço Amostral de 36. Qual é a probabilidade de termos número
par nos dois dados ou de saírem dois números cuja soma seja igual
a seis?
Resolução: analisando o Evento A= {sair número par nos dois
dados}, podemos verificar que, dos 36 resultados possíveis, em
apenas 9 deles teremos dois números pares, a saber: {(2,2) (2,4)
(2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6)}:
n( A) 9
P=
( A) =
n(W) 36
Analisando o Evento B= {sair dois números cuja soma seja
igual a seis}, podemos verificar que, dos 36 resultados possíveis,
em apenas 5 deles teremos uma soma igual a 6, a saber: {(1,5)
(2,4) (3,3) (4,2) (5,1)}. Então:
n( B ) 5
P=
( B) =
n(W) 36
Como queremos o Evento A ou o Evento B, e eles não são
disjuntos (note que existem dois resultados em comum entre A e
B, que chamamos de "intersecção entre A e B"), fazemos:
9 5 2 12 1
P( A ∪ B) =P( A) + P( B) − P( A ∩ B ) = + − = = =0,3333 =33,33%
36 36 36 36 3
Exemplo 9
Três estudantes estão em um torneio de natação que admite
apenas um vencedor. Pelo retrospecto dos três, imagina-se que o
nadador 1 e o nadador 2 tenham a mesma probabilidade de ven-
cer, que é igual a 3 . O nadador 3 tem menor probabilidade de
7
© U5 – Teoria Elementar de Probabilidade 195
3 1 4
P ( A ∪ B ) = P ( A) + P ( B ) = + = = 0,5714 = 57,14%
7 7 7
Exemplo 10
Em um colégio, foi realizada uma pesquisa sobre as ativida-
des extracurriculares dos alunos. Dos 500 alunos entrevistados,
240 praticavam algum tipo de esporte, 180 frequentavam algum
curso de idiomas e 120 realizavam as duas atividades, ou seja, pra-
ticavam algum esporte e frequentavam algum curso de idiomas.
Se, dos alunos entrevistados, um é escolhido ao acaso, qual a pro-
babilidade de que ele realize uma das duas atividades, ou seja,
esportes ou curso de idiomas?
Resolução: pelo enunciado, vemos que é possível um aluno
executar as duas coisas, esportes e idiomas. Assim, A= {esporte} e
B= {idiomas} são eventos não disjuntos. Para calcular a probabili-
dade, utilizamos:
Exemplo 11
Vamos considerar o lançamento de três dados, com um Espa-
ço Amostral formado por 216 resultados em forma de triplas (um
resultado para cada dado). Qual a probabilidade de não termos
três números iguais como resultado do lançamento dos dados?
n( A) 6
P=
( A) =
n(W) 216
Como o Evento B= {não saírem 3 números iguais} é comple-
mentar ao Evento A, pelo Teorema 2, temos:
6 216 − 6 210 35
P( B) =
1 − P ( A) =
1− = = == 0,9722 =
97, 22%
216 216 216 36
Portas E Janelas
15 x 20
PN = n !
Em Matemática, o símbolo (!) significa o fatorial de um nú-
mero. Para calculá-lo, basta irmos efetuando o produto desse nú-
mero, com todos os seus antecessores, até chegar em 1, como,
por exemplo: 10! = 10 ⋅ 9 ⋅ 8 ⋅ 7 ⋅ 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 . Por definição, 0! = 1.
Observe o Exemplo 14 a seguir para compreender melhor como
resolver um fatorial.
Exemplo 14
Um estudante do curso de Matemática decidiu organizar
seus livros em uma estante. Ele possui 6 livros diferentes de Cál-
culo Diferencial e Integral, 4 livros diferentes de Física e 3 livros
diferentes de Matemática Básica. Então, de quantas formas ele
pode organizar a estante, considerando que ele quer os livros de
matérias iguais juntos?
Resolução: pensando nos 6 livros diferentes de Cálculo, como
ele vai organizar todos os 6, e estes são diferentes entre si, temos
uma permutação de 6 elementos: P6 = 6! = 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 = 720 , ou
seja, há 720 possibilidades de organizar os livros de cálculo.
Fazendo o mesmo com as outras duas matérias, temos:
• Para Física, uma permutação de 4 elementos:
P4 = 4! = 4 ⋅ 3 ⋅ 2 ⋅1 = 24 .
N!
AN , K =
( N − K )!
N!
CN ,k =
K !⋅ ( N − K )!
Exemplo 17
Suponhamos que, de uma urna com 100 bolas, sendo 30
brancas, 40 pretas, 20 verdes e 10 amarelas, vamos retirar 3 bolas
de uma só vez. Assim, qual a probabilidade de termos 3 bolas de
mesma cor?
Resolução: inicialmente, vamos contabilizar o tamanho do
Espaço Amostral. Note que o conjunto Ω será formado por todas
as triplas (3 bolas) possíveis de se retirar da urna com 100 bolas.
Como as bolas são retiradas de uma só vez, a ordem não importa,
e, assim, n(Ω) será igual a C100,3 .
n( E ) 15200 152
P=
(E) = = = 0,= 094 9, 4%
n(W) 161700 1617
Ou seja, a probabilidade de retirarmos 3 bolas de mesma cor
é de 9,4%.
Exemplo 20
Suponhamos uma determinada circunferência de raio R. Se
um ponto qualquer for atirado dentro dessa circunferência, qual
a probabilidade de o ponto cair mais perto da circunferência pro-
priamente dita do que de seu centro?
Resolução: pelo enunciado, podemos representar o cenário
considerando outra circunferência menor, com raio r igual à meta-
de do raio maior R, de forma que, se o ponto cair dentro da circun-
ferência menor (r), estará mais próximo do centro; caso contrário,
estará mais próximo da circunferência. Vejamos a Figura 9.
# A π ⋅ r2 r2 r2 r2 r2 1
P( A
=) = = = = = =
#S π ⋅R 2
R 2
(2 ⋅ r ) 2 2
2 ⋅r 2
4⋅r 2
4
n( A) 3
P=
( A) =
n(W) 36
Agora, suponhamos que seja fornecida uma informação,
que chamaremos de Evento B, da forma: B= {saiu o número 5 em
pelo menos um dos dados}. Com base nessa informação, o Espaço
Amostral fica reduzido em função da informação, ou seja, os resul-
tados passam a depender da informação dada. Nessa ilustração, o
Espaço Amostral reduzido, com base na informação B, será:
ΩReduzido = {[1,5], [2,5], [3,5], [4,5], [5,1], [5,2], [5,3], [5,4], [5,5],
[5,6], [6,5]}
n( A) 1
P( A)
= =
n(W Re duzido ) 11
Note que a P(A) mudou de valor; passou de 3 = 1 para 1 ,
36 12 11
ou seja, o valor da probabilidade de ocorrer o Evento A mudou em
função da informação B, ou seja, A e B são eventos dependentes.
Outro exemplo para explicar os eventos dependentes, consideran-
do que A e B sejam dois eventos aleatórios, A ⊂ W e B ⊂ W, com
A e B não disjuntos (ou não mutuamente exclusivos) seria: se a
© U5 – Teoria Elementar de Probabilidade 209
Exemplo 21
Em um colégio, foi realizada uma pesquisa sobre atividades
extracurriculares dos alunos. Dos 500 alunos entrevistados, 240
praticavam algum tipo de esporte, 180 frequentavam algum cur-
so de idiomas e 120 realizavam as duas atividades, ou seja, pra-
ticavam algum tipo de esporte e frequentavam algum curso de
idiomas. Se, dos alunos entrevistados, um é escolhido ao acaso,
e sabe-se que este pratica algum esporte, qual a probabilidade de
que ele faça, também, um curso de idiomas?
Resolução: do exposto no enunciado, podemos destacar
dois eventos:
• A= {Aluno escolhido ao acaso que pratica esporte}.
• B= {Aluno escolhido ao acaso que faz curso de idiomas}.
O calculo será sobre a probabilidade do Evento B (fazer idio-
mas), pois a informação dada no enunciado é de que o aluno pra-
tica esporte. Assim:
© U5 – Teoria Elementar de Probabilidade 211
120
P( A ∩ B ) 500 120 1
P( B \ A)= = = = = 0,5= 50%
P( A) 240 240 2
500
Então, a probabilidade de o aluno escolhido fazer idiomas,
dado que ele pratica esportes, é de 50%.
Exemplo 22
Em uma instituição de Ensino Superior, sabe-se que, dos
1.300 alunos matriculados no primeiro ano de seus cursos, 750
cursaram todo o Ensino Médio em escola pública e 500 estudan-
tes possuem renda familiar abaixo de R$700,00. Sabe-se, também,
que, do total de alunos matriculados, 200 cursaram todo o Ensi-
no Médio em escola pública e possuem renda familiar abaixo de
R$700,00. Se um aluno matriculado no primeiro ano veio da esco-
la pública, qual será a probabilidade de ele possuir renda familiar
abaixo de R$700,00?
Resolução: do exposto no enunciado, podemos destacar
dois eventos:
• A= {Aluno veio de escola pública}.
• B= {Aluno possui renda inferior a R$700,00}.
O interesse é calcular a probabilidade de B, pois já sabemos
que o aluno veio de escola pública, conforme informação dada no
enunciado. Assim:
200
P( A ∩ B ) 1300 200 4
P( B \ A=
) = = = = 0, 2667 = 26, 67%
P( A) 750 750 15
1300
Então, a probabilidade de o aluno ter renda inferior a
R$700,00, dado que ele veio da escola pública, é de 26,67%.
Um dos principais estudiosos das probabilidades condicio-
nais foi Thomas Bayes (1702-1761). Por meio dos seus trabalhos,
P( A ∩ B)
P( A \ B)= ⇒ P( A ∩ B)= P( B) ⋅ P( A \ B)
P( B)
Dizendo de outro modo, dados dois eventos dependentes, a
probabilidade de ocorrência simultânea dos dois é igual à proba-
bilidade de ocorrência do primeiro evento (que é a informação ou
o evento inicial de interesse) multiplicada pela probabilidade de
ocorrência do segundo evento, uma vez que o primeiro evento já
ocorreu.
A fórmula pode ser aplicada em qualquer coleção de eventos
que sejam não mutuamente exclusivos com intersecção definida.
Essa fórmula pode ser representada por:
P( A1 ∩ A2 ∩ A3 ∩ ∩ An ) =
P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 ) ⋅ ⋅ P( An \ A1 ∩ A2 ∩ ∩ An −1 )
P( A1 ∩ A2 ∩ A3=
) P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 )
4
P(A1 ) =
12
3
• P ( A2 \ A1 ) =
11 , dado que A1 ocorreu e uma peça defei-
tuosa foi retirada, sobrando 3 defeitos em 11 peças;
2
• P ( A3 \ A1 ∩ A2 ) =, dado que A e A ocorreram e duas
10 1 2
peças defeituosas foram retiradas, sobrando 2 defeitos
em 10 peças;
Assim, temos:
P( A1 ∩ A2 ∩ A3 ) =
P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 ) =
4 3 2 1
⋅ ⋅ =
12 11 10 55
Exemplo 24
(PROVÃO, 2000) Em certa cidade o tempo, bom ou chuvoso,
2
é igual ao do dia anterior com probabilidade . Se hoje faz tempo
3
bom, a probabilidade de que chova depois de amanhã será?
Exemplo 25
Um vendedor estima que a probabilidade de ele executar
uma venda durante o primeiro contato com o cliente é de 55%,
melhorando para 60% em um segundo contato, caso não tenha
conseguido vender no primeiro contato. Suponhamos que esse
vendedor faça, no máximo, dois contatos com cada cliente. Se ele
entrar em contato com um novo cliente, qual a probabilidade de
ele efetuar a venda?
Resolução: temos os seguintes eventos:
• A= {vendeu no primeiro contato}.
• B= {não vendeu no primeiro contato}.
• C= {vender no segundo contato}.
Para efetuar a venda, o vendedor deve vender no primeiro
contato OU não vender no primeiro contato E vender no segundo
contato. Matematicamente, temos:
© U5 – Teoria Elementar de Probabilidade 215
P(Vender )= P ( A) + P ( B ∩ C )=
P( A) + P( B) ⋅ P(C \ B)
= 0,55 + 0, 45 ⋅ 0, 60 = 0,82 = 82%
n( a ) 2 1
P( A=
) = =
n(W) 12 6
P ( A ∩ B )= P ( B ) ⋅ P ( A)
1 1 1
P(A ∩ B)= P(A) ⋅ P(B)= ⋅ =
10000 10000 100000000
© U5 – Teoria Elementar de Probabilidade 217
Exemplo 27
As probabilidades de 3 motoristas serem capazes de guiar
até em casa com segurança após ingerirem bebida alcoólica são
1 , 1 e 1 , respectivamente. Qual a probabilidade de todos eles
5 6 2
sofrerem algum acidente?
Resolução: temos três eventos independentes para repre-
sentar o problema:
• Evento A= {1º sofrer acidente}.
• Evento B= {2º sofrer acidente}.
• Evento C= {3º sofrer acidente}.
Desse modo, para satisfação da pergunta do problema, de-
vem ocorrer A e B e C assim:
4 5 1 20 2 1
P ( A ∩ B ∩ C ) = P ( A) ⋅ P ( B ) ⋅ P (C ) = ⋅ ⋅ = = =
5 6 2 60 6 3
Exemplo 28
Uma pessoa pode ir para a direita, para a esquerda e para
frente em cada um dos 5 cruzamentos de um labirinto. Qual a pro-
babilidade de a pessoa atravessar o labirinto corretamente, haven-
do um único caminho correto?
Resolução: temos cinco eventos independentes para repre-
sentar o problema:
• Evento A= {acertar o caminho no cruzamento 1}.
• Evento B= {acertar o caminho no cruzamento 2}.
• Evento C= {acertar o caminho no cruzamento 3}.
• Evento D= {acertar o caminho no cruzamento 4}.
• Evento E= {acertar o caminho no cruzamento 5}.
Desse modo, para satisfação da pergunta do problema, de-
vem ocorrer A e B e C e D e E assim:
P( A ∩ B ∩ C ∩ D ∩ E ) =
1 1 1 1 1 1
P( A) ⋅ P( B) ⋅ P(C ) ⋅ P( D) ⋅ P( E ) = ⋅ ⋅ ⋅ ⋅ =
3 3 3 3 3 243
Exemplo 29
A probabilidade de um atirador acertar um alvo colocado a
100 metros é de 70% em uma única tentativa. Qual a probabilida-
de de que, em cinco tentativas, o atirador acerte, no mínimo, uma
vez o alvo?
Resolução: para facilitar a resolução, vamos trabalhar com
um Evento Complementar ao que foi solicitado no exercício. Va-
mos calcular a probabilidade de erro de todas as cinco tentativas:
• Evento A= {errar a tentativa 1}.
• Evento B= {errar a tentativa 2}.
• Evento C= {errar a tentativa 3}.
• Evento D= {errar a tentativa 4}.
• Evento E= {errar a tentativa 5}.
Desse modo, para satisfação do Evento Complementar defi-
nido, devem ocorrer A e B e C e D e E assim:
P( A ∩ B ∩ C ∩ D ∩ E ) =
P ( A) ⋅ P ( B ) ⋅ P (C ) ⋅ P( D) ⋅ P ( E ) = 0,3 ⋅ 0,3 ⋅ 0,3 ⋅ 0,3 ⋅ 0,3 = 0, 00243
Então, tomando o Evento T= {acertar, ao menos, uma tenta-
tiva}, temos:
P (T ) =
1 − 0, 00243 =
0,99757
Exemplo 30
(ENEM, 1998) Em um concurso de televisão, são apresentadas
a um participante 3 fichas voltadas para baixo, estando representa-
das, em cada uma delas, as letras T, V e E. As fichas encontram-se
alinhadas em uma ordem qualquer. O participante deve ordenar as
fichas ao seu gosto, mantendo as letras voltadas para baixo, tentan-
do obter a sigla TVE. Ao desvirá-las, para cada letra que esteja na
posição correta, ganhará um prêmio de R$200,00. Qual a probabili-
dade de o participante não ganhar qualquer prêmio?
Então:
1 1 1 3
P (opção1) = P ( A ) + P ( B ) + P ( C ) = + + =
10 10 10 10
• 2ª opção: o apostador está apostando nos números A e
B para o primeiro sorteio e no número C para o terceiro
sorteio (como os sorteios são independentes, pode ser
até um número que já havia sido escolhido no primeiro
sorteio). Assim, ele ganhará se sair A ou B no primeiro ou
se sair C no segundo sorteio:
Exemplo 33
(ENEM, 2001) Uma empresa de alimentos imprimiu em suas
embalagens um cartão de apostas do seguinte tipo:
2
5) E = {encontrar uma bola na linha 5} ⇒ P( E )= = 1 .
2
Então, como necessitamos que ocorram todos os even-
tos anteriores, temos:
P(Ganhar )= P( A ∩ B ∩ C ∩ D ∩ E )=
1 1 1 2 2 1
P( A) ⋅ P( B) ⋅ P(C ) ⋅ P( D) ⋅ P( E ) = ⋅ ⋅ ⋅ ⋅1 = =
3 4 3 3 108 54
Exemplo 34
(ENEM, 2001) Um município de 628km² é atendido por duas
emissoras de rádio, cujas antenas A e B alcançam um raio de 10km
do município, conforme nos mostra a figura a seguir. Para orçar um
contrato publicitário, uma agência precisa avaliar a probabilidade
que um morador tem de, circulando livremente pelo município,
estar na área de alcance de, pelo menos, uma das emissoras. De
quanto é, aproximadamente, essa probabilidade?
π ⋅102 π ⋅100
P ( Alcançe=
)
n( A)
= 2= 2 = 50 ⋅ π ≅ 0, 08 ⋅ π ≅ 0, 25
n (W) 628 628 628
Ou seja, a probabilidade de um morador estar na área de
alcance é de, aproximadamente, 25%.
Exemplo 35
(ENEM, 2005) As 23 ex-alunas de uma turma que comple-
tou o Ensino Médio há 10 anos se encontraram em uma reunião
comemorativa. Várias delas haviam se casado e tido filhos. A dis-
tribuição das mulheres, de acordo com a quantidade de filhos, é
mostrada no gráfico a seguir.
10
0
Sem filhos 1 Filho 2 filhos 3 filhos
Ω = { A, A, A, A, A, A, A, B, B, B, B, B, B, B, B, B, B,
B, B, B, B, B, B, B, B}.
n( F ) 7
P=
(F ) =
n(W) 25
Exemplo 36
(ENEM, 2006) A tabela a seguir indica a posição relativa de
quatro times de futebol na classificação geral de um torneio, em
dois anos consecutivos. O símbolo (●) significa que o time indicado
na linha ficou, no ano de 2004, à frente do indicado na coluna, e o
símbolo (*) significa que o time indicado na linha ficou, no ano de
2005, à frente do indicado na coluna.
A B C D
A *
B • * • • *
C • * * *
D • •
Qual a probabilidade de que um desses quatro times, esco-
lhido ao acaso, tenha obtido a mesma classificação no torneio em
2004 e 2005?
Resolução: avaliando o ano de 2004, notamos que todas as
equipes ficaram à frente de A e que a equipe B ficou à frente de
todas as demais (B em primeiro e A em 4º lugar). No ano de 2005,
notamos que todas ficaram à frente de D e que C ficou à frente de
todas as demais (C em primeiro e D em 4º lugar). Assim, não existe
possibilidade de que uma determinada equipe tenha mantido a
mesma posição, ou seja, a probabilidade é igual a zero.
Exemplo 37
(ENEM, 2006) Um time de futebol amador ganhou uma taça
ao vencer um campeonato. Os jogadores decidiram que o prêmio
seria guardado na casa de um deles. Todos quiseram guardar a
taça em suas casas. Na discussão para se decidir com quem ficaria
o troféu, travou-se o seguinte dialogo:
Pedro, camisa 6: — Tive uma ideia! Nós somos 11 jogadores, e
nossas camisas estão numeradas de 2 a 12. Tenho dois dados, com
as faces numeradas de 1 a 6. Se eu jogar os dois dados, a soma dos
números das faces que ficarem para cima pode variar de 2 (1 + 1)
a 12 (6 + 6). Vamos jogar os dados, e quem tiver a camisa com o
número do resultado vai guardar a taça.
Tadeu, camisa 2: — Não sei, não... Pedro sempre foi muito esper-
to... Acho que ele está levando alguma vantagem nessa proposta...
Ricardo, camisa 12: — Pensando bem, você pode estar certo! Co-
nhecendo o Pedro, é capaz que ele tenha mais chances de ganhar
que nós dois juntos...
Desse dialogo, o que podemos concluir?
Resolução: vamos detalhar o Espaço Amostral no lançamen-
to de dois dados, colocando, para cada um, a soma dos valores.
2 5 7 5 5 10
2 6 8 5 6 11
3 1 4 6 1 7
3 2 5 6 2 8
3 3 6 6 3 9
3 4 7 6 4 10
3 5 8 6 5 11
3 6 9 6 6 12
Assim:
1
P( Soma
= 2)
=
36
5
P ( Soma= 6)
=
36
1
P ( Soma
= 12)
=
36
Conclui-se que Tadeu e Ricardo tinham razão, pois os dois
juntos tinham menos chances de ganhar a guarda da taça do que
Pedro.
Exemplo 38
(ENEM, 2007) A queima de cana aumenta a concentração de
dióxido de carbono e de material particulado na atmosfera, causan-
do alteração do clima e contribuindo para o aumento de doenças
respiratórias. A tabela a seguir apresenta números relativos a pa-
cientes internados em um hospital no período da queima da cana.
150 3
P ( A)= = = 0, 75
200 4
Resolução 2: podemos observar que o fato de ter proble-
mas respiratórios não é independente do tipo de paciente. Assim,
podemos resolver este exercício utilizando a Fórmula da Probabi-
lidade Condicional. Chamando de A = {ser criança} o paciente e a
informação dada a priori de B = {tem problema respiratório devido
a queimadas}, temos:
150
P( A ∩ B ) 710 150 3
P( A \ B)= = = = = 0, 75
P( B) 200 200 4
710
Exemplo 39
(ENEM, 2009) O controle de qualidade de uma empresa fa-
bricante de telefones celulares aponta que a probabilidade de um
aparelho de determinado modelo apresentar defeito de fabrica-
ção é de 0,2%. Se uma loja acaba de vender 4 aparelhos desse
modelo para um cliente, qual é a probabilidade de esse cliente sair
da loja com exatamente dois aparelhos defeituosos?
Resolução: vamos supor 4 eventos independentes (um para
cada aparelho) da seguinte forma:
© U5 – Teoria Elementar de Probabilidade 229
4! 4! 4 ⋅ 3 ⋅ 2 ⋅1 24
Possibilidades
= C4,2
= = = = = 6
2!⋅ (4 − 2)! 2!⋅ 2! 2 ⋅1 ⋅ 2 ⋅1 4
Então, a resposta correta para P(D) é:
Exemplo 40
(ENEM, 2009) A população brasileira sabe, pelo menos, in-
tuitivamente, que a probabilidade de se acertar as seis dezenas da
Mega Sena não é zero, mas é quase isso! Mesmo assim, milhões
de pessoas são atraídas por essa loteria, especialmente quando o
prêmio se acumula em valores altos.
Até junho de 2009, cada aposta de seis dezenas, pertencen-
tes ao conjunto {01, 02, 03, ..., 59, 60}, custava R$1,50. Considere
que uma pessoa decida apostar, exatamente, R$126,00 e que ela
esteja mais interessada em acertar apenas cinco das seis dezenas
Exemplo 41
(ENEM, 2010) A Figura I a seguir mostra um esquema das
principais vias que interligam a cidade A com a cidade B. Cada nú-
mero indicado na Figura II representa a probabilidade de engarra-
famento quando se passa na via indicada. Assim, há uma probabi-
lidade de 30% de engarrafamento no deslocamento do ponto C ao
o ponto B, passando pela estrada E4, e de 50%, quando passando
por E3. Essas probabilidades são independentes umas das outras.
Paula deseja se deslocar da cidade A para a cidade B usando,
exatamente, duas das vias indicadas, percorrendo um trajeto com
a menor probabilidade de engarrafamento possível. Qual é o me-
lhor trajeto para Paula?
Exemplo 42
(ENEM, 2010) O diretor de um colégio leu, numa revista, que
os pés das mulheres estão aumentando. Há alguns anos, a média
do tamanho dos calçados das mulheres era de 35,5 e, hoje, é de
37,0. Embora essa não fosse uma informação científica, ele ficou
curioso e fez uma pesquisa com as funcionárias do seu colégio,
obtendo os dados dispostos no quadro a seguir:
38 10
37 3
36 5
35 6
39 1
38 10
37 3
10 5
P( A=
) =
14 7
Exemplo 43
(SECRETARIA DA EDUCAÇÃO DO ESTADO DE SÃO PAULO,
2011) Ao jogar-se um dado comum, qual a probabilidade de que
ele caia com a face 5 ou a face 6 voltadas para cima?
Resolução: o Espaço Amostral resultante do lançamento de
um dado comum é:
1 1 2 1
P( A ∪ B ) = P ( A) + P ( B ) = + = =
6 6 6 3
Exemplo 44
(SECRETARIA DA EDUCAÇÃO DO ESTADO DE SÃO PAULO,
2011) Um restaurante oferece, no seu cardápio, 2 saladas distin-
tas, 4 tipos de pratos de carne, 5 variedades de bebidas e 3 so-
bremesas diferentes. Uma pessoa deseja uma salada, um prato
de carne, uma bebida e uma sobremesa. Qual o total de pedidos
diferentes que essa pessoa poderá fazer?
Resolução: pela regra do produto, o total de pedidos é:
5) Uma linha ferroviária tem 16 estações. Quantos tipos de bilhetes devem ser
impressos se cada tipo deve assinalar a estação de origem e a de destino,
respectivamente?
Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) Para entender a resolução do exercício, vejamos a figura a seguir:
n( A) 1
P=
( A) =
n (W) 6
5) Como cada bilhete deve ter uma origem e um destino, que, logicamente, de-
vem ser diferentes, podemos escolher qualquer uma das 16 para cada local,
sendo que a ordem importa muito, pois sair de Batatais em direção a São
Paulo não é o mesmo que sair de São Paulo e ir em direção a Batatais, pois,
se você estiver em Batatais, apenas a primeira será de utilidade para você.
Então, como vamos utilizar parte dos elementos e a ordem interessa, temos
um Arranjo Simples, de 16 elementos tomados de 2 em 2:
16! 16! 16 ⋅15 ⋅14!
A16,2
= = = = 240 bilhetes diferentes.
(16 − 2)! 14! 14!
9! 9! 9 ⋅ 8 ⋅ 7! 72
n(W)= C9,2= = = = = 36
2!⋅ (9 − 2)! 2!⋅ 7! 2 ⋅1 ⋅ 7! 2
Ainda, para termos 2 da mesma cor, pode ser:
Temos:
© U5 – Teoria Elementar de Probabilidade 239
1
P( A1) =
5
1
P( A2 \ A1) =
4
1
P( A3 \ A1 ∩ A2) =
3
1
P( A4 \ A1 ∩ A2 ∩ A3) =
2
P( A5 \ A1 ∩ A2 ∩ A3 ∩ A4) =
1
Então:
1 1 1 1 1
P( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) = ⋅ ⋅ ⋅ ⋅1 =
5 4 3 2 120
Contudo, essa resolução parte do pressuposto de que os três primeiros rece-
beram os corretos, mas não necessariamente precisam ser os três primeiros;
poderiam ser, por exemplo, os três últimos. Assim, temos de determinar de
quantas formas podem ocorrer 3 corretos em 5, o que pode ser determinado
por:
5! 5! 5 ⋅ 4 ⋅ 3! 20
C5,3
= = = = = 10
3!⋅ ( 5 − 3) ! 3!⋅ 2! 3!⋅ 2 ⋅1 2
11. CONSIDERAÇÕES
Finalizamos, aqui, o conteúdo de Probabilidade e Estatística
e lembramos a você que o objetivo deste CRC não é esgotar os tó-
picos, o que seria quase impossível, mas, sim, dar uma diretriz do
que julgamos ser essencial.
É importante que você procure complementar os seus es-
tudos consultando as referências bibliográficas indicadas, muitas
delas disponíveis na Biblioteca Virtual da SAV e algumas na Biblio-
teca Digital Pearson. Procure novos exercícios e aplicações, novos
desafios, contando sempre com a equipe de professores e tutores
para auxiliá-lo nos estudos.
12. E-REFERÊNCIAS
DANTAS, C. A. B. Probabilidade: um curso introdutório. Disponível em: <http://books.
google.com.br/bkshp?hl=pt-BR&tab=wp>. Acesso em: 5 mar. 2012.
MAGALHÃES, M. N. Probabilidade e variáveis aleatórias. Disponível em: <http://books.
google.com.br/bkshp?hl=pt-BR&tab=wp>. Acesso em: 5 mar. 2012.