Você está na página 1de 240

PROBABILIDADE E ESTATÍSTICA

CURSOS DE GRADUAÇÃO – EAD


Probabilidade e Estatística – Prof. Ms. Carlos Alberto Marinheiro e Prof. Ms. Cláudio
Pereira Bidurin

Meu nome é Carlos Alberto Marinheiro, sou mestre em


Bioengenharia, pela Interunidades Escola de Engenharia de São
Paulo, Instituto de Química de São Carlos e Faculdade de
Medicina de Ribeirão Preto, da Universidade de São Paulo.
Tenho formação em Matemática (licenciatura plena), Pedagogia
e Engenharia Civil, com especializações em: Geometria Analítica
(Matemática), Métodos de Procedimentos Didáticos (Educação)
e Metodologia e Técnicas de Ensino (Educação) e pós-graduação
lato sensu em Metodologia do Ensino de Matemática. Atuo
como docente nas áreas de Metodologia da Pesquisa Científica,
Administração de Produção, Estatística Aplicada à Administração, Desenho Geométrico e
Geometria Descritiva, Tópicos de Educação Matemática e Biofísica em diversos cursos de
Graduação, e com Metodologia da Pesquisa Científica nos cursos de Pós-graduação.
Além disso, sou coordenador da CPA (Comissão Própria de Avaliação) e membro do CEP
(Comitê de Ética em Pesquisa) no Centro Universitário Claretiano de Batatais.
E-mail: marinheiro@claretiano.edu.br

Olá! Meu nome é Cláudio Pereira Bidurin. Sou bacharel e


mestre em Estatística pela Universidade Federal de São Carlos
(UFSCar). Já atuei como estatístico em indústrias e no setor
público, no período de 2001 a 2007. Atualmente, sou consultor
e assessor em desenvolvimento de análises e modelagem
estatística em empresas e no departamento de pesquisas da
USP e da UFSCar. Sou professor de Estatística no Ensino Superior
há mais de 15 anos e, no Centro Universitário Claretiano, atuo
há mais de dez anos, tanto em cursos presenciais quanto em
cursos a distância. Coloco-me à disposição para contribuir com
você, aluno EaD, por uma aprendizagem significativa.
E-mail: bidurin@claretiano.edu.br

Fazemos parte do Claretiano - Rede de Educação


Carlos Alberto Marinheiro
Cláudio Pereira Bidurin

PROBABILIDADE E ESTATÍSTICA

Batatais
Claretiano
2013
© Ação Educacional Claretiana, 2012 – Batatais (SP)
Versão: dez./2013

519 M289p

Marinheiro, Carlos Alberto


Probabilidade e estatística / Carlos Alberto Marinheiro, Cláudio Pereira
Bidurin – Batatais, SP : Claretiano, 2013.
240 p.

ISBN: 978-85-8377-042-8

1. Conjuntos. 2. Análise combinatória. 3. Probabilidade. 4. Gráficos.


5. Medidas. I. Bidurin, Cláudio Pereira. II. Probabilidade e estatística.

CDD 519

Corpo Técnico Editorial do Material Didático Mediacional


Coordenador de Material Didático Mediacional: J. Alves

Preparação Revisão
Aline de Fátima Guedes Cecília Beatriz Alves Teixeira
Camila Maria Nardi Matos Felipe Aleixo
Carolina de Andrade Baviera Filipi Andrade de Deus Silveira
Cátia Aparecida Ribeiro Paulo Roberto F. M. Sposati Ortiz
Dandara Louise Vieira Matavelli Rodrigo Ferreira Daverni
Elaine Aparecida de Lima Moraes Sônia Galindo Melo
Josiane Marchiori Martins
Talita Cristina Bartolomeu
Lidiane Maria Magalini
Vanessa Vergani Machado
Luciana A. Mani Adami
Luciana dos Santos Sançana de Melo
Luis Henrique de Souza Projeto gráfico, diagramação e capa
Patrícia Alves Veronez Montera Eduardo de Oliveira Azevedo
Rita Cristina Bartolomeu Joice Cristina Micai
Rosemeire Cristina Astolphi Buzzelli Lúcia Maria de Sousa Ferrão
Simone Rodrigues de Oliveira Luis Antônio Guimarães Toloi
Raphael Fantacini de Oliveira
Bibliotecária Tamires Botta Murakami de Souza
Ana Carolina Guimarães – CRB7: 64/11 Wagner Segato dos Santos

Todos os direitos reservados. É proibida a reprodução, a transmissão total ou parcial por qualquer
forma e/ou qualquer meio (eletrônico ou mecânico, incluindo fotocópia, gravação e distribuição na
web), ou o arquivamento em qualquer sistema de banco de dados sem a permissão por escrito do
autor e da Ação Educacional Claretiana.

Claretiano - Centro Universitário


Rua Dom Bosco, 466 - Bairro: Castelo – Batatais SP – CEP 14.300-000
cead@claretiano.edu.br
Fone: (16) 3660-1777 – Fax: (16) 3660-1780 – 0800 941 0006
www.claretianobt.com.br

Fazemos parte do Claretiano - Rede de Educação


SUMÁRIO

CADERNO DE REFERÊNCIA DE CONTEÚDO


1 INTRODUÇÃO.................................................................................................... 9
2 ORIENTAÇÕES PARA ESTUDO........................................................................... 10
3 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 28
4 E-REFERÊNCIAS................................................................................................. 28

Unidade 1 – A NATUREZA DOS DADOS ESTATÍSTICOS


1 OBJETIVOS......................................................................................................... 29
2 CONTEÚDOS...................................................................................................... 29
3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE................................................ 30
4 INTRODUÇÃO À UNIDADE................................................................................ 30
5 ORIGEM E HISTÓRIA DA ESTATÍSTICA.............................................................. 31
6 CONCEITOS IMPORTANTES EM ESTATÍSTICA.................................................. 33
7 POPULAÇÃO VERSUS AMOSTRA...................................................................... 35
8 MÉTODOS DE AMOSTRAGEM.......................................................................... 37
9 A COLETA DE DADOS......................................................................................... 42
10 TRABALHANDO EM SALA DE AULA.................................................................. 43
11 QUESTÕES AUTOAVALIATIVAS......................................................................... 45
12 CONSIDERAÇÕES............................................................................................... 45
13 E-REFERÊNCIAS................................................................................................. 46
14 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 46

Unidade 2 – TABULAÇÃO DE DADOS


1 OBJETIVOS......................................................................................................... 47
2 CONTEÚDOS...................................................................................................... 47
3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE................................................ 48
4 INTRODUÇÃO À UNIDADE................................................................................ 48
5 OS DADOS BRUTOS .......................................................................................... 48
6 TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS................................................. 51
7 GRÁFICOS DE FREQUÊNCIAS............................................................................ 57
8 GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2003................................................. 59
9 GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2007 OU 2010.................................. 65
10 GRÁFICOS DE SÉRIES......................................................................................... 77
11 TRABALHANDO EM SALA DE AULA.................................................................. 87
12 QUESTÃO AUTOAVALIATIVA............................................................................. 88
13 CONSIDERAÇÕES............................................................................................... 92
14 E-REFERÊNCIAS................................................................................................. 92
15 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 93
Unidade 3 – MEDIDAS ESTATÍSTICAS DE POSIÇÃO
1 OBJETIVOS......................................................................................................... 95
2 CONTEÚDOS...................................................................................................... 95
3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE................................................ 95
4 INTRODUÇÃO À UNIDADE................................................................................ 96
5 MEDIDAS ESTATÍSTICAS DE TENDÊNCIA CENTRAL......................................... 97
6 RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL.............................. 122
7 MEDIDAS SEPARATRIZES.................................................................................. 124
8 TRABALHANDO EM SALA DE AULA.................................................................. 127
9 QUESTÕES AUTOAVALIATIVAS......................................................................... 132
10 CONSIDERAÇÕES............................................................................................... 134
11 E-REFERÊNCIAS................................................................................................. 134
12 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 134

Unidade 4 – MEDIDAS ESTATÍSTICAS DE DISPERSÃO


1 OBJETIVOS......................................................................................................... 137
2 CONTEÚDOS...................................................................................................... 137
3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE................................................ 138
4 INTRODUÇÃO À UNIDADE................................................................................ 138
5 MEDIDAS DE DISPERSÃO.................................................................................. 139
6 APLICAÇÕES DO DESVIO PADRÃO................................................................... 145
7 RECURSOS TECNOLÓGICOS.............................................................................. 152
8 EXEMPLOS DE APLICAÇÃO DAS MEDIDAS DE VARIABILIDADE..................... 158
9 QUESTÕES AUTOAVALIATIVAS......................................................................... 170
10 CONSIDERAÇÕES............................................................................................... 172
11 E-REFERÊNCIAS................................................................................................. 173
12 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 173

Unidade 5 – TEORIA ELEMENTAR DE PROBABILIDADE


1 OBJETIVOS......................................................................................................... 175
2 CONTEÚDOS...................................................................................................... 175
3 ORIENTAÇÕES PARA O ESTUDO DA UNIDADE................................................ 176
4 INTRODUÇÃO À UNIDADE................................................................................ 176
5 UM POUCO DA HISTÓRIA DA PROBABILIDADE.............................................. 177
6 CONCEITOS IMPORTANTES EM PROBABILIDADE........................................... 178
7 PROBABILIDADE FREQUENTISTA..................................................................... 184
8 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA...................................... 207
9 O ENSINO DAS PROBABILIDADES.................................................................... 219
10 QUESTÕES AUTOAVALIATIVAS......................................................................... 234
11 CONSIDERAÇÕES............................................................................................... 240
12 E-REFERÊNCIAS................................................................................................. 240
13 REFERÊNCIAS BIBLIOGRÁFICAS....................................................................... 240
Caderno de
Referência de
Conteúdo

CRC

Ementa––––––––––––––––––––––––––––––––––––––––––––––
Noções de teoria de conjuntos. Técnicas de contagem e análise combinatória.
Probabilidade frequentista. Probabilidade condicional e independência. Popula-
ção e amostra. Distribuições e gráficos de frequências. Medidas de tendência
central. Medidas de posição e de ordem. Medidas de dispersão. Excel e calcu-
ladoras científicas.
––––––––––––––––––––––––––––––––––––––––––––––––––––

1. INTRODUÇÃO
O Caderno de Referência de Conteúdo Probabilidade e Esta-
tística é subdividido em quatro partes, apesar de ser constituído
por cinco unidades. A primeira destina-se a uma visão conceitual
sobre Estatística; a segunda está focada no estudo das técnicas e
ferramentas de tabulação de dados; as Unidades 3 e 4 tratam das
medidas de Estatística Descritiva; e a Unidade 5 aborda estudos de
probabilidades.
Os estudos realizados sobre o que chamamos de "Estatísti-
ca Descritiva" são de fundamental importância em qualquer área
10 © Probabilidade e Estatística

de atuação profissional, já que todos nós somos levados a decidir


sobre uma diversidade de situações, sempre tomadas com base
em informações e análises. A Estatística Descritiva ajuda na ca-
racterização das informações coletadas na amostra, mas ela não
possibilita análises mais avançadas, que chamamos de "Estatística
Inferencial". Além das estatísticas, outro importante campo de es-
tudo, o qual está presente nos Parâmetros Curriculares Nacionais
(PCNs) de Matemática, são as probabilidades baseadas na visão
frequentista e, também, as probabilidades condicionais.
Após esta breve introdução aos conceitos principais que ve-
remos apresentamos, a seguir, no Tópico Orientações para estudo,
algumas orientações de caráter motivacional, como também dicas
e estratégias de aprendizagem, que poderão facilitar o seu estudo.

2. ORIENTAÇÕES PARA ESTUDO

Abordagem Geral
Aqui, você entrará em contato com os assuntos principais
deste conteúdo de forma breve e geral e terá a oportunidade de
aprofundar essas questões no estudo de cada unidade. Desse
modo, esta Abordagem Geral visa fornecer-lhe o conhecimento
básico necessário a partir do qual você possa construir um
referencial teórico com base sólida – científica e cultural – para
que, no futuro exercício de sua profissão, você a exerça com
competência cognitiva, ética e responsabilidade social.
Você pode estar pensando: Estatística serve para quê?
Quais são os motivos para estudá-la? Considerando os cenários
administrativos e gerenciais; situações de análises contábeis;
problemas de gestão de pessoas e de materiais; casos de logística
e de transportes; análise de cenários econômicos; experimentos
médicos, biológicos e agronômicos em geral; entrevistas; estudos
sociológicos; enfim, situações relacionadas com a prática de quase
© Caderno de Referência de Conteúdo 11

todas as profissões e mercados, o que podemos detectar de


comum em tudo isso?
Entre essas similaridades, vamos destacar uma que nos
interessa mais. Em todos os casos citados, existe um momento
importante, chamado "tomada de decisão", em que o analista ou
pesquisador decide qual o caminho a ser tomado, qual a decisão
que levará ao atingimento de seus objetivos e/ou suas metas.
Se concordarmos que o processo de tomada de decisões é, de
fato, inerente aos cenários descritos, cabe uma nova pergunta: O
que é importante para uma tomada de decisão? O mais importante
é dispor de informações que propiciem que essa decisão seja feita
com embasamento e critérios. Mas, então, temos, novamente,
outra questão a responder: Como as informações devem ser
analisadas para propiciar uma decisão acertada?
Temos vários caminhos para analisar as informações. Um
desses caminhos, que contribui de forma decisiva para a tomada
de decisão, é a análise estatística dos dados. Assim, temos de
estudar Estatística, pois é natural a sua utilização no dia a dia sob
diversas formas. Além disso, veremos que, em muitos casos, não
basta conhecermos as ferramentas de análise; devemos, também,
possuir um olhar crítico para saber utilizar os resultados.
Nosso objetivo, então, é propiciar a você um conjunto de
ferramentas para a análise de conjuntos de dados sob a ótica da
Estatística, trabalhando o ferramental matemático e o processo de
cálculo associado à necessidade de compreensão da aplicabilidade
de cada ferramenta apresentada.
A Estatística nasceu como uma ferramenta destinada apenas
à coleta e descrição de dados, como veremos na Unidade 1, mas,
com o tempo, transformou-se em uma importante ferramenta
de análise, quando utilizada em conjunto com as probabilidades.
Todas as áreas do conhecimento fazem uso da Estatística, seja
para o planejamento de pesquisas e experimentos, seja para a
representação de dados, isto é, para a análise inferencial das
informações.

Claretiano - Centro Universitário


12 © Probabilidade e Estatística

Contudo, como a Estatística lida com a análise de dados, é


importante que esses dados ou informações sejam produzidos,
coletados ou pesquisados com critérios técnicos, de forma a
resultarem em dados pertinentes e confiáveis. Pensemos um
pouco: se vamos analisar um conjunto de dados, é necessário que
esses dados possam de fato representar o fenômeno de interesse.
Isso ocorre quando utilizamos metodologias adequadas para a
coleta dos dados.
Assim, quando elaboramos os procedimentos e metodologias
que serão utilizados para a coleta e pesquisa dos dados, devemos
seguir padrões rigorosos e científicos, para que os dados não sejam
distorcidos e ou manipulados. Para tal rigor, podemos nos valer
dos procedimentos discutidos em Metodologia Científica, que
sugere etapas a serem seguidas para permitir-se uma pesquisa de
dados adequada, isto é, definir os objetivos que desejamos atingir
e as hipóteses; definir as fontes a serem utilizadas e de onde
serão retirados os dados; e definir os instrumentos de coleta de
dados ou questionários utilizados, que devem estar diretamente
relacionados com os objetivos e estabelecer as técnicas apropriadas
para a coleta efetiva das informações, ou seja, um processo de
amostragem que seja o mais recomendável para aquela situação.
Um detalhamento sobre esse assunto será abordado na
Unidade 1, bem como a conceituação de população estatística e
amostra. Quando definimos as fontes de dados, podemos trabalhar
com todas as fontes existentes, como, por exemplo, em uma
pesquisa de mercado, utilizar todos os possíveis consumidores, ou,
em uma análise de qualidade, verificar 100% dos itens produzidos,
ou, ainda, em uma avaliação financeira de uma franquia, analisar
todos os franqueados do Brasil. Contudo, você deve refletir sobre
a viabilidade de analisar 100% das fontes existentes e pensar
que isso, na maioria dos casos, não será prudente ou será, até
mesmo, impossível de ser feito. Assim, podemos trabalhar com
uma amostra das fontes ou uma amostra dos dados e utilizar
© Caderno de Referência de Conteúdo 13

apenas uma parte representativa das informações, o que, embora


possa gerar um erro de análise, é muito mais coerente em termos
práticos.
É justamente nesse cenário de utilização de amostras que
a Estatística tem maior importância – em primeiro lugar, para
possibilitar uma análise que faça o erro gerado ser minimizado, e,
em segundo lugar, para viabilizar uma generalização dos resultados
obtidos na amostra para toda a população.
Considerando a realização da amostragem, o profissional
depara-se com a seguinte situação: a partir da coleta de dados
realizada, dispõe-se de um conjunto de dados (informações) que
devem ser analisados, a fim de permitir uma interpretação e
uma decisão, isto é, uma conclusão final. Discutiremos, portanto,
na Unidade 2, as formas de análise de dados chamadas de
"tabulação", que nada mais são do que a disposição dos dados em
forma de tabelas e/ou gráficos construídos com base no conceito
de frequência.
É natural supor que, na coleta de dados, exista certa repetição
de algumas informações ou dados (qualitativos ou quantitativos).
Essa repetição de alguns resultados é o início do processo
investigativo sobre os dados, e a função da frequência é justamente
mostrar e descrever como ocorrem essas repetições. Estudaremos
as duas frequências principais: a primeira, chamada de Frequência
Absoluta (ou Frequência Simples), é a contagem do número de
vezes que cada informação se repete nos dados coletados e possui
a capacidade de ilustrar qual resultado é mais expressivo em
relação aos demais, indicando um início de análise por incidência.
Contudo, a Frequência Absoluta não permite comparações entre
períodos ou cenários e, por isso, é transformada no segundo tipo
de frequência, chamado de Frequência Relativa (ou Frequência
Percentual), que tem como principal função permitir análises
comparativas entre as informações originárias de períodos ou
cenários diferentes.

Claretiano - Centro Universitário


14 © Probabilidade e Estatística

A transformação de uma Frequência Absoluta em uma


Frequência Relativa segue a mesma mecânica dos cálculos
percentuais tradicionais, isto é, dividindo-se uma Frequência
Absoluta pelo total e multiplicando-se o resultado por 100,
obtemos a Frequência Percentual, ou Relativa. Durante os estudos
da Unidade 2, mais detalhes serão fornecidos e exemplos trabalhos.
O uso das frequências pode ser feito por meio de tabelas
ou gráficos de frequências. As tabelas de frequências diferenciam-
se de acordo com o tipo de informação coletada, a qual pode
ser qualitativa (não é expressa numericamente), quantitativa
inteira (é expressa numericamente, mas sempre por números
inteiros) e quantitativa fracionária (é expressa numericamente
e pode apresentar casas decimais). Já os gráficos de frequências
podem ser, geralmente, de colunas (apresentados na vertical), de
barras (apresentados na horizontal) e de setores, ou de "pizza",
(apresentado em formato de círculo fatiado).
Tanto as tabelas quanto os gráficos de frequências são
ferramentas descritivas dos dados, ou seja, não possuem intenção
de permitir uma análise aprofundada dos dados, mas apenas de
apresentar as informações de forma ordenada, a fim de facilitar a
análise posterior. É muito comum encontrarmos tabelas e gráficos
em artigos de jornais e revistas e mesmo em matérias de jornais
televisivos, pois seu impacto visual é muito favorável à transmissão
da ideia sobre os resultados. Além dos gráficos de frequências,
vamos abordar os gráficos de séries estatísticas, muito utilizados
para caracterizar variáveis que oscilam no tempo.
Quando trabalhamos com dados qualitativos, a representação
descritiva das tabelas e gráficos é muito eficiente. Contudo,
quando trabalhamos com dados quantitativos, essa representação
não é suficiente para uma plena compreensão dos resultados. Para
aprimorar a descrição dos dados quando estes são originários de
variáveis quantitativas (expressas numericamente, como preço,
quantidade produzida, lucro, taxas, peso, número de funcionários
© Caderno de Referência de Conteúdo 15

etc.), fazemos uso das medidas estatísticas. Assim, nas Unidades 3


e 4, estudaremos um conjunto de medidas que tem como objetivo
descrever de forma mais completa o comportamento de variáveis
quantitativas. Iniciaremos nossos estudos com as medidas
estatísticas de posição, cuja função é resumir as informações
coletadas em apenas um único valor representativo.
Dentre as medidas existentes, veremos como trabalhar com
as médias. Em especial, trataremos da:
• Média Aritmética Simples, que é definida pela divisão
entre a soma dos valores e o número de elementos;
• Média Aritmética Ponderada, que é definida pela divisão
entre a soma ponderada dos valores e o peso total atribu-
ído aos dados;
• Média Geométrica, que é definida como uma média arit-
mética na escala logarítmica dos dados.
Essas três médias possuem características similares, mas são
calculadas de modos diferentes. Estudaremos detalhadamente
cada uma delas na Unidade 3, desde a formalização dos cálculos
até suas aplicações. As médias caracterizam-se por utilizar todos
os dados disponíveis e, portanto, são sensíveis ao comportamento
deles.
Quando temos valores muito altos ou muito baixos nos dados,
as médias podem oscilar para cima ou para baixo, resultando, em
alguns momentos, em análises que não representam a realidade.
Assim, nossos estudos não se limitarão à utilização de fórmulas;
ao contrário, faremos uma avaliação criteriosa sobre a utilização
prática das médias. Em muitos casos, a aplicação de uma média
pode mais prejudicar a análise do que colaborar com o analista.
Para complementar a análise via médias, estudaremos,
também, a Mediana, a Moda e as medidas separatrizes, que
possuem características bem distintas das médias e que, em muitas
situações, permitem uma análise mais coerente. É importante

Claretiano - Centro Universitário


16 © Probabilidade e Estatística

reforçar que cabe ao analista a seleção adequada das ferramentas


que serão utilizadas, e, para isso, é muito mais importante conhecer
as propriedades de cada uma do que sua forma de cálculo, pois,
se sabemos calcular, mas não sabemos aplicar o resultado, de que
adianta o cálculo?
Devido a alguns problemas na utilização das médias,
estudaremos, na Unidade 4, as medidas estatísticas de dispersão
(ou medidas estatísticas de variabilidade). A dispersão nada mais
é do que o grau de variação que existe dentro de um conjunto de
dados numéricos. Quando esse grau de variação é alto, a análise
pelas médias fica prejudicada. Assim, é importante saber mensurar,
isto é, medir o grau de variação dos dados. E faremos isso por meio
das seguintes medidas:
• Variância Amostral: é uma medida de variabilidade abso-
luta definida como a diferença, ao quadrado, entre cada
valor existente no conjunto de dados e a média aritmética
do conjunto.
• Desvio Padrão Amostral: é uma medida de variabilida-
de absoluta definida como a raiz quadrada da Variância
Amostral.
• Coeficiente de Variação: é uma medida de variabilidade
relativa definida pela divisão entre o desvio padrão e a
média aritmética dos dados.
A variância é uma medida que serve para determinar o grau
de variação dos dados. Assim, quanto maior o valor da medida
variância, maior é o grau de variação, e, consequentemente, a média
perde a capacidade de mostrar uma informação pertinente. Como a
variância tem a característica de trabalhar com as diferenças tomadas
ao quadrado, pode, muitas vezes, gerar resultados inconsistentes,
na prática, utilizamos outra medida, que, de certa forma, anula o
efeito dos expoentes quadráticos. Essa medida é o desvio padrão,
que, de tão importante no segmento de análise de dados, aparece
em todas as calculadoras científicas e financeiras. Durante nossos
© Caderno de Referência de Conteúdo 17

estudos, vamos abordar, também, o uso dos recursos tecnológicos


para o cálculo de algumas medidas estatísticas.
O desvio padrão permitirá uma série de análises importantes,
como, por exemplo, o cálculo de uma medida de variabilidade
relativa que chamamos de "Coeficiente de Variação". Por ser uma
medida de variabilidade relativa, o Coeficiente de Variação permite
compararmos o grau de variação entre dois ou mais cenários, o
que pode ser de fundamental importância na análise de decisão.
Outra medida que estudaremos na Unidade 4 é o Índice de
Assimetria dos dados, que é o resultado de uma relação entre
a média aritmética, a Mediana e o Desvio Padrão Amostral.
A assimetria dos dados está diretamente relacionada com a
aplicabilidade da média. Dados simétricos permitem uma análise
mais criteriosa da média, enquanto dados assimétricos podem
resultar em uma representação não significativa pela média. Note
que não estamos falando apenas de cálculos, mas, sim, de cálculos
que permitem uma análise crítica sobre os dados e, por assim
dizer, sobre a possibilidade efetiva de avaliar esses dados a fim de
tomar decisões.
Nas Unidades 2, 3 e 4, discutiremos as ferramentas
descritas anteriormente, em especial as medidas de posição e as
medidas de dispersão, que correspondem à chamada "Estatística
Descritiva". Como o próprio nome menciona, a principal função
dessas ferramentas é apresentar e descrever os dados que foram
coletados na amostragem.
Na forma mais completa da análise estatística, tais medidas
descritivas devem ser transformadas em medidas chamadas
de "inferenciais", as quais conseguem generalizar os resultados
amostrais em populacionais. No entanto, esse assunto não será
estudado neste Caderno de Referência de Conteúdo, pois nosso
objetivo está focado na formação do professor de Matemática,
que deverá trabalhar a Estatística na Educação Básica, abordando
assuntos similares aos tratados aqui.

Claretiano - Centro Universitário


18 © Probabilidade e Estatística

Apesar de não termos o objetivo de abordar a Estatística


Inferencial, estudar as probabilidades é muito importante, pois
esse é um assunto amplamente utilizado na Educação Básica,
assim como em concursos dos mais variados tipos. Na Unidade
5, portanto, faremos um estudo bem detalhado dos principais
conceitos e resultados da teorias frequentistas de probabilidades.
Veremos que o conceito de Probabilidade Frequentista
nada mais é do que o relacionamento entre conjuntos de dados
– um que determina os resultados de interesse e outro que
determina o conjunto total de resultados possíveis, chamado de
"Espaço Amostral", sempre considerando que esses conjuntos são
resultados de uma ação ou cenário aleatório, isto é, com um certo
grau de incerteza sobre os resultados.
As probabilidades, que surgiram para atribuir chances em
jogos de azar, evoluíram de forma acelerada no campo das ciências,
com muitas aplicações importantes. Vamos iniciar nosso estudo
sobre elas discutindo a visão frequentista, seus principais axiomas e
teoremas, e, do estudo dos teoremas e axiomas, algumas fórmulas
de cálculo serão construídas e permitirão diversas aplicações das
probabilidades.
No entanto, como você verá ao estudar a Unidade 5, a
aplicação direta das fórmulas conhecidas de Probabilidade
algumas vezes apresenta certas limitações de ordem prática, e,
nesses casos, pelo menos quando possível, podemos recorrer
a técnicas de contagem e regras geométricas para permitir os
cálculos. Veremos com detalhes essas limitações e como efetuar
os cálculos por outros caminhos.
Vamos abordar os casos de eventos dependentes no final de
nossos estudos, com a Fórmula da Probabilidade Condicional e do
Produto das Probabilidades, que possuem uma aplicação muito
ampla nos mais variados cenários práticos. Depois, ampliaremos
o estudo com os eventos independentes, conseguindo, assim,
reunir, neste material, os principais conceitos e resultados para um
bom entendimento das probabilidades.
© Caderno de Referência de Conteúdo 19

Glossário de Conceitos
O Glossário de Conceitos permite a você uma consulta rá-
pida e precisa das definições conceituais, possibilitando-lhe um
bom domínio dos termos técnico-científicos utilizados na área de
conhecimento dos temas tratados em Probabilidade e Estatística.
Veja, a seguir, a definição dos principais conceitos:
1) Amostra: subconjunto da população. Por possuir um
número reduzido de elementos, é mais viável de ser
pesquisada do que a população, mas, em compensação,
gera um erro maior na análise. Deve satisfazer algumas
propriedades, e a principal delas é ser aleatória.
2) Ciência: conjunto de conhecimentos exatos e racionais
relativos às causas das realizações deduzidas pela de-
monstração.
3) Coeficiente de Variação: ferramenta que permite anali-
sar comparativamente a variabilidade entre dois ou mais
conjuntos. É, também, referência para avaliar o grau de
variabilidade de uma variável.
4) Conjunto: união de elementos que possuem, pelo me-
nos, uma característica em comum. Em Probabilidade,
toda teoria e aplicações são definidas pela utilização de
conjuntos e subconjuntos, e um importante conjunto
utilizado nessa área é o chamado "espaço amostral".
5) Distribuição de frequências: ferramenta de tabulação
de dados que corresponde a uma ordenação dos dados
segundo um agrupamento por frequência de ocorrên-
cia, que pode ser absoluta ou relativa.
6) Espaço Amostral: conjunto formado por todos os possí-
veis resultados de um fenômeno aleatório.
7) Evento Aleatório: resultado particular do espaço amos-
tral; representa o resultado de interesse sobre o qual se
quer calcular a probabilidade de ocorrência.
8) Eventos complementares: eventos que, além de serem
mutuamente exclusivos, se unidos, reproduzem exata-
mente os resultados do espaço amostral.

Claretiano - Centro Universitário


20 © Probabilidade e Estatística

9) Eventos dependentes: eventos que possuem um grau


de dependência, de forma que a ocorrência de um deles
modifica a probabilidade de ocorrência do outro.
10) Eventos independentes: eventos que não possuem um
grau de dependência, de forma que a ocorrência de um
deles não altera em nada a probabilidade de ocorrência
do outro.
11) Eventos mutuamente exclusivos: eventos que nunca
podem ocorrer simultaneamente, ou seja, não possuem
intersecção. Também são chamados de "eventos disjun-
tos".
12) Eventos não mutuamente exclusivos: eventos que po-
dem ocorrer simultaneamente, ou seja, possuem inter-
secção. Também são chamados de "eventos não disjun-
tos".
13) Fenômeno Aleatório: situação ou ação cotidiana cujo
resultado ou consequência é marcado pela incerteza, ou
seja, não se pode afirmar com certeza o resultado final
do fenômeno. Os resultados amostrais advindos da Esta-
tística são todos aleatórios.
14) Ferramenta: ordem ou conjunto de processos que de-
vem ser estabelecidos para, mediante investigação, se
atingir determinado objetivo. Quando definimos um
procedimento que já se mostrou válido para vários ex-
perimentos, temos o método científico.
15) Gráfico de frequência: representação gráfica da tabela
que permite uma transmissão, visualização e análise de
dados mais facilitada.
16) Gráfico de série: utilizado para a análise de séries histó-
ricas ou temporais.
17) Índice de Assimetria: medida que visa contabilizar o fe-
nômeno da simetria ou assimetria da variável.
18) Medidas de dispersão: utilizadas para mensurar o grau
de variabilidade no conjunto de dados, considerando a
representação dos dados por meio da média aritmética.
19) Medida estatística de ordem: ferramenta que visa re-
presentar os dados de um conjunto ordenado por me-
© Caderno de Referência de Conteúdo 21

didas que subdividam esse conjunto em subconjuntos,


contendo um percentual estipulado de elementos.
20) Medida estatística de tendência central: ferramenta
que visa representar um conjunto de dados numéricos
em apenas um único valor representativo, com tendên-
cia a se localizar no centro dos dados.
21) Medidas de posição: ferramentas de análise descritiva
dos dados que podem ser classificadas como de tendên-
cia central (Médias, Mediana e Moda) e de ordem (quar-
til, decil e percentil).
22) Metodologia de pesquisa: como as análises estatísticas
são feitas com base em amostragem, é importante que a
metodologia empregada na coleta dos dados seja a mais
adequada possível, a fim de garantir a representativida-
de dos dados da amostra, ou seja, possibilitar que a aná-
lise dos dados amostrais permita uma extrapolação para
a população.
23) Operações entre conjuntos: como as probabilidades são
baseadas em conjuntos, as operações realizadas com as
probabilidades são baseadas nas operações entre con-
juntos. Podemos destacar a União entre Conjuntos, de-
notada por ∪, e a Intersecção entre Conjuntos, denota-
da por , a qual representa os elementos em comum

entre os conjuntos.
24) População estatística: conjunto que contém todas as
fontes de dados (elementos ou indivíduos) de interes-
se para a realização de uma pesquisa. Em geral, é muito
grande e inviável de ser pesquisada completamente.
25) Probabilidade: ferramenta que possibilita associar uma
chance de ocorrência a um determinado fenômeno ale-
atório.
26) Relações entre conjuntos: como as probabilidades são
baseadas em conjuntos, as relações existentes nas pro-
babilidades são baseadas nas relações entre conjuntos.
Podemos destacar as relações de exclusividade entre
conjuntos, ou seja, quando não possuem elementos em
comum, ou não exclusivos, quando possuem elementos
em comum.

Claretiano - Centro Universitário


22 © Probabilidade e Estatística

27) Simetria: comportamento típico dos dados numéricos


e que pode ser verificado utilizando-se das medidas es-
tatísticas de tendência central. A análise desse compor-
tamento tem diversas aplicações práticas e é de grande
importância no estudo da Estatística.
28) Tabela de frequência: instrumento de tabulação de da-
dos. Organiza as informações em formato de tabela, re-
lacionando cada resposta obtida nos dados brutos com
a sua ocorrência por meio da Frequência Absoluta e da
Frequência Relativa.
29) Tabulação: processo utilizado para ordenar um conjunto
de dados brutos obtidos em uma coleta de dados.
30) Técnicas de contagem: procedimentos da Matemática
Discreta úteis para contabilizar de quantas formas uma
determinada ação pode ser feita. Basicamente, temos a
regra da soma, a regra do produto, as permutações, os
arranjos e as combinações.

Esquema dos Conceitos-chave


Para que você tenha uma visão geral dos conceitos mais
importantes deste estudo, apresentamos, a seguir (Figura 1), um
Esquema dos Conceitos-chave. O mais aconselhável é que você
mesmo faça o seu esquema de conceitos-chave ou até mesmo o
seu mapa mental. Esse exercício é uma forma de você construir o
seu conhecimento, ressignificando as informações a partir de suas
próprias percepções.
É importante ressaltar que o propósito desse Esquema dos
Conceitos-chave é representar, de maneira gráfica, as relações entre
os conceitos por meio de palavras-chave, partindo dos mais com-
plexos para os mais simples. Esse recurso pode auxiliar você na or-
denação e na sequenciação hierarquizada dos conteúdos de ensino.
Com base na teoria de aprendizagem significativa, entende-
-se que, por meio da organização das ideias e dos princípios em
esquemas e mapas mentais, o indivíduo pode construir o seu co-
nhecimento de maneira mais produtiva e obter, assim, ganhos pe-
© Caderno de Referência de Conteúdo 23

dagógicos significativos no seu processo de ensino e aprendizagem.


Aplicado a diversas áreas do ensino e da aprendizagem es-
colar (tais como planejamentos de currículo, sistemas e pesquisas
em Educação), o Esquema dos Conceitos-chave baseia-se, ainda,
na ideia fundamental da Psicologia Cognitiva de Ausubel, que es-
tabelece que a aprendizagem ocorre pela assimilação de novos
conceitos e de proposições na estrutura cognitiva do aluno. Assim,
novas ideias e informações são aprendidas, uma vez que existem
pontos de ancoragem.
Tem-se de destacar que "aprendizagem" não significa, ape-
nas, realizar acréscimos na estrutura cognitiva do aluno; é preci-
so, sobretudo, estabelecer modificações para que ela se configure
como uma aprendizagem significativa. Para isso, é importante con-
siderar as entradas de conhecimento e organizar bem os materiais
de aprendizagem. Além disso, as novas ideias e os novos concei-
tos devem ser potencialmente significativos para o aluno, uma vez
que, ao fixar esses conceitos nas suas já existentes estruturas cog-
nitivas, outros serão também relembrados.
Nessa perspectiva, partindo-se do pressuposto de que é
você o principal agente da construção do próprio conhecimento,
por meio de sua predisposição afetiva e de suas motivações
internas e externas, o Esquema dos Conceitos-chave tem por
objetivo tornar significativa a sua aprendizagem, transformando
o seu conhecimento sistematizado em conteúdo curricular, ou
seja, estabelecendo uma relação entre aquilo que você acabou
de conhecer com o que já fazia parte do seu conhecimento de
mundo (adaptado do site disponível em: <http://penta2.ufrgs.
br/edutools/mapasconceituais/utilizamapasconceituais.html>.
Acesso em: 11 mar. 2010).
Como poderá observar, esse esquema oferecerá a você,
como dissemos anteriormente, uma visão geral dos conceitos
mais importantes deste estudo. Ao segui-lo, será possível transitar
entre os principais conceitos e descobrir o caminho para construir

Claretiano - Centro Universitário


24 © Probabilidade e Estatística

o seu processo de ensino-aprendizagem. Por exemplo, antes de


estudar os conceitos de medidas de dispersão, você deverá estu-
dar os conceitos básicos de Estatística e as medidas de tendência
central.
© Caderno de Referência de Conteúdo 25

Figura 1 Esquema dos Conceitos-chave do Caderno de Referência de Conteúdo Probabilidade


e Estatística.

O Esquema dos Conceitos-chave é mais um dos recursos de


aprendizagem que vem se somar àqueles disponíveis no ambien-
te virtual, por meio de suas ferramentas interativas, bem como
àqueles relacionados às atividades didático-pedagógicas realiza-
das presencialmente no polo. Lembre-se de que você, aluno EaD,
deve valer-se da sua autonomia na construção de seu próprio co-
nhecimento.
Claretiano - Centro Universitário
26 © Probabilidade e Estatística

Questões Autoavaliativas
No final de cada unidade, você encontrará algumas questões
autoavaliativas sobre os conteúdos ali tratados, as quais podem ser
de múltipla escolha, abertas objetivas ou abertas dissertativas.
Responder, discutir e comentar essas questões, bem como
relacioná-las com a prática da Probabilidade e da Estatística, pode
ser uma forma de você avaliar o seu conhecimento. Assim, me-
diante a resolução de questões pertinentes ao assunto tratado,
você estará se preparando para a avaliação final, que será disser-
tativa. Além disso, essa é uma maneira privilegiada de você testar
seus conhecimentos e adquirir uma formação sólida para a sua
prática profissional.
Você encontrará, ainda, no final de cada unidade, um gabari-
to, que lhe permitirá conferir as suas respostas sobre as questões
autoavaliativas de múltipla escolha.

As questões de múltipla escolha são as que têm como resposta


apenas uma alternativa correta. Por sua vez, entendem-se por
questões abertas objetivas as que se referem aos conteúdos
matemáticos ou àqueles que exigem uma resposta determinada,
inalterada. Já as questões abertas dissertativas obtêm por
resposta uma interpretação pessoal sobre o tema tratado; por isso,
normalmente, não há nada relacionado a elas no Tópico Gabarito.
Você pode comentar suas respostas com o seu tutor ou com seus
colegas de turma.

Bibliografia Básica
É fundamental que você use a Bibliografia Básica em seus
estudos, mas não se prenda só a ela. Consulte, também, as biblio-
grafias complementares.
© Caderno de Referência de Conteúdo 27

Figuras (ilustrações, quadros...)


Neste material instrucional, as ilustrações fazem parte inte-
grante dos conteúdos, ou seja, elas não são meramente ilustra-
tivas, pois esquematizam e resumem conteúdos explicitados no
texto. Não deixe de observar a relação dessas figuras com os con-
teúdos deste Caderno de Referência de Conteúdo, pois relacionar
aquilo que está no campo visual com o conceitual faz parte de uma
boa formação intelectual.

Dicas (motivacionais)
O estudo deste Caderno de Referência de Conteúdo convida
você a olhar, de forma mais apurada, a Educação como processo
de emancipação do ser humano. É importante que você se atente
às explicações teóricas, práticas e científicas que estão presentes
nos meios de comunicação, bem como partilhe suas descobertas
com seus colegas, pois, ao compartilhar com outras pessoas aqui-
lo que você observa, permite-se descobrir algo que ainda não se
conhece, aprendendo a ver e a notar o que não havia sido perce-
bido antes. Observar é, portanto, uma capacidade que nos impele
à maturidade.
Você, como aluno do curso de Graduação na modalidade
EaD, necessita de uma formação conceitual sólida e consistente.
Para isso, você contará com a ajuda do tutor a distância, do tutor
presencial e, sobretudo, da interação com seus colegas. Sugeri-
mos, pois, que organize bem o seu tempo e realize as atividades
nas datas estipuladas.
É importante, ainda, que você anote as suas reflexões em
seu caderno ou no Bloco de Anotações, pois, no futuro, elas pode-
rão ser utilizadas na elaboração de sua monografia ou de produ-
ções científicas.
Leia os livros da bibliografia indicada, para que você amplie
seus horizontes teóricos. Coteje-os com o material didático, discuta
a unidade com seus colegas e com o tutor e assista às videoaulas.

Claretiano - Centro Universitário


28 © Probabilidade e Estatística

No final de cada unidade, você encontrará algumas questões


autoavaliativas, que são importantes para a sua análise sobre os
conteúdos desenvolvidos e para saber se estes foram significativos
para sua formação. Indague, reflita, conteste e construa
resenhas, pois esses procedimentos serão importantes para o seu
amadurecimento intelectual.
Lembre-se de que o segredo do sucesso em um curso na
modalidade a distância é participar, ou seja, interagir, procurando
sempre cooperar e colaborar com seus colegas e tutores.
Caso precise de auxílio sobre algum assunto relacionado aos
conteúdos estudados, entre em contato com seu tutor. Ele estará
pronto para ajudar você.

3. REFERÊNCIAS BIBLIOGRÁFICAS
BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.

4. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
EAD
A Natureza dos Dados
Estatísticos

1
1. OBJETIVOS
• Conhecer a origem e a história da Estatística.
• Entender o que é população e amostra, bem como as
suas relações.
• Aplicar as fases de desenvolvimento de um trabalho es-
tatístico.
• Compreender a metodologia da coleta de dados.

2. CONTEÚDOS
• Origem e história da Estatística.
• População e amostra.
• Fases de um trabalho estatístico.
• Coleta, crítica, apuração e exposição de dados.
30 © Probabilidade e Estatística

3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE


Antes de iniciar o estudo desta unidade, é importante que
você leia as orientações a seguir:
1) Tenha sempre à mão o significado dos termos e expres-
sões explicitados no Glossário de Conceitos e suas liga-
ções pelo Esquema dos Conceitos-chave para o estudo
de não apenas esta, mas todas as unidades deste CRC.
Isso facilitará sua aprendizagem e seu desempenho.
2) Procure desenvolver as atividades e interatividades den-
tro do cronograma previsto para não prejudicar o anda-
mento de seus estudos.
3) Leia os livros da bibliografia indicada para ampliar seus
estudos em relação aos conceitos básicos de Estatística e
coteje-os com o material didático, discutindo a unidade
com seus colegas e com o tutor. Pesquise novas fontes e
troque experiências com eles, pois todo conhecimento é
bem-vindo e ajudará no seu aprendizado.

4. INTRODUÇÃO À UNIDADE
Nesta unidade, vamos estudar um pouco sobre a origem e a
evolução da Estatística. Além disso, compreenderemos a inclusão
dos tratamentos da informação nos Parâmetros Curriculares
Nacionais (PCNs), bem como sua importância.
Ainda, abordaremos a Fundação IBGE, que é a responsável
por todas as estatísticas no Brasil, fornecendo dados importantes
para as tomadas de decisão de nossos governantes.
Além de tratar do aspecto histórico, veremos nessa unidade
que a Estatística, na grande maioria dos casos, trabalha com
dados originários de pesquisas e coleta de dados. Desse modo,
discutiremos um pouco sobre a metodologia envolvida nesses
eventos e como se processa a análise estatística dos dados,
pensando nas principais fases, de coleta, crítica, apuração e
exposição dos resultados. Vamos lá.
© U1 – A Natureza dos Dados Estatísticos 31

5. ORIGEM E HISTÓRIA DA ESTATÍSTICA


A origem da palavra "estatística" está diretamente associada
à palavra latina status (Estado). Desde a Antiguidade, realizavam-
-se coletas de informações com finalidades tributárias, e existem
indícios, também, de que há 3.000a.C. já se faziam coletas de da-
dos na Babilônia, China e Egito.
De acordo com Moreira (1981), a Estatística pode ser dividi-
da em três grandes períodos para caracterização de sua história e
evolução. Vamos conhecê-los a seguir.

Período focado na obtenção de fatos


O primeiro período, focado na obtenção de fatos, abrange
a Idade Antiga, a Idade Média e parte da Idade Moderna. Pelos
registros encontrados, a Estatística era conhecida como "Estatísti-
ca Administrativa", tendo em vista o interesse estatal dos dados.
Vejamos alguns destaques:
• Por meio do livro sacro Chou king, de Confúcio, têm-se
notícias da preparação dos estados da China, no ano
2.238a.C.
• Na Idade Média, no ano 721d.C., os árabes fizeram uma
coleta numérica das cidades dominadas, computando a
população e a produção para controle das conquistas ter-
ritoriais.
• Guilherme, o Conquistador, ordenou a elaboração de um
cadastro da divisão do solo da Inglaterra das várias classes
sociais existentes, para fins de arrecadação de impostos.
Notemos que a origem da palavra faz jus às suas origens.
A evolução no processo de coleta e armazenamento dos da-
dos e informações acabou por promover uma grande quantidade
de estudos e pesquisas, no sentido de desenvolver técnicas mais
apuradas para a análise dos dados.

Claretiano - Centro Universitário


32 © Probabilidade e Estatística

Período de evolução das teorias estatísticas


No segundo período, surge a denominação "Estatística", que
passa a ser uma disciplina autônoma. Vamos observar alguns des-
taques desse período:
• Na Inglaterra, no século 17, John Grant inicia as investi-
gações sobre a Estatística Demográfica e estabelece algu-
mas relações entre os nascimentos e as mortes.
• Blaise Pascal e Pierre de Fermat descobrem os cálculos
das probabilidades, instrumento muito útil hoje em dia
para análise de fenômenos aleatórios.
• Adolphe Quetelet, no século 18, aplica a Lei dos Grandes
Números no estudo demográfico e social.
Com a evolução das técnicas de análise e a junção da Estatís-
tica com a Probabilidade, abriu-se caminho para a aplicação desses
conhecimentos na análise de dados de muitas ciências naturais.

Período do aperfeiçoamento técnico-científico


O terceiro período é caracterizado pela aplicação dos concei-
tos estatísticos na ciência. Vejamos os destaques desse período:
• Em 1853, ocorre o Primeiro Congresso de Estatística.
• Francis Galton emprega a Estatística Metodológica nos
problemas de hereditariedade.
• James Maxwell emprega a Estatística na Teoria Cinética
dos Gases.
Além da Europa e dos Estados Unidos, outras regiões apre-
sentaram grande avanço na aplicação da Estatística nos mais diver-
sos campos e instituíram a criação de cursos específicos na área,
inclusive no Brasil.
© U1 – A Natureza dos Dados Estatísticos 33

Instituto Brasileiro de Geografia e Estatística (IBGE)


No Brasil, a Estatística tem sua história associada à história
do Instituto Brasileiro de Geografia e Estatística (IBGE), cujas raízes
remontam ao Império.
É claro que a evolução da Estatística como ciência foi promo-
vida devido às suas aplicações nas mais diversas áreas do conheci-
mento. Assim como as ciências naturais e as ciências da saúde, as
ciências sociais foram aprofundando-se; as metodologias de aná-
lise estatística foram estruturando-se e evoluindo naturalmente,
especialmente após a utilização mais eficiente dos recursos com-
putacionais.
É importante esclarecermos que, independentemente do
cenário de aplicação da Estatística, os conceitos básicos e os prin-
cípios analíticos são os mesmos. Algumas ferramentas servem
para determinados propósitos, mas, para outros, não, embora a
concepção da análise estatística seja a mesma. Veremos, a seguir,
alguns desses importantes conceitos.

6. CONCEITOS IMPORTANTES EM ESTATÍSTICA


Para entendermos a extensão da aplicação da Estatística, é
importante que tenhamos claros os principais conceitos que nela
são aplicados.
Conforme Moreira (1981), podemos dar à Estatística
diversas definições, seja como ciência, seja como ferramenta. Para
efeito da disciplina Estatística como área de aplicação, podemos
entender que ela é um conjunto de técnicas relacionadas com a
coleta, representação, interpretação e análise de dados obtidos em
processos investigativos referentes a experimentos de laboratório,
experimentos de campo, simulações, pesquisas de mercado,
pesquisas de opinião etc., ou seja, qualquer procedimento cuja
finalidade seja coletar dados para análise.

Claretiano - Centro Universitário


34 © Probabilidade e Estatística

Para entender de fato quais são os objetivos da Estatística,


considere, por exemplo, que você retirou uma fatia de um bolo
inteiro. Ao experimentá-la, uma pessoa pede sua opinião sobre
o bolo, perguntando se ele está bom. Em geral, a tendência das
pessoas é responder algo do tipo: "o bolo está bom" ou, então, "o
bolo não está bom".
É claro que as respostas apresentadas não estão totalmente
de acordo com a situação, pois não temos como afirmar se o bolo
está ou não está bom, uma vez que conhecemos apenas uma
pequena parte dele. Então, por que as pessoas respondem dessa
forma?
É simples: nós temos a tendência de generalizar o pedaço
imediatamente para o bolo. Mas a generalização só tem sentido se
o bolo for totalmente homogêneo, o que já não podemos afirmar.
Avaliemos, portanto, da seguinte forma: quando você se serve
de um pedaço de bolo, costuma optar pelos pedaços dos cantos
ou prefere os pedaços que estão na região mais central? Se sua
resposta para qualquer uma das opções for "sim", você acaba de
oferecer argumentos contrários à homogeneidade do bolo.
Se o bolo for homogêneo, a generalização será imediata, já
que o pedaço veio do bolo, e, se o pedaço está bom, então, o bolo
também está. Como não podemos afirmar se o bolo é ou não é
homogêneo, não podemos afirmar se está bom ou não.
Se pudéssemos comer o bolo todo, certamente o nível de
precisão da análise seria maior, já que, quanto mais informação,
menor a chance de erro. Contudo, como o bolo não é homogêneo,
mesmo se comêssemos todo ele, cada parte apresentaria um
sabor diferente, não sendo possível, portanto, afirmar algo sobre
ele, e o erro ainda ocorreria, em razão da heterogeneidade.
Nesse sentido, temos situações práticas em que a informação
de interesse não é total, mas, sim, apenas uma parte dos dados, e
ainda existe um fator de mudança não totalmente controlável. Em
casos como esse, todas as conclusões não são totalmente corretas.
© U1 – A Natureza dos Dados Estatísticos 35

Desse modo, podemos dizer que a Estatística é uma ciência


que analisa e caracteriza variáveis, considerando a presença de
alterações e resultados parciais. Essas alterações presentes nas
variáveis são naturais, visto que, no processo de coleta de qualquer
tipo de variável, ocorre a particularidade de cada elemento
estudado, mesmo em situações de alto controle. Sempre existirão
componentes não controláveis e que acarretarão variações nos
resultados, gerando, assim, probabilidades de acerto ou de erro
nas análises.

7. POPULAÇÃO VERSUS AMOSTRA


A amostra é definida como um subconjunto da população, isto
é, uma parte representativa do todo, que necessariamente deve
conservar todas as características dos elementos da população.
Em geral, deve ser definida de forma finita e bem delineada para
que consiga viabilizar a coleta dos dados. É por meio da amostra
que chegamos ao conhecimento da população, e seu uso gera
redução nos custos da coleta, redução no tempo de execução da
coleta, maior facilidade na coleta, porém erros nas análises.
A população estatística é o conjunto total de elementos
disponíveis com, pelo menos, uma característica em comum e de
interesse, contendo N elementos (tendendo a ser muito grande).
A população pode ser classificada como:
• finita ou infinita, em relação ao número de elementos;
• discreta ou contínua, em relação ao tipo de elemento.
Para não confundirmos o conceito de população estatística
com o de população humana, vale esclarecer que a população
estatística deve ser entendida como qualquer tipo de agrupamento,
não só de pessoas, mas também de objetos, empresas, espécimes
animais e vegetais, entre outros.
Quanto à parcialidade dos resultados, podemos melhorar o
conceito, pensando o seguinte: em um processo de pesquisa ou de

Claretiano - Centro Universitário


36 © Probabilidade e Estatística

investigação, sempre temos um conjunto de fontes de informações,


contendo, em geral, um grande número de elementos. Certamente,
você já ouviu falar em pesquisas eleitorais; então, por exemplo,
imagine uma pesquisa sobre candidatos ao cargo de prefeito
de uma cidade que possua, aproximadamente, 42 mil eleitores.
Poderíamos pesquisar todos eles?
Se pesquisarmos todas as fontes, teremos três problemas:
o tempo e o custo gastos para a coleta, que tendem a ser
significativos e podem inviabilizar a coleta, e a possibilidade do
desconhecimento de parte dos elementos. Nesse sentido, torna-
se inviável o estudo de toda a população de elementos.
Utilizando a população, garantimos benefícios importantes
para a precisão dos resultados finais, já que toda informação
disponível passa a ser conhecida. Contudo, permanece o problema
da variação natural dos dados, que pode ser mais bem entendido
com 100% da informação à disposição.
Quando a inviabilidade do estudo populacional se faz
presente, a coleta de dados é feita com apenas uma parte
representativa da população, conhecida como "amostra".
Como não temos todos os elementos, existirá uma chance de
os resultados não serem significativos a ponto de representarem
a população. Assim, é fundamental estruturar corretamente a
amostragem, a fim de minimizar a margem de erro dos dados.
Nem toda amostra é útil para análises estatísticas. A amostra deve
ser representativa, ou seja, deve ser um retrato em miniatura da
população.
Garantindo-se um procedimento correto de amostragem,
podemos analisar o comportamento das variáveis, por meio da
análise estatística descritiva, e construir estimativas confiáveis e
precisas a respeito das variáveis, por meio da análise estatística
inferencial, que é o processo pelo qual tiramos conclusões sobre
o comportamento populacional de uma variável, baseando-se no
comportamento particular observado e estudado na amostra.
© U1 – A Natureza dos Dados Estatísticos 37

A composição de uma amostra deve considerar critérios


rigorosos para possibilitar resultados mais confiáveis. Em
Estatística, lidamos com amostras probabilísticas, que permitem
trabalhar com estimativas e determinar de forma correta o erro
amostral.

Para você fortalecer os conceitos estudados neste tópico,


responda à nossa primeira questão autoavaliativa, disposta ao
final desta unidade.

8. MÉTODOS DE AMOSTRAGEM
Para cada pesquisa realizada, devemos utilizar métodos
científicos adequados, pois o pesquisador tem como principal
preocupação verificar se os elementos da amostra são
suficientemente representativos de toda a população, de forma a
generalizá-la.
Assim, cada elemento da população deve ter uma
probabilidade conhecida para fazer parte da amostra, sendo esta
denominada "amostra aleatória", ou "amostra probabilística".

Amostra aleatória, ou amostra probabilística


O uso de amostragem probabilística, ou amostragem aleató-
ria, permite a generalização dos resultados amostrais para a popu-
lação, adotando medidas probabilísticas para o dimensionamento
do erro amostral.
No entanto, por questões de conveniência e falta de interes-
se em estabelecer resultados populacionais, em alguns casos, são
utilizadas amostragens não aleatórias, ou não probabilísticas, ou
por cotas, que, na prática, não permitem uma análise estatística
inferencial. Sendo assim, não detalharemos esse tipo de amostra-
gem. Nosso foco ficará apenas em torno das amostras aleatórias,
que são mais adequadas às análises estatísticas.

Claretiano - Centro Universitário


38 © Probabilidade e Estatística

Como a amostra aleatória (ou probabilística) deve garantir


que todos os elementos da população de origem tenham uma
probabilidade diferente de zero de serem selecionados, a fim de
tornar a amostra o mais representativa possível da população,
podemos questionar como isso pode ser feito?
Existem diversas formas de se obter uma amostra aleatória,
de acordo com os objetivos da coleta de dados e das características
da população. Um tipo básico de amostra aleatória muito utilizada
é a técnica de Amostragem Aleatória Simples, que possui como
característica básica uma metodologia baseada em sorteio ou na
utilização de tabelas de números aleatórios.
A Tabela 1 de números aleatórios permite uma simulação
bastante prática de um sorteio. Utilizando essa tabela, vamos
simular o sorteio de uma amostra de 10 elementos de uma
população, que, por exemplo, possua 500 elementos. Para iniciar o
sorteio, devemos sortear separadamente uma linha e uma coluna
da tabela.
© U1 – A Natureza dos Dados Estatísticos 39

Tabela 1 Tabela de números aleatórios.


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
L1 7 0 3 0 2 0 1 1 5 0 0 0 3 4 5 7 2 3 4 1
L2 1 6 5 8 1 5 2 0 2 8 5 0 9 6 6 1 7 5 4 4
L3 9 4 5 4 0 9 2 5 2 9 5 8 4 0 5 3 2 9 3 8
L4 8 7 9 0 4 4 9 8 8 3 9 3 2 6 8 6 1 2 8 0
L5 4 9 3 9 3 5 7 5 8 1 3 1 9 9 1 3 0 6 2 0
L6 4 6 1 4 9 6 5 7 7 9 0 7 9 8 4 0 8 7 3 2
L7 3 7 1 3 6 4 7 5 8 1 5 3 3 8 3 7 8 5 4 8
L8 0 2 0 5 5 5 3 5 9 7 9 5 0 2 2 3 0 1 1 9
L9 4 7 6 7 9 5 1 1 0 9 0 0 0 8 8 5 5 3 3 3
L10 3 0 0 2 7 1 9 2 7 5 3 8 2 7 1 2 2 8 4 2
L11 0 5 4 4 0 6 4 3 3 9 8 9 9 1 1 1 4 7 4 1
L12 6 0 9 5 7 8 7 5 5 8 0 6 1 1 4 7 1 0 5 4
L13 3 4 6 6 5 3 3 9 5 2 5 8 6 7 3 4 3 1 9 2
L14 9 9 6 8 2 5 8 9 8 4 4 4 4 7 5 9 6 7 3 8
L15 8 5 7 2 8 6 2 4 1 8 0 5 7 9 8 4 3 6 6 4
L16 1 4 4 3 4 0 3 3 9 3 7 3 3 4 6 6 8 0 8 6
L17 6 7 5 1 6 8 6 7 7 3 3 7 0 4 9 2 4 9 3 0
L18 5 2 7 6 5 2 8 4 8 5 2 6 7 3 1 4 0 2 1 7
L19 5 9 6 8 4 9 7 5 3 1 5 6 7 5 1 4 6 0 1 0
L20 9 7 8 5 7 4 5 5 7 8 6 9 6 4 0 7 5 7 5 9
L21 3 8 5 0 8 4 3 2 5 4 6 5 4 9 0 7 5 5 4 4
L22 3 5 4 3 8 4 7 6 5 4 2 1 9 5 0 2 1 9 4 1
L23 2 7 1 0 7 9 2 6 9 9 4 6 8 3 2 3 7 2 0 6
L24 6 1 5 1 5 8 9 7 9 3 6 8 1 6 8 8 9 4 1 8
L25 3 3 8 6 8 0 4 2 2 5 9 8 3 7 5 9 2 3 9 9
L26 5 1 5 3 6 5 8 2 3 4 9 7 2 5 3 9 9 5 2 2
L27 6 7 6 4 1 3 9 7 0 6 5 7 5 4 7 9 7 4 1 7
L28 2 2 5 8 9 4 7 9 1 5 5 7 2 6 6 6 2 0 6 5
L29 9 4 8 2 9 6 9 8 5 9 5 9 9 6 8 3 6 9 4 9
L30 6 0 2 3 1 7 4 9 5 1 8 7 0 3 0 6 8 1 4 6
L31 6 2 1 6 9 4 0 5 8 7 2 7 9 9 5 3 2 3 6 1
L32 6 7 2 9 7 4 6 7 1 2 0 1 1 7 1 6 9 1 5 0
L33 0 4 6 0 4 8 2 8 1 9 9 7 4 9 0 0 2 6 7 3
L34 4 2 5 2 6 8 0 6 7 3 7 4 5 7 1 2 6 4 4 0
L35 3 1 1 6 2 1 2 2 0 4 3 3 4 9 7 0 3 9 5 3
L36 9 5 2 1 7 5 5 8 6 7 5 1 7 9 8 2 8 0 8 7
L37 2 3 0 6 1 5 5 5 4 3 0 9 3 1 4 9 2 5 9 8
L38 8 9 2 7 6 6 8 3 1 9 7 9 4 9 3 8 4 3 8 6
L39 6 7 1 6 5 0 2 1 1 2 0 9 1 2 0 2 6 7 0 5
L40 2 2 1 2 2 2 3 4 7 1 1 9 0 0 5 6 0 2 1 1
L41 7 6 2 8 1 3 4 1 9 6 4 4 1 0 1 4 1 2 0 1
L42 9 6 1 5 8 6 6 2 9 6 4 6 7 4 7 8 5 9 3 5
L43 6 4 4 6 8 7 5 3 6 0 6 1 6 5 8 6 3 6 8 7
L44 3 5 6 6 9 7 0 0 6 3 3 6 9 7 9 6 7 8 8 0
L45 4 6 3 0 8 0 0 7 2 6 1 5 8 8 4 1 5 4 3 1

Claretiano - Centro Universitário


40 © Probabilidade e Estatística

Por exemplo, suponhamos que foram selecionadas a linha


10 e a coluna 8. Veja que, na intersecção delas, encontramos o
número 2. Partindo desse número e caminhando para a direita,
consideraremos, para esse exemplo, três algarismos, já que a po-
pulação possui 500 elementos. O primeiro número a se formar é
o 275; assim, o primeiro elemento sorteado é o 275º. Proceden-
do dessa forma, seguindo a direita e continuando nas linhas logo
abaixo, montaremos números com três algarismos, considerando
apenas os que forem menores do que 500 e sem repetição. Assim,
prosseguindo com a seleção, acharemos os 10 a serem conside-
rados na amostra, que são os seguintes: 275º, 382º, 284º, 205º,
440º, 398º, 114º, 466º, 319º e 399º.
O procedimento de Amostragem Aleatória Simples é a base
para a definição de diversos tipos de amostragens probabilísticas.
Uma das mais utilizadas também é a chamada Amostragem Alea-
tória Estratificada, que deve ser usada sempre que a informação
de interesse na população tenha relação com características da po-
pulação. Por exemplo, ao realizar uma pesquisa de mercado com
consumidores de uma população para verificar a aceitação de um
novo modelo de aparelho celular, devemos considerar que a acei-
tação pode ser influenciada pelo gênero do consumidor, pela sua
renda, pela sua condição profissional, entre outras características.
Assim, ao selecionar aleatoriamente os consumidores, deve-
mos manter uma proporcionalidade dentro de cada característica
(estrato) para garantir a representatividade. Trabalhando dentro
dos estratos, facilita-se o processo de seleção ou sorteio.
Note que a diferença entre uma amostra estratificada (pro-
babilística) e uma amostra por cotas (não probabilística) está na
forma de seleção dos sujeitos.
Outra maneira de selecionar aleatoriamente os sujeitos da
população é adotar a Amostragem Aleatória Sistemática, útil
quando os elementos da população são definidos com base em lis-
tas, como, por exemplo, uma lista telefônica, um cadastro de clien-
tes ou fornecedores, uma lista de endereços de e-mail etc. Com
© U1 – A Natureza dos Dados Estatísticos 41

base em uma lista, podemos, em vez de proceder a um sorteio


completo, subdividir a lista em listas menores e sortear apenas um
sujeito de cada lista, sistematizando para as demais.
Por exemplo, suponhamos que a lista da população conte-
nha 10.000 sujeitos e que nós necessitemos sortear 500 sujeitos.
Dividindo 10.000 por 500, chegamos a 20; então, podemos imagi-
nar 500 listas com 20 sujeitos cada. Assim, sorteamos um número
de 1 a 20, como, por exemplo, o número 12, e, dessa forma, esco-
lhemos o 12º elemento de cada uma das 500 listas. Certamente, é
bem mais simples do que sortear, diretamente, dos 10.000.
Independentemente do método utilizado, os três casos cita-
dos procedem da escolha aleatória (sortida) dos elementos, o que
pode ser, em alguns casos, algo trabalhoso. Para minimizar esse
trabalho, podemos utilizar a Amostragem por Conglomerados,
útil quando temos uma população que pode ser subdividida geo-
graficamente ou segundo algum critério de localidade. Assim, em
vez de sortearmos sujeitos, utilizamos o sorteio das localidades.
Esse tipo de amostragem é muito comum nas pesquisas popula-
cionais, nas quais podemos identificar bairros com diversidades de
pessoas (variabilidade dentro do bairro), mas não muito diferentes
de outros bairros da mesma cidade. Assim, podemos simplesmen-
te sortear um bairro e pesquisar toda a sua população.
Independentemente do método a ser utilizado na con-
strução da amostra aleatória, uma coisa é certa: a presença do
erro amostral. Assim, devemos considerar que a amostra possui
uma chance de não gerar dados corretos sobre a população e,
por esse motivo, devemos associar medidas probabilísticas nas
amostras para dimensionar as chances de sucesso e fracasso da
amostragem.

Para concluir o estudo deste tópico, responda à segunda questão


autoavaliativa proposta ao final desta unidade.

Claretiano - Centro Universitário


42 © Probabilidade e Estatística

9. A COLETA DE DADOS
Como todas as análises serão feitas com base nos dados co-
letados, é importante que a metodologia utilizada na coleta seja
cientificamente correta e que os instrumentos ou questionários
utilizados sejam eficientes.
Assim, é fundamental que se conheça com detalhes os obje-
tivos da pesquisa ou o objetivo que se deseja atingir com os dados,
quais as hipóteses de interesse e o que se deseja testar e investigar.
Com base nos objetivos definidos, podemos pensar, de for-
ma geral, nos seguintes procedimentos metodológicos:
• Identificar a população de interesse e estruturar como
será o procedimento amostral.
• Construir os instrumentos para a coleta dos dados (ques-
tionários, formulários, roteiros etc.).
Para a elaboração dos instrumentos de coleta dos dados, de-
vemos considerar os aspectos a seguir:
1) Questionário de dados: essa fase é a "espinha dorsal"
de qualquer levantamento. Trata-se de reunir as infor-
mações necessárias para avaliar os objetivos definidos,
utilizando uma linguagem adequada e de fácil compre-
ensão, sem induzir a uma resposta. Podem-se mesclar
questões abertas (dissertativas) e questões fechadas
(múltipla escolha).
2) Pré-pesquisa de dados: nessa fase, realiza-se uma pré-
-pesquisa, tendo como propósito avaliar a eficácia dos
instrumentos de coleta ou mesmo do processo amostral.
Feita a pré-pesquisa, os resultados nela obtidos devem
ser utilizados para efetuar as correções necessárias tan-
to nos instrumentos quanto no perfil da amostragem.
3) Coleta de dados: essa é a fase da obtenção de dados e
deverá ser feita com muito cuidado, pois dela depende-
rá a veracidade dos resultados obtidos. Basicamente, é a
aplicação dos instrumentos, já revisados, nos elementos
selecionados na amostragem, que deve ser probabilísti-
© U1 – A Natureza dos Dados Estatísticos 43

ca. Assim, o procedimento a ser aplicado para se efetivar


a coleta dos dados deve respeitar as características pro-
babilísticas da amostra.
4) Crítica de dados: essa fase tem por objetivo verificar
possíveis ocorrências de dados equivocados tanto na co-
leta direta dos dados quanto na fase de digitação ou de
registro dos dados.
5) Tabulação dos dados: é a fase de organização dos dados
obtidos na amostragem. A tabulação, que pode ser feita
com tabelas ou gráficos, permite uma visão inicial dos
resultados e também serve para uma divulgação inicial
dos dados.
6) Análise dos dados: é a fase em que de fato utilizamos
os recursos da análise estatística, por meio das medidas
descritivas e inferenciais, que permitirão a determinação
das estimativas e dos testes das hipóteses de interesse.
O sucesso no processo metodológico representa o sucesso
na coleta dos dados, ou seja, significa que teremos dados repre-
sentativos para analisar e, assim, obtermos respostas significativas
para avaliar os interesses estipulados no objetivo inicial.

10. TRABALHANDO EM SALA DE AULA


É importante que os conceitos trabalhados nesta unidade
sejam bem compreendidos para garantia de uma discussão mais
completa em sala de aula, mesmo no Ensino Fundamental. É in-
teressante que você, futuro professor de Matemática, discuta tais
conceitos, de forma a permitir aos seus alunos que construam as
concepções e relacionamentos entre eles.
Em vez de definir diretamente o que é população, amostra,
amostragem e os métodos envolvidos, é interessante que você
elabore uma prática para ser aplicada em sala de aula que permita
aos alunos a dedução direta ou indireta dos conceitos estudados.

Claretiano - Centro Universitário


44 © Probabilidade e Estatística

Por exemplo, com o objetivo de fazer os alunos pensarem so-


bre um problema, a fim de definir, inicialmente, o conceito de po-
pulação de dados e, na sequência, a amostra envolvida, utilizando
apenas o processo de construção do exemplo, podemos imaginar
o diálogo do professor com a sua turma da maneira demonstrada
a seguir. Acompanhe.

Apresentação do problema para a sala de aula–––––––––––––


Professor:
— Bom dia, turma! Tudo bem? Quero propor uma atividade para vocês. Como
estamos nos preparando para sediar uma copa do mundo de futebol [ou outra
situação], seria interessante descobrirmos se os alunos estão confiantes ou não
em um bom desempenho da seleção e se eles acompanharão os jogos. O que
vocês acham? Vamos pensar numa forma de descobrir isso?
Ao iniciar a atividade, o professor deverá direcionar a discussão para a seguinte
questão:
— Como podemos ou o que temos de fazer para descobrir se os alunos estão
confiantes e se acompanharão os jogos?
Com um pouco de paciência e insistência, é natural que alguém diga o seguinte:
— Professor, vamos ter de perguntar para os alunos o que queremos saber!
Nesse momento, o professor interfere e inicia o caminho para a definição da
população.
— Sim, é verdade, devemos perguntar para os alunos. Mas para quais alunos
devemos perguntar? Será que todos os alunos podem participar e responder às
nossas perguntas?
O professor deve agora deixar um tempo para os alunos refletirem e, logo em
seguida, direcionar a questão.
Professor:
— O que vocês acham? Todos os alunos podem participar, não é mesmo?
Continuando, o professor deve, nessa hora, utilizar-se do bom senso dos alunos
e argumentar da seguinte forma:
— Mas turma, se pegarmos todos os alunos, um a um, não vamos demorar muito
para terminar a atividade? Será que dará tempo de terminá-la até o final da aula?
Assim, o professor conduz os alunos a pensarem na inviabilidade prática de
coletar todos os alunos (a população), e esse é o momento certo para intervir e
perguntar, caso algum aluno já não tenha se adiantado e definido o que fazer:
Professor:
— Se não dá para pegar todos os alunos, como vamos resolver o problema?
Naturalmente, alguém responderá que deverá pegar uma parte dos alunos, por
um critério que não necessariamente será muito científico, pois os alunos ainda
não conhecem os conceitos da amostragem, mas, intuitivamente, vale a partici-
pação, pois o aparecimento da amostra é o mais importante.
Nessa hora, o professor pode ir até o quadro e escrever as duas ações previstas:
• pesquisar os alunos da escola (população);
• escolher uma parte dos alunos da escola (amostra).
© U1 – A Natureza dos Dados Estatísticos 45

A partir de então, ele poderá colocar os conceitos e propriedades que julgar


pertinentes.
––––––––––––––––––––––––––––––––––––––––––––––––––––
A partir desse exemplo, podemos conceituar situações após
um entendimento real destas e, o mais importante, situações que
podem ser implementadas realmente, que fazem parte do cotidia-
no do aluno e que podem instigá-lo a compreender os conceitos.

11. QUESTÕES AUTOAVALIATIVAS


Sugerimos que você procure responder, discutir e comentar
as questões a seguir que tratam da temática desenvolvida nesta
unidade.
A autoavaliação pode ser uma ferramenta importante para
você testar o seu desempenho. Se você encontrar dificuldades em
responder a essas questões, procure revisar os conteúdos estuda-
dos para sanar as suas dúvidas. Esse é o momento ideal para que
você faça uma revisão desta unidade. Lembre-se de que, na Edu-
cação a Distância, a construção do conhecimento ocorre de forma
cooperativa e colaborativa; compartilhe, portanto, as suas desco-
bertas com os seus colegas.
Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) Pense em um exemplo que ilustre suas considerações a respeito dos motivos
que tornam inviável a coleta de toda a população estatística, bem como as
vantagens e desvantagens em utilizar uma amostra ao invés da população.

2) Na realização de uma pesquisa de mercado para avaliar a potencialidade


de venda de uma determinada marca de bebida energética, a qual será
realizada por amostragem, qual o procedimento amostral mais indicado?
Reflita.

12. CONSIDERAÇÕES
Estudamos, nesta primeira unidade, alguns conceitos im-
portantes para o bom entendimento da Estatística. Vimos que,
em geral, trabalhamos com uma amostra dos dados e que, para

Claretiano - Centro Universitário


46 © Probabilidade e Estatística

gerar uma amostragem com dados representativos, devemos uti-


lizar uma metodologia adequada aos objetivos que pretendemos
alcançar.
Com base nos dados coletados, ou seja, na amostra obtida,
passamos para as fases de tabulação e análise dos dados, as quais
serão discutidas nas unidades seguintes.
Bons estudos.

13. E-REFERÊNCIAS
IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Home page. Disponível em:
<http://www.ibge.gov.br/home/>. Acesso em: 7 fev. 2012.
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.

14. REFERÊNCIAS BIBLIOGRÁFICAS


BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
FREUND, J. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto
Alegre: Bookman, 2007.
LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004.
MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson,
2009.
MOREIRA, J. S. Elementos de estatística. São Paulo: Atlas, 1981.
NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson
Prentice Hall, 2003.
SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo:
Atlas, 2002.
SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e
estatística. 2. ed. Porto Alegre: Bookman, 2004.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São
Paulo: Pearson, 2008.
EAD
Tabulação de Dados

2
1. OBJETIVOS
• Representar os dados coletados em tabelas e gráficos.
• Conhecer e compreender a construção das tabelas e grá-
ficos.
• Analisar e interpretar os resultados.

2. CONTEÚDOS
• Tabelas de frequências simples.
• Tabelas de frequências em intervalos.
• Gráficos de frequências.
• Gráficos de séries.
48 © Probabilidade e Estatística

3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE


Antes de iniciar o estudo desta unidade, é importante que
você leia as orientações a seguir:
1) As dicas que serão apresentadas nesta unidade não pre-
tenderão esgotar as possibilidades de uso da ferramenta
de construção de gráficos do Excel, mas apenas apresen-
tar, de forma mais simples, como iniciar sua utilização.
2) Para reforçar e aprofundar seus estudos em relação às
tabelas e gráficos, faça pesquisas em sites confiáveis e,
especialmente, na Biblioteca Virtual Pearson.

4. INTRODUÇÃO À UNIDADE
Nesta segunda unidade, vamos compreender como pode-
mos descrever e analisar os dados estatísticos resultantes de variá-
veis qualitativas (não numéricas) e quantitativas (números inteiros
ou fracionários) por meio da construção de tabelas e gráficos de
frequências.
Para conceituarmos os dados brutos (ou tabela primitiva), o
ROL, bem como as tabelas e os gráficos de frequências, nos servi-
remos de exemplos de coletas de dados já realizadas, relacionadas
a um determinado contexto. Para a construção dos gráficos de fre-
quências, adotaremos a planilha eletrônica do Excel.

5. OS DADOS BRUTOS
De acordo com Toledo (2008), os dados brutos, ou tabela
primitiva, podem ser definidos como a relação inicial, o resultado
da coleta dos dados de interesse de uma determinada pesquisa,
sejam eles numéricos, sejam não numéricos. Lembre-se de que,
quando realizamos uma coleta de dados, as questões ou variáveis
devem se relacionar com os objetivos da pesquisa. Assim, às ve-
zes, teremos variáveis qualitativas (não numéricas) e/ou variáveis
quantitativas (numéricas).
© U2 – Tabulação de Dados 49

Os dados brutos correspondem aos dados iniciais da pesqui-


sa, não possuindo nenhum tipo de organização ou tratamento –
daí o nome. E a função da tabulação é organizar esses dados.
Uma primeira forma de organizar os dados é a construção
de um ROL, que nada mais é do que a ordenação dos dados brutos
em ordem crescente (para os quantitativos) ou alfabética (para os
qualitativos).
Para exemplificar, vamos considerar uma pesquisa que foi
realizada com 20 consumidores de café, na qual o interesse era
avaliar a preferência e o consumo quanto à três diferentes marcas.
Perguntou-se a marca de preferência, o número de copinhos de
café tomados diariamente e o preço que se julgava justo pelo quilo
do pó de café da marca de preferência. Os dados obtidos na pes-
quisa estão dispostos na Tabela 1.
Tabela 1 Dados brutos da pesquisa sobre preferência e consumo
de café.
PREÇO
PESSOA MARCA Nº DE COPOS
(R$)
1 A 6 3,50
2 A 8 3,00
3 B 6 3,25
4 C 5 4,00
5 B 5 3,75
6 C 8 3,00
7 A 8 3,15
8 A 7 3,25
9 A 6 2,90
10 D 5 4,15
11 B 5 4,21
12 D 5 3,25
13 A 9 3,20
14 A 5 3,75

Claretiano - Centro Universitário


50 © Probabilidade e Estatística

PREÇO
PESSOA MARCA Nº DE COPOS
(R$)
15 C 6 4,10
16 B 6 2,85
17 D 7 2,90
18 A 7 3,15
19 A 8 3,80
20 C 9 4,15

Note que as informações de cada uma das três opções de in-


teresse estão sem nenhum tipo de organização; elas estão apenas
listadas na tabela. Isso é o que chamamos de "dados brutos". Para
construir o ROL de cada questão, basta ordenar os dados como na
Tabela 2, na qual são apresentados os conjuntos ordenados.
Tabela 2 ROL para as variáveis da pesquisa sobre preferência e
consumo de café.
MARCA NO COPOS PREÇO
A 5 2,85
A 5 2,90
A 5 2,90
A 5 3,00
A 5 3,00
A 5 3,15
A 6 3,15
A 6 3,20
A 6 3,25
B 6 3,25
B 6 3,25
B 7 3,50
B 7 3,75
C 7 3,75
C 8 3,80
C 8 4,00
© U2 – Tabulação de Dados 51

MARCA NO COPOS PREÇO


C 8 4,10
D 8 4,15
D 2 4,15
D 2 4,21

Você pode notar que, na Tabela 2, apesar de a situação


melhorar um pouco com a aplicação do ROL, os dados ainda
não possuem uma organização adequada, pois, dependendo
do tamanho da amostra, a leitura deles pode ficar muito difícil.
Imagine, por exemplo, essa mesma situação, porém com 2.000
consumidores em vez de 20!
Assim, o melhor é transformar o ROL em um instrumento de
tabulação que utilize a ordenação presente, mas consiga resumir
os dados, de forma a facilitar a interpretação. Esse instrumento é
chamado de "tabela de frequências".

6. TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS


Uma tabela de frequências nada mais é do que um arranjo,
em linhas e colunas, das informações contidas na amostra em
relação à variável estudada. Para a construção de uma tabela
de frequências, iniciamos pela identificação das categorias da
variável, que nada mais são do que as diferentes informações que
aparecem nos dados brutos ou no ROL. Em outras palavras, com
as categorias identificadas, calculamos duas frequências básicas:
• Frequência Absoluta (fa): número de elementos da amos-
tra que apresentaram a categoria como resultado, ou, de
forma mais simples, contagem do número de vezes que a
categoria se repete na amostra.
• Frequência Relativa (fr%): porcentagem de elementos da
amostra que apresentaram a categoria como resultado da
variável, ou, de forma mais simples, percentual de vezes
que a categoria aparece na amostra.

Claretiano - Centro Universitário


52 © Probabilidade e Estatística

Para a montagem das tabelas, devemos esclarecer dois itens


de muita importância:
1) Dependendo do tipo da variável e do número de catego-
rias, podemos ter dois tipos diferentes de tabela:
a) Tabela de frequências simplificada: utilizada quan-
do temos dados qualitativos ou quantitativos ex-
pressos por números inteiros com pouca variação
(número reduzido de categorias).
b) Tabela de frequências em intervalos: quando temos
dados quantitativos inteiros com muita variação
(número elevado de categorias) ou dados fracioná-
rios (com casas decimais).
2) A construção de uma tabela deve respeitar algumas nor-
mas estabelecidas em conjunto pelo IBGE e pelo Conse-
lho Federal de Estatística. Por exemplo, as laterais das
tabelas devem ser abertas, e não devemos separar as
categorias por linhas horizontais.
Como vimos, as tabelas podem ser classificadas em simples
ou por intervalos, dependendo do tipo de informação a ser tabula-
da. Vamos agora verificar como construí-las.

Tabela de frequências simplificada


Para a construção desse tipo de tabela, basta, na primeira
coluna, listarmos os diferentes resultados da variável, ou seja,
as categorias, e, em seguida, contar o número de ocorrências
(fa), convertendo-as em porcentagem (fr%). Utilizando o mesmo
exemplo do café, podemos construir uma tabela desse tipo para
a variável qualitativa (marca preferida) e uma para a variável
quantitativa (número de copos de café).
Vamos iniciar pela tabela para a variável qualitativa marca pre-
ferida. As categorias que podemos identificar são: Marca A, Marca
B, Marca C e Marca D. Colocando na primeira coluna, temos:
© U2 – Tabulação de Dados 53

Marca Preferida
Marca A
Marca B
Marca C
Marca D

Continuando, temos, agora, de obter, para cada categoria,


ou seja, para cada marca de café, a Frequência Absoluta (fa), con-
tando quantas pessoas disseram o nome de cada uma das marcas,
e adicionamos uma linha no final para totalizar a Frequência Ab-
soluta. Esse total, que é o tamanho da amostra utilizada, será re-
presentado por (n). Fazendo a contagem, chegamos aos seguintes
resultados:

Marca Preferida fa
Marca A 9
Marca B 4
Marca C 4
Marca D 3
Total 20

Faremos, agora, a conversão da Frequência Absoluta em Fre-


quência Relativa (fr%), dividindo o valor de fa pelo total (n) e mul-
tiplicando por 100, ou seja:
fa
fr %
= ⋅100
n

Fazendo os cálculos, chegamos ao resultado demonstrado


na Tabela 3.

Claretiano - Centro Universitário


54 © Probabilidade e Estatística

Tabela 3 Distribuição dos consumidores em relação à marca


preferida de café.
Marca Preferida fa fr%
Marca A 9 45,0
Marca B 4 20,0
Marca C 4 20,0
Marca D 3 15,0
Total 20 100,0

Note que a Tabela 3 está com as laterais abertas e sem


linhas horizontais separando as marcas de café (categorias), como
determina a norma.
Repetindo esse mesmo processo para a variável número de
copos de café (Tabela 4), temos:

Tabela 4 Distribuição dos consumidores em relação ao número de


copos consumidos diariamente.

Número de Copos fa fr%

5 6 30,0

6 5 25,0

7 3 15,0

8 4 20,0

9 2 10,0

Total 20 100,0

Esse tipo de tabela, que considera individualmente cada


categoria, só é eficiente quando temos dados qualitativos ou
quantitativos com pouca variação.
© U2 – Tabulação de Dados 55

Tabela de frequências por intervalos


Quando os dados são compostos por números com muita
variação, como vimos no exemplo do preço do café, torna-se com-
plicado colocar cada um deles como uma categoria na tabela, pois
esta fica muito extensa. A alternativa, nesse caso, é adotar catego-
rias intervalares ou em classes.
Para a montagem dos intervalos, procedemos da seguinte
forma:
• Calculamos a Amplitude Total (At) dos dados, que é de-
finida pela diferença entre o maior valor do conjunto e o
menor valor do conjunto: At = Maior – Menor.
• Calculamos o número de intervalos a serem construídos,
utilizando, por exemplo, a Fórmula de Sturges, dada por:
K =+ 1 3,3 ⋅ Log10 n , onde K é o número de intervalos (ou
classes), o qual deve ser arredondado para baixo, e n é o
número total de dados.
• Calculamos o tamanho de cada intervalo (Ti) dividindo a
Amplitude Total por K, arredondando o valor com o mes-
mo número de casas decimais dos dados e com arredon-
damento sempre para mais.
No exemplo anterior, para a variável preço do café, temos:
• At = Maior − Menor = 4, 21 − 2,85 = 1,36
• K =+1 3,3 ⋅ Log10 n ⇒ K =+ 1 3,3 ⋅ Log10 20
• K =1 + 3,3 ⋅1,3 ⇒ K =1 + 4, 29 ⇒ K =5, 29
1,36
=Ti = 0, 272 . Como os dados possuem duas casas
5
decimais, arredondamos Ti para 0,28. Assim, devemos
montar cinco intervalos de tamanho 0,28.
Os intervalos a serem construídos serão de tal forma que o
limite inferior pertencerá ao intervalo (fechado) e o limite superior
não pertencerá ao intervalo (aberto), sendo que utilizamos o
símbolo |— para representar tal situação.

Claretiano - Centro Universitário


56 © Probabilidade e Estatística

Para a construção do primeiro intervalo, iniciamos sempre


pelo menor valor dos dados – nesse caso, o menor preço – e
somamos Ti para obtermos o limite superior, como, por exemplo,
2,85 + 0, 28 − 3,13 . O próximo intervalo será iniciado pelo limite
superior do intervalo anterior, e somamos, novamente, Ti.
Prosseguindo assim até o último intervalo, teremos os seguintes
intervalos:

Preço Justo
2,85 |— 3,13
3,13 |— 3,41
3,41 |— 3,69
3,69 |— 3,97
3,97 |— 4,25
Total

Na notação dos intervalos, o intervalo 2,85 |— 3,13 conterá


todos os preços que são maiores ou iguais a 2,85 e menores que
3,13.
Na Tabela 5, procedendo a contagem para cada intervalo a
fim de obter (fa) e convertendo para (fr%), temos:

Tabela 5 Distribuição dos consumidores em relação ao preço


considerado justo a pagar.

Preço Justo fa fr%


2,85 |— 3,13 5 25,0
3,13 |— 3,41 6 30,0
3,41 |— 3,69 1 5,0
3,69 |— 3,97 3 15,0
3,97 |— 4,25 5 25,0
Total 20 100,0
© U2 – Tabulação de Dados 57

Neste momento, é interessante que você resolva os exercícios


da questão autoavaliativa ao final desta unidade, pois, com os
dois tipos de tabela de frequências que acabamos de conhecer,
você poderá tabular qualquer tipo de variável, bastando optar pelo
modelo mais adequado ao tipo de variável que deseja tabular.

7. GRÁFICOS DE FREQUÊNCIAS
Utilizar tabelas de frequências para a representação dos re-
sultados de pesquisas e estudos de uma determinada variável é
bastante comum. Contudo, muitas vezes, as tabelas não conse-
guem, sozinhas, apresentar os resultados de forma clara, rápida e
simplificada, já que exigem algum conhecimento de leitura de ta-
belas. Por esse fato, é comum a utilização de uma ferramenta que
simplifica a informação das tabelas, mostrando-as em forma de
figuras e/ou diagramas. Essas ferramentas são conhecidas como
gráficos de frequências, os quais iremos conhecer e estudar neste
tópico.

Gráficos de colunas
O gráfico de colunas é utilizado apenas para as tabelas sim-
plificadas, sendo que, no eixo horizontal, são representadas as ca-
tegorias, e, no eixo vertical, as porcentagens. Observe, na Figura 1,
um exemplo desse tipo.
Marca
Marcapreferida
preferidade
decafé
café

45

40

35

30
opiniões
deopiniões

25

20
%de

15
%

10

0
Marca A Marca B Marca C Marca D
Marcas
Marcas

Figura 1 Exemplo de gráfico de colunas.

Claretiano - Centro Universitário


58 © Probabilidade e Estatística

A representação gráfica do gráfico de colunas é feita por


meio de retângulos com base nas categorias, cuja altura é igual à
porcentagem.

Gráficos de barras
O gráfico de barras (Figura 2) é utilizado apenas para as tabelas
simplificadas, sendo que, no eixo horizontal, são representadas as
porcentagens, e, no eixo vertical, as categorias.
Marca
Marcapreferida de de
preferida café
café

Marca D

Marca C
Marcas
Marcas

Marca B

Marca A

0 5 10 15 20 25 30 35 40 45
%%de
deopiniões
opiniões

Figura 2 Exemplo de gráfico de barras.

A representação gráfica do gráfico de barras é feita por meio


de retângulos com base nas categorias, cujo comprimento é igual
à porcentagem.

Gráficos de setores
O gráfico de setores é popularmente conhecido como
"gráfico de pizza" e é utilizado para qualquer tipo de tabela. Aqui, os
percentuais são convertidos em medidas de graus e representados
em uma circunferência (Figura 3).
© U2 – Tabulação de Dados 59

Marca
Marcapreferida
preferidade
decafé
café

15%
15%

45%
45%

20%
20%

20%
20%

Marca A Marca B Marca C Marca D


Marca A Marca B Marca C Marca D

Figura 3 Exemplo de gráfico de setores, ou de pizza.

É importante lembrar que os gráficos de colunas (Figura 1) e


de barras (Figura 2), quando utilizados para representar uma única
tabela, devem ter todos os seus retângulos de mesma cor, ou seja,
não podemos colorir cada um com uma cor diferente. Além disso,
os retângulos devem ficar separados por um pequeno espaço, isto
é, não podem ficar colados uns nos outros.
Além desses gráficos, existem outros tipos, como o histogra-
ma, o polígono de frequência etc. Esses outros tipos possuem uma
aplicação reduzida, e você poderá saber mais detalhes sobre eles
pesquisando nas referências bibliográficas inseridas no final desta
unidade.

8. GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2003


Antes de confeccionar um gráfico, é necessário que a tabela
de frequências que se deseja representar graficamente esteja digi-
tada de maneira adequada no Excel.
A entrada dos dados na planilha consiste em digitar a tabela
do mesmo modo em que ela foi construída, ou seja, continuando
com o exemplo das marcas de café, com o número correto de colu-
nas – neste caso, três –, contendo as categorias, frequências ab-
solutas (fa) e frequências percentuais (fr%). O único cuidado que
devemos tomar é quanto à largura das colunas no Excel. Ao digitar

Claretiano - Centro Universitário


60 © Probabilidade e Estatística

os títulos ou categorias, pode ser que o conteúdo da célula seja


maior que a própria célula; assim, devemos alargar a célula, de
forma que todas as palavras estejam completamente dentro delas,
como podemos observar na Figura 4.

Figura 4 Planilha com células alargadas.

Seleção dos dados para elaboração do gráfico


Com os dados digitados adequadamente, passamos para a
seleção dos dados que o Excel deverá utilizar para a confecção dos
gráficos. Os gráficos de colunas, de barras e de setores utilizam
apenas duas das colunas da tabela: a primeira coluna, na qual
estão as categorias, e a terceira, na qual estão os percentuais.
Selecione, com o auxílio do mouse, apenas as categorias
(deixando de selecionar o título e a palavra total) na primeira
coluna, solte o mouse e pressione, mantendo pressionada, a tecla
CTRL do teclado. Com o mouse, novamente, selecione os valores
percentuais (apenas os números, excluindo-se o 100,00) da terceira
coluna. Observe esse procedimento na Figura 5.

Figura 5 Colunas selecionadas.


© U2 – Tabulação de Dados 61

Assistente de Gráfico
Com os dados selecionados, você deverá acessar a opção As-
sistente de Gráfico para confeccionar um gráfico, o que pode ser
feito de duas maneiras:
• entrando em Inserir e selecionando Gráfico;
• selecionando o ícone referente ao Assistente de Gráfico
(Figura 6).

Figura 6 Assistente de Gráfico.

Ao entrar no Assistente de Gráfico, uma janela de opções


será aberta (Figura 7).

Figura 7 Janela de opções.

Claretiano - Centro Universitário


62 © Probabilidade e Estatística

Por meio da ferramenta Assistente de Gráfico, é muito fácil


a confecção de gráficos de colunas, barras e setores. Note que, no
topo da janela da Figura 7, está indicado Etapa 1 de 4, e isso quer
dizer que você está na primeira etapa (início) do processo de con-
strução. Vamos caminhar até a Etapa 4 (final)?
Etapa 1 do Assistente de Gráfico
A primeira etapa do Assistente de Gráfico tem, como única
finalidade, a seleção do gráfico desejado, cujos tipos estão dis-
postos do lado esquerdo da janela (Figura 7). Cada tipo de gráfico
selecionado possui alguns subtipos ou modelos que você poderá
escolher, os quais estão do lado direito da janela (Figura 7). Após a
escolha do tipo de gráfico, clique em Avançar.
Etapa 2 do Assistente de Gráfico
A primeira finalidade da segunda etapa é mostrar como o
gráfico ficará, considerando a seleção dos dados feita anterior-
mente e o tipo de gráfico selecionado. O gráfico apresentado na
Figura 8 serve para que você verifique se a seleção foi bem suce-
dida ou alguma coisa precisará ser corrigida.

Figura 8 Intervalo de dados.

Note que, na Figura 8, o gráfico está praticamente pronto.


Nessa tela, o Excel confirma os dados que estão sendo utilizados
© U2 – Tabulação de Dados 63

(Intervalo de dados) e mostra como ficará o modelo de gráfico


aplicado. Qualquer inversão ou eliminação dos dados pode ser re-
alizada selecionando a aba Série, na parte superior do assistente.
Confirmado o aspecto do gráfico, clique em Avançar para
passar à Etapa 3.
Etapa 3 do Assistente de Gráfico
A Etapa 3 refere-se ao layout complementar do gráfico. É
aqui que você poderá incluir textos, títulos, eixos horizontais e ver-
ticais, linhas de grade (linhas internas verticais e horizontais), leg-
endas, rótulos de dados e tabelas de dados. O formato de gráfico
é convencional e bem simples, mas pode ser sofisticado, conforme
o seu interesse. Sugerimos, então, que você tente inserir títulos no
seu gráfico, bem como trabalhar com legendas e com os rótulos
de dados. Experimente as opções, observando os desenhos que
aparecerão no lado direito às mudanças.
Para encerrar essa etapa e passar para a próxima, basta cli-
car em Avançar.
Etapa 4 do Assistente de Gráfico
Na Etapa 4, são dadas opções para a gravação do gráfico
elaborado, conforme demonstra a Figura 9.

Figura 9 Local do gráfico.

Para salvar o gráfico elaborado, você terá duas opções de


posicionamento, que são:

Claretiano - Centro Universitário


64 © Probabilidade e Estatística

• Como objeto: nessa opção, o Excel irá gravar seu gráfico


na planilha em que você digitou os dados, ficando como
um objeto em tamanho pequeno.
• Como nova planilha: nessa opção, o Excel gravará seu
gráfico em uma planilha separada, sendo essa a opção
mais recomendada, pois o gráfico ocupando todo o tama-
nho de seu monitor facilitará a etapa de edição.
Após escolher a forma de gravação, basta clicar, para finali-
zar, em Concluir.
Com o gráfico finalizado, você poderá editar todos os com-
ponentes de acordo com sua criatividade, respeitando os critérios
técnicos.
A seguir, disponibilizamos alguns componentes que podem
ser editados e alguns critérios técnicos que servirão de alerta para
efetuar as edições.
1) Nos gráficos de colunas e de barras, é importante:
a) colocar três títulos, sendo um geral, um para o eixo
horizontal e um para o eixo vertical;
b) dar aos retângulos o mesmo tipo de preenchimento
e/ou cor, separando-os uns dos outros.
2) No gráfico de setores, só podemos inserir um título, e
este deverá ser bem completo.
3) No gráfico de setores, o Excel não insere os valores per-
centuais ao lado de cada fatia. Assim, você deverá retor-
nar à Etapa 2 e inserir esses valores, indo até Rótulo de
Dados e clicando em Mostrar Valor.
4) Um efeito interessante que podemos dar no gráfico de
setores é a separação das fatias. Para isso, clique uma
única vez em qualquer ponto do gráfico (circunferência)
e, em seguida, escolha uma fatia mais à direita da cir-
cunferência, aponte com o mouse, clique e mantenha
o mouse clicado, arrastando-o para a sua direita. Você
verá que as fatias serão separadas. Para voltar as fatias
para os seus lugares, basta repetir o processo, arrastan-
do o mouse para a esquerda até grudar. Se você quiser
© U2 – Tabulação de Dados 65

desgrudar uma única fatia, proceda desta forma: escolha


uma fatia, clique uma única vez sobre ela e, em seguida,
clique novamente uma única vez em cima dela. Só aque-
la fatia ficará selecionada; então, clique com o mouse so-
bre ela, mantendo-o segurado e arrastando para o lado.
Além dessas dicas apresentadas, você poderá utilizar o Ex-
cel para melhorar, de forma significativa, o visual do seu gráfico.
Tente explorar todas as ferramentas do Assistente de Gráfico para
a edição.

9. GRÁFICOS DE FREQUÊNCIAS NO EXCEL 2007 OU


2010
Para usuários do Excel 2007, a única diferença é que, após
selecionar as colunas da tabela, basta ir ao menu Inserir e escolher
o tipo de gráfico.
Depois de selecionar as informações, ainda no menu Inserir,
você verá que imediatamente aparecerão os gráficos que o Excel
pode inserir na planilha com base na seleção feita, como podemos
observar na Figura 10.

Figura 10 Modelos de gráficos.

Gráfico de colunas
Vamos iniciar nosso pequeno "guia" pelo gráfico de colunas.
Ao selecionar a opção Colunas, aparecerá uma tela com os tipos
de gráficos de colunas que o Excel pode desenhar (Figura 11). Note
que a única diferença está na forma de expor as colunas (em 2D
ou em 3D, utilizando retângulos ou outra forma geométrica). Para
ilustrar, vamos utilizar a primeira opção, em 2D.

Claretiano - Centro Universitário


66 © Probabilidade e Estatística

Figura 11 Opções de gráficos de colunas.

Note que, automaticamente, o Excel confecciona o gráfico


(Figura 12) pedido e já o posiciona na planilha.

Figura 12 Gráfico pronto e posicionado.

Note, também, que, ao inserir o gráfico, se clicarmos uma


vez sobre ele, três novas opções de Menu ficarão disponíveis no
Excel: a opção Design, a opção Layout e a opção Formatar, que são
ferramentas utilizadas para editar o gráfico.
Para inserir os títulos nos eixos e no gráfico, vamos acessar o
menu Layout (Figura 13).
© U2 – Tabulação de Dados 67

Figura 13 Layout.

Para inserir o título no eixo das categorias (horizontal), se-


lecione a opção Títulos dos eixos; depois, a opção Título do eixo
horizontal principal; depois, Título abaixo do eixo. Basta agora
digitar o título desejado, como, por exemplo, "Setor Econômico".
Observe, na Figura 14, as alterações realizadas.
Para inserir o título no eixo das porcentagens (vertical), se-
lecione a opção Títulos dos eixos; depois, a opção Título do eixo
vertical principal; depois, Título girado. Agora, basta digitar o tí-
tulo desejado, como, por exemplo, "% de Empresas".
Para inserir o título geral do gráfico, selecione a opção Títu-
los do gráfico e, depois, a opção Acima do gráfico. Agora, basta
digitar o título desejado, como, por exemplo, "Distribuição das
Empresas segundo Setores Econômicos".
O resultado deverá ser semelhante ao gráfico modificado da
Figura 14.

Figura 14 Gráfico pronto (títulos inseridos).

Claretiano - Centro Universitário


68 © Probabilidade e Estatística

Note que, do lado direito do gráfico da Figura 14, existe uma


informação, denominada "Série 1". Essa é a chamada Legenda,
cuja utilização só é necessária quando, em um mesmo gráfico, ela
estiver representando mais de uma tabela. Como temos apenas
uma única tabela sendo representada, a legenda deve ser retirada.
Para isso, selecione o seu gráfico, acesse o menu Layout e, depois,
Legenda, e selecione a opção Nenhuma.
Pronto! Seu gráfico de colunas está finalizado. O que você
pode fazer agora é editar o seu gráfico, alterando a fonte e o
tamanho das letras, as cores de fundo e a cor das colunas etc. Para
proceder com a edição, você deverá selecionar seu gráfico com um
clique e acessar o menu Formatar. Nele, você encontrará muitas
formas diferentes de personalizar o seu gráfico; portanto, explore
essa ferramenta e seja criativo!
Os gráficos de colunas podem ser utilizados sempre que a
tabela possuir categorias qualitativas, como o gráfico da Figura
14, ou categorias quantitativas inteiras não representadas em
intervalos, como na Figura 15.

Estudo do número de funcionário


sindicalizados
40
35
ass 30
% de Empresas

e
r 25
p
m 20
E
e 15
d
% 10
5
0
12 14 15 17 21
Número de Funcionários

Figura 15 Gráfico com categorias quantitativas.


© U2 – Tabulação de Dados 69

Gráfico de barras
Para criar um gráfico de barras, utilizaremos tudo o que
foi discutido anteriormente no gráfico de colunas. Então, para
selecionar o gráfico de barras, acesse Inserir e, depois, Barras,
selecionando, em seguida, o modelo de sua preferência. Em nosso
caso, continuaremos optando pelo modelo 2D (Figura 16).

Figura 16 Modelo de gráfico de barras.

A única diferença é que o gráfico de barras é mais indicado


em casos de variáveis qualitativas com um grande número de cat-
egorias, como podemos ver na Figura 17.

Vestuários
Petrolífera
s Naval
o
ic Armamentos
Setores Econômicos

m
ô Tecnologia
n
o
cE Eletro-eletrônicos
s Bebidas
e
r
o
t Transportes
e
S Siderurgico
Alimentos
Automotivo

0.00 5.00 10.00 15.00 20.00 25.00


Percentual de Empresas

Figura 17 Gráfico com categorias quantitativas.

Claretiano - Centro Universitário


70 © Probabilidade e Estatística

Gráfico de setores
O gráfico de setores é chamado de Pizza no Excel. Para a sua
construção, retornamos ao passo de escolha do gráfico.
Depois de selecionar as informações da planilha, acesse o
menu Inserir. Observe, na Figura 18, os gráficos que o Excel pode
inserir na planilha com base na seleção feita. Selecione a opção
Pizza e escolha a primeira opção em 3D.

Figura 18 Opções de gráficos no modelo pizza.

Para inserir os títulos nos eixos e os percentuais no gráfico,


vamos acessar o menu Layout (Figura 13).
Você notará que a opção Títulos dos eixos estará desabilitada,
o que é natural, já que o gráfico é feito em uma circunferência
e, portanto, não possui eixos. Assim, podemos editar apenas um
título geral para o gráfico.
Para inserir o título geral do gráfico, selecione a opção Títulos
do gráfico e, depois, a opção Acima do gráfico. Em seguida, basta
digitar o título desejado, como, por exemplo, "Distribuição % de
empresas segundo setores econômicos".
Note que o gráfico não possui os valores das porcentagens
da tabela. Desse modo, para inserir os valores ao lado de cada fatia
© U2 – Tabulação de Dados 71

do gráfico, você deve selecionar a opção Rótulo de dados e, em


seguida, a opção Extremidade externa.
O resultado deverá ser similar ao da Figura 19.

Distribuição % de empresas por


setores econômicos
11.9
29.5

Automotivo
Alimentos
Siderurgico
Transportes
12.7 45.9

Figura 19 Gráfico de pizza com títulos e porcentagens.

Note que, do lado direito do gráfico da Figura 19, há uma


legenda. Nesse tipo de gráfico, a legenda é de fundamental
importância, pois diferencia as fatias em relação à categoria de
cada uma delas, devendo, portanto, sempre acompanhar esse
modelo de gráfico.
Um efeito bastante interessante e que podemos explorar
nos gráficos de setores é afastar uma determinada fatia de
maior interesse. Para isso, basta clicar uma única vez dentro da
circunferência; depois, clicar mais uma vez na fatia que se quer
retirar e arrastá-la com o mouse, obtendo resultado semelhante
ao da Figura 20.

Claretiano - Centro Universitário


72 © Probabilidade e Estatística

Distribuição % de empresas por


setores econômicos
11.9
29.5
Automotivo
Alimentos
Siderurgico

45.9 Transportes
12.7

Figura 20 Gráfico de setores com fatia afastada.

O gráfico de setores pode ser utilizado em qualquer situação,


com categorias qualitativas, categorias quantitativas inteiras
ou quando temos intervalos. Contudo, no caso das categorias
qualitativas, devemos utilizá-las somente quando o seu número
for pequeno, pois, senão, as fatias ficarão muito pequenas e o
gráfico não ficará muito legível.

Uma visão da aplicação dos gráficos de frequências


Para termos uma visão mais clara sobre a aplicação dos
gráficos de frequências, vejamos, a seguir, alguns exemplos de
cada variável e os gráficos que podemos utilizar para cada uma
das categorias. Os exemplos contarão com a ajuda do Excel.
Categoria qualitativa
Para as tabelas com categorias qualitativas, podemos utilizar
os três tipos de gráficos.
Aqui, vamos utilizar, como exemplo, os dados de uma
pesquisa realizada em 131 cidades do estado de São Paulo, que
investigou qual produto da cesta básica apresentou maior variação
de preço em abril de 2011.
© U2 – Tabulação de Dados 73

Produto com maior Número de


% de Cidades
variação de preço Cidades
Arroz 44 33.59
Feijão 48 36.64
Macarrão 12 9.16
Carne de segunda 11 8.40
Açúcar 8 6.11
Sal 8 6.11
Total 131 100

Observe as representações gráficas dos dados dessa pesquisa


nas Figuras 21, 22 e 23.
Produtos com maior Variação de Preços em Cidades do
Estado de SP
40,00
35,00
s 30,00
e
ad 25,00
% de cidades

d
i 20,00
C
e 15,00
d
% 10,00
5,00
0,00
Arroz Feijão Macarrão Carne de Açúcar Sal
Segunda
Produto com maior variação de preço no mês

Figura 21 Gráfico de colunas.

Produtos com maior Variação de Preços em Cidades do Estado


de SP

o
ç Sal
re
Produto com maior variação de preço

p Açúcar
e
d
o Carne de Segunda
çãa
ir Macarrão
av
r Feijão
o
ai
m Arroz
m
co
o
t 0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00
u
d
o
r % de Cidades
P

Figura 22 Gráfico de barras.

Claretiano - Centro Universitário


74 © Probabilidade e Estatística

Produtos com maior variação de


preço em cidades do estado de SP
6,11
6,11
8,40 33,59 Arroz
Feijão
Macarrão
9,16
Carne de Segunda
Açúcar
Sal

36,64

Figura 23 Gráfico de setores.

Vejamos, agora, um exemplo com categoria quantitativa


sem intervalos.
Categoria quantitativa sem intervalos
A categoria quantitativa sem intervalos é representada por
números inteiros (ou seja, sem intervalos), e, para ela, podemos
utilizar o gráfico de colunas ou o gráfico de setores.
Para exemplificar, vamos prosseguir com a demonstração so-
bre o produto da cesta básica que mais variou de preço em abril
de 2011.

Número de produtos com Número de % de


aumento de preço Cidades Cidades
5 9 6.87
7 50 38.17
8 61 46.56
10 8 6.11
11 3 2.29
Total 131 100.00

Ao digitar as categorias numéricas, uma dica que vale ser


mencionada é iniciar com aspas (‘), para que o Excel interprete
isso como uma categoria do eixo X.
© U2 – Tabulação de Dados 75

Observe a representação gráfica dos dados dessa pesquisa


nas Figuras 24 e 25.

Análise do Número de Produtos com


Aumento de Preço
50,00

s 40,00
e
d
% de cidades

a 30,00
d
ic
e 20,00
d
%
10,00

0,00
5 7 8 10 11
Número de Produtos com aumento de preço

Figura 24 Gráfico de colunas.

Análise do Número de Produtos com


Aumento de Preço
6,11 2,29 6,87

5
7

38,17 8
10
46,56
11

Figura 25 Gráfico de setores.

Categoria quantitativa com intervalos


Para tabelas com categorias quantitativas representadas por
números fracionários subdivididos em intervalos, podemos utilizar
o gráfico de colunas ou o gráfico de setores.
Vamos continuar utilizando os dados da pesquisa sobre a
variação percentual de preços da cesta básica, cujos resultados
foram subdivididos em cinco intervalos numéricos.

Claretiano - Centro Universitário


76 © Probabilidade e Estatística

Variação % no preço
Número de Cidades % de Cidades
da cesta básica
1,22 |— 1,31 77 58.78
1,32 |— 1,41 23 17.56
1,42 |— 1,51 17 12.98
1,52 |— 1,61 9 6.87
1,62 |— 1,71 5 3.82
Total 131 100.00

Observe a representação gráfica dos dados dessa pesquisa


na Figura 26.

Variação Percentual da Cesta Básica


6.87 3.82

12.98
1,22 |-- 1,31
1,32 |-- 1,41
1,42 |-- 1,51
58.78 1,52 |-- 1,61
17.56
1,62 |-- 1,71

Figura 26 Gráfico de setores, ou de pizza.

Você deve ter notado que a elaboração de gráficos de


frequências no Excel é um procedimento bem simples. Por isso,
recomendamos que você procure exercitar o uso da planilha, de
forma a fortalecer os conceitos e procedimentos apreendidos neste
"manual" que elaboramos sobre a utilização das ferramentas do
Excel para a criação de representações gráficas de dados.
Mas você deve saber que este assunto não se encerrou ainda!
Além dos gráficos de frequências, podemos elaborar gráficos que
representam séries estatísticas. Vamos conhecê-los?
© U2 – Tabulação de Dados 77

10. GRÁFICOS DE SÉRIES


Como acabamos de ver, além dos gráficos de frequências,
temos os gráficos de séries, ou gráficos de linha, que servem para
representar situações em que a variável observada está relaciona-
da com alguma medida temporal ou sequencial. É importante sa-
lientar que esses tipos de gráficos não são como os de frequências
e, portanto, não podem ser utilizados para tabelas de frequências,
exceto em casos de variáveis temporais ou sequenciais.

Gráfico de séries no Excel 2003


Para facilitar, é sempre importante digitarmos os dados em
colunas, sendo que a identificação do tempo deve ser colocada na
primeira coluna, à esquerda, e os valores das variáveis, ao lado,
caminhando sempre para a direita, tal como na tabela a seguir, em
que temos o número de casos de dengue registrado em uma série
histórica de 20 semanas em dois grandes municípios do interior do
estado de São Paulo. Vejamos.

SEMANA CIDADE 1 CIDADE 2


Semana 1 12 23
Semana 2 25 45
Semana 3 33 56
Semana 4 41 67
Semana 5 42 78
Semana 6 43 79
Semana 7 45 65
Semana 8 56 61
Semana 9 78 59
Semana 10 123 58
Semana 11 145 45
Semana 12 89 44
Semana 13 77 32
Semana 14 65 31

Claretiano - Centro Universitário


78 © Probabilidade e Estatística

SEMANA CIDADE 1 CIDADE 2


Semana 15 43 28
Semana 16 41 25
Semana 17 32 21
Semana 18 23 13
Semana 19 12 10
Semana 20 10 3

Ao selecionar os dados, basta digitar os valores e seguir o


procedimento inicial para a construção do gráfico de linhas (ou de
séries), pois o método dele é similar ao dos casos anteriores, con-
siderando a seleção direta dos dados, inclusive a linha dos títulos
das colunas, conforme a Figura 27.

Figura 27 Tabela de dados digitada no Excel.


© U2 – Tabulação de Dados 79

Depois de selecionar as informações, vamos escolher o


gráfico. Para isso, acessaremos o menu Inserir e selecionaremos a
opção Gráfico ou o ícone do Assistente de Gráfico, como mostrado
anteriormente, nos exemplos de gráficos de frequências. Em geral,
para esse tipo de exemplo, é mais indicado o gráfico de linhas com
marcadores, conforme a Figura 28.

Figura 28 Escolha do tipo de gráfico – gráfico de linhas com marcadores.

Após a seleção do gráfico, o Excel apresenta, na segunda


etapa, uma visão preliminar do gráfico de linhas. Observe, na
Figura 29, que, como selecionamos a linha com os títulos das
colunas, estes aparecem na legenda do lado direito. Vamos, agora,
selecionar a opção Avançar.

Claretiano - Centro Universitário


80 © Probabilidade e Estatística

9
a3
a1

a5

a7

a9

a1

a1

a1

a1

a1
an
an

an

an

an

an

an

an

an

an
m
m

m
Se
Se

Se

Se

Se

Se

Se

Se

Se

Se

Figura 29 Assistente de gráfico.

Como já discutido nos exemplos anteriores dos gráficos de


colunas e de barras, na Etapa 3, devemos inserir os títulos – um
para o gráfico e um para cada eixo. Na Figura 30, podemos nomear
o gráfico de "Histórico dos casos de dengue"; o eixo horizontal
(das categorias), de "Semanas"; e o eixo vertical (dos valores), de
"Número de casos".
© U2 – Tabulação de Dados 81

Figura 30 Títulos do gráfico.

Após colocarmos os títulos, selecionaremos a opção OK


e passaremos para a Etapa 4, em que escolheremos a forma de
gravação do gráfico. É interessante que se utilize a opção Como
Nova Planilha, tal como é mostrado na Figura 31.

Figura 31 Gravação do gráfico.

Seguindo corretamente todas as etapas, nosso gráfico deve-


rá ficar igual ao da Figura 32.

Claretiano - Centro Universitário


82 © Probabilidade e Estatística

Histórico dos casos de dengue

160

140

120

100
Número de Casos

Cidade 1
80
Cidade 2

60

40

20

0
1

10

11

12

13

14

15

16

17

18

19

20
a

a
an

an

an

an

an

an

an

an

an

a
an

an

an

an

an

an

an

an

an

an

an
m

m
Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se

Se
Semanas

Figura 32 Gráfico de linhas pronto.

Os procedimentos vistos para a versão 2003 do Excel são


bem diferentes dos que utilizamos para as versões 2007 e 2010.
Vamos, então, a seguir, ver como executar esses gráficos nessas
versões mais atuais.

Gráfico de séries no Excel 2007 e 2010


É sempre importante começar digitando os dados em
colunas, sendo que a identificação do tempo deve ser colocada na
primeira coluna da esquerda e os valores das variáveis econômicas
nas colunas ao lado, caminhando sempre para a direita, como no
exemplo a seguir, no qual temos os índices de inflação medidos
pelo IPC-FIPE no período de janeiro/2010 a julho/2011, numa
série histórica.

PERÍODO IPCA-IBGE IPC-FIPE


01/10 0.75 1.34
02/10 0.78 0.74
03/10 0.52 0.34
© U2 – Tabulação de Dados 83

04/10 0.57 0.39


05/10 0.43 0.22
06/10 0.00 0.04
07/10 0.01 0.17
08/10 0.04 0.17
09/10 0.45 0.53
10/10 0.75 1.04
11/10 0.83 0.72
12/10 0.63 0.54
01/11 0.83 1.15
02/11 0.80 0.60
03/11 0.79 0.35
04/11 0.77 0.70
05/11 0.47 0.31
06/11 0.15 0.01
07/11 0.16 0.30

Com os valores digitados, o procedimento inicial para a cons-


trução do gráfico de séries é similar à dos casos anteriores, consi-
derando a seleção direta dos dados, inclusive a linha dos títulos
das colunas, ficando da mesma forma que a Figura 33.

Claretiano - Centro Universitário


84 © Probabilidade e Estatística

Figura 33 Tabela com dados digitados.

Depois de selecionar as informações, acessaremos o menu


Inserir, e, imediatamente, aparecerão os gráficos que o Excel
pode inserir na planilha (Figura 34) com base na seleção feita.
Selecionaremos a opção Linhas e escolheremos a opção com
linhas e marcadores.
© U2 – Tabulação de Dados 85

Figura 34 Opções de gráficos de linha.

Após selecionarmos a opção do gráfico de linhas, a primeira


versão do gráfico ficará igual à da Figura 35.

Figura 35 Primeira versão do gráfico de linhas.

Feito o gráfico, podemos colocar os títulos nos eixos e um


título para o gráfico, bastando proceder da mesma forma como
fizemos na construção do gráfico de colunas para a versão 2007 e
2010.
Para inserir os títulos nos eixos e no gráfico, vamos entrar no
menu Layout.

Claretiano - Centro Universitário


86 © Probabilidade e Estatística

Para inserir o título no eixo horizontal, selecionamos a


opção Títulos dos eixos; depois, a opção Título do eixo horizontal
principal; depois, Título abaixo do eixo, bastando digitar o título
desejado, como, por exemplo, "Períodos".
Para inserir o título no eixo vertical, selecionamos a opção
Títulos dos eixos; depois, a opção Título do eixo vertical principal;
depois, Título girado, bastando digitar o título desejado, como,
por exemplo, "Índice de Inflação".
Para inserir o título geral do gráfico, selecionamos a opção
Títulos do gráfico e, depois, a opção Acima do gráfico, bastando
digitar o título desejado, como, por exemplo, "Comparação dos
Índices IPCA e IPC".
Como temos duas séries históricas no mesmo gráfico,
a legenda deve ser mantida. Note, na Figura 36, que, como
selecionamos os títulos das colunas, na legenda, já aparecem os
nomes corretos das séries.

Figura 36 Gráfico de linhas pronto.

Com o gráfico pronto, podemos partir para a sua edição,


trocando os marcadores ou o tipo de linha ou retirando os
marcadores e/ou as linhas. Para efetuar uma edição no formato das
linhas e marcadores, devemos apontar com o mouse para qualquer
© U2 – Tabulação de Dados 87

um dos marcadores de uma das séries e clicar com o botão direito.


Uma tela com as opções de edição (Figura 37) surgirá, e bastará
selecionar a opção Formatar série de dados.

Figura 37 Opções de edição.

Por meio dos exemplos, foi possível notar que os gráficos são
ferramentas amplamente utilizadas nos meios de comunicação
em geral. Portanto, é preciso ficar atento às situações ideais para
a representação de dados via gráficos e saber utilizar recursos
tecnológicos para a sua construção.

11. TRABALHANDO EM SALA DE AULA


Podemos separar a utilização dos recursos de tabulação,
seja em forma de tabelas, seja em forma de gráficos, em duas
modalidades.
A primeira é a do trabalho com as tabelas, especialmente as
mais simples, que é bem fácil e não exige recursos computacionais,
além de fortalecer os conceitos de associação de elementos
semelhantes e operações matemáticas de soma e divisão e de
trabalhar conceitos percentuais e de proporcionalidade.
Uma dinâmica interessante é dar continuidade nas
discussões de amostragem, executando, de fato, uma coleta de
dados na escola, como, por exemplo, o que os alunos preferem

Claretiano - Centro Universitário


88 © Probabilidade e Estatística

na cantina ou no lanche; o esporte, filme ou programa preferido;


quem recicla materiais em casa; enfim, assuntos de algum
interesse comum. Com a coleta, fica fácil a construção das tabelas.
Por exemplo, o professor pode separar a sala em grupos, e cada
grupo fica responsável pela pesquisa em uma parte da escola. Em
seguida, cada grupo apresenta sua tabela, e uma discussão sobre
as diferenças nos resultados pode ser feita.
Na segunda, temos os gráficos. Aqui, é interessante que o
professor proceda de duas formas diferentes caso a escola possua
recursos computacionais: primeiramente, incentivando os alunos
a construírem os gráficos manualmente, pois essa é uma boa
forma de discutir alguns conceitos de Geometria e de construção
geométrica, e, depois, mostrando alguns passos em algum
programa computacional para facilitar a construção.
Cabe, aqui, uma observação importante: é comum
professores pedirem aos alunos que recolham, em jornais e revistas,
exemplares de tabelas e gráficos. Porém, normalmente, os meios
de comunicação não respeitam as normas técnicas estabelecidas
para a construção dessas representações, especialmente em se
tratando de tabelas; portanto, vale a ressalva, para que você se
atente a essa ocorrência e se previna ao solicitar atividades como
essas para seus futuros alunos.

12. QUESTÃO AUTOAVALIATIVA


Confira, a seguir, a questão proposta para verificar o seu
desempenho no estudo desta unidade:
1) Uma importante teoria econômica, chamada de "Teoria do Consumidor",
diz que, em um mercado no qual haja produtos competitivos, se o preço
de um determinado produto tiver um comportamento crescente ao
longo do tempo, a quantidade comercializada do produto tende a ter um
comportamento decrescente, ou seja, quanto mais caro o produto, menor
a vendagem dele, teoricamente. Para avaliar a veracidade dessa teoria, um
estudo foi realizado em 40 supermercados da região de Ribeirão Preto, com
o objetivo de avaliar a procura por uma determinada marca de bolacha,
vendida em três diferentes sabores: chocolate (CHO), morango (MOR) e leite
© U2 – Tabulação de Dados 89

(LEI). Em cada um dos supermercados, os pesquisadores observaram três


diferentes variáveis:
• Variável 1: sabor mais vendido em um período de 5 meses.
• Variável 2: quantidade total vendida daquela marca em mil unidades,
somando-se os três sabores.
• Variável 3: preço máximo cobrado por cada pacote de bolacha daquela
marca no mesmo período de 5 meses.

Executada a pesquisa, ou seja, visitados todos os 40 supermercados, foram


obtidas as respostas para cada uma das variáveis de interesse. Os resultados
estão colocados nos conjuntos a seguir.
a) Quanto ao sabor mais vendido:

CHO MOR MOR CHO CHO LEI CHO CHO MOR MOR

MOR LEI CHO CHO LEI CHO CHO MOR CHO CHO

LEI CHO MOR MOR CHO CHO MOR MOR LEI MOR

MOR LEI CHO LEI MOR MOR LEI CHO MOR CHO

b) Quanto à quantidade total vendida (em mil unidades):

23 21 25 20 22 20 25 21 25 23

22 23 25 23 19 19 19 23 25 25

19 22 19 22 19 23 19 22 22 22

19 21 23 25 21 20 25 21 23 21

c) Quanto ao preço máximo cobrado pela unidade do produto:

2,35 2,45 2,41 2,40 2,33 2,29 2,55 2,48 2,47 2,51

2,15 2,45 2,45 2,64 2,58 2,61 2,49 2,22 2,24 2,20

2,47 2,59 2,60 2,41 2,49 2,44 2,19 2,22 2,23 2,55

2,55 2,56 2,57 2,45 2,46 2,59 2,64 2,63 2,15 2,18

Com base nos dados anteriores, construa uma tabela de frequências para
cada conjunto de dados e, depois, represente cada uma das tabelas por
meio de um gráfico de frequências da seguinte forma:

Claretiano - Centro Universitário


90 © Probabilidade e Estatística

a) A primeira tabela por um gráfico de barras.


b) A segunda tabela por um gráfico de barras.
c) A terceira tabela por um gráfico de setores.

Gabarito
Confira, a seguir, a resposta correta para a questão
autoavaliativa proposta:
1)
a) Primeira tabela: Distribuição dos supermercados em relação aos
sabores mais vendidos.

Sabor mais vendido fa fr%


Chocolate 17 42,5
Leite 8 20,0
Morango 15 37,5
Total 40 100,0

b) Segunda tabela: Distribuição dos supermercados em relação à


quantidade vendida em mil unidades.

Quantidade (mil
fa fr%
unidades)
19 8 20,0
20 3 7,5
21 6 15,0
© U2 – Tabulação de Dados 91

Quantidade (mil
fa fr%
unidades)
22 7 17,5
23 8 20,0
25 8 20,0
Total 40 100,0

c) Terceira tabela: Distribuição dos supermercados em relação ao


preço máximo cobrado.

Preço Máximo fa fr%


2,15 |— 2,24 8 20,0
2,24 |— 2,33 2 5,0
2,33 |— 2,42 5 12,5
2,42 |— 2,51 11 27,5
2,51 |— 2,60 9 22,5
2,60 |— 2,69 5 12,5
Total 40 100,0

Fazemos:

• At = 2, 64 − 2,15 = 0, 49
• K =+
1 3,3 ⋅ Log10 40 =+
1 3,3 ⋅1, 6 =6, 28
0, 49
• Ti= = 0, 082 → Ti= 0, 09
6

Claretiano - Centro Universitário


92 © Probabilidade e Estatística

Gráfico da terceira tabela


Preço máximo do pacote
12,5
20
2,15 |--- 2,24

22,5 5 2,24 |--- 2,33


2,33 |--- 2,42
2,42 |--- 2,51
12,5
2,51 |--- 2,60
2,60 |--- 2,69

27,5

13. CONSIDERAÇÕES
Nesta unidade, discutimos dois importantes instrumentos
de tabulação de dados: as tabelas e os gráficos de frequências,
que, apesar de não exigirem muito esforço para sua construção,
exigem rigor quanto às normas de montagem.
Podemos, no dia a dia, identificar muitas situações nas quais
as tabelas e os gráficos são utilizados, inclusive exemplos estuda-
dos nesta unidade. Por isso, é importante saber construir e tam-
bém interpretar os resultados de uma tabela ou gráfico.
Na próxima unidade, vamos evoluir na representação e
análise dos dados coletados e/ou pesquisados, introduzindo as
medidas de tendência central, ou medidas de posição, entre elas a
média, que é uma unidade muito utilizada.

14. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.
© U2 – Tabulação de Dados 93

15. REFERÊNCIAS BIBLIOGRÁFICAS


BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
FREUND, J. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto
Alegre: Bookman, 2007.
LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004.
MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson,
2009.
NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson
Prentice Hall, 2003.
SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo:
Atlas, 2002.
SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e
estatística. 2. ed. Porto Alegre: Bookman, 2004.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São
Paulo: Pearson, 2008.

Claretiano - Centro Universitário


Claretiano - Centro Universitário
EAD
Medidas Estatísticas de
Posição
3
1. OBJETIVOS
• Conceituar as principais medidas estatísticas de posição.
• Aplicar as medidas de posição.
• Relacionar as medidas de posição.

2. CONTEÚDOS
• Médias aritméticas e Média Geométrica.
• Mediana e Moda.
• Medidas de ordem.

3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE


Antes de iniciar o estudo desta unidade, é importante que
você leia as orientações a seguir:
96 © Probabilidade e Estatística

1) Para obter outras informações sobre a edição de


fórmulas e equações no Word 2007 e 2010, assista
ao vídeo disponível em: <http://www.youtube.com/
watch?v=Iv3koVfjDbQ>. Acesso em: 27 fev. 2012.
2) Estudaremos apenas as medidas de quartil, mas você
poderá pesquisar as medidas de decil e percentil em
obras como:
a) LARSON, R.; FARBER, E. Estatística aplicada. 4. ed.
São Paulo: Pearson, 2010.
b) LEVIN, J.; FOX, J. Estatística para ciências humanas.
4. ed. São Paulo: Pearson, 2004.
3) Também veremos nesta unidade que a média aritmética
possui uma forma simples e uma forma ponderada de ser
calculada. O mesmo acontece com a Média Geométrica,
que pode ser calculada de forma ponderada. Você
poderá consultar mais informações sobre a Média
Geométrica nesta obra: TOLEDO, G. Estatística básica. 2.
ed. São Paulo: Atlas, 2008.

4. INTRODUÇÃO À UNIDADE
O objetivo principal de uma medida de posição é representar,
de forma resumida, um conjunto de dados gerado pelo estudo
de uma variável quantitativa, ou seja, um conjunto de dados
numéricos. Esse resumo é definido de maneira que todos os dados
presentes no conjunto sejam transformados em apenas um valor
típico, que representa, de modo significativo (que posicione), os
valores da variável.
Existem muitas formas de transformar um conjunto com n
elementos em apenas um valor representativo. Discutiremos duas
abordagens: as medidas de tendência central e as medidas de
ordem.
© U3 – Medidas Estatísticas de Posição 97

5. MEDIDAS ESTATÍSTICAS DE TENDÊNCIA CENTRAL


O conceito de medida de tendência central é que a caracte-
rização dos dados se dá por meio de um valor que possua uma ten-
dência a se localizar, razoavelmente, no centro dos dados, ou seja,
aproximadamente, no meio dos dados, deixando uma informação
relacionada aos menores valores similar à dos valores maiores.
Entre as muitas medidas de tendência central, estudaremos
apenas as médias, a Mediana e a Moda.

Médias aritméticas
Temos dois tipos principais de média aritmética: a Média
Aritmética Simples e a Média Aritmética Ponderada. Você se lem-
bra do conceito de "média"? Já viu sua utilização nas reportagens
que aparecem na televisão e nos jornais? Lembra-se de que é por
meio de médias que as escolas avaliam seus alunos? Pois bem.
Essa é a média que estudaremos.
Média Aritmética Simples
A Média Aritmética Simples, que denotaremos por X , de
um conjunto com n valores observados de uma variável quantita-
tiva X é obtida dividindo-se a soma de todos os valores de X pelo
total n de valores, ou seja, se considerarmos o conjunto com n
valores de X : X = { X 1 , X 2 , X 3 ,..., X n } , então, a Média Aritmética
Simples dos valores de X será igual a:

X 1 + X 2 + X 3 + ... + X n
X=
n
EXEMPLO 1
Em um levantamento dos últimos sete dias em uma
empresa, foram anotadas as quantidades de pedidos (X) efetuados
pelo serviço de e-commerce (comércio eletrônico) dessa empresa,
chegando-se aos seguintes dados: X = {12, 23, 11, 54, 34, 21, 10}.
Assim, a Média Aritmética Simples diária de pedidos é:

Claretiano - Centro Universitário


98 © Probabilidade e Estatística

12 + 23 + 11 + 54 + 34 + 21 + 13 168
X
= = = 24
7 7
Para facilitar a notação, utilizaremos a indicação de somatório
para representar o numerador da fórmula da seguinte maneira:
n

∑X 1
X= i =1

n
A Média Aritmética Simples é uma medida que transforma
todos os dados da variável, de forma que todos fiquem iguais à
média calculada. Assim, em um problema prático, a média torna-
se o valor de referência para cada valor ou, então, todos ficam
iguais em média.

EXEMPLO 2
Em uma pesquisa, foram avaliadas as rendas (X), em número
de salários mínimos, de dez empregados do setor terciário,
obtendo-se os seguintes resultados: X = {12,3; 11,4; 13,2; 10,1;
8,5; 11,9; 22,1; 15,7; 10,7; 6,7}. Então, qual a renda média para
esses dez empregados?
Calculando, temos:
n

∑X
i
12,3 + 11, 4 + 13, 2 + 10,1 + 8,5 + 11,9 + 22,1 + 15, 7 + 10, 7 + 6, 7
=X = i =1

n 10
122, 6
=X = 12, 26
10

Desse modo, a renda média dos dez empregados é de 12,26


salários mínimos, ou, então, podemos interpretar o resultado
afirmando que cada empregado tem salário igual a 12,26 salários
mínimos em média.
© U3 – Medidas Estatísticas de Posição 99

A Média Aritmética Simples só é utilizada para dados brutos


(não agrupados em tabelas ou gráficos de frequências) e que não
possuam pesos associados. Quando os dados coletados possuem
pesos associados ou estão agrupados por frequência, temos o
caso da Média Aritmética Ponderada.
Média Aritmética Ponderada
A Média Aritmética Ponderada, que denotaremos por
X p , de um conjunto com n valores observados de uma variável
quantitativa X é obtida calculando-se a soma do produto de
cada valor de X pelo seu peso e dividindo o resultado pela
soma dos pesos, ou seja, se considerarmos o conjunto com
n valores de X : X = { X 1 , X 2 , X 3 ,..., X n } , com pesos iguais a
p = { p1 , p2 , p3 ,..., pn } , então, a Média Aritmética Ponderada dos
valores de X será igual a:

XP =
( X 1 ⋅ p1 ) + ( X 2 ⋅ p2 ) +  + ( X k ⋅ pk )
p1 + p2 +  + pk

Ou, de uma forma mais simbólica:


k

∑( X i ⋅ pi )
XP = i =1
k

∑p i
EXEMPLO 1 i =1

Suponhamos que uma concessionária de veículos passou


um questionário para seus clientes, para que eles dessem notas
a determinados quesitos da loja, como limpeza, tratamento rece-
bido e tempo de espera pelo serviço. Para avaliar o resultado, a
diretoria estabeleceu que o item "limpeza" tivesse peso 1; o item
"tratamento" teria peso 4; e o item "tempo de espera", peso 5.
Considerando esses pesos, se um cliente deu notas (X) iguais a
X = {9, 0;8,5;7,5} , respectivamente, qual será a nota média dada
pelo cliente para a loja?

Claretiano - Centro Universitário


100 © Probabilidade e Estatística

Como temos pesos para as notas, devemos nos utilizar da


Média Aritmética Ponderada para efetuarmos esse cálculo. Assim,
temos:
k

∑( X ⋅ pi )
i
( 9, 0 ⋅1) + (8,5 ⋅ 4 ) + ( 7,5=
⋅ 5) 9 + 34 + 37,5 80,5
XP
= i =1
k
= = = 8, 05
1+ 4 + 5 10 10
∑ i
p
i =1

Desse modo, a nota média dada pelo cliente é 8,05.

EXEMPLO 2
O uso de ponderação é um dos principais componentes dos
cálculos de inflação. Para ilustrar, vamos considerar quatro dife-
rentes produtos da cesta básica, com seus respectivos pesos de
importância: arroz, com peso igual a 4; feijão, com peso 2,5; sabo-
nete, com peso igual a 2; e detergente, com peso igual a 1,5. Se,
em um determinado mês, cada um dos produtos apresentou uma
determinada variação percentual de preço – o arroz subiu 2%, o
feijão subiu 3%, o sabonete subiu 15% e o detergente subiu 9% –,
então, qual o índice de variação média de preço?
k

∑( X ⋅ pi ) i
( 2 ⋅ 4 ) + ( 3 ⋅ 2,5) + (15 ⋅ 2 ) + ( 9 ⋅1,5=) 59
X=
P
i =1
k
= = 5,9
4 + 2,5 + 2 + 1,5 10
∑ pi
i =1

Dessa forma, a variação média de preço foi de 5,9%.


Outra situação que leva ao uso da Média Aritmética
Ponderada é o fato de os dados estarem agrupados em tabelas ou
gráficos de frequências. Nesse caso, não temos uma ponderação
por pesos, mas, sim, pelas frequências (absolutas ou relativas).
Desse modo, a fórmula da Média Aritmética Ponderada é alterada,
trocando-se a letra p, de "peso", pela letra f, de "frequência", da
seguinte forma:
© U3 – Medidas Estatísticas de Posição 101

∑( X i ⋅ fi )
XP = i =1
k

∑f
i =1
i

Vale lembrar que f pode ser a Frequência Absoluta ou a


Frequência Relativa encontradas nas tabelas estudadas na unidade
anterior.

EXEMPLO 3
Tomemos como exemplo uma tabela construída na unidade
anterior, a qual reapresentamos a seguir, que representava o nú-
mero de copos de café que as 20 pessoas pesquisadas consumiam
por dia. Com base nela, vamos calcular a média diária de copos de
café que são consumidos.

Número de Copos fa fr%


5 6 30,0
6 5 25,0
7 3 15,0
8 4 20,0
9 2 10,0
Total 20 100,0

Como os dados estão agrupados por frequência (estão den-


tro de uma tabela), calcularemos a Média Aritmética Ponderada,
utilizando as Frequências Absolutas (fa) para ponderar o cálculo,
da seguinte forma:
k

∑( X i ⋅ fi )
( 5 ⋅ 6 ) + ( 6 ⋅ 5) + ( 7 ⋅ 3) + ( 8 ⋅ 4 ) + ( 9 ⋅=
2) 131
X
= P
i =1
k
= = 6,55
6+5+3+ 4+ 2 20

i =1
fi

Portanto, as pessoas consomem, em média, 6,55 copos de


café por dia.

Claretiano - Centro Universitário


102 © Probabilidade e Estatística

EXEMPLO 4
Continuando com o exemplo da unidade anterior, porém,
desta vez, não o que representava o número de copos de café,
mas o que representava o preço sugerido para o quilo do pó de
café preferido, qual o preço médio que as pessoas indicam como
justo a pagar?

Preço Justo fa fr%


2,85 |— 3,13 5 25,0
3,13 |— 3,41 6 30,0
3,41 |— 3,69 1 5,0
3,69 |— 3,97 3 15,0
3,97 |— 4,25 5 25,0
Total 20 100,0

Como os dados estão agrupados por frequência (estão den-


tro de uma tabela), calcularemos a Média Aritmética Ponderada,
utilizando as Frequências Absolutas (fa) para ponderar o cálculo.
Contudo, como podemos notar, a tabela não possui os preços des-
criminados; os valores estão em intervalos. Desse modo, é possível
utilizar os intervalos na fórmula da Média Aritmética Ponderada?
Se pensarmos um pouco, veremos que não há como colocar
intervalos na fórmula, apenas número; então, teremos de trans-
formar os intervalos em números. Para isso, determinaremos o
ponto médio de cada intervalo, somando os limites do intervalo e
dividindo o resultado por 2, não importando se o intervalo é aber-
to ou fechado (lembra-se do que quer dizer isso?). Os cálculos que
deverão ser realizados são estes:

1) Ponto médio do primeiro intervalo:


2,85 + 3,13
= Pm = 2,99 .
2
© U3 – Medidas Estatísticas de Posição 103

2) Ponto médio do segundo intervalo:


3,13 + 3, 41
= Pm = 3, 27 .
2
3) Ponto médio do terceiro intervalo:
3, 41 + 3, 69
= Pm = 3,55 .
2
4) Ponto médio do quarto intervalo:
3, 69 + 3,97
= Pm = 3,83 .
2
5) Ponto médio do quinto intervalo:
3,97 + 4, 25
= Pm = 4,11 .
2
Encontrados os pontos médios dos intervalos, calcularemos,
agora, o preço médio.
k

∑( X i ⋅ fi )
( 2,99 ⋅ 5) + ( 3, 27 ⋅ 6 ) + ( 3,55 ⋅1) + ( 3,83 ⋅ 3) + ( 4,11 ⋅ 5) 70,16
XP
= i =1
=
k
= = 3,508
6+5+3+ 4+ 2 20
∑ fi
i =1

Portanto, o preço médio justo indicado pelas pessoas é de


R$3,51, aproximadamente.
Propriedades das Médias Aritméticas
Vejamos, agora, três interessantes propriedades matemá-
ticas relacionadas tanto com a Média Aritmética Simples quanto
com a Média Aritmética Ponderada e que são originárias das pro-
priedades dos somatórios.

PROPRIEDADE 1
Se somarmos uma mesma constante W a todos os elemen-
tos de uma variável X, a média aritmética dessa variável também
fica somada da constante W.

Claretiano - Centro Universitário


104 © Probabilidade e Estatística

Fazendo X como sendo X+W, teremos:


n n n n n n

∑ X i ∑ ( X i + W ) ∑ X i + ∑W ∑ X i + n ⋅W ∑X i
n ⋅W
X=
=i 1 =i 1
= =
=i 1 =i 1 =i 1
= =
=i 1
+ X W
=+
n n n n n n
PROPRIEDADE 2
Se multiplicarmos uma mesma constante W por todos os
elementos de uma variável X, a média aritmética dessa variável
também fica multiplicada pela constante W.
Fazendo X como sendo X ⋅ W , teremos:
n n n n

∑ X i ∑ ( X i ⋅W ) =
W ⋅ ∑ Xi ∑ Xi
X= =
=i 1 =i 1
= i 1
W⋅
=
=i 1
W⋅X
=
n n n n

PROPRIEDADE 3
A média aritmética pode ser interpretada como o ponto de
equilíbrio da variável. Isso pode ser demonstrado pelo cálculo da
soma das diferenças entre cada valor de X e a média, que resultará
sempre em zero, ou seja, o montante de informação à esquerda
da média (valores negativos) sempre será igual ao montante de
informação ao lado direito da média (valores positivos).
Fazendo a subtração X − X e somando as diferenças,
teremos:
n n n n

=i 1
∑( X i − X
= ) ∑ X − ∑=
i X ∑X
=i 1 =i 1 =i 1
i − n⋅ X

Note que o termo n ⋅ X é igual ao somatório dos valores de


X, resultado que sai diretamente da fórmula da Média Aritmética
n

∑X 1 n
Simples, ou seja, X = i =1 =n ⋅ X =∑ X 1 .
n i =1

Substituindo esse resultado na expressão anterior, teremos:


n n n n

∑( X
=i 1
1− X
= ) ∑X
=i 1
1 − n ⋅=
X ∑ Xi − ∑=
Xi 0 ,
i −1 =i 1
que era o
resultado esperado.
© U3 – Medidas Estatísticas de Posição 105

Problemas das Médias Aritméticas


Apesar da simplicidade dos cálculos, uma análise da fórmula
da média aritmética, seja simples, seja ponderada, gera duas
situações que causam problemas na sua representatividade.
Em primeiro lugar, se os dados apresentarem muita variação,
será difícil a média aritmética conseguir representar os dados
adequadamente. Em segundo lugar, quando existe a ocorrência de
valores extremos (valor muito baixo ou muito alto), sua influência
sobre a média prejudica a representatividade. Vejamos, a seguir,
alguns exemplos dessas situações.

EXEMPLO 1
A seguir, temos três diferentes conjuntos de dados.
Calcularemos a Média Aritmética Simples de cada um deles e
observaremos o que acontece com o resultado.
• X = {2, 4, 7, 8, 10}
2 + 4 + 7 + 8 + 10 31
X
= = = 6, 2
5 5
Veja que, no cálculo apresentado, o valor 6,2 está razoavel-
mente no centro dos dados e que é um valor relativamente pró-
ximo dos demais. Isso significa que temos uma média aritmética
representativa.
• X = {2, 14, 37, 68, 91}
2 + 14 + 37 + 68 + 91 212
X
= = = 42, 4
5 5
Nesse caso, apesar de o valor 42,4 estar razoavelmente pró-
ximo do centro dos dados, é um valor muito diferente dos demais,
o que significa que não temos uma média aritmética representa-
tiva. Isso ocorre pelo fato de termos alta variação nos dados, ou
seja, existe muita diferença entre eles.
• X = {2, 4, 7, 8, 100}

Claretiano - Centro Universitário


106 © Probabilidade e Estatística

2 + 4 + 7 + 8 + 100 121
X
= = = 24, 2
5 5
O valor 24,2 não está se posicionando onde poderíamos con-
siderar como o centro dos dados e é um valor muito diferente dos
demais, o que significa que não temos uma média aritmética re-
presentativa. Isso ocorreu pela presença de um valor extremo, o
valor 100.
Assim, podemos considerar que a média aritmética (simples
ou ponderada) tem sua representatividade associada ao compor-
tamento dos dados. É desejado que exista pouca variação entre os
dados, ou seja, que eles sejam os mais próximos possíveis entre si
e, de preferência, sem valores extremos.

Outros exemplos da cálculos da Média Aritmética


Vejamos mais alguns exemplos de aplicação das médias arit-
méticas.

EXEMPLO 1
Quatro amigos trabalham em um supermercado por tempo
parcial com os seguintes salários/horário: Paulo, com R$2,20; José,
com R$2,40; Antônio, com R$2,50; e Manuel, com R$ 2,10. Então:
• Qual será o salário/horário médio entre os quatro?

2, 20 + 2, 40 + 2,50 + 2,10 9, 20
X
= = = 2,30 .
4 4

O salário/horário médio será de R$2,30.


• Se os quatro trabalharem, respectivamente, 20 horas, 10
horas, 20 horas e 15 horas em uma semana, qual será o
novo salário/horário médio?
2, 20 ⋅ 30 + 2, 40 ⋅10 + 2,50 ⋅ 20 + 2,10 ⋅15 171,5
=X = = 2, 2867
30 + 10 + 20 + 15 75
© U3 – Medidas Estatísticas de Posição 107

• O novo salário/horário médio será de R$2,29, aproxima-


damente.

EXEMPLO 2
Um produto é acondicionado em lotes, contendo, cada um
deles, 10 unidades. O lote só é aprovado se apresentar um peso (X)
médio superior a 4kg. Se as unidades que compõem um determi-
nado lote pesam: X = {3,0; 4,0; 3,5; 5,0; 3,5; 4,0; 5,0; 5,5; 4,0; 5,0},
esse lote será aprovado?
3 + 4 + 3,5 + 5 + 3,5 + 4 + 5 + 5,5 + 4 + 5 42,5
X
= = = 4, 25
10 10
Como o peso médio dos pacotes é de 4,25kg, o lote será
aprovado.

EXEMPLO 3
Uma empresa que produz e comercializa um determinado
tipo de bebida à base de soja, com a finalidade de aumentar suas
vendas, estruturou um plano de marketing, aproveitando a atual
importância que as pessoas estão dando para a melhoria da qua-
lidade de vida. Nos meses anteriores ao início do plano, as vendas
registradas foram as seguintes: {564, 589, 578, 568, 554, 579, 549,
567, 568, 577, 567, 587}.
Após a execução da estratégia de marketing da empresa, as
vendas foram registradas para um período de 12 meses, obtendo-
-se os dados: {584, 615, 610, 599, 588, 564, 610, 605, 587, 598,
601, 615}.
Para avaliar a eficiência ou não do plano de marketing, es-
tabeleceremos uma análise comparativa entre o consumo médio
antes e depois dele. Qual o risco nesse tipo de análise?
• Antes do plano:= 6847
X = 570, 6 unidades vendidas
em média. 12

Claretiano - Centro Universitário


108 © Probabilidade e Estatística

7176
• Depois do plano:=X = 598 unidades vendidas em
média. 12

Aparentemente, o plano de marketing foi eficiente, pois


elevou a vendagem média, certo? Não exatamente, pois uma
análise desse tipo está desconsiderando a variação dos dados, o
que pode provocar uma alteração nas médias. O correto é sempre
adotar uma medida que traga a variação para a análise, conforme
estudaremos na próxima unidade.

Antes de prosseguirmos com o estudo das medidas de tendência


central, é interessante que você resolva as questões autoavaliativas
1, 2 e 3 ao final desta unidade para aprofundar os conhecimentos
que adquiriu até aqui.

Colocados em prática os conhecimentos adquiridos sobre


as médias aritméticas nos exercícios dos exemplos propostos,
estudaremos, a seguir, outras medidas de tendência central que
podem ser utilizadas para representar o comportamento de uma
variável quantitativa.

Média Geométrica
A Média Geométrica, que indicaremos por G, é muito
interessante quando os dados são resultados de uma análise
que considera o crescimento temporal de uma variável, como
a evolução da rentabilidade de uma aplicação financeira ou a
variação percentual de preço em períodos diferentes, ou quando
temos uma variável que apresenta alto grau de variação. Nesses
casos, a Média Geométrica funciona melhor, pois o cálculo é feito
na escala logarítmica da variável.
Antes da apresentação da Média Geométrica, avaliaremos o
impacto da escala logarítmica no conjunto de dados a seguir.

X = {1, 12, 56, 199, 367, 987, 1223, 5555, 10000}


© U3 – Medidas Estatísticas de Posição 109

Como podemos notar, os valores oscilam bastante,


prejudicando o cálculo da média aritmética, que, nesse caso,
será X = 2044, 4 (faça os cálculos). Agora, tomaremos o mesmo
conjunto de dados, considerando os logaritmos naturais ( Ln ) de
cada valor, ou seja:

Ln(1) = 0
Ln(12) = 2, 48
Ln(56) = 4, 025
Ln(199) = 5, 293
Ln(367) = 5,905
Ln(987) = 6,895
Ln(1223) = 7,109
Ln(5555) = 8, 622
Ln(10000) = 9, 210

Como podemos ver, a variação que era de 1 a 10.000


passou a ser de 0 a 9,21, uma redução muito acentuada da
variação. Se fizermos a média dos valores na escala logarítmica, a
representatividade será maior, devido à menor variação. É isso que
a Média Geométrica acaba por fazer: considera a média na escala
logarítmica.
O cálculo da Média Geométrica é definido como a raiz
enésima do produto dos valores do conjunto, ou seja:

G= n X 1 ⋅ X 2 ⋅ ... ⋅ X n

Essa fórmula também pode ser representada por meio de


um produtório:
n
G= n Π Xi
i =1

Vejamos, a seguir, um exemplo de aplicação da Média


Geométrica.

Claretiano - Centro Universitário


110 © Probabilidade e Estatística

Suponhamos que uma aplicação do tipo poupança forneceu,


no mês de junho, um rendimento de 10%, e, no mês de julho,
um rendimento de 30%. Qual foi o rendimento médio no período
bimestral?
Se aplicarmos a média aritmética, estaremos ignorando o
fato de os juros serem compostos, ou seja, juros sobre juros, o que
não é o correto. Usando a Média Aritmética Simples, chegamos ao
 10 + 30 
rendimento médio de 20% =  X = 20%  .
 2 
Contudo, como essa é uma variável que apresenta dados
relativos, ou seja, que possuem um crescimento a partir do
anterior, o correto é utilizar a Média Geométrica. Assim, temos:
n
G =n Π X i =2 1,10 ⋅1,30 =2 1, 43 =1,1958
i =1

Pela Média Geométrica, a rentabilidade média no bimestre


foi de 19,58%.
Agora, imaginemos uma aplicação de R$100,00.
• Ao final de junho, teremos: 100 x 1,10 = R$110,00.
• Ao final de julho, teremos: 110 x 1,30 = R$143,00.
Pela Média Aritmética, com uma rentabilidade média de
20%, teremos:
• Ao final de junho: 100 x 1,20 = R$120,00.
• Ao final de julho: 120 x 1,20 = R$144,00 (que é diferente
do valor verdadeiro).

Pela Média Geométrica, com uma rentabilidade média de


19,58%, teremos:
• Ao final de junho: 100 x 1,1958 = R$119,58.
• Ao final de julho: 119,58 x 1,1958 = R$143,00 (que está
correto).
© U3 – Medidas Estatísticas de Posição 111

Dessa forma, sempre que a coleta ou a observação da variável


de interesse sugerir que os dados possuam um comportamento
de crescimento, especialmente ao longo do tempo, a Média
Geométrica será a melhor alternativa. Nas ciências administrativas
e econômicas, a Média Geométrica é muito utilizada para
representar a taxa média de investimentos financeiros e variações
de preço, bem como na composição de valores médios para
inflacionar e/ou deflacionar preços ou quantidades.
Outros exemplos de Cálculos das Médias
Vejamos, a seguir, mais alguns exemplos de aplicação das
médias.

EXEMPLO 1
Em uma determinada construtora, a principal equipe de pe-
dreiros foi avaliada em sua eficiência para futuros serviços. Nos
primeiros sete dias de avaliação, os pedreiros construíram 215m²
de parede. Nos 15 dias subsequentes, construíram 352m² de pa-
rede e, nos últimos 30 dias, 615m² de parede. Então, qual a média
diária de m² de parede da equipe de pedreiros?
Resolução:
Para calcular a média diária, basta somar a quantidade de
parede e dividir o resultado pela quantidade de dias, da seguinte
forma: n

∑i=1X 1 215 + 352 + 615 1182


= X = = = 22, 73
n 7 + 15 + 30 52
Portanto, os pedreiros conseguem construir 22,73m2 de pa-
rede por dia aproximadamente.

EXEMPLO 2
Os dados a seguir foram obtidos na medição do diâmetro
(X) de tubos de PVC utilizados em sistemas de saneamento de

Claretiano - Centro Universitário


112 © Probabilidade e Estatística

grande porte, ou seja, com uma grande vazão. Na especificação do


material, o tubo deve ter um diâmetro longitudinal igual a 12cm,
e aceita-se uma tolerância de 0,049cm, para mais ou para menos,
para não comprometer os possíveis encaixes entre as peças.

X 12,06 12,04 12,11 11,97 12,03 12,09 12,05 12,01 12,10 12,09
={
12,10 12,06 12,03 12,00 12,01 12,06 12,07 12,05 12,08 12,03

12,01 12,05 12,09 12,11 12,15 12,01 11,99 11,98 12,05 12,01 }

1) Com base nos dados, calcule o diâmetro médio das pe-


ças e analise se o lote de peças examinadas satisfaz a
tolerância recomendada.
2) Represente os dados brutos em uma tabela com quatro
intervalos de tamanho 0,05cm. Com base nessa tabela,
calcule o diâmetro médio das peças e analise se o lote
de peças examinadas satisfaz a tolerância recomendada.
3) Como podemos explicar as diferenças ocorridas entre as
duas médias e, consequentemente, entre as duas con-
clusões?
4) Qual o caminho mais correto para analisar o problema?
Por meio da Média Aritmética Simples (1) ou da Média
Aritmética Ponderada (2)?

Resolução do Item (1):


n

∑X 1
361, 49
=X =
i −1
= 12, 0497
n 30
Como a média está acima da tolerância fixada, o lote de pe-
ças não satisfaz a exigência.

Resolução do Item (2):


Construindo a tabela e calculando a Média Aritmética
Ponderada, temos:
© U3 – Medidas Estatísticas de Posição 113

Diâmetro fa fr%
11,97 |— 12,02 9 30,0
12,02 |— 12,07 11 36,7
12,07 |— 12,12 9 30,0
12,12 |— 12,17 1 3,3
Total 30 100,0

∑( X i ⋅ fi )
Xp = i =1
k

∑f
i =1
i

Xp =
(11,995 ⋅ 9 ) + (12, 045 ⋅11) + (12, 095 ⋅ 9 ) + (12,145 ⋅1)
9 + 11 + 9 + 1
361, 45
Xp
= = 12, 04833
30
Como a média ficou abaixo da tolerância fixada, o lote foi
aprovado, isto é, satisfez a tolerância.

Resolução do Item (3):


A diferença é causada pela alteração nos dados provocada
pela média ponderada. Notemos que, no Item (1), a Média Aritmé-
tica Simples utiliza os dados brutos obtidos na amostragem, sem
alterar nenhum valor. Já a Média Aritmética Ponderada (2), em
razão de os resultados terem sido expostos em uma tabela com
intervalos, não utiliza os dados reais, mas, sim, os pontos médios
de cada intervalo, como no último intervalo, em que o único valor
presente é o 12,15, mas, no cálculo, foi utilizado o valor 12,145
(ponto médio do último intervalo).

Resolução do Item (4):


Pelas observações do Item (3), é imediato afirmar que a mé-
dia mais correta é a Média Aritmética Simples, pois o resultado é

Claretiano - Centro Universitário


114 © Probabilidade e Estatística

o correto. Quando temos dados em forma de intervalos, a Média


Aritmética Ponderada, como já vimos, sempre vai resultar em va-
lores aproximados, nunca em reais.

EXEMPLO 3
Em estudos de Microeconomia relacionados com as teorias
do consumidor, é comum o relacionamento entre a demanda e a
oferta de um produto em função do preço de mercado dele. Em
um estudo envolvendo demanda e preços, foram coletadas, em
abril de 2006, informações sobre a quantidade vendida e o preço
de um dado produto em dez diferentes estabelecimentos repre-
sentativos de uma determinada cidade, obtendo-se os seguintes
dados:
• Demanda: {123; 145; 176; 165; 177; 143; 165; 188; 155;
142}.
• Preço: {12,33; 13,55; 12,66; 11,76; 10,99; 11,33; 12,98;
12,98; 11,90; 12,59}.
Os mesmos estabelecimentos foram visitados novamente,
em julho de 2006, obtendo-se os seguintes dados:
• Demanda: {112; 125; 146; 135; 161; 132; 154; 166; 145;
112}.
• Preço: {13,33; 13,85; 14,66; 12,76; 11,89; 12,13; 13,38;
14,18; 13,70; 14,89}.
1) Com base nos dados apresentados, calcule o preço e a
demanda média aritmética para cada um dos meses e
interprete os resultados.
2) Em uma situação em que a variação percentual de que-
da da demanda é maior que a variação percentual do
aumento dos preços, dizemos que o produto não é im-
portante economicamente; caso contrário, o produto é
importante. Com base nas médias obtidas no Item (1),
calcule as variações percentuais e verifique se o produto
pesquisado é ou não é economicamente importante.
© U3 – Medidas Estatísticas de Posição 115

Resolução do Item (1):


• Demanda média em abril/2006:
1579 , ou seja, demanda média
X Demanda/abril
= = 157,9
10
mensal de 157,9 unidades do produto.
123, 07
• Preço médio em abril/2006: X Preço/abril
= = 12,307 ,
10
ou seja, preço médio mensal de R$12,31.
• Demanda média em julho/2006:
1388
X Demanda/julho
= = 138,80 , ou seja, demanda média
10
mensal de 138,8 unidades do produto.
134, 77
• Preço médio em julho/2006: X Preço/abril
= = 13, 477,
ou seja, preço médio mensal de R$12,31. 10

Resolução do Item (2):


Para calcularmos a variação percentual de abril para julho,
subtraímos o valor de julho do valor de abril e dividimos o resulta-
do pelo valor de abril. Assim, temos:
• Variação % da demanda
138,80 − 157,9 −19,10
= = = −0,1209 , o que significa
157,9 157,90
que a demanda reduziu 12,09% de abril para julho.
13, 48 − 12,31 1,11
=
• Variação % do preço = = 0, 0902 , o
12,31 12,31
que significa que o preço aumentou 9,02% de abril para
julho.
Assim, como a redução da demanda foi maior que o aumento
de preço, o produto não é importante.

EXEMPLO 4
A fim de detectar relações entre consumo de água e produ-
ção de resíduos sólidos poluentes, um estudo foi montado com

Claretiano - Centro Universitário


116 © Probabilidade e Estatística

um grupo de 22 domicílios de uma grande cidade, observando-se


duas variáveis: o consumo de água em um mês em m3 (variável X1)
e o volume de resíduos sólidos poluentes extraídos do esgoto for-
mado pelo domicílio em m3 (variável X2). Os dados obtidos foram:
• Consumo de água: X1 = {14,2; 16,5; 10,1; 13,3; 15,1; 14,7;
11,9; 10,0; 11,8; 14,7; 15,9; 11,7; 14,8; 14,4; 11.7; 12,9;
13,6; 14,0; 15,7; 15,1; 12,2; 11,8}.
• Produção de resíduos: X2 = {5,2; 4,2; 3,7; 4,1; 6,2; 4,0; 3,6;
3,2; 4,1; 6,3; 6,8; 4,1; 5,3; 5,2; 3,1; 2,9; 3,7; 4,1; 5,2; 4,3;
4,2; 3,0}.
Com base nos dados anteriores:
1) Represente o consumo de água e a produção de resídu-
os pela média dos valores observados, interpretando o
significado de cada uma das médias.
2) Considerando as duas médias encontradas, qual a pro-
dução esperada de resíduos sólidos poluentes em um
domicílio com consumo de 13,7m3 de água?

Resolução do Item (1):


296,1
•= X 1 = 13, 46 , ou seja, cada domicílio apresenta
22
um consumo médio de 13,46m3 de água.
96,5
X2
• = = 4,39 , ou seja, cada domicílio apresenta uma
22
produção média de 4,39m3 de resíduos.

Resolução do Item (2):


Considerando as médias encontradas, podemos dizer que,
em média, os domicílios que consomem 13,46m3 de água produ-
zem 4,39m3 de resíduos. Então, por meio de uma regra de três,
podemos resolver a questão da seguinte forma:
© U3 – Medidas Estatísticas de Posição 117

13,46 —— 4,39

13,7 —— Y

13, 7 ⋅ 4,39 60,14


=Y = = 4, 47
13, 46 13, 46
Assim, espera-se que o domicílio produza 4,47m3 de resíduos.

EXEMPLO 5
Em um estudo de composição de custo de vida, um instituto
de pesquisas econômicas considerou uma cesta com dez produ-
tos, sendo quatro do gênero alimentação (arroz, feijão, macarrão e
batata), três do gênero higiene pessoal (sabonete, pasta de dente
e papel higiênico) e três do gênero limpeza (detergente, sabão em
pó e amaciante). De posse da cesta, foram efetuadas coletas de
preços em dois períodos diferentes, obtendo-se os dados referen-
tes à seguinte variação percentual do preço:

Produto Variação % do Preço


Arroz + 0,95%
Feijão + 0,78%
Macarrão - 0,09%
Batata + 0,55%
Sabonete + 2,55%
Pasta de dente + 3,67%
Papel Higiênico + 3,33%
Detergente - 0,15%
Sabão em pó - 0,02%
Amaciante + 0,22%

Com base nesses dados:


1) Suponhamos que o critério estabelecido pelo instituto
seja o seguinte: calcula-se a média aritmética da variação

Claretiano - Centro Universitário


118 © Probabilidade e Estatística

percentual do preço dentro de cada grupo, considerando


que cada produto tenha a mesma importância. De posse
da variação média de cada grupo, calcula-se a variação
média total, via média aritmética, considerando que
cada grupo tenha um peso diferente: alimentação com
peso 5, higiene pessoal com peso 3 e limpeza com peso
2. Qual será a variação de preço da cesta?
2) Podemos determinar a variação média da cesta por meio
da Média Geométrica? Se sim, calcule a variação média
por meio desse método.

Resolução do Item (1):


Variação percentual média dentro de cada grupo: como os
produtos possuem a mesma importância dentro do grupo, utiliza-
mos a Média Aritmética Simples.
• Grupo alimentação:
0,95 + 0, 78 + (−0, 09) + 0,55 2,19
X
= = = 0,5475 .
4 4
2,55 + 3, 67 + 3,33 9,55
X
• Grupo higiene:= = = 3,1833 .
3 3
( −0,15) + ( −0, 02 ) + 0,=
22 0, 05
• Grupo limpeza:=
X = 0, 0167 .
3 3
Variação percentual média na cesta de produtos: como cada
grupo possui um peso (importância) específico, utilizamos a Média
Aritmética Ponderada.
• Variação da cesta:
0,5475 ⋅ 5 + 3,1833 ⋅ 3 + 0, 0167 ⋅ 2 12,3208
=Xp = = 1, 23208
5+3+ 2 10
Assim, a variação média foi de, aproximadamente, 1,23%.

Resolução do Item (2):


Como os valores são percentuais, a média mais adequada
para calcular a variação é a Média Geométrica, mas, nesse caso,
© U3 – Medidas Estatísticas de Posição 119

temos um problema. Possuímos três valores negativos (-0,09,


-0,15 e -0,02) em um total de dez valores. Assim, ao calcularmos o
produto dos números, o resultado será negativo, e, como são dez
valores, teremos de extrair a raiz de ordem 10 de um valor negati-
vo, o que não é possível nos números Reais.
Além das médias, existem outras medidas de tendência cen-
tral de interesse, algumas pela questão prática, outras por ques-
tões de conceitos futuros. Dentre estas, estudaremos a Mediana
e a Moda.

Mediana
A Mediana, que denotaremos por Md, é definida como o va-
lor que ocupa a posição central dos dados ordenados. Pela sua de-
finição, notamos que, para calculá-la, é importante saber quantos
elementos temos no conjunto para determinar o seu centro. Além
disso, não podemos nos esquecer de ordenar os dados.
Exemplo 1
Quando a quantidade de elementos n for ímpar, para
determinarmos a Mediana, basta localizarmos o elemento da
posição Po = n + 1 .
2
Por exemplo, vamos determinar a Mediana do conjunto X =
{1, 4, 7, 10, 11, 20, 21}. Temos que a posição de interesse é:
n +1 7 +1 8
Po= = = = 4º posição
2 2 2
A Mediana é o valor que ocupa a 4ª posição; então, Md = 10.
Exemplo 2
Quando a quantidade de elementos n for par, para
determinarmos a Mediana, basta localizarmos os elementos das
n n
posições centrais Po1 = e Po2= + 1 e, depois, calcularmos
2 2
a Média Aritmética Simples dos valores que se encontram nas
posições centrais.

Claretiano - Centro Universitário


120 © Probabilidade e Estatística

Por exemplo, vamos determinar a Mediana do conjunto X =


{1, 4, 7, 11, 20, 21}. Temos que as posições centrais são:
n 6
Po1=
= = 3º posição
2 2
n 6
Po2 = + 1 = + 1 = 3 + 1 = 4º posição
2 2

A Mediana será a Média Aritmética Simples dos valores que


7 + 11 18
estão na 3ª e 4ª posições; então: Md
= = = 9.
2 2
Interpretando, a Mediana, por ser o valor central, deixa 50%
dos dados abaixo do valor e 50% acima. Assim, teremos 50% dos
números menores ou iguais a 9 e 50% dos números maiores ou
iguais a 9.

Exemplo 3
Uma boa qualidade da Mediana é que ela é uma medida que
não é afetada por valores extremos como é a média aritmética.
Seja o conjunto de dados X = {10, 20, 30, 40, 50}, podemos
observar que tanto a média aritmética quanto a Mediana são
iguais a 30. Entretanto, se alterarmos os dados para X = {10, 20,
30, 40, 5000}, qual será a média e qual será a Mediana?
Calculando a média, obteremos um valor igual a 1.020, que
aumentou muito devido ao aparecimento do valor extremo 5.000,
mas a Mediana continuará igual a 30.
Isso nos mostra que a Mediana é uma medida preferível
quando temos variáveis com valores extremos.
Além da Mediana, outra medida considerada de tendência
central é a Moda. Vamos conhecê-la?
© U3 – Medidas Estatísticas de Posição 121

Moda
A Moda, que denotaremos por Mo, é definida como o valor
que possui maior frequência, ou seja, o que aparece mais vezes no
conjunto de dados.
Vejamos um exemplo de aplicação dessa medida de
tendência central nos conjuntos a seguir:
• X = {2, 2, 3, 3, 3, 4, 4}. Então, Mo = 3, que é o valor que
mais vezes se repete.
• X = {3, 3, 4, 4, 4, 5, 5, 5, 6}. Nesse caso, temos dois valores
que mais se repetem; assim, Mo = 4 e Mo = 5. Esse caso é
chamado de "bimodal".
• X = {2, 4, 6, 7, 8}. Como todos os valores aparecem com
frequências iguais, todos aparecem apenas uma vez. En-
tão, podemos dizer que, nesse caso, não existe Moda,
sendo chamado de "amodal".
Você deve estar pensando: Quando posso utilizar a Moda?
A resposta para essa pergunta é que, raramente, a Moda será uti-
lizada isoladamente na prática, diferentemente das médias e da
Mediana. Contudo, ela tem um papel importante na interpretação
do conceito de simetria, que veremos mais adiante.
Antes de avançarmos, devemos chamar a atenção para um
importante detalhe: tanto a Mediana quanto a Moda são medidas
que podem ser calculadas com base em tabelas de frequências,
desde que não tenhamos as informações em intervalos. Nesse
caso, as medidas possuem uma imprecisão muito grande e não
apresentam bons resultados, como já pudemos comprovar.
Sem dúvida, dentre as medidas anteriores, as que mais pos-
suem aplicação prática são as médias aritméticas, mas elas depen-
dem muito da variabilidade dos dados. Para ilustrar essa situação,
vejamos, a seguir, uma relação interessante entre as medidas es-
tudadas até aqui.

Claretiano - Centro Universitário


122 © Probabilidade e Estatística

6. RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA


CENTRAL

Desta análise, excluiremos a Média Geométrica, pois sua


aplicação é voltada, de fato, para estudos financeiros e econômi-
cos. Em análises estatísticas, utilizamos mais as médias aritméti-
cas, que, a partir de agora, serão chamadas apenas de Média.
Entre as três medidas de tendência central – Média, Media-
na e Moda –, existe uma importante relação. Para ilustrá-la, tome-
mos o seguinte conjunto de números:
X = {1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5}

Calculando as três medidas, temos que:


n

∑X i
63
X
• Média: = i =1
= = 3.
n 21
n + 1 21 + 1 22
• Mediana: Po
= = = = 11ª posição , então
2 2 2
Md = 3.
• Moda: Mo = 3 (possui maior frequência igual a 7).
Representando os dados em um gráfico de colunas e apontan-
do os valores da Média, da Mediana e da Moda, teremos um gráfico
em formato simétrico, como podemos observar na Figura 1.
© U3 – Medidas Estatísticas de Posição 123

Gráfico Simétrico

8
Média Aritmética = Mediana = Moda = 3
7

5
Frequência

1 2 3 4 5
Valores de X

Figura 1 Visualização dos dados simétricos.

Você notou que as três medidas são iguais e que, quando


isso ocorre, o gráfico fica simétrico, ou seja, o que tem no lado
esquerdo da Média é exatamente igual ao que tem no seu lado
direito? Geometricamente, estamos falando de simetria, mas isso
quer dizer que, além do gráfico, a variável (os dados) também
é simétrica. Desse modo, dizemos que uma variável é simétrica
quando o valor da Média, o da Mediana e o da Moda forem
exatamente iguais, ou seja, = X Md= Mo .
Mas você deve estar pensando: Qual a importância prática
desse aspecto? O que ganhamos com a simetria?
Para responder a essa pergunta, devemos responder, antes,
a outra: Qual o papel de uma medida de tendência central? Se
voltarmos ao início desta unidade, veremos que o conceito de me-
dida de tendência central é possibilitar a representação de uma
variável quantitativa por meio de um valor apenas. Se pensarmos
um pouco, veremos que, em geral, utilizamos a Média para essa fi-
nalidade. Ainda, se relembrarmos as deficiências da Média, perce-
beremos que ela não funciona muito bem se os dados possuírem
muita variação ou valores extremos.

Claretiano - Centro Universitário


124 © Probabilidade e Estatística

Notemos que, quando temos simetria, a Média é igual à


Moda, ou seja, a Média é igual ao valor que mais vezes aparece.
Podemos dizer, então, que a Média representa bem os dados e
que isso favorece a ocorrência de uma variação menor.
A Média também é igual à Mediana, pois ela se localiza
exatamente no centro do conjunto, o que mostra que o conjunto
não possui valores extremos ou, então, possui valores extremos
nas duas extremidades, o que não prejudica a representatividade
da Média, uma vez que eles acabam se anulando. Assim, a Média
está no centro, e o conjunto, bem equilibrado.
A simetria é um dos comportamentos mais relevantes em se
tratando de análise de dados, pois possibilita um tratamento mais
adequado da informação e uma redução significativa do erro na
análise.

7. MEDIDAS SEPARATRIZES
Além das medidas de tendência central, cujo objetivo é
avaliar, de forma integral, a variável por meio de uma medida
local, temos um grupo de medidas cujo objetivo é estabelecer
uma relação de ordem na variável, com muita aplicação na
criação de cenários de classificação. Essas medidas são chamadas
de estatísticas de ordem, ou medidas separatrizes. Devido à
similaridade de procedimentos, discutiremos, neste material,
apenas as medidas de quartil.

Medidas de quartil
As medidas de quartil servem para dividir os dados ordenados
em quatro partes, equivalentes a 25%, 50% e 75% dos dados.
Vejamos o esquema representado na Figura 2.
© U3 – Medidas Estatísticas de Posição 125

Figura 2 Esquema de montagem dos quartis.

Nesse esquema, o primeiro quartil (Quartil 1, ou Q1) será o


valor que deixará, abaixo dele, 25% dos elementos da variável; o
segundo quartil (Quartil 2, ou Q2) será o valor que deixará, abaixo
dele, 50% dos elementos da variável; e o terceiro quartil (Quartil
3, ou Q3) será o valor que deixará, abaixo dele, 75% dos elementos
da distribuição.
Você reconhece o Quartil 2 de algum lugar? Se respondeu
que ele faz o mesmo que a Mediana, está com a razão! O Q2 e a
Mediana são iguais e calculados da mesma forma. Antes de indi-
carmos o processo de obtenção de cada quartil, devemos saber
que, semelhantemente à Mediana e à Moda, os quartis não de-
vem ser calculados para dados em intervalos, pois a imprecisão é
bem significativa.
Existem diversos caminhos para determinar os valores de
Q1, Q2 e Q3. Adotaremos o mais simples, que utiliza apenas o con-
ceito de Mediana, já discutido anteriormente.
Por esse processo, faremos o seguinte:
1) calcularemos o valor de Q2, que é, exatamente, a Me-
diana;
2) com o valor de Q2, subdividiremos os dados em duas
metades;
3) o valor de Q1 será a Mediana da primeira metade;
4) o valor de Q3 será a Mediana da segunda metade.
Vejamos, a seguir, um exemplo de aplicação dessa medida
separatriz.

Claretiano - Centro Universitário


126 © Probabilidade e Estatística

A empresa Talecoisa apresentou, no ano passado, uma


produção igual a 1,6 toneladas (t). Para fins de estratégias de
expansão, os dirigentes examinaram os dados de um grupo de
19 empresas do mesmo setor, com a finalidade de posicionar a
empresa no mercado em função da sua produção. Os dados das 19
empresas, já ordenados, são os seguintes:

0,22 0,52 0,63 0,69 0,75 0,89 0,95 1,15 1,25 1,35
1,45 1,49 1,52 1,58 2,33 2,65 2,78 3,02 3,15

Calculamos, inicialmente, o valor de Q2, que é, exatamente,


a Mediana:= n + 1 19 + 1 20 = 10ª posição ⇒ Q2 = 1,35t.
Po = =
2 2 2
Com base no valor de Q2, temos, agora, dois subconjuntos
com nove valores cada:
• Subconjunto 1: {0,22; 0,52; 0,63; 0,69; 0,75; 0,89; 0,95;
1,15; 1,25}. Calculamos Q1 como a Mediana desse
n + 1 9 + 1 10
subconjunto da seguinte forma: = Po = = =
2 2 2
5ª posição ⇒ Q1 = 0,75t.
• Subconjunto 2: {1,45; 1,49; 1,52; 1,58; 2,33; 2,65; 2,78;
3,02; 3,15}. Calculamos Q3 como a Mediana desse
n + 1 9 + 1 10
subconjunto da seguinte forma: = Po = =
2 2 2
= 5ª posição ⇒ Q3 = 2,33t.
Vejamos, na Figura 3, o esquema elaborado com os resultados
obtidos.

Figura 3 Esquema dos quartis dos resultados obtidos.


© U3 – Medidas Estatísticas de Posição 127

Interpretando o esquema da Figura 3, dizemos que 25% das


empresas possuem produção limitada a 0,75t, 50% das empresas
possuem produção limitada a 1,35t e 75% das empresas possuem
produção limitada a 2,33t, ou, ainda, que as 25% maiores empre-
sas possuem produção de, no mínimo, 2,33t.
Posicionando, então, a empresa Talecoisa, que teve uma
produção de 1,6t, notamos que ela está entre os valores de Q2 e
Q3, e, assim, pelo menos 50% das empresas do mercado possuem
produção menor que a Talecoisa, ou, ainda, podemos dizer que
ela se posiciona entre as 50% maiores em relação à produção, pois
está acima de Q2.
Assim, sempre que o interesse for estabelecer uma análise
de classificação ou de ordenação, as estatísticas de ordem são bem
úteis, até mais que as medidas de tendência central, que possuem
outras finalidades.

Para compreender melhor as medidas de quartil, sugerimos que


você resolva a quarta questão autoavaliativa ao final desta uni-
dade.

8. TRABALHANDO EM SALA DE AULA


Uma forma interessante de trabalhar os conceitos de
medidas em sala de aula é mesclar a operacionalização dos
cálculos, utilizando os conhecimentos algébricos dos alunos, com
a interpretação prática.
É importante que você, como professor, se preocupe com
a interpretação dos resultados, pois, assim, ficará mais fácil a
compreensão da aplicabilidade das ferramentas.
Você deve ter notado que trabalhamos com diversas
fórmulas e operações, as quais, às vezes, são difíceis de serem
representadas digitalmente. Para os usuários do Word 2003, 2007

Claretiano - Centro Universitário


128 © Probabilidade e Estatística

e 2010, apresentaremos um resumo de como editar uma fórmula


ou expressão matemática. Nossa pretensão é apresentar apenas
a ferramenta, pois não é possível um tutorial completo. Por isso,
indicamos, no início desta unidade, no Tópico Orientações para o
estudo da unidade, uma fonte disponível na internet que poderá
complementar nossa síntese.

Inserindo fórmulas no Word versão 2003


No Word versão 2003, no menu Inserir, escolha a opção Ob-
jetos/Criar novo. Você verá uma tela (Figura 4) com as possibilida-
des de inserção. Procure a opção Microsoft Equation 3.0.

Figura 4 Possibilidades de inserção de fórmulas no Word 2003.

Outro modo de inserção de fórmulas no Word 2003 é pro-


curar, na barra de ferramentas (ícones), o símbolo do editor de
fórmulas (Figura 5), que é a letra α, em azul, dentro de uma raiz
quadrada em vermelho.

Figura 5 Símbolo do editor de fórmulas do Word 2003.


© U3 – Medidas Estatísticas de Posição 129

Ao acessar o editor de fórmulas (por qualquer um dos cami-


nhos descritos), você notará que uma nova janela se abrirá, com
dezenas de opções de símbolos e operadores matemáticos (Figura
6).

Figura 6 Símbolos e operadores matemáticos do Word 2003.

Além disso, repare que uma caixa de texto será aberta na


página do Word, como na Figura 7, em que será construída a
equação.

Figura 7 Caixa de texto do Word 2003.

Vejamos, a seguir, um exemplo.


Para escrever uma fração do tipo A , basta seguir estes passos:
B
1) Na barra de ferramentas de equação (Figura 8), selecio-
ne a opção Fração.

Figura 8 Equação/fração (Word 2003).

Claretiano - Centro Universitário


130 © Probabilidade e Estatística

2) Uma estrutura de fração surgirá na caixa de texto (Figura


9), e você deverá clicar no campo do numerador e digitar
A, e, em seguida, clicar no campo no denominador e di-
gitar B. Montada a fração, clique em algum local fora da
caixa de texto, e a fração A aparecerá.
B

Figura 9 Caixa de texto/fração (Word 2003).

Inserindo fórmulas no Word versão 2007 e versão 2010


Para digitar fórmulas no Word 2007 e 2010, você deverá
acessar o menu Inserir e selecionar a opção Equação, clicando
sobre a letra π (Figura 10).

Figura 10 Equação/letra π no Word 2007 e 2010.


Ao selecionar a opção Equação, uma nova barra de
ferramentas será aberta: a barra de Ferramentas de Equação
(design). Você verá que, na página do Word, será disponibilizada
uma caixa de texto (Figura 11), contendo a descrição Digite a
equação aqui. Tudo o que você selecionar na barra de Ferramentas
de Equação será inserido na caixa de texto.

Figura 11 Caixa de texto/Digite a equação aqui (Word 2007 e 2010).


© U3 – Medidas Estatísticas de Posição 131

Vejamos, a seguir, um exemplo.


Para escrever uma fração do tipo A , basta seguir estes
passos: B
1) Na barra de Ferramentas de Equação, selecione a opção
Fração (Figura 12).

Figura 12 Fração (Word 2007 e 2010).

2) Uma tela surgirá com as opções de frações (Figura 13)


que você poderá utilizar. No caso em questão, selecione
a primeira opção.

Figura 13 Opções de frações (Word 2007 e 2010).

3) A estrutura de uma fração surgirá na caixa de texto (Fi-


gura 14), com um campo para a digitação do numerador
e um campo para a digitação do denominador.

Figura 14 Fração na caixa de texto (Word 2007 e 2010).

Claretiano - Centro Universitário


132 © Probabilidade e Estatística

4) Agora, basta clicar no campo do numerador e digitar A e,


em seguida, clicar no campo do denominador e digitar B.
Montada a fração, clique em algum local fora da caixa de
texto, e a fração A aparecerá.
B
É claro que a Ferramenta de Equação possui muitas
possibilidades, como expoentes, operadores do tipo somatórios,
notações de derivadas e integrais, matrizes, símbolos matemáticos
e várias formas de edição. Nossa intenção foi apenas apresentá-la,
cabendo a você explorar suas potencialidades.

9. QUESTÕES AUTOAVALIATIVAS
Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) A Média de um conjunto numérico pode ser igual a zero? Pode ser um
número negativo? Explique.

2) Um determinado sindicato de classes, interessado em conhecer a média


salarial de seus afiliados, estudou um conjunto de funcionários de três
diferentes empresas, A, B e C. Na empresa A, estudou 20 empregados,
obtendo um total de salários pagos de R$21.050,32; na empresa B, estudou
25 empregados, registrando um total de salários pagos de R$22.045,00; e,
na empresa C, estudou 33 empregados, obtendo um total de salários pagos
de R$40.050,00. Com base nessas informações, calcule a média salarial para
o conjunto total das três empresas e interprete o valor obtido.

3) Uma empresa, interessada em avaliar a qualidade de seu produto, elaborou


uma pesquisa com consumidores finais para avaliar a importância relativa
(peso) de quatro diferentes atributos do produto (durabilidade, confiabilidade,
prazo de entrega e qualidade do pós-venda), que, conjuntamente, refletem
a qualidade desse produto. Em paralelo, a empresa solicitou a um grupo
de representantes de vendas que dessem uma nota, de zero a 100, para a
qualidade de cada um dos atributos. Ao final do processo, os dados obtidos
foram:
a) Durabilidade à nota 65 com peso igual a 25.
b) Confiabilidade à nota 70 com peso igual a 30.
c) Prazo de entrega à nota 80 com peso igual a 15.
d) Qualidade do pós-venda à nota 50 com peso igual a 30.
Se a empresa esperava uma nota mínima de 65 pontos para seu produto, com
base nos dados coletados, determine a nota média do produto e verifique
se a expectativa da empresa foi confirmada ou não. Justifique sua resposta
objetivamente.
© U3 – Medidas Estatísticas de Posição 133

4) Um investidor está interessado em investir seu capital em uma rede de lojas


de cosméticos de uma franquia A, por acreditar que o tempo de retorno
do investimento está compatível com seus objetivos, que são de começar a
lucrar sobre o capital investido próximo de dois anos após o início. Suponha
que os dados a seguir representem o tempo de retorno em meses (X) de
20 diferentes lojas da mesma franquia espalhadas por diversas cidades
brasileiras, com público consumidor similar ao da cidade do investidor:
X = {32, 28, 21, 19, 28, 24, 23, 30, 23, 31, 25, 24, 27, 22, 24, 25, 21, 29, 24, 20}
Calcule qual o tempo de retorno do investimento nesse tipo de franquia e
interprete o resultado obtido, utilizando:
a) O tempo médio.
b) O tempo mediano.
c) O tempo modal.
d) Qual das três medidas é mais adequada para avaliar o interesse do
investidor?
e) Os dados são simétricos ou assimétricos? Explique.

Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) Sim, pode ser zero, bastando que a soma dos números seja igual a zero. Sim,
pode ser negativa, bastando que a soma dos números seja negativa. Como
exemplo, considere o saldo bancário (X) de três pessoas:
Caso 1: X = {100,00; -80,00; -20,00}. Nesse caso, o saldo médio será igual a
zero.
Caso 2: X = {100,00; -180,00; -20,00}. Nesse caso, o saldo médio será igual a
-100,00.

2) A Média será igual a R$1.065,97.

3) A pontuação média será igual a 64,25, não atingindo a nota mínima.

4)
a) O tempo médio será igual a 25 meses. Assim, cada loja apresentou
um tempo de retorno do investimento igual a 25 meses em média.
b) Ordenando os dados, veremos que Md = 24 meses. Assim, 50% das
lojas apresentou um tempo de retorno menor ou igual a 24 meses,
e 50% das lojas, um tempo maior ou igual a 24 meses.
c) Verificando a repetição dos números, temos que Mo = 24 meses.
Assim, a maior parte das lojas registrou um tempo de retorno de
24 meses.
d) Como os dados não apresentam uma variação muito elevada e
também não possuem um valor extremo, a melhor medida é a

Claretiano - Centro Universitário


134 © Probabilidade e Estatística

média aritmética, que está próxima do esperado pelo investidor.


Assim, a franquia deve ser adquirida.
e) Os dados não são simétricos, pois, apesar de a Mediana ser igual à
Moda, a Média não é exatamente igual às demais.

10. CONSIDERAÇÕES
Podemos dizer que, dentre as medidas discutidas nesta uni-
dade, a média aritmética (simples ou ponderada) é a mais utiliza-
da, devido às suas propriedades matemáticas e à sua facilidade de
cálculo.
Contudo, há duas considerações importantes a serem feitas.
A primeira é que, como a Média provoca uma alteração nos da-
dos, "substituindo-os" pela Média calculada, ela tende a ignorar a
variabilidade natural dos dados. A segunda é que diferentes con-
juntos numéricos podem possuir a mesma Média. Nesses casos,
é importante conhecer a dispersão, ou variabilidade, dos valores
para uma análise mais correta da Média, utilizando, para isso, as
medidas de dispersão, que estudaremos na próxima unidade.
Hoje, podemos utilizar calculadoras científicas e planilhas
eletrônicas para o cálculo de algumas medidas estatísticas. Isso
também será discutido na próxima unidade.
Vamos lá?

11. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.

12. REFERÊNCIAS BIBLIOGRÁFICAS


BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
FREUND, J. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto
Alegre: Bookman, 2007.
© U3 – Medidas Estatísticas de Posição 135

LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004.
MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson,
2009.
NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson
Prentice Hall, 2003.
SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo:
Atlas, 2002.
SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e
estatística. 2. ed. Porto Alegre: Bookman, 2004.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São
Paulo: Pearson, 2008.

Claretiano - Centro Universitário


Claretiano - Centro Universitário
EAD
Medidas Estatísticas de
Dispersão

4
1. OBJETIVOS
• Classificar as principais medidas de dispersão.
• Aplicar e interpretar as medidas de dispersão.
• Relacionar as medidas de dispersão.
• Aplicar os cálculos das medidas estatísticas em calculado-
ras científicas e na planilha do Excel.

2. CONTEÚDOS
• Variância Amostral e Desvio Padrão Amostral.
• Coeficiente de Variação.
• Índice de Assimetria.
138 © Probabilidade e Estatística

3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE


Antes de iniciar o estudo desta unidade, é importante que
você leia as orientações a seguir:
1) Nesta unidade, estudaremos as medidas de dispersão,
ou medidas de variabilidade, que podem gerar processos
de cálculos um tanto quanto demorados e exaustivos.
Por isso, é importante que você tenha concentração
e perseverança nos seus cálculos e que se dedique
verdadeiramente a este estudo.
2) Para o estudo desta unidade, é interessante você utilizar
uma calculadora que contenha funções estatísticas
para facilitar alguns dos cálculos que veremos.
Apresentaremos, ao final desta unidade, algumas
alternativas quanto a calculadoras das quais você poderá
se servir.

4. INTRODUÇÃO À UNIDADE
As medidas de dispersão também são conhecidas como
"medidas de variabilidade". O grau de diferença existente entre
os dados de uma variável quantitativa, ou seja, o quanto os dados
numéricos tendem a dispersar-se em torno da média aritmética,
são chamados de "variação", ou "dispersão", de dados.
Essa análise é importante para avaliarmos o quanto que a
média aritmética possui de capacidade para representar os dados
de uma variável. Apenas para ilustrar, vejamos o exemplo a seguir.
• Seja um grupo de funcionários com os seguintes salários em
reais: X = {1260,00; 1275,00; 1265,00; 1260,00; 1270,00}.
Calculando o salário médio desse grupo, teremos:
n

i ∑X
6330
=X
= = 1266, 00
i =1

n 5
• Seja um segundo conjunto de funcionários, com os se-
guintes salários: X = {1535,00; 1000,00; 1755,00; 1100,00;
© U4 – Medidas Estatísticas de Dispersão 139

940,00}. Calculando o salário médio desse conjunto, tere-


mos: n

∑ Xi
6330
= X = = 1266, 00
i =1

n 5
Como podemos notar, os dois conjuntos de funcionários re-
sultaram na mesma Média, mas os funcionários do primeiro grupo
apresentaram salários mais próximos da Média (um desvio menor
em relação à Média), enquanto os funcionários do segundo grupo
apresentaram salários mais distantes da Média (um desvio maior
em relação à Média).
Por isso, é importante que a aplicação tanto da Média Arit-
mética Simples quanto da Média Aritmética Ponderada seja acom-
panhada de alguma medida que indique de quanto é a variação
dos dados.

5. MEDIDAS DE DISPERSÃO
Como vimos no exemplo anterior, o cálculo da média arit-
mética não consegue diferenciar o grau de variação (de desvio)
dos dados, uma vez que considera os dados homogêneos, ou seja,
para a Média, os dados são iguais. Vejamos o esquema da Figura 1.

Figura 1 A Média considera que todos os valores são iguais.

Para explicar melhor o esquema da Figura 1, pegamos, como


exemplo, um conjunto X = {2, 6, 12, 20} e calculamos a sua Média.

Claretiano - Centro Universitário


140 © Probabilidade e Estatística

∑X i
2 + 6 + 12 + 20 40
X
= i =1
= = = 10
n 4 4
A Média transforma os dados; cada valor passa a ser exa-
tamente igual à Média, ou seja, o conjunto X pode ser inter-
pretado como um novo conjunto de dados transformados:
X T = {10,10,10,10} .
Sendo assim, é importante questionar o seguinte: Os dados
observados (reais e verdadeiros) são próximos o suficiente da Mé-
dia para validarem a aproximação, ou, então, os desvios dos valo-
res em relação à Média são baixos?
Isso vem ao encontro das análises feitas na Unidade 3, em
que dissemos que a Média funciona melhor quando os dados pos-
suem pouca variação, ou seja, pouca diferença entre si. Se isso
ocorre, certamente, a aproximação será adequada.
Para responder a essas perguntas, devemos calcular o grau
de variação dos dados, que é o mesmo que avaliar a distância de
cada valor em relação à Média, o que chamaremos de "desvio".
Mas como poderemos medir esse desvio? Se você respondeu que
devemos subtrair cada valor X da Média X , está com a razão!
Para mensurar a variabilidade existente nos dados, teremos
de subtrair cada um dos valores X observados na Média, ou seja,
( X − X ) . Como temos vários valores, ao final das subtrações, vamos
somar essas diferenças da seguinte forma:
n

∑( X
i −1
i −X)

Porém, como vimos nas propriedades da média aritmética,


tal somatório resulta em zero. Vamos verificar numericamente a
propriedade, utilizando o conjunto X = {2, 6, 12, 20}.
© U4 – Medidas Estatísticas de Dispersão 141

∑( X
i =1
i − X ) =(2 − 10) + (6 − 10) + (12 − 10) + (20 − 10) =

= ( −8 ) + ( −4 ) + 2 + 10
( 12 ) + 12 =0
=−

Como podemos notar, o cálculo resultou em zero. Você se


lembra do que significa o resultado zero em uma subtração? Ele
quer dizer que as coisas são iguais. Assim, o cálculo está dizendo
que os dois conjuntos de dados, X e X T , são iguais.
Estranho, não é? Se eles são diferentes, por que o cálculo
aponta que são iguais?
Isso ocorre devido à centralidade da média aritmética. Po-
demos utilizar qualquer conjunto e fazer o mesmo cálculo que o
resultado sempre será igual a zero. Assim, para evitar que dê zero,
devemos considerar os desvios elevados ao quadrado. Mas por
que ao quadrado? Lembre-se sempre de que, elevando um valor
negativo ao quadrado, o resultado será sempre positivo. Desse
modo, ao somarmos os desvios ao quadrado, não encontraremos
valores negativos, pois a soma não será igual a zero.
Para calcularmos o desvio ao quadrado, utilizaremos o
conjunto X = {2, 6, 12, 20} e a seguinte fórmula:
n

∑( X −X)
2
i
i −1
n

∑( X −X) =
2
i (2 − 10) 2 + (6 − 10) 2 + (12 − 10) 2 + (20 − 10) 2 =
i =1

= (−8) 2 + (−4) 2 + 22 + 102 = 64 + 16 + 4 + 100 = 184

Veja que o uso do quadrado dos desvios funcionou de fato,


pois o resultado não deu zero, o que significa que existe diferença
entre os elementos ou existe diferença entre os elementos e a
Média.

Claretiano - Centro Universitário


142 © Probabilidade e Estatística

Com base nessa soma de quadrados, foram desenvolvidas


algumas medidas de dispersão. Uma delas é a Variância Amostral,
a qual estudaremos a seguir.

Variância Amostral
A Variância Amostral, que denotaremos por VAR(X), é
definida como a Média dos desvios ao quadrado e é calculada da
seguinte forma:
n

∑( X −X)
2
i
VAR ( X ) = i =1

n −1

Como podemos observar, o cálculo dessa diferença média


usa uma divisão por (n-1), e não por n, devido ao fato de termos
dados amostrais. Quando o cálculo envolve todos os elementos da
população, a divisão passa a ser feita por n, mas, neste Caderno de
Referência de Conteúdo, trabalharemos com amostras e, portanto,
sempre faremos a divisão por (n-1).
Utilizando o resultado do cálculo anterior, no qual o valor da
soma das diferenças ao quadrado foi 184, temos:
n

∑( X −X)
2
i
184 184
VAR (=
X) i =1
= = = 61,3
n −1 4 −1 3

Pela fórmula da Variância Amostral, que utiliza os quadrados,


a diferença média entre os valores do conjunto X é de 61,3
unidades. Se compararmos os valores entre si, veremos que a
maior diferença que existe é entre o valor 2 e o valor 20, que é uma
diferença de 18 unidades. Assim, podemos afirmar que o valor
fornecido pela Variância Amostral exagera a variação verdadeira.
Para corrigir essa deficiência da variância, foi desenvolvida
uma segunda medida de dispersão: o Desvio Padrão Amostral.
© U4 – Medidas Estatísticas de Dispersão 143

Desvio Padrão Amostral


O Desvio Padrão Amostral, que denotaremos por S, é
definido como a raiz quadrada da Média dos desvios ao quadrado,
ou, simplesmente, a raiz quadrada da variância, sendo calculado
da seguinte forma:
n

∑( X −X)
2
i
S= i =1

n −1
Demonstraremos o cálculo do Desvio Padrão Amostral
utilizando os mesmos dados dos exemplos anteriores. Vejamos,
então, o cálculo a seguir.
n

∑( X −X)
2
i
184 184
=S i =1
= = = 61,3 7,8
=
n −1 4 −1 3

Como podemos notar, o valor do desvio padrão é mais


correto para dimensionar o grau de variabilidade dos dados e, por
isso, é a medida de dispersão mais utilizada na prática, com muitas
aplicações nas mais diversas áreas.
Antes de discutirmos algumas aplicações da Média em
conjunto com o desvio padrão, vejamos alguns exemplos para
praticar essa fórmula de cálculo.
Para cada um dos conjuntos a seguir, calcularemos a Média
e o Desvio Padrão Amostral:
• Conjunto 1: X = {2, 2, 4, 6, 7, 15}

Claretiano - Centro Universitário


144 © Probabilidade e Estatística

n
2 + 2 + 4 + 6 + 7 + 15 36
X
= ∑ X=
i =1
i
6
= = 6
6
n

∑(X − X )2 i
=S =
i =1

n −1
( 2 − 6 ) + ( 2 − 6 ) + ( 4 − 6 ) + ( 6 − 6 ) + (15 − 6 )
2 2 2 2 2

=
6 −1
( −4 ) + ( −4 ) + ( −2 ) + ( 0 ) + (1) + ( 9 )
2 2 2 2 2 2

=
5
16 + 16 + 4 + 0 + 1 + 81
=
5
118
= 23, 6 4,86
=
5

• Os valores valem, em média, 6 unidades, com uma varia-


ção média entre eles de 4,86 unidades.
• Conjunto 2: X = {1,5; 2,5; 3,7; 1,1}
n
1,5 + 2,5 + 3, 7 + 1,1 8,8
X
= ∑=
X
i =1
i
4
= = 2, 2
4
n

∑( X )
2
−X i
=S =
i =1

n −1
(1,5 − 2, 2) 2 + ( 2,5 − 2, 2 ) + ( 3, 7 − 2, 2 ) + (1,1 − 2, 2 )
2 2 2

=
4 −1
(−0, 7) 2 + ( 0,3) + (1,5 ) + ( −1,1)
2 2 2

=
3
0, 49 + 0, 09 + 2, 25 + 1, 21
=
3
4, 04
= 1,35 1,16
=
3
© U4 – Medidas Estatísticas de Dispersão 145

• Os valores obtidos valem, em média, 2,2 unidades, com


uma variação média entre eles de 1,16 unidades.
Após estudarmos as medidas de dispersão Variância Amos-
tral e Desvio Padrão Amostral, veremos, no tópico a seguir, as apli-
cações do desvio padrão.

6. APLICAÇÕES DO DESVIO PADRÃO


O desvio padrão e, de certa forma, a variância, não pos-
suem uma aplicação isolada; ao contrário, eles têm sua aplicação
relacionada com a Média e, como veremos na próxima unidade,
com medidas de probabilidade e inferências. Por enquanto, estu-
daremos somente duas importantes aplicações do desvio padrão
juntamente com a Média: o Coeficiente de Variação e o Índice de
Assimetria.

Coeficiente de Variação (CV)


O Coeficiente de Variação de Pearson, que denotaremos
por CV, é uma medida de variabilidade relativa que possui duas
aplicações:
• A primeira é que ele permite a comparação da variabili-
dade entre dois ou mais conjuntos e/ou variáveis, mesmo
que sejam de naturezas diferentes.
• A segunda é que ele permite uma análise isolada da re-
presentatividade da Média, pois, dependendo do valor
do CV, o grau de variabilidade será alto o suficiente para
prejudicar a análise da Média.
O Coeficiente de Variação é calculado da seguinte forma:
S
CV =
X
Como o Coeficiente de Variação se trata de uma medida rela-
tiva, seu resultado pode ser dado em porcentagem, bastando mul-
tiplicar esse resultado por 100. Segundo Martins (2002), valores de

Claretiano - Centro Universitário


146 © Probabilidade e Estatística

CV acima de 30% podem ser interpretados como sendo muito altos,


e, assim, a Média tem sua representatividade comprometida.
Vejamos um exemplo: no estudo da produtividade de dois
funcionários, uma empresa avaliou o número de peças que cada
um conseguia montar em um determinado período de tempo, re-
petindo esse processo durante cinco dias de trabalho. Os conjun-
tos de dados a seguir representam o número de peças (X) monta-
das por cada um por dia:
• Funcionário 1: X = {10, 12, 15, 11, 14}
• Funcionário 2: X = {12, 11, 15, 16, 19}
O interesse da empresa é verificar qual dos dois possui pro-
dutividade mais irregular (com mais variação). Qual será o funcio-
nário escolhido?
Para responder a essa questão, teremos de calcular o CV de
cada funcionário, o que significa que teremos de calcular, também,
a Média e o desvio padrão do número de peças montadas. Vamos
aos cálculos do Funcionário 1?
n
10 + 12 + 15 + 11 + 14 62
X ∑ X=
= i = = 12, 4
i =1 5 5
O número de peças por dia é de 12,4 em média.
n

∑( X −X)
2
i
S =
i =1

n −1
(10 − 12, 4) 2 + (12 − 12, 4) 2 + (15 − 12, 4) 2 + (11 − 12, 4) 2 + (14 − 12, 4) 2
5 −1
(−2, 4) 2 + (−0, 4) 2 + (2, 6) 2 + ( −1, 4) 2 + (1, 6) 2
=
4
5, 76 + 0,16 + 6, 76 + 1,96 + 2,56
=
4
17, 2
= 4,3 2, 07
=
4
© U4 – Medidas Estatísticas de Dispersão 147

A variação média diária na produção das peças é de 2,07.


S 2, 07
CV= = = 0,1669
X 12, 4
Portanto, o grau de variação na produção do Funcionário 1
é de 16,69%.
Façamos, agora, os mesmos cálculos para o Funcionário 2.
n
12 + 11 + 15 + 16 + 19 73
X
= ∑ X=
i =1
i
5
= = 14, 6
5
O Funcionário 2 produz 14,6 peças por dia em média.
n

∑(X − X )2
1
=S =
i =1

n −1
(12 − 14, 6) 2 + (11 − 14, 6) 2 + (15 − 14, 6 ) + (16 − 14, 6 ) + (19 − 14, 6 )
2 2 2

=
5 −1
( −2, 6 ) + ( −3, 6 ) + ( 0, 4 ) + (1, 4 ) + ( 4, 4 )
2 2 2 2 2

=
4
6, 76 + 12,96+, 016 + 1,96 + 19,36
=
4
41, 2
= 10,3 3, 21
=
4

A variação média diária na produção das peças é de 3,21.


S 3, 21
CV
= = = 0, 2198
X 14, 6

Assim, o grau de variação na produção do Funcionário 2 é de


21,98%.
Dessa forma, com base nos cálculos realizados, concluímos
que o Funcionário 2 possui uma produção mais irregular, pois seu
Coeficiente de Variação é mais alto.

Claretiano - Centro Universitário


148 © Probabilidade e Estatística

Após acompanhar os cálculos do Coeficiente de Variação dos


dois funcionários do exemplo anterior, resolva as questões
autoavaliativas 2 e 3 disponíveis ao final desta unidade para
aprofundar os conhecimentos adquiridos.

Assim como a média aritmética, o desvio padrão e o


Coeficiente de Variação possuem propriedades matemáticas
interessantes. Vejamos, a seguir, duas dessas propriedades.
Propriedade 1
Se somarmos uma mesma constante W a todos os elementos
de uma variável X, o desvio padrão não se alterará, e o Coeficiente
de Variação será menor caso a constante seja maior que zero.
Para verificarmos a ocorrência da Propriedade 1, devemos
nos lembrar de que a Média da variável fica somada à constante
(conforme demonstrado na Unidade 3), ou seja, X= X + W .
Assim, temos:

∑( X )
2
i + X
=S =
i =1

n −1
n

∑ ( X i (
+W ) − X +W 
 )
i =1
=
n −1
n

∑( X 1 +W − X −W )
i =1
=
n −1
n

∑( X )
2
1 +X
i =1
=S
n −1
Como vemos, somando W, o desvio padrão não se altera.
Agora, analisando o Coeficiente de Variação, teremos:
© U4 – Medidas Estatísticas de Dispersão 149

S S
CV
= =
X X +W
Assim, se W for maior que zero, o CV será menor; logo, a
propriedade será verdadeira.
Propriedade 2
Ao multiplicarmos todos os elementos de uma variável X por
uma mesma constante W, o desvio padrão ficará multiplicado por
W e o coeficiente de variação não se alterará.
Na Propriedade 2, devemos nos lembrar de que a Média da
variável fica multiplicada pela constante (como demonstrado na
Unidade 3), ou seja, X= X ⋅ W . Assim, temos:
n

∑( X )
2
+X i
=S =
i =1

n −1
n

( )
2
∑ ( X i ⋅W ) − X ⋅W 

i =1
=
n −1
n

∑ W ⋅ ( X )
2
−X 
i 
i =1
=
n −1
n n

∑W ⋅ ( X ) ∑( X )
2 2
2
i −X i −X
2 i 1
=i 1 =
= W ⋅
n −1 n −1
n

∑( X )
2
i − X
W2 ⋅ i =1
=
n −1
n

∑( X )
2
i −X
W⋅ i =1
W ⋅S
=
n −1

Claretiano - Centro Universitário


150 © Probabilidade e Estatística

Como vemos, o desvio padrão também ficou multiplicado


pela constante.
Analisando o Coeficiente de Variação, temos:
S S ⋅W S
CV
= = =
X X ⋅W X
Portanto, o CV não se altera.
Vale ressaltar que a aplicação conjunta da Média e do desvio
padrão pode apresentar resultados melhores que os da utilização
individual dessas medidas. No entanto, mesmo sendo essa aplica-
ção conjunta eficiente na medição da variação relativa, é impor-
tante, na avaliação da distorção da distribuição dos dados, que a
análise seja feita, também, por meio do Índice de Assimetria, que
estudaremos agora.

Índice de Assimetria (IA)


O Índice de Assimetria serve para avaliar o grau de assime-
tria dos dados, e, como já discutimos na unidade anterior, a ocor-
rência de simetria favorece a análise pela Média e também é útil
na composição das medidas de inferência estatística. Dessa for-
ma, quanto mais assimétricos forem os dados, mais ineficiente é a
Média, e, ainda, quando temos dados simétricos, a ocorrência da
variação é menor.
O Índice de Assimetria é calculado da seguinte forma:

3 ⋅ ( X − Md )
IA =
S
Você se lembra de que a simetria ocorre quando a Média é
igual à Mediana e à Moda? Pois bem. Se os dados forem simétri-
cos, então X = Md , e dá para perceber que IA será igual a zero.
Assim, quanto mais o valor de IA se afastar de zero, maior será a
assimetria dos dados, lembrando que IA pode ser positivo ou ne-
gativo, dependendo dos valores da Média e da Mediana.
© U4 – Medidas Estatísticas de Dispersão 151

Vejamos um exemplo: dois setores produtivos, indústrias


metalúrgicas e indústrias alimentícias, foram pesquisados segun-
do a sua produção mensal em toneladas de produtos. A finalidade
do estudo é avaliar em qual setor a produção mensal se mantém
mais concentrada em torno da produção média e em qual existe
mais ocorrências de meses de picos de produção. Para a análise,
foram considerados seis meses de produção (X), com os seguintes
dados (em toneladas):
• Setor metalúrgico: X = {10,4; 11,5; 12,4; 10,5; 11,7; 11,9}
• Setor alimentício: X = {5,4; 6,7; 9,1; 5,7; 4,6; 5,2}
Que análise podemos fazer, considerando o interesse do es-
tudo?
Para resolvermos essa questão, devemos avaliar o grau de
assimetria dos dados. Assim, calcularemos a Média, a Mediana e
o desvio padrão, como nos exemplos dados anteriormente, pois, a
partir de agora, trataremos com mais detalhes os cálculos do Índi-
ce de Assimetria.
Para o setor metalúrgico:
n
68, 4
X
= ∑=
X
i =1
i = 11, 4
6
Md = 11,6 (lembre-se de ordenar os dados).

∑( X −X)
2
i
3,16 3,16
=S i =1
= = = 0,
= 632 0, 795
n −1 6 −1 5

Então:

3 ⋅ ( X − Md ) 3 ⋅ (11, 4 − 11, 6) 3 ⋅ (−0, 2) −0, 6


IA = = = = = −0, 755
S 0, 795 0, 795 0, 795

Claretiano - Centro Universitário


152 © Probabilidade e Estatística

Para o setor alimentício:


n
36, 7
= X ∑= X i = 6,12
i =1 6
Md = 5,55 (lembre-se de ordenar os dados).
n

∑( X −X)
2
i
13, 068 13, 068
=S i =1
= = = = 2, 614 1, 617
n −1 6 −1 5

Então:
3 ⋅ ( X − Md ) 3 ⋅ (6,12 − 5,55) 3 ⋅ (0,57) 1, 71
IA
= = = = = 1, 057
S 1, 617 1, 617 1, 617
Por meio dos cálculos realizados, podemos concluir que o Ín-
dice de Assimetria do setor metalúrgico é menor (ignore o sinal de
negativo para realizar a comparação) que o do setor alimentício.
No setor metalúrgico, a produção mensal está mais concentrada,
mais próxima da média mensal, enquanto, no setor alimentício, a
produção mensal se distancia mais da produção média, com possí-
veis picos de produção.

Para fixar seus conhecimentos sobre o Índice de Assimetria,


recomendamos que você resolva a quarta questão autoavaliativa
disponível ao final desta unidade.

7. RECURSOS TECNOLÓGICOS
O cálculo do desvio padrão e da Média Aritmética Simples
são, como bem sabemos, trabalhosos de serem resolvidos. Por
isso, existem alguns recursos tecnológicos que favorecem a reali-
zação desses cálculos. Vamos conhecê-los?
Inicialmente, conheceremos os procedimentos para o cálcu-
lo da Média Aritmética Simples e do desvio padrão em alguns mo-
© U4 – Medidas Estatísticas de Dispersão 153

delos de calculadoras financeiras e científicas. Tomaremos como


exemplo o conjunto numérico X = {1, 2, 3, 4} e, para esses dados,
Média X = 2,5 e desvio padrão S = 1,291.

Calculadora Financeira HP12C


Para resolvermos o cálculo da Média e do desvio padrão na
calculadora financeira, basta seguirmos os comandos a seguir.

1) Para limpar a memória: F SST .

2) Para digitar os dados na memória:

3) Para calcular a Média X : G 0 .

4) Para calcular o desvio padrão S: G . .


5) Para efetuar um novo cálculo, repita os mesmos passos.

Calculadora Científica Casio FX-82 ou similares


Para calcularmos a Média e o desvio padrão em calculadoras
científicas, os comandos são os seguintes:

Claretiano - Centro Universitário


154 © Probabilidade e Estatística

1) Para entrar no módulo estatístico: Mode 2 .


2) Para apagar a memória: .
3) Para digitar os dados na memória:
1 Μ+ 2 Μ+ 3 Μ+ 4 Μ+ .

4) Para calcular a Média X : .


5) Para calcular o desvio padrão S:
.
6) Para efetuar um novo cálculo, repita apenas os coman-
dos de 2 a 5, pois o módulo estatístico já foi ativado no
primeiro cálculo.

Calculadoras científicas mais simples


Para calcularmos o desvio padrão e a Média Aritmética
Simples em calculadoras científicas mais simples, seguiremos os
seguintes comandos:
© U4 – Medidas Estatísticas de Dispersão 155

1) Para entrar no módulo estatístico: .


2) Para digitar os dados na memória:

3) Para calcular a Média X : .


4) Para calcular o desvio padrão S: .
5) Para apagar a memória: .
6) Para efetuar um novo cálculo, repita os comandos.

Calculadora Científica Texas do tipo da 36X e similares


Utilizando a Calculadora Científica Texas do tipo da 36X
ou similares a ela, os cálculos serão realizados da seguinte
maneira:

Claretiano - Centro Universitário


156 © Probabilidade e Estatística

1) Para entrar no módulo estatístico: .


2) Para digitar os dados na memória:
.

3) Para calcular a Média X : .


4) Para calcular o desvio padrão S: .
5) Para apagar a memória: .
6) Para efetuar um novo cálculo, repita os passos de 1 a 5.
Além das calculadoras científicas e financeiras, podemos cal-
cular algumas medidas estudadas neste Caderno de Referência de
Conteúdo utilizando a planilha eletrônica do Excel. Vejamos alguns
exemplos:
1) Soma simples de um conjunto de números
=SOMA (selecionar as células que contêm os
dados)

2) Soma de valores ao quadrado


=SOMAQUAD (selecionar as células que contêm os
dados)
© U4 – Medidas Estatísticas de Dispersão 157

3) Soma Ponderada: soma do produto entre dois conjuntos


numéricos
=SOMARPRODUTO (selecionar o primeiro conjunto; selecio-
nar o segundo conjunto)

4) Média Aritmética Simples


=MÉDIA (selecionar as células que contêm os da-
dos)

5) Média Geométrica
=MÉDIAGEOMÉTRICA (selecionar as células que contêm os
dados)

6) Mediana
=MED (selecionar as células que contêm os
dados)

7) Moda
=MODO (selecionar as células que contêm os
dados)

8) Primeiro Quartil
=QUARTIL (selecionar as células que contêm os da-
dos; 1)

9) Segundo Quartil
=QUARTIL (selecionar as células que contêm os da-
dos; 2)

10) Terceiro Quartil


=QUARTIL (selecionar as células que contêm os da-
dos; 3)

11) Variância Amostral


=VAR (selecionar as células que contêm os da-
dos)

12) Desvio Padrão Amostral


=DESVPAD (selecionar as células que contêm os da-
dos)

Claretiano - Centro Universitário


158 © Probabilidade e Estatística

8. EXEMPLOS DE APLICAÇÃO DAS MEDIDAS DE


VARIABILIDADE
Vejamos, neste tópico, mais alguns exemplos de aplicação
das medidas de variabilidade.

Exemplo 1
Em uma situação de entusiasmo financeiro, uma usina de
beneficiamento de algodão está ampliando seu setor produtivo,
devendo contratar mais uma equipe de 13 funcionários. O anúncio
de contratação atraiu muitos candidatos, que, ao final do processo
seletivo, foram reduzidos a apenas 39, os quais foram divididos em
três equipes de 13 pessoas. Cada uma das equipes passou por um
treinamento e um processo de experiência, no qual os responsá-
veis pelo setor de RH observaram a eficiência de suas tarefas por
meio do tempo gasto na execução delas. Os tempos observados
(em minutos) para cada candidato de cada uma das equipes foram:
• Equipe 1: X = {23,1; 24,2; 21,3; 24,2; 23,1; 23,2; 23,4;
21,3; 21,7; 23,6; 25,7; 21,3; 22,5}.
• Equipe 2: X = {23,8; 24,9; 22,0; 24,9; 23,8; 23,9; 24,1;
22,0; 22,4; 24,3; 26,4; 22,0; 23,2}.
• Equipe 3: X = {21,5; 20,3; 24,7; 22,6; 20,7; 20,3; 22,4;
22,2; 22,1; 23,2; 20,3; 23,2; 22,1}.
Para definir a contratação, os responsáveis vão considerar a
equipe mais homogênea, ou seja, a equipe em que os tempos são
mais parecidos entre si, com menor grau de variabilidade. Consi-
derando o exposto, estabeleça uma análise que identifique a equi-
pe a ser contratada.
Resolução: como o interesse é determinar a equipe com me-
nor grau de variabilidade, devemos comparar os valores dos Coefi-
cientes de Variação das equipes.
© U4 – Medidas Estatísticas de Dispersão 159

• Equipe 1:
n

∑X i
298, 6
=X =
i =1
= 22,97
2 13
n

∑( X )
2
−X 1
21,345
=S i =1
= = = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0581
= 5,81%
X 22,97

• Equipe 2:
n

∑X i
307, 7
=X =
I =1
= 23, 67
n 13
n

∑(X
− X )2
21,345 1
=S =i =1
= = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0564
= 5, 64%
X 23, 67

• Equipe 3:
n

∑X i
285, 6
=X =
I =1
= 21,97
n 13
n

∑(X
− X )2
21,345 1
=S = i =1
= = 1, 779 1,3338
n −1 12
S 1,3338
CV= = = 0, 0607
= 6, 07%
X 21,97

Conclusão: como a Equipe 2 possui o menor Coeficiente de


Variação, deverá ser a contrata.

Exemplo 2
O gráfico de linhas da Figura 2 representa a evolução do
número de pisos com defeito produzidos por hora em uma
indústria de cerâmica.

Claretiano - Centro Universitário


160 © Probabilidade e Estatística

Figura 2 Gráfico de linhas do número de pisos produzidos com defeito por hora.

Suponhamos que fosse estabelecido um limite superior de


número de defeitos aceitáveis igual à quantidade média de defei-
tos somada ao desvio padrão (limite superior = Média + desvio pa-
drão). Calcule esse limite e analise se a produção anterior atende
o limite estabelecido.
Resolução: antes de resolvermos essa questão, vamos iden-
tificar o número de defeitos em cada momento, observando a es-
cala do eixo dos valores.
Desse modo, teremos a seguinte série de dados: X = {10, 15,
19, 21, 14, 12, 10, 9, 22, 15, 19, 18, 17, 20, 10, 9, 10, 18, 14, 20, 15,
11, 18, 19}.
Fazendo os cálculos, teremos:
n

∑X i
365
X
= I =1
= = 15, 208
n 24
n

∑( X −X)
2
i
411,9583
=S i =1
= = 17,911 4, 232
=
n −1 23
© U4 – Medidas Estatísticas de Dispersão 161

Para o cálculo do limite, basta somarmos a Média com o des-


vio padrão, da seguinte forma:
Limite superior = X +
= S 15, 208 + 4, 232
= 19, 44
Conclusão: a produção não atende o limite superior, pois,
em quatro diferentes momentos, o número de defeitos produzi-
dos estava acima desse limite.

Exemplo 3
Sabe-se que uma variável numérica Z tem Média igual a 100
e uma variância igual a 50. Considerando duas outras variáveis X
Z
e Y, tais que: X = 4 ⋅ Z + 19 e Y= + 15 , determine qual das três
3
variáveis possui a maior variabilidade.
Resolução: como a variância da variável Z é igual a 50, seu
desvio padrão será=S = 50 7, 07 e seu Coeficiente de Variação
7, 07
CV = 0, 0707 . Para efetuarmos os cálculos para X e Y,
será =
100
devemos nos lembrar das propriedades da Média e do desvio pa-
drão, quando somamos e multiplicamos constantes. Assim, temos:
Para a variável X:
• Sua Média será: X =4 ⋅ Z + 19 =4 ⋅100 + 19 =400 + 19 =419 .
• Seu desvio padrão será: S X =4 ⋅ S Z =4 ⋅ 7, 07 =28, 28 .
28, 28
• Seu Coeficiente de Variação será:= CV = 0, 0675 .
419
Para a variável Y:
Z 100
• Sua Média será: Y = + 15 = + 15 = 33,33 + 15 = 48,33 .
3 3
S Z 7, 07
• Seu desvio padrão será: S=
Y = = 2,36 .
3 3
2,36
• Seu Coeficiente de Variação será:= CV = 0, 0488 .
48,33
Conclusão: temos, então, CVX = 0, 0675 , CVY = 0, 0488 e
CVZ = 0, 0707 ; portanto, a variável com maior variabilidade é a Z,
pois o seu CV é o maior.

Claretiano - Centro Universitário


162 © Probabilidade e Estatística

Exemplo 4
Considerando o problema de operação de uma catapulta ro-
mana (máquina de guerra), o objetivo de lançar projéteis a uma
determinada distância depende de três fatores, que são pontos
que podem ser variados pelo operador: altura do pivô, compri-
mento do braço e ângulo de parada. Um experimento foi planeja-
do para determinar a distância média que o projétil poderia alcan-
çar variando as condições da catapulta. A seguir, reproduzimos um
dos experimentos, com duas condições fixadas:
• Condição 1: altura do pivô = 1,30m; comprimento do braço
= 0,90m; e ângulo de parada = 30º
• Distâncias observadas (em m) em dez lançamentos:
• {20,5; 21,5; 21,6; 20,7; 21,3; 20,5; 21,1; 21,6; 20,9; 20,4}.
• Condição 2: altura do pivô = 1,30m; comprimento do bra-
ço = 0,90m; e ângulo de parada = 45º
• Distâncias observadas (em m) em dez lançamentos:
• {22,9; 23,7; 24,6; 23,1; 24,8; 25,1; 26,7; 26,7; 25,9; 24,7}
Calcule a distância média atingida pelo projétil em cada con-
dição e admita um intervalo com, mais ou menos, dois desvios pa-
drão. Pode-se dizer que o aumento de 50% no ângulo de parada
provocou um aumento na distância do projétil? Em qual das duas
condições mais oscilaram as distâncias registradas?
Resolução: para a primeira questão, deveremos calcular a
Média, o desvio padrão e o intervalo com dois desvios, comparan-
do os intervalos em seguida.
• Condição 1:
n

∑X i
210,1
=X =
I =1
= 21, 01
n 10
© U4 – Medidas Estatísticas de Dispersão 163

∑( X−X)
2
i
2, 029
= S i =1
= = = 0, 2254 0, 4748
n −1 9
a) Limite inferior do intervalo =
X − 2=
⋅ S 21, 01 − 2 ⋅ 0, 4748
= 21, 01 − 0,95
= 20, 06

b) Limite superior do intervalo


X + 2=
⋅ S 21, 01 + 2 ⋅ 0, 4748
= 21, 01 + 0,95
= 21,96

• Condição 2: n

∑X i
248, 2
=X =
I =1
= 24,82
n 10
n

∑( X −X)
2
i
16, 276
=S i =1
= = 1,8084 1,345
=
n −1 9
a) Limite inferior do intervalo =
X − 2=
⋅ S 24,82 − 2 ⋅1,345
= 24,82 − 2,=
69 22,13

b) Limite superior do intervalo =


X + 2=
⋅ S 24,82 + 2 ⋅1,345
= 24,82 + 2,=
69 27,51

Na Condição 1, espera-se uma variação na distância no


intervalo [20,06; 21,96], e, na Condição 2, no intervalo [22,13;
27,51]. Como os intervalos não possuem intersecção, são
estatisticamente diferentes; assim, o aumento no ângulo de
parada provocou, de fato, um aumento na distância.
Para responder à segunda questão, temos de calcular o CV
de cada caso e compará-los.
0, 4748
1: CV
• Condição = = 0, 0226 .
21, 01
1,345
CV = 0, 0542 .
• Condição 2:=
24,82
Claretiano - Centro Universitário
164 © Probabilidade e Estatística

Conclusão: a oscilação (variação) foi maior na Condição 2,


pois o seu CV é maior.

Exemplo 5
Para avaliar o impacto da manipulação genética em uma
determinada fruta tropical quanto à quantidade de vitaminas por
unidade da fruta, dois canteiros foram cultivados, sendo o primei-
ro (C1) contendo 10 plantas sem modificação genética e o segundo
(C2) contendo 10 plantas modificadas geneticamente. A seguir, es-
tão os valores obtidos na pesquisa, sendo que cada número repre-
senta a contagem das vitaminas (em mg) por kg de fruta em cada
planta do canteiro:
• C1 = {5,8; 4,8; 5,1; 4,9; 5,2; 4,7; 4,8; 5,1; 5,2; 4,9}.
• C2 = {5,9; 5,3; 4,9; 5,5; 5,1; 5,9; 4,7; 4,2; 5,4; 5,5}.
Com base nos dados anteriores, construindo um intervalo
com a média mais ou menos 1,5 desvios padrão, o que pode ser
dito sobre a modificação genética das plantas?
Resolução:
• Canteiro (C1):
n

∑X i
50,5
X
= I =1
= = 5, 05
n 10
n

∑( X −X)
2
i
0,905
=S i =1
= = 0,10056
= 0,317
n −1 9
a) Limite inferior do intervalo =
X − 1,5 ⋅ S = 5, 05 − 1,5 ⋅ 0,317= 5, 05 − 0, 48= 4,57 .

b) Limite superior do intervalo =


X − 1,5 ⋅ S= 5, 05 + 1,5 ⋅ 0,317= 5, 05 + 0, 48= 5,53
© U4 – Medidas Estatísticas de Dispersão 165

• Canteiro C2:
n

∑X i
52, 4
X
= I =1
= = 5, 24
n 10
n

∑( X −X)
2
i
2,544
=S i =1
= = 0,=
28267 0,532
n −1 9
a) Limite inferior do intervalo =
X − 1,5 ⋅ S = 5, 24 − 1,5 ⋅ 0,532= 5, 24 − 0,80= 4, 44 .

b) Limite superior do intervalo =


X + 1,5 ⋅ S = 5, 24 + 1,5 ⋅ 0,532= 5, 24 + 0,80= 6, 04

No Canteiro C1, espera-se uma quantidade de vitaminas no


intervalo [4,57; 5,53], e, no Canteiro C2, no intervalo [4,44; 6,04].
Conclusão: como os intervalos possuem intersecção, são es-
tatisticamente iguais. Assim, a modificação genética não provocou
mudanças na quantidade de vitaminas.

Exemplo 6
A fim de avaliar a influência do aumento da densidade de-
mográfica na dispersão de colônias de formigas, um pesquisador
efetuou um estudo comparativo da realidade atual de uma locali-
dade, com resultados de pesquisas passadas. Na localidade, foram
consideradas 10 áreas de mesmo tamanho, e, em cada uma delas,
foi contado o número de formigueiros em atividade, resultando
em: {0, 1, 4, 10, 15, 0, 2, 1, 10, 7}. No estudo passado, consideran-
do-se as mesmas áreas, foi detectado um número médio de 6 for-
migueiros por área, com um desvio padrão igual a 1 formigueiro.
O pesquisador, durante seu estudo, verificou que, com o au-
mento na densidade demográfica, os formigueiros migraram, causan-
do uma concentração em algumas áreas e esvaziamento em outras,
aumentando, assim, a variabilidade no número de formigueiros.

Claretiano - Centro Universitário


166 © Probabilidade e Estatística

Com base nesses resultados, calcule a Média e o desvio


padrão dos dados atuais e, em seguida, avalie a observação feita
pelo pesquisador.
Para os dados atuais:
n

∑X i
50
X
= I =1
= = 5
n 10
n

∑( X −X)
2
i
246
=S i =1
= = 27,33
= 5, 23
n −1 9
5, 23
CV
= = 1, 046
5
Considerando os dados do passado informados no enun-
ciado, ou seja, X = 6 e S = 1 , temos que o CV do passado era
1
CV= = 0,17 . Assim, a afirmação está correta; no presente, a
6
variabilidade é bem maior que no passado.

Exemplo 7
Para fins de aproveitamento de solo, a vegetação lenhosa
pode ser eliminada por corte sem queima ou por corte seguido
de queima dos galhos. Uma pesquisa foi conduzida para avaliar
a diferença entre a limpeza com a queima e sem a queima,
considerando o nível de chumbo presente no solo após um período
de tempo. Na pesquisa, foram encontrados resultados referentes à
quantidade de chumbo no solo (em partes por milhão – ppm) em
amostras de solos de uma mesma área:
• Corte sem queima: X = {9,5; 9,3; 8,9; 9,1; 8,8; 9,4; 9,1}.
• Corte com queima: X = {8,5; 9,1; 8,8; 9;0; 8,7; 9,4; 9,0}.
Calcule a média de chumbo no solo (em ppm) para os dois
casos e, também, o desvio padrão para cada caso, obtendo um
© U4 – Medidas Estatísticas de Dispersão 167

intervalo para Média com, mais ou menos, dois desvios padrão.


Com base nos resultados alcançados, o que se pode dizer sobre a
influência da queimada na presença de chumbo no solo?
Resolução:
• Sem a queima:
n

∑X i
64,1
X
= I =1
= = 9,157
n 7
n

∑( X −X)
2
i
0,3971
=S i =1
= = 0, 0662 0, 257
=
n −1 6
a) Limite inferior do intervalo =
X − 2=
⋅ S 9,157 − 2 ⋅ 0, 257
= 9,157 − 0,514
= 8, 643

b) Limite superior do intervalo =


X + 2=
⋅ S 9,157 + 2 ⋅ 0, 257
= 9,157 + 0,514
= 9, 671

• Com a queima:
n

∑X i
62,5
X
= I =1
= = 8,923
n 7
n

∑( X −X)
2
i
0,514
=S i =1
= = 0,
= 0857 0, 293
n −1 6

c) Limite inferior do intervalo =


X − 2=
⋅ S 8,923 − 2 ⋅ 0, 293
= 8,923 − 0,586
= 8,337

d) Limite superior do intervalo =


X + 2=
⋅ S 8,923 + 2 ⋅ 0, 293
= 8,923 + 0,586
= 9,509

Claretiano - Centro Universitário


168 © Probabilidade e Estatística

Conclusão: sem a queima, o nível de chumbo esperado é


determinado pelo intervalo [8,643; 9,671], e, com a queima, pelo
intervalo [8,337; 9,509]. Como os intervalos possuem intersecção,
são estatisticamente iguais; assim, o nível de chumbo não se altera
com a queima ou sem ela.

Exemplo 8
Para medir a variabilidade de uma variável, utilizamos o Des-
vio Padrão Amostral. Demonstre, detalhadamente, que essa medi-
da também pode ser calculada por:

1  n 2 
S
= ⋅ ∑ X i − n ⋅ X 2 
n − 1  i =1 

Resolução: tomaremos a fórmula do desvio padrão e, com


algumas manipulações algébricas, deduziremos a fórmula anterior:
n n

i − X) ∑ ( X i2 − 2 ⋅ X i ⋅ X + X 2 )
∑( X
2

=S =
=i 1 =i 1
=
n −1 n −1
n n n

i
2
∑ X − ∑(2 ⋅ X
i ⋅X )+∑ X
2

=i 1 =i 1
= =i 1

n −1
n n

∑ X i2 − 2 ⋅ X ⋅ ∑ X i + n ⋅ X 2
=i 1 =i 1
=
n −1
n

∑X 2
− 2⋅ X ⋅n⋅ X + n⋅ X 2
i
=
i =1

n −1
n

∑X i
2
− 2⋅n⋅ X 2 + n⋅ X 2
i =1
=
n −1
© U4 – Medidas Estatísticas de Dispersão 169

∑X 2
− n⋅ X 2
i
= =
i =1

n −1
1  n 2 
⋅ ∑ X i − n ⋅ X 2 
n − 1  i =1 
Conclusão: desse modo, a fórmula está deduzida.

Exemplo 9
Utilizando o conjunto de dados X= {5, 7, 9, 11, 13, 15}, calcu-
le o desvio padrão por meio de suas duas fórmulas (vistas no início
desta unidade).
Calculando a Média dos dados, temos:
n

∑X i
60
X
= i =1
= = 10
n 6
Calculando o desvio padrão pela sua fórmula tradicional,
temos:
n

∑( X −X)
2
i
S= i =1

n −1
(5 − 10) 2 + (7 − 10) 2 + (9 − 10) 2 + (11 − 10) 2 + (13 − 10) 2 + (15 − 10) 2
=
6 −1

(−5) 2 + (−3) 2 + (−1) 2 + (1) 2 + (3) 2 + (5) 2


S=
5
25 + 9 + 1 + 1 + 9 + 25 70
= = = 14 3, 74
=
5 5
Calculando o desvio padrão pela fórmula deduzida neste
exercício e calculando, separadamente, o somatório dos valores
de X ao quadrado, temos:

Claretiano - Centro Universitário


170 © Probabilidade e Estatística

∑X
i =1
i
2
= 52 + 7 2 + 92 + 112 + 132 + 152

= 25 + 49 + 81 + 121 + 169 + 225 = 670


Assim:

1  n 2 2 1 1
S
= ⋅  ∑ X i − n ⋅ X= ⋅ 670 − 6 ⋅10=
2
 .[ 670 − 6 ⋅100
= ]
n − 1  i =1  6 −1  5
1 1 70
= ⋅ [ 670 − 600] = ⋅ 70 = = 14 = 3, 74
5 5 5

Note que os resultados são iguais, como esperado. Assim,


podemos optar por qualquer uma dessas fórmulas para calcular o
desvio padrão.

9. QUESTÕES AUTOAVALIATIVAS
Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) Qual o menor valor que o desvio padrão pode assumir? Explique o significado
desse valor.

2) Teoricamente, variáveis simétricas possuem uma variabilidade menor


que variáveis assimétricas. Considerando os conjuntos de dados a seguir,
verifique se eles são simétricos (Média = Mediana = Moda) ou assimétricos
e verifique em qual deles temos uma menor variabilidade, confirmando o
que diz a teoria.
a) Conjunto 1: X = {5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9}.
b) Conjunto 2: X = {4, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9}.
3) Em cálculos de inflação em geral, são estudados todos os tipos de pontos de
vendas (pequenos, médios e grandes), a fim de dar maior representatividade
à amostra. A seleção dos pontos de vendas a serem amostrados é feita com
base em uma pesquisa chamada de "PPV" (Pesquisa de Pontos de Venda),
que visa caracterizar o tipo de estabelecimento. Um determinado instituto,
ao realizar a PPV, separou um grupo de 60 pontos de venda em três grupos
com 20 estabelecimentos cada, registrando o valor total (em R$) de uma
cesta de produtos em cada um deles (admitindo o menor preço encontrado
para cada produto). Os dados a seguir representam o resultado dessa
pesquisa:
© U4 – Medidas Estatísticas de Dispersão 171

Grupo 1
123,56 115,45 117,89 121,46 122,22 121,33 118,06
123,00 122,47 121,56 121,33 120,44 116,99 117,45
118,52 121,01 119,99 120,99 125,77 119,66

Grupo 2
125,45 126,33 119,55 124,50 121,89 118,66 117,54
122,35 123,65 124,56 122,21 121,02 120,45 120,36
115,22 119,32 121,55 123,66 124,77 119,50

Grupo 3
119,55 118,54 118,77 117,55 116,23 115,45 114,56
117,00 116,59 122,02 122,99 121,45 120,33 119,58
121,56 122,02 119,58 119,11 118,55 117,44

Para fins de utilização no cálculo da inflação, o instituto de pesquisas


econômicas deverá utilizar o grupo que apresentar menor variabilidade no
preço total da cesta. Identifique qual será o grupo a ser utilizado e justifique
sua resposta.
4) Muito se discute acerca dos efeitos da política monetária sobre os
investimentos no mercado financeiro. Para verificar esses efeitos, um estudo
foi realizado, comparando-se o montante (em mil R$) investido em grupo
de aplicações financeiras nas nove semanas anteriores à mudança da taxa
básica de juros e nas nove semanas posteriores à mudança, obtendo-se os
seguintes dados:
a) Antes: X= {251,6; 178,9; 225,6; 245,9; 221,5; 179,6; 205,1; 203,6; 211,0}.
b) Depois: X= {215,6; 205,6; 201,9; 199,6; 187,5; 175,2; 154,2; 156,9;
145,2}.
Os responsáveis pelo estudo afirmaram que, depois da mudança da taxa, a
tendência foi uma dispersão maior dos investimentos, distanciando-se do
investimento médio do período. Confirme essa teoria, calculando o Índice de
Assimetria para os dois casos.

Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) O menor valor que o desvio padrão pode assumir é zero, e ele ocorre quan-
do todos os valores são exatamente iguais entre si e iguais à média, signifi-
cando que não existe variação nos dados.

Claretiano - Centro Universitário


172 © Probabilidade e Estatística

2)
a) No Conjunto 1, temos: X = 7 , Mo= 7 e Md= 7, sendo ele, então, simétrico.
Ainda para esse conjunto, temos S = 1,2536 e CV = 0,1791.

b) No Conjunto 2, temos: X = 6,93 , Mo= 7 e Md= 7, sendo ele, então,


assimétrico. Ainda para esse conjunto, temos S = 1,3870 e CV = 0,2001.

Assim, o Conjunto 1, que é simétrico, possui menor variação (menor CV) que
o Conjunto 2, que é assimétrico, confirmando a teoria.

3) Grupo 1: X = 120, 46 ; S = 2,50 e CV = 0,021.


Grupo 2: X = 121,63 ; S = 2,87 e CV = 0,024.
Grupo 3: X = 118,94 ; S = 2,34 e CV = 0,020.

Assim, será escolhido o Grupo 3, pois, como ele tem menor CV, é o que tem,
também, menor variabilidade.

4) Antes: X = 213,6 ; Md = 211,0; S = 25,6 e IA = 0,305


Depois: X = 182, 4 ; Md = 187,5; S = 25,55 e IA = - 0,599
Os dados confirmam a teoria, já que, para depois, a assimetria é maior, e,
portanto, os dados estão mais distantes da Média.

10. CONSIDERAÇÕES
Considerando as formas de tabulação, as medidas de
posição e de tendência central e as medidas de dispersão, temos
instrumentos mais do que suficientes para caracterizar os dados
amostrais.
É importante salientar que existem outras medidas
descritivas da amostra, e você poderá aprofundar seus estudos
sobre elas consultando as referências indicadas.
Dando continuidade aos nossos estudos, na próxima unidade,
estudaremos um pouco sobre as teorias da probabilidade.
Vamos lá?
© U4 – Medidas Estatísticas de Dispersão 173

11. E-REFERÊNCIAS
SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de estatística. Disponível em: <http://www.
ecnsoft.net/wp-content/uploads/2009/08/Apostila-Estatistica-UFSC.pdf>. Acesso em:
13 fev. 2012.
TAVARES, M. Estatística aplicada à administração. Disponível em: <http://www.ufpi.br/
uapi/conteudo/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf>.
Acesso em: 13 fev. 2012.

12. REFERÊNCIAS BIBLIOGRÁFICAS


BUSSAB, W.; MORETTIN, P. Estatística básica. 5. ed. São Paulo: Saraiva, 2009.
FREUND, J. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto
Alegre: Bookman, 2007.
LARSON, R.; FARBER, E. Estatística aplicada. 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J. Estatística para ciências humanas. 4. ed. São Paulo: Pearson, 2004.
MCCLAVE, J. et al. Estatística para administração e economia. 10. ed. São Paulo: Pearson,
2009.
NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pearson
Prentice Hall, 2003.
SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo:
Atlas, 2002.
SPIEGEL, M. Estatística. 4. ed. Porto Alegre: Bookman, 2009.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e
estatística. 2. ed. Porto Alegre: Bookman, 2004.
TOLEDO, G. Estatística básica. 2. ed. São Paulo: Atlas, 2008.
TRIOLA, M. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
WALPOLE, R. et al. Probabilidade e estatística: para engenharia e ciências. 8. ed. São
Paulo: Pearson, 2008.

Claretiano - Centro Universitário


Claretiano - Centro Universitário
EAD
Teoria Elementar de
Probabilidade

5
1. OBJETIVOS
• Trabalhar os princípios elementares das probabilidades.
• Compreender as relações matemáticas das probabilida-
des.

2. CONTEÚDOS
• Conceitos de conjuntos e eventos e suas relações.
• Formulação básica da Probabilidade Frequentista.
• Principais axiomas e teoremas das probabilidades.
• Aplicação das técnicas de contagem nas probabilidades.
• Dependência e independência entre eventos.
176 © Probabilidade e Estatística

3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE


Antes de iniciar o estudo desta unidade, é importante que
você leia as orientações a seguir:
1) Procure não decorar os conceitos que serão estudados
nesta unidade, e sim entender o seu significado, pois
eles serão associados a outros conceitos para análises e
para determinação de índices.
2) Os estudos envolvendo probabilidades dependem mui-
to dos conhecimentos básicos de Teoria de Conjuntos.
Por isso, é muito importante que você faça uma revisão
desses conceitos à medida que for avançando na leitura
desta unidade, caso sinta dificuldades em entender al-
gumas regras de operação das probabilidades.
3) Todos os problemas envolvendo probabilidades exigem,
em igual medida, a capacidade de formular e interpre-
tar o problema, identificando o Espaço Amostral e os
eventos associados. Por isso, é importante que, em cada
exemplo discutido no decorrer da unidade, você enten-
da a origem do Espaço Amostral e dos eventos utilizados.

4. INTRODUÇÃO À UNIDADE
Qual a importância de se estudar Probabilidade? Para res-
ponder a essa pergunta, devemos pensar que, infelizmente, gran-
de parte dos fenômenos naturais e envolvidos nos cenários em-
presariais é caracterizada por variáveis aleatórias. Podemos dizer
que fenômenos aleatórios são aqueles rodeados por incertezas, o
que, de forma geral, é uma característica inerente aos estudos que
envolvem Estatística. Assim, para avançarmos nas análises estatís-
ticas, é necessária a incorporação de componentes probabilísticos.
Nesta unidade, estudaremos os princípios elementares e
compreenderemos as relações matemáticas das probabilidades.
Mas, antes de aprofundarmos nossos estudos nesses objetivos,
conheceremos um pouco mais sobre a origem da Probabilidade.
Bons estudos!
© U5 – Teoria Elementar de Probabilidade 177

5. UM POUCO DA HISTÓRIA DA PROBABILIDADE


A origem mais aceita da Teoria Frequentista das Probabilida-
des ocorreu com a publicação da obra O livro dos jogos de azar, de
Girolamo Cardamo (1501-1576), que introduziu, entre outros con-
ceitos, o de "espaços amostrais equiprováveis". Contudo, a evo-
lução das teorias das probabilidades e, também, das técnicas de
contagem (ou análise combinatória) ocorreu devido aos trabalhos
realizados por Blaise Pascal (1623-1662) em parceria com Pierre
de Fermat (1601-1665), motivados por uma troca de ideias sobre
uma questão que ficou conhecida como o Problema dos Pontos.
Ao que tudo indica, o Problema dos Pontos era similar à se-
guinte situação: A e B jogam dados. Suponhamos, então, que A
ganha 1 ponto quando o resultado pertence ao conjunto {1, 2},
enquanto B ganha 1 ponto quando o resultado pertence ao con-
junto {3, 4, 5, 6}. Sendo que A precisa de n pontos e B necessita
de m pontos para ganhar, qual a probabilidade de que A ganhe o
jogo? Ainda, se o jogo for interrompido, como devem ser divididos
os montantes apostados?
Como podemos notar, a origem e evolução das probabilida-
des foram motivadas pela vontade de vencer em jogos de azar.
Posteriormente, novos avanços foram obtidos por Jacques Ber-
noulli (1654-1705), publicados no livro A arte de conjecturar, que
tratava de resultados matemáticos, posteriormente chamados de
"procedimentos de análise combinatória", além da Lei dos Gran-
des Números.
A partir de então, muitos matemáticos apresentaram situa-
ções práticas para a aplicação de um novo ramo da Matemática: a
Teoria Frequentista das Probabilidades, em especial Carl Friedrich
Gauss (1777-1855), Simeon Denis Poisson (1781-1840) e Pierre Si-
mon Laplace (1749-1827).
Apesar de a origem histórica das probabilidades se remeter
ao seu uso em jogos de azar, com o passar do tempo e com o avan-

Claretiano - Centro Universitário


178 © Probabilidade e Estatística

ço das ciências aplicadas, a Probabilidade foi se tornando uma im-


portante ferramenta analítica e, atualmente, é aplicada nas mais
diferentes áreas, como na avaliação da eficiência de um medica-
mento, em exames de DNA, estudos de qualidade em produção
industrial, medidas de avaliação utilizadas por agências governa-
mentais, certificações, entre outras.
Você perceberá que, neste estágio do nosso estudo das pro-
babilidades, a Matemática necessária é bem elementar, mas é im-
portante compreendermos a montagem e análise das probabili-
dades desde o início. Para isso, estudaremos, inicialmente, seus
conceitos mais importantes.

6. CONCEITOS IMPORTANTES EM PROBABILIDADE


Iniciaremos nossos estudos por meio de situações mais sim-
ples e de fácil visualização relacionadas com a atualidade. De uma
forma simplificada, as probabilidades foram desenvolvidas para
atribuir chances de ocorrências para particulares resultados de
uma dada situação.
A chance de perder ou ganhar e os números que definem
essa chance representam, de certa forma, o que são as probabili-
dades. Durante o desenvolvimento deste conteúdo, procuraremos
fixar alguns conceitos importantes para a compreensão da teoria
das probabilidades, começando pelos apresentados a seguir.

Fenômenos aleatórios
Os fenômenos aleatórios são todos aqueles fenômenos que
podem ser infinitamente repetidos sob as mesmas condições, cujo
resultado só é conhecido com certeza após a sua finalização, ou
seja, não temos certeza do resultado final. Por exemplo, se jogar-
mos uma pedra para o alto em direção a um pátio contendo 100
baldes cheios de água, podemos perguntar: a pedra cairá dentro
de algum dos baldes? Em qual balde ela cairá? Não podemos afir-
mar o que vai acontecer, pois o resultado é aleatório.
© U5 – Teoria Elementar de Probabilidade 179

Fenômenos determinísticos
Outro conceito importante é o dos fenômenos determinísti-
cos, que, ao contrário dos fenômenos aleatórios, se repetidos infi-
nitas vezes sob as mesmas condições, sempre produzirão o mesmo
resultado, que é conhecido previamente, ou seja, é pré-determi-
nado. Por exemplo, se jogarmos uma pedra dentro de um balde
cheio de água, podemos perguntar: ela afundará? Provavelmente,
você respondeu que sim, mesmo sem ter feito o experimento, cer-
to? Mas por quê? Essa resposta é simples: sua percepção e visua-
lização do fenômeno, bem como a intuição física, já anteciparam
o resultado certo.

Espaço Amostral
O Espaço Amostral também é um dos conceitos importantes
em Probabilidade, pois, em se tratando de fenômenos aleatórios,
para lidar com a incerteza via medidas de Probabilidade, somos
obrigados a definir o conjunto de possibilidades. Como não temos
certeza do resultado final, devemos, pelo menos, listar todos os
possíveis resultados, em um conjunto chamado de "Espaço Amos-
tral", denotado por S ou Ω. Por exemplo, no lançamento de um
dado honesto, o Espaço Amostral será: Ω = {1, 2, 3, 4, 5, 6}.
Dependendo do tipo de Fenômeno Aleatório, podemos ter
um Espaço Amostral discreto, finito, bem definido e equiprovável,
sendo que todos os resultados possuem a mesma probabilidade
de ocorrência, o que é o cenário ideal para se trabalhar com as
probabilidades frequentistas. Contudo, nem todos são assim. Para
entendermos melhor, vejamos, a seguir, três exemplos:
• Ilustração 1: suponhamos que, em uma caixa, existam 10
bolas numeradas de 1 a 10 e que essas bolas sejam exa-
tamente iguais em tamanho e peso. A ação aleatória será
sortear uma das bolas e verificar o seu número. Para esse
caso, temos um Espaço Amostral Ω = {1, 2, 3, 4, 5, 6, 7,
8, 9, 10}, e, como as bolas são idênticas, a chance de sair

Claretiano - Centro Universitário


180 © Probabilidade e Estatística

a bola número 1 é igual à probabilidade de sair a bola


número 2, e assim por diante. Esse é um caso de Espaço
Amostral com finitos resultados, todos conhecidos e com
igual probabilidade (equiprovável).
• Ilustração 2: suponhamos que você plantou, em sua casa,
uma muda de laranjeira. Passado algum tempo, uma pes-
soa de sua família vai visitá-lo e lhe pergunta: quantas
laranjas estarão no pé daqui a cinco meses? Como não
temos certeza de quantas laranjas estarão no pé nesse
período, temos um Fenômeno Aleatório com o seguinte
Espaço Amostral: Ω = {0, 1, 2, 3, 4, 5, ..., n}, onde n repre-
senta o máximo em número de laranjas, já que não po-
demos admitir infinitas laranjas no pé, mas também não
sabemos qual é o seu número máximo. Note que, nesse
caso, temos dois problemas: não conhecemos o valor de
n, o que impossibilita cálculos, e não podemos afirmar
que as probabilidades são iguais para cada quantidade de
laranjas. Esse cenário é ruim em se tratando de cálculos
probabilísticos baseados na teoria frequentista.
• Ilustração 3: suponhamos que você conheceu uma pes-
soa durante um passeio. Quando chegou em sua casa e
comentou o ocorrido, alguém pergunta: qual será a renda
dessa pessoa? Como não temos certeza dessa informa-
ção, temos um Fenômeno Aleatório que possui um Espaço
Amostral do tipo Ω = {R1 ≤ Renda ≤ R2}, ou seja, podemos
apenas argumentar que sua renda varia de um mínimo
até um valor máximo, ambos desconhecidos. Note que,
nesse caso, temos três problemas: o primeiro é que não
conhecemos os valores de R1 e de R2, o que impossibilita
cálculos; o segundo é que não podemos afirmar que as
probabilidades são iguais para cada renda no intervalo;
e o terceiro é que se trata de um Espaço Amostral com
infinitos resultados. Podemos concluir, então, que esse
cenário é ruim em se tratando de cálculos probabilísticos
baseados na teoria frequentista.
© U5 – Teoria Elementar de Probabilidade 181

Como pudemos ver nos exemplos anteriores, as teorias das


probabilidades baseadas na visão frequentista só permitem uma
aplicação direta e clara em situações nas quais o Espaço Amostral
é bem definido e possui todos os resultados conhecidos, preferen-
cialmente, com uma situação equiprovável.

Evento Aleatório
Considerando a execução de um Fenômeno Aleatório e a exis-
tência do Espaço Amostral W associado, qualquer resultado de inte-
resse associado ao fenômeno e que esteja contido em W é chamado
de Evento Aleatório, que expressa o(s) particular(es) resultado(s)
que será(ão) objeto(s) de determinação de probabilidades.
Em geral, os eventos são denotados por uma letra, em mai-
úsculo, de nosso alfabeto (A, B, C,...) e devem ser descritos como
um conjunto bem definido.
Considerando um Espaço Amostral qualquer, podemos ter
interesse em avaliar apenas um Evento Aleatório ou, em alguns
casos, dois ou mais eventos aleatórios. Nesses casos, como um
Evento Aleatório possui as mesmas propriedades dos conjuntos,
temos algumas relações possíveis entre eles.

Relações entre eventos aleatórios


Dependendo do tipo de Fenômeno Aleatório e do tipo de
interesse sobre ele, encontramos algumas situações típicas, consi-
derando o interesse em dois ou mais eventos aleatórios. Vejamos.
Eventos aleatórios mutuamente exclusivos (ou disjuntos)
Sejam A e B dois eventos aleatórios, A ⊂ W e B ⊂ W. Se A e B
não puderem ocorrer simultaneamente para uma mesma ocorrên-
cia do Fenômeno Aleatório, então, A e B são ditos "eventos disjun-
tos", ou "mutuamente exclusivos", valendo a seguinte relação:
A ∩ B = ∅. Veja, no Diagrama de Venn (Figura 1), a representação
dos Eventos A e B.

Claretiano - Centro Universitário


182 © Probabilidade e Estatística

Figura 1 Diagrama de Venn 1.

Para ilustrar essa relação, utilizamos o lançamento de um


dado honesto, cujo Espaço Amostral é Ω = {1, 2, 3, 4, 5, 6}. Su-
ponhamos, para o caso do lançamento do dado, que estejamos
interessados nos Eventos A = {sair um número par} e B = {sair um
número menor que 2}. Temos os seguintes resultados, associados
a cada evento: A = {2, 4, 6} e B = {1}. Nota-se, então, que, ao lan-
çarmos o dado, OU ocorre o Evento A (no caso de sair um número
par) OU ocorre o Evento B (no caso de sair o número 1). Não existe
possibilidade de ambos ocorrerem ao mesmo tempo; OU ocorre A
OU ocorre B. Nesse caso, dizemos que A e B são eventos mutua-
mente exclusivos, isto é, não possuem intersecção.
Eventos aleatórios complementares
Sejam A e B dois eventos aleatórios, A ⊂ W e B ⊂ W, com A e
B eventos mutuamente exclusivos. Se a união de A com B resultar
no Espaço Amostral W, então, A e B são ditos "eventos comple-
mentares", valendo as seguintes relações: A ∩ B = ∅ e A ∪ B = W.
Veja, no Diagrama de Venn (Figura 2), a representação dos Eventos
A e B.
© U5 – Teoria Elementar de Probabilidade 183

Figura 2 Diagrama de Venn 2.

Utilizando os dados do exemplo anterior, suponhamos, para


o caso do lançamento do dado, que estamos interessados nos
Eventos A = {sair um número par} e B = {sair um número ímpar}.
Temos os seguintes resultados, associados a cada evento: A = {2,
4, 6} e B = {1, 3, 5}. Nota-se, então, que, ao lançarmos o dado, OU
ocorre o Evento A (no caso de sair um número par) OU ocorre o
Evento B (no caso de sair um número ímpar). Não existe a possi-
bilidade de ambos ocorrerem ao mesmo tempo; OU ocorre A OU
ocorre B. Nesse caso, dizemos que A e B são eventos mutuamente
exclusivos, isto é, não possuem intersecção. Além disso, se unir-
mos os resultados de A com os resultados de B, teremos, exata-
mente, os resultados do Espaço Amostral, ou seja, A∪B = W, e,
assim, A e B são ditos "eventos complementares".
Eventos aleatórios não mutuamente exclusivos (ou não disjuntos)
Sejam A e B dois eventos aleatórios, A ⊂ W e B ⊂ W, se A e
B puderem ocorrer simultaneamente para uma mesma ocorrên-
cia do Fenômeno Aleatório, então, A e B são ditos "eventos não
disjuntos", ou "não mutuamente exclusivos", valendo a seguinte
relação: A ∩ B ≠ ∅. Veja, no Diagrama de Venn (Figura 3), a repre-
sentação dos Eventos A e B, com destaque para a intersecção entre
A e B (A ∩ B).

Claretiano - Centro Universitário


184 © Probabilidade e Estatística

Figura 3 Diagrama de Venn 3.

Vejamos um exemplo de eventos aleatórios não mutuamen-


te exclusivos, o lançamento de um dado honesto, cujo Espaço
Amostral é Ω = {1, 2, 3, 4, 5, 6}. Suponhamos, para o caso do lança-
mento do dado, que estejamos interessados nos Eventos A = {sair
um número menor que 4} e B = {sair um número ímpar}. Temos os
seguintes resultados, associados a cada evento: A = {1, 2, 3} e B =
{1, 3, 5}. Note que, nesse caso, temos intersecção entre A e B: A
∩ B = {1, 3}. Observa-se, então, que, ao lançarmos o dado, se, por
ventura, sair o número 1 ou o número 2, ambos os eventos ocor-
rem, ou seja, ocorrem o Evento A e o Evento B ao mesmo tempo.
Devido à presença da intersecção, os dois eventos podem ocorrer
simultaneamente e, por isso, são chamados de "não mutuamente
exclusivos".
Após estudarmos os principais conceitos envolvidos nas pro-
babilidades frequentistas e as relações existentes entre eventos
aleatórios, estamos prontos para iniciar os cálculos com as proba-
bilidades no campo frequentista. Vamos lá?

7. PROBABILIDADE FREQUENTISTA
Uma probabilidade pode assumir qualquer valor entre zero
e 1. Ainda, as probabilidades podem ser representadas em valores
fracionários ou em valores percentuais, ou seja, uma probabilida-
de igual a 1 pode ser escrita como 0,50 ou como 50%.
2
© U5 – Teoria Elementar de Probabilidade 185

Com a fixação de uma fórmula básica para a determinação


da probabilidade, ficará mais fácil realizar os cálculos. A seguir, va-
mos determinar essa fórmula.
Supondo a realização de uma ação aleatória qualquer com
um Espaço Amostral (Ω) construído, definimos um Evento Aleató-
rio A de interesse e a Probabilidade P de ocorrência do Evento A
considerando o Espaço Amostral (Ω), que denotamos por P(A), da
seguinte maneira:

n( A)
P( A) =
n (W)
Ou

#( A)
P( A) =
#(W)

Onde n(A) ou #(A) representam o número de resultados fa-


voráveis ao Evento A, e n(Ω) ou #(Ω) representam o número de
resultados possíveis que estão no Espaço Amostral.
Vejamos, a seguir, alguns exemplos de aplicação dessas fór-
mulas.

Exemplo 1
Jogando-se uma moeda, qual a probabilidade de sair cara?
Resolução: o Espaço Amostral (Ω) é: Ω = {cara, coroa}. O
evento de interesse A é: A= {sair cara}. Devemos calcular P(A). Note
que temos dois resultados possíveis (cara ou coroa), então, n(Ω) =
2, e, dos casos possíveis, apenas um deles é favorável ao evento de
interesse A (temos uma cara apenas), então, n(A) = 1. Logo:

n( A) 1
P( A)= = = 0,50= 50%
n (W) 2

Claretiano - Centro Universitário


186 © Probabilidade e Estatística

Exemplo 2
Jogando-se um dado comum, qual a probabilidade de sair
um número menor que 3?
Resolução: temos seis resultados possíveis (os números 1, 2,
3, 4, 5 e 6) e, desses resultados, dois são favoráveis (os números 1
e 2). Logo:

n( A) 2 1
P ( A)= = = = 0,3333= 33,33%
n (W) 6 3

Exemplo 3
Jogando-se um dado, qual a probabilidade de sair um núme-
ro par?
Resolução: temos seis resultados possíveis e, desses resulta-
dos, três são favoráveis (os números 2, 4 e 6). Logo:

n( A) 3 1
P( A)= = = = 0,50= 50%
n (W) 6 2
Exemplo 4
Retirando-se uma carta qualquer de um baralho, qual a pro-
babilidade de sair um ás?
Resolução: temos 52 casos possíveis (no baralho, há 52 car-
tas) e, dos casos possíveis, temos quatro favoráveis (no baralho, há
quatro ases). Logo:

n( A) 4 1
P ( A=
) = = = 0, 0769... ≅ 7, 69%
n(W) 52 13
Exemplo 5
Uma pessoa possui três pares de meias, de cores diferentes,
todos colocados em uma mesma gaveta. Se a pessoa escolher ale-
atoriamente duas meias, qual a probabilidade de formar um par
correto?
© U5 – Teoria Elementar de Probabilidade 187

Resolução: veja que, para esse exemplo, o Espaço Amostral


corresponde a todas as possibilidades de retiradas de duas meias
de dentro da gaveta. Podemos representar da seguinte forma: 1º
par de meias (d1, e1), 2º par de meias (d2, e2) e 3º par de meias
(d3, e3). Assim, todas as retiradas de duas meias compreendem
um Espaço Amostral (Ω) da seguinte forma:
Ω = {(d1, e1), (d1, e2), (d1, e3), (d2, e1), (d2, e2), (d2, e3),
(d3, e1), (d3, e2), (d3, e3), (d1, d2), (d1, d3), (d2, d3),(e1, e2), (e1,
e3), (e2, e3)}
Note que n(Ω) = 15 possíveis resultados. Dentre esses 15 re-
sultados, em apenas três deles o par está correto, em: (d1, e1), em
(d2, e2) e em (d3, e3). Assim, temos que n(A) = 3. Então, a proba-
bilidade procurada é:

n( A) 3 1
P( A)= = = = 0, 20= 20%
n(W) 15 5
Exemplo 6
Considere um baralho comum, com quatro diferentes nai-
pes e 13 cartas em cada naipe, totalizando 52 cartas. Se uma carta
for retirada aleatoriamente do baralho, qual a probabilidade de
ela trazer um número par? Qual será a probabilidade de ser uma
letra?
Resolução: veja que, para esse exemplo, o Espaço Amostral
corresponde a todas as possibilidades de retiradas de uma carta
do baralho, ou seja, n(Ω) = 52. Para calcular a probabilidade de a
carta ser um número par, temos de considerar todos os eventos
dessa natureza, ou seja, sair o número 2, 4, 6, 8 ou 10 de cada um
dos naipes, isto é, cinco diferentes números pares em cada um dos
quatro naipes. Assim, n(A) = 20. Então, a probabilidade é:

n( A) 20 5
P ( A=
) = = = 0,3846... ≅ 38, 46%
n(W) 52 13

Claretiano - Centro Universitário


188 © Probabilidade e Estatística

Agora, para calcular a probabilidade de a carta ser uma le-


tra, temos de considerar todos os eventos dessa natureza, ou seja,
saírem as letras A, J, Q ou R de cada um dos naipes, isto é, quatro
diferentes letras em cada um dos quatro naipes. Assim, n(A) = 16.
Então, a probabilidade é:

n( A) 16 4
P( A=
) = = = 0,30769... ≅ 30, 77%
n(W) 52 13

Após a resolução desses exemplos, sugerimos que, neste mo-


mento, você responda às questões autoavaliativas 1 e 2 disponí-
veis ao final desta unidade para fortalecer os conceitos até aqui
estudados.

A partir da fórmula elementar das probabilidades, e admitin-


do que o Espaço Amostral (W) possui resultados discretos, finitos
e bem definidos, temos alguns axiomas básicos da Teoria Frequen-
tista das Probabilidades, os quais veremos a seguir.

Axiomas importantes da Teoria Frequentista das Probabilidades


Um axioma, na Matemática, é uma proposição e/ou enun-
ciado que serve para a construção formal de outros conceitos: os
teoremas. Por serem hipóteses iniciais, os axiomas não necessitam
de demonstração formal.
• Axioma [I]: P(W) = 1.
• Axioma [II]: para todo e qualquer Evento Aleatório A,
P(A) ≥ 0.
• Axioma [III]: dada uma sequência de eventos aleatórios
disjuntos A1, A2,..., An, a probabilidade da união dos
eventos é igual ao somatório das probabilidades de cada
evento: P(A1 ∪ A2 ∪ ... ∪ An) = P(A1) + P(A2) + ... + P(An).
Com base nesses axiomas, podemos estruturar um formalis-
mo para as probabilidades que nos permite efetuar cálculos mais
© U5 – Teoria Elementar de Probabilidade 189

elaborados e, por conseguinte, ampliar as aplicações da Probabili-


dade Fequentista.

Teoremas importantes da Teoria Frequentista das Probabilidades


Considerando os axiomas anteriores, podemos definir al-
guns teoremas importantes para a formatação da Teoria Frequen-
tista das Probabilidades.
Diferentemente de um axioma, um teorema necessita de
demonstração formal, que deve necessariamente estar baseada
nos axiomas que sustentam o formalismo da teoria ou, então, em
outros teoremas já demonstrados.
Teorema 1
O Teorema 1 trata da probabilidade do Evento Vazio.
Seja o conjunto vazio ∅ chamado de "Evento Impossível",
então, P(∅) = 0.
Demonstrando o Teorema 1, sabemos que o conjunto vazio
∅ unido a qualquer conjunto resulta, exatamente, nesse conjunto.
Assim, temos que: ∅ ∪ W = W. Aplicando a probabilidade de am-
bos os lados da igualdade, temos: P(∅ ∪ W) = P(W).
Sabemos, também, que o conjunto vazio ∅ não possui in-
tersecção com nenhum outro conjunto; assim, o conjunto vazio é
mutuamente exclusivo de qualquer outro conjunto. Na expressão
P(∅ ∪ W), podemos aplicar o axioma [III], ficando: P(∅ ∪ W) =
P(W) ⇒ P(∅) + P(W) = P(W).
Aplicando agora o axioma [I], ficamos com: P(∅) + P(W) =
P(W) ⇒ P(∅) + 1 = 1 ⇒ P(∅) = 1 – 1 = 0. Assim, está demonstrado
o Teorema 1.
Teorema 2
O Teorema 2 trata da probabilidade de eventos complemen-
tares.

Claretiano - Centro Universitário


190 © Probabilidade e Estatística

Sejam A e B dois eventos complementares, então, P(A) = 1 – P(B).


Demonstrando o Teorema 2, se A e B são complementares
(pela condição do teorema), sabemos, então, que A e B são mutu-
amente exclusivos e que A ∪ B = W. Aplicando a probabilidade em
ambos os lados dessa igualdade, temos: P(A ∪ B) = P(W).
Como A e B são complementares e mutuamente exclusivos,
podemos utilizar o axioma [III], ficando: P(A ∪ B) = P(W) ⇒ P(A) +
P(B) = P(W).
Utilizando o axioma [I], temos: P(A) + P(B) = P(W) ⇒ P(A) +
P(B) = 1 ⇒ P(A) = 1 - P(B). Assim, está demonstrado o Teorema 2.
Teorema 3
O Teorema 3 trata da probabilidade associada a subconjun-
tos.
Sejam A e B dois eventos aleatórios, então, A ⊂ Ω e B ⊂ Ω. Se
A estiver contido em B, A ⊂ B, então, P(A) ≤ P(B).
Demonstrando o Teorema 3 por meio da Figura 4, podemos
observar que, se A ⊂ B, então, existe um conjunto (em destaque
na figura) formado pelos elementos de B que não estão em A, que
chamaremos de "conjunto (B-A)".

Figura 4 Demonstrando o Teorema 3.

Podemos notar que A ∪ (B-A) = B e, ainda, podemos obser-


var que A e (B-A) são dois eventos (conjuntos) mutuamente exclu-
sivos. Aplicando a probabilidade em ambos os lados da igualdade
© U5 – Teoria Elementar de Probabilidade 191

e utilizando o axioma [III], temos: P[A ∪ (B-A)] = P(B) ⇒ P(A) +


P(B-A) = P(B) ⇒ P(A) = P(B) – P(B-A).
Entretanto, pelo axioma [II], temos que P(B-A) ≥ 0. Isso quer
dizer que:
• Se P(B-A) = 0 ⇒ P(A) = P(B).
• Se P(B-A) > 0 ⇒ P(A) < P(B).
Portanto, se A ⊂ B, então, P(A) ≤ P(B). Assis, está provado o
Teorema 3.
Teorema 4
A imagem da função de probabilidade será demonstrada no
Teorema 4.
Seja A um Evento Aleatório, A ⊂ W. Então, a probabilidade de
ocorrer A pertence ao intervalo [0,1] ou 0 ≤ P(A) ≤ 1.
• Primeira demonstração: suponhamos dois eventos ale-
atórios A e B, A ⊂ W e B ⊂ W, de forma que A e B se-
jam complementares. Pelo Teorema 2, sabemos que:
P(A) = 1 – P(B). Considerando o axioma [II], temos que:
P(B) ≥ 0. Agora, se P(B) ≥ 0, então, P(A) é igual a 1 me-
nos uma quantidade maior ou igual a zero e, conse-
quentemente, P(A) deve ser menor ou igual a 1, ou seja,
P(A) ≤ 1. Assim, para qualquer Evento Aleatório, a probabi-
lidade deve ser maior ou igual a zero e menor ou igual a 1.
• Segunda demonstração: como A é um Evento Aleató-
rio, temos que A ⊂ W, e, pelo Teorema 3, sabemos que:
P(A) ≤ P(W). Assim, pelo axioma [I], de imediato, concluí-
mos que P(A) ≤ 1 e, adicionando o axioma [II], temos que
0 ≤ P(A) ≤ 1.
Teorema 5
O Teorema 5 trata da probabilidade da união de quaisquer
eventos.

Claretiano - Centro Universitário


192 © Probabilidade e Estatística

Sejam A e B dois eventos quaisquer, então, P(A∪B) = P(A) +


P(B) – P(A∩B).
Demonstrando o Teorema 5, considerando dois eventos
quaisquer A e B, podemos escrever a união de A com B, A ∪ B,
como sendo a união de dois particulares conjuntos (eventos) mu-
tuamente exclusivos, que são B e (A-B), conforme a Figura 5 (em
destaque, o conjunto (A-B)).

Figura 5 Demonstrando o Teorema 5.

Temos, então, que: (A ∪ B) = B ∪ (A-B). Aplicando a proba-


bilidade em ambos os lados da igualdade, e como B e (A-B) são
mutuamente exclusivos, utilizando o axioma [III], temos: P(A ∪ B)
= P[B ∪ (A-B)] ⇒ P(A ∪ B) = P(B) + P(A-B) [*].
Mas como podemos desmembrar P(A-B)? Na mesma condi-
ção desse teorema, podemos compor o conjunto (evento) A como
sendo a união de dois conjuntos mutuamente exclusivos, o con-
junto (A-B) e o conjunto (A∩B), como na Figura 6.

Figura 6 União de dois conjuntos.


© U5 – Teoria Elementar de Probabilidade 193

Então, temos que: A = (A-B) ∪ (A∩B). Aplicando a probabi-


lidade em ambos os lados da igualdade e considerando o axioma
[III], temos: P(A) = P[(A-B) ∪ (A ∩ B)] ⇒ P(A) = P(A-B) + P(A ∩ B) ⇒
P(A-B) = P(A) – P(A ∩ B).
Substituindo esse resultado na expressão indicada por [*],
temos que P(A ∪ B) = P(B) + P(A-B) ⇒ P(A ∪ B) = P(B) + P(A) – P(A
∩ B), que é o resultado procurado.
Vejamos, a seguir, alguns exemplos de como podemos apli-
car os resultados anteriores.

Exemplo 7
Considere o lançamento de dois dados honestos, gerando o
Espaço Amostral de 36. Qual é a probabilidade de termos número
par nos dois dados ou de saírem dois números cuja soma seja igual
a cinco?
Resolução: analisando o Evento A= {sair número par nos dois
dados}, podemos verificar que, dos 36 resultados possíveis, em
apenas 9 deles teremos dois números pares, a saber: {(2,2) (2,4)
(2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6)}:

n( A) 9
P=
( A) =
n(W) 36

Analisando o Evento B= {sair dois números cuja soma seja


igual a cinco}, podemos verificar que, dos 36 resultados possíveis,
em apenas 4 deles teremos uma soma igual a 5, a saber: {(1,4)
(2,3) (3,2) (4,1)}. Então:

n( B ) 4
P=
( B) =
n(W) 36

Como queremos o Evento A ou o Evento B, e eles são disjun-


tos (note que não existe nenhum resultado em comum entre A e
B), fazemos:
Claretiano - Centro Universitário
194 © Probabilidade e Estatística

9 4 13
P( A ∪ B ) = P ( A) + P ( B ) = + = = 0,3611 = 36,11%
36 36 36
Exemplo 8
Considere o lançamento de dois dados honestos, gerando o
Espaço Amostral de 36. Qual é a probabilidade de termos número
par nos dois dados ou de saírem dois números cuja soma seja igual
a seis?
Resolução: analisando o Evento A= {sair número par nos dois
dados}, podemos verificar que, dos 36 resultados possíveis, em
apenas 9 deles teremos dois números pares, a saber: {(2,2) (2,4)
(2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6)}:

n( A) 9
P=
( A) =
n(W) 36
Analisando o Evento B= {sair dois números cuja soma seja
igual a seis}, podemos verificar que, dos 36 resultados possíveis,
em apenas 5 deles teremos uma soma igual a 6, a saber: {(1,5)
(2,4) (3,3) (4,2) (5,1)}. Então:

n( B ) 5
P=
( B) =
n(W) 36
Como queremos o Evento A ou o Evento B, e eles não são
disjuntos (note que existem dois resultados em comum entre A e
B, que chamamos de "intersecção entre A e B"), fazemos:
9 5 2 12 1
P( A ∪ B) =P( A) + P( B) − P( A ∩ B ) = + − = = =0,3333 =33,33%
36 36 36 36 3
Exemplo 9
Três estudantes estão em um torneio de natação que admite
apenas um vencedor. Pelo retrospecto dos três, imagina-se que o
nadador 1 e o nadador 2 tenham a mesma probabilidade de ven-
cer, que é igual a 3 . O nadador 3 tem menor probabilidade de
7
© U5 – Teoria Elementar de Probabilidade 195

vencer, igual a 1 . Então, qual a probabilidade de que o nadador 1


7
ou o nadador 3 vençam o torneio?
Resolução: pelo enunciado, como só é admitido um vence-
dor, os Eventos A= {nadador 1 vencer} e B= {nadador 3 vencer} são
disjuntos, ou seja, os estudantes não podem vencer, ao mesmo
tempo, o torneio. Assim, para calcular a probabilidade, utilizamos:

3 1 4
P ( A ∪ B ) = P ( A) + P ( B ) = + = = 0,5714 = 57,14%
7 7 7
Exemplo 10
Em um colégio, foi realizada uma pesquisa sobre as ativida-
des extracurriculares dos alunos. Dos 500 alunos entrevistados,
240 praticavam algum tipo de esporte, 180 frequentavam algum
curso de idiomas e 120 realizavam as duas atividades, ou seja, pra-
ticavam algum esporte e frequentavam algum curso de idiomas.
Se, dos alunos entrevistados, um é escolhido ao acaso, qual a pro-
babilidade de que ele realize uma das duas atividades, ou seja,
esportes ou curso de idiomas?
Resolução: pelo enunciado, vemos que é possível um aluno
executar as duas coisas, esportes e idiomas. Assim, A= {esporte} e
B= {idiomas} são eventos não disjuntos. Para calcular a probabili-
dade, utilizamos:

240 180 120 300 3


P( A ∪ B) =P( A) + P( B) − P( A ∩ B ) = + − = = =0, 60 =60%
500 500 500 500 5

Exemplo 11
Vamos considerar o lançamento de três dados, com um Espa-
ço Amostral formado por 216 resultados em forma de triplas (um
resultado para cada dado). Qual a probabilidade de não termos
três números iguais como resultado do lançamento dos dados?

Claretiano - Centro Universitário


196 © Probabilidade e Estatística

Resolução: como são muitos os resultados, vamos pensar


em outro Evento Complementar ao que foi solicitado. Seja o Even-
to A= {saírem 3 números iguais}, que, na verdade, corresponde aos
resultados (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5) e (6,6,6). Então:

n( A) 6
P=
( A) =
n(W) 216
Como o Evento B= {não saírem 3 números iguais} é comple-
mentar ao Evento A, pelo Teorema 2, temos:

6 216 − 6 210 35
P( B) =
1 − P ( A) =
1− = = == 0,9722 =
97, 22%
216 216 216 36

Após acompanhar a resolução desses exemplos e antes de pros-


seguir com sua leitura, sugerimos que você resolva a terceira
questão autoavaliativa disponível ao final desta unidade para fixar
os conhecimentos adquiridos até o momento.

É importante ressaltar que a aplicação desses resultados só


ocorre quando temos espaços amostrais bem definidos, equipro-
váveis e totalmente conhecidos. Dependendo da situação prática,
a montagem do Espaço Amostral, apesar de ser finita e equiprová-
vel, exige um esforço muito grande, devido à quantidade de resul-
tados. Vejamos o exemplo a seguir.
Suponhamos que, de uma urna com 100 bolas, sendo 30
brancas, 40 pretas, 20 verdes e 10 amarelas, vamos retirar três
de uma só vez. Qual a probabilidade de retirarmos três bolas de
mesma cor?
Vejamos que, nesse caso, o Espaço Amostral tende a ficar
muito grande se optarmos por enumerar, em um conjunto, um
a um, todos os resultados. Para evitar tal trabalho, podemos nos
valer das técnicas de contagem para contabilizar as possibilida-
des, afinal, para os cálculos probabilísticos, o que mais importa é
a quantidade de resultados do Espaço Amostral, n(Ω), e a quanti-
© U5 – Teoria Elementar de Probabilidade 197

dade de resultados do evento de interesse, n(A). Apresentaremos,


a seguir, uma breve revisão das técnicas de contagem, bem como
alguns exemplos de sua aplicação em Probabilidade.

Uma breve revisão das técnicas de contagem


Todas as técnicas de contagem (técnicas de análise combina-
tória) são baseadas em dois princípios fundamentais: o princípio
aditivo e o princípio multiplicativo.
O princípio aditivo pode ser definido da seguinte maneira:
se uma determinada ação A pode ocorrer de M maneiras e uma
ação B pode ocorre de N maneiras, de forma que A e B sejam mu-
tuamente exclusivos (não podem ocorrer simultaneamente), en-
tão, o total de possibilidades de ocorrência envolvendo as duas
ações será M+N. Em geral, o princípio aditivo, ou da soma, está
envolvido com o uso de OU na junção das ações, o que associa a
palavra "OU" à soma das possibilidades. Observe o Exemplo 12.
Exemplo 12
Um garoto recebeu, como pagamento de uma determinada
tarefa feita a pedido de sua mãe, R$10,00. De posse do dinheiro,
resolveu ir até o cinema perto de sua casa. Lá, ao comprar pipoca e
suco, restaram-lhe R$7,00, que era exatamente o valor da entrada
para um dos seis filmes em cartaz. Então, de quantas formas dife-
rentes ele poderia gastar os R$7,00 restantes?
Resolução: considerando as opções do cinema, o garoto
pode escolher o filme 1 OU o filme 2 OU o filme 3 OU o filme 4 OU
o filme 5 OU o filme 6, e, como não dá para assistir a dois filmes ao
mesmo tempo, a escolha de um filme é mutuamente exclusiva das
demais. De uma forma esquemática, temos:

Filme1 OU Filme2 OU Filme3 OU Filme4 OU Filme5 OU Filme6


1 + 1 + 1 + 1 + 1 + 1

Claretiano - Centro Universitário


198 © Probabilidade e Estatística

Pelo princípio aditivo, o garoto tem 1+1+1+1+1+1 = 6 possi-


bilidades de gastar o restante do dinheiro. Nota-se que o princípio
aditivo é bastante intuitivo, mas fundamental para a construção
das contagens.
Já o princípio multiplicativo é definido da seguinte forma:
se uma determinada ação A pode ocorrer de M maneiras e uma
determinada ação B pode ocorre de N maneiras, de forma que A e
B sejam não mutuamente exclusivos (podem ocorrer simultanea-
mente), então, o total de possibilidades de ocorrência envolvendo
as duas ações será M ⋅ N . Em geral, o princípio multiplicativo, ou
do produto, está envolvido com o uso de E na junção das ações, o
que associa o uso de E ao produto possibilidades. Observe o Exem-
plo 13.
Exemplo 13
Uma serralheria possui, em seu mostruário, 15 modelos di-
ferentes de portas e 20 modelos diferentes de janela de aço. Um
cliente que escolhe comprar nessa serralheria tem quantas pos-
sibilidades diferentes de equipar a fachada de sua casa com uma
porta e uma janela de aço?
Resolução: considerando inicialmente as portas, pelo prin-
cípio aditivo, o cliente pode escolher qualquer uma das portas,
então, ele tem 15 possibilidades. Pensando nas janelas, pode es-
colher qualquer uma, tendo 20 possibilidades no total. Agora, para
escolher uma porta E uma janela, as possibilidades serão:

Portas E Janelas
15 x 20

Então, pelo princípio multiplicativo, o cliente tem 15x20 =


300 possibilidades para escolher uma porta e uma janela.
Sob determinadas condições, os dois princípios fundamen-
tais da contagem transformam-se em fórmulas particulares, com
aplicação mais direta. É claro que são muitas as opções, mas, a tí-
© U5 – Teoria Elementar de Probabilidade 199

tulo de revisão, discutiremos as permutações simples, os arranjos


simples e as combinações simples.
Para definir a Permutação Simples, podemos considerar um
cenário envolvendo N objetos necessariamente distintos, de acor-
do com a sua natureza do problema. Se o interesse for realizar
ações (agrupamentos) envolvendo todos os N elementos dispo-
níveis, de forma que a disposição ou ordem desses objetivos seja
importante para diferenciar os agrupamentos ou ações, então, o
total de possibilidades é chamado de "Permutação Simples" (PN)
dos objetos e é calculado da seguinte forma:

PN = n !
Em Matemática, o símbolo (!) significa o fatorial de um nú-
mero. Para calculá-lo, basta irmos efetuando o produto desse nú-
mero, com todos os seus antecessores, até chegar em 1, como,
por exemplo: 10! = 10 ⋅ 9 ⋅ 8 ⋅ 7 ⋅ 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 . Por definição, 0! = 1.
Observe o Exemplo 14 a seguir para compreender melhor como
resolver um fatorial.
Exemplo 14
Um estudante do curso de Matemática decidiu organizar
seus livros em uma estante. Ele possui 6 livros diferentes de Cál-
culo Diferencial e Integral, 4 livros diferentes de Física e 3 livros
diferentes de Matemática Básica. Então, de quantas formas ele
pode organizar a estante, considerando que ele quer os livros de
matérias iguais juntos?
Resolução: pensando nos 6 livros diferentes de Cálculo, como
ele vai organizar todos os 6, e estes são diferentes entre si, temos
uma permutação de 6 elementos: P6 = 6! = 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 = 720 , ou
seja, há 720 possibilidades de organizar os livros de cálculo.
Fazendo o mesmo com as outras duas matérias, temos:
• Para Física, uma permutação de 4 elementos:
P4 = 4! = 4 ⋅ 3 ⋅ 2 ⋅1 = 24 .

Claretiano - Centro Universitário


200 © Probabilidade e Estatística

• Para Matemática Básica, uma permutação de 3 elemen-


tos: P3 = 3! = 3 ⋅ 2 ⋅1 = 6 .
Pelo princípio multiplicativo, o total de possibilidades de orga-
nizar os livros de Cálculo E de Física E de Matemática Básica é calcu-
lado por: Total = 720 x 24 x 6 = 103680 possibilidades. Será que esse
é o resultado final? Não, não é. Pensemos um pouco: em que ordem
o estudante colocará os livros na estante? Qual matéria primeiro? E
depois? Assim, temos que o total anterior é apenas para uma forma-
ção na estante, mas de quantas formas diferentes podemos alterar
a ordem de colocação das matérias? Com uma permutação de 3, ou
seja, 6 possibilidades. Assim, a resposta final é:

Total = 103680 x 6 = 622080 possibilidades.

Para o Arranjo Simples, podemos considerar um cenário en-


volvendo N objetos necessariamente distintos, de acordo com a
sua natureza do problema. Se o interesse for realizar ações (agru-
pamentos) envolvendo apenas uma parcela com K elementos (com
K ≤ N), de forma que a disposição ou ordem desses objetivos seja
importante para diferenciar os agrupamentos ou ações, então, o
total de possibilidades é chamado de "Arranjo Simples", AN , K , dos
N objetos tomados de K em K e é calculado da seguinte forma:

N!
AN , K =
( N − K )!

Colocando em prática o que foi determinado anteriormente


para calcular o Arranjo Simples, observe o Exemplo 15.
Exemplo 15
Considere os algarismos 1, 2, 3, 4, 5 e 6. Quantos números
distintos com 3 algarismos podemos formar?
Resolução: note que temos N=6 elementos, mas utiliza-
remos apenas 3 elementos para a formação dos números. Nes-
se caso, fica claro que a ordem de colocação dos elementos im-
© U5 – Teoria Elementar de Probabilidade 201

porta, pois o número 123 é diferente do número 213. Assim,


temos um cenário propício para a aplicação do Arranjo Simples:
6! 6! 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 720 números diferentes com
A=
6,3 = = = = 120
(6 − 3)! 3! 3 ⋅ 2 ⋅1 6
3 algarismos.

Para calcular a Combinação Simples, devemos considerar


um cenário envolvendo N objetos necessariamente distintos, de
acordo com a sua natureza no problema. Se o interesse for realizar
ações (agrupamentos) envolvendo apenas uma parcela com K ele-
mentos (com K ≤ N), de forma que a disposição ou ordem desses
objetivos não seja importante para diferenciar os agrupamentos
ou ações, então, o total de possibilidades é chamado de "Com-
binações Simples", CN , K , dos N objetos tomados de K em K e é
calculado da seguinte forma:

N!
CN ,k =
K !⋅ ( N − K )!

Observe o Exemplo 16 de como calcular uma Combinação


Simples.
Exemplo 16
Suponhamos que, em um plano, existam 30 pontos, sendo
que não existem 3 pontos colineares. Assim, quantos triângulos
(de qualquer tipo) podem ser formados utilizando os 30 pontos?
Resolução: note que, dos 30 pontos disponíveis, vamos uti-
lizar apenas 3 pontos para a formação dos triângulos e devemos
nos lembrar de que a ordem de citação dos vértices não altera o
triângulo, ou seja, o triângulo ABC é o mesmo que o triângulo CBA.
Assim, esse cenário é o ideal para aplicarmos a Combinação Sim-
ples. Desse modo:
30! 30! 30 ⋅ 29 ⋅ 28 ⋅ 27! 24360
C30,3
= = = = = 4060
3!⋅ (30 − 3)! 3!⋅ 27! 3 ⋅ 2 ⋅1 ⋅ 27! 6

Claretiano - Centro Universitário


202 © Probabilidade e Estatística

Ou seja, podemos fazer 4.060 triângulos diferentes.

Após uma breve explicação sobre combinações, retome o exem-


plo dado anteriormente para explicar as técnicas de contagem e
observe o Exemplo 17, que relembra o problema sugerido.

Exemplo 17
Suponhamos que, de uma urna com 100 bolas, sendo 30
brancas, 40 pretas, 20 verdes e 10 amarelas, vamos retirar 3 bolas
de uma só vez. Assim, qual a probabilidade de termos 3 bolas de
mesma cor?
Resolução: inicialmente, vamos contabilizar o tamanho do
Espaço Amostral. Note que o conjunto Ω será formado por todas
as triplas (3 bolas) possíveis de se retirar da urna com 100 bolas.
Como as bolas são retiradas de uma só vez, a ordem não importa,
e, assim, n(Ω) será igual a C100,3 .

100! 100! 100 ⋅ 99 ⋅ 98 ⋅ 97! 970200


n (W
= ) C100,3
= = = = = 161700
3!⋅ (100 − 3)! 3!⋅ 97! 3 ⋅ 2 ⋅1 ⋅ 97! 6

Ainda, para conseguirmos 3 bolas da mesma cor, teremos:


• Evento A = {3 bolas brancas} e
30! 30 ⋅ 29 ⋅ 28 ⋅ 27! 24360
n=
( A) C=
30,3 = = = 4060
3!⋅ (30 − 3)! 3 ⋅ 2 ⋅1⋅ 27! 6

• Evento B = {3 bolas pretas} e


40! 40 ⋅ 39 ⋅ 38 ⋅ 37! 59280
n=
( B) C=
40,3 = = = 9880
3!⋅ (40 − 3)! 3 ⋅ 2 ⋅1 ⋅ 37! 6

• Evento C = {3 bolas verdes} e


20! 20 ⋅19 ⋅18 ⋅17! 6840
n=
(C ) C=
20,3 = = = 1140
3!⋅ (20 − 3)! 3 ⋅ 2 ⋅1 ⋅17! 6

• Evento D = {3 bolas amarelas} e


10! 10 ⋅ 9 ⋅ 8 ⋅ 7! 720
n(=
D) C=
10,3 = = = 120
3!⋅ (10 − 3)! 3 ⋅ 2 ⋅1 ⋅ 7! 6
© U5 – Teoria Elementar de Probabilidade 203

Podemos definir um Evento Auxiliar E = {saírem 3 bolas de


mesma cor}, que pode ser traduzido como a união de eventos mu-
tuamente exclusivos definidos anteriormente.
Assim, E = A ∪ B ∪ C ∪ D, e, pelo axioma [III], podemos so-
mar as possibilidades de cada um. Desse modo, n(E) = 4060 + 9880
+ 1140 + 120 = 15200.

n( E ) 15200 152
P=
(E) = = = 0,= 094 9, 4%
n(W) 161700 1617
Ou seja, a probabilidade de retirarmos 3 bolas de mesma cor
é de 9,4%.

Para fortalecer seu aprendizado sobre as técnicas de contagem


e as probabilidades com a utilização dessas técnicas, sugerimos
que você resolva as questões autoavaliativas de 4 a 7 disponíveis
ao final desta unidade.

Dando continuidade em nosso estudo, em alguns casos, os


espaços amostrais não terão comportamentos favoráveis à apli-
cação dos resultados anteriores. Um exemplo ocorre quando as
probabilidades são determinadas em problemas com cunho geo-
métrico. Nesses casos, a contagem de resultados é dificultada por
termos um Espaço Amostral infinito, transformando-se em uma
medida de área. Portanto, toda a argumentação anterior deve
ser interpretada para relações entre áreas. Vejamos mais alguns
exemplos a seguir.
Exemplo 18
Suponhamos uma situação em que uma circunferência de
raio R está inscrita (dentro) em um quadrado de lado L. Se lançar-
mos um ponto dentro do quadrado, qual a probabilidade de que o
ponto caia dentro da circunferência?
Resolução: pelo enunciado, podemos representar o cenário
por meio da Figura 7.

Claretiano - Centro Universitário


204 © Probabilidade e Estatística

Figura 7 Circunferência de raio R inscrita em quadrado de lado L.

Como o ponto foi lançado dentro do quadrado, o Espaço


Amostral são todos os locais onde o ponto pode cair dentro do
quadrado; portanto, temos que nosso Espaço Amostral será de-
finido por todos os pontos, ou seja, a área do quadrado e n(W) =
área do quadrado de lado L. Como o interesse é determinar a pro-
babilidade de o ponto cair dentro da circunferência, nosso evento
passa a considerar todos os pontos dentro dela, ou seja, temos
um evento do tipo A= {ponto atirado dentro de o quadrado cair na
circunferência} e n(A) = área da circunferência de raio R.
Temos que a área da circunferência é igual a π ⋅ R e que a
2

área do quadrado é igual a L2. Note, ainda, que, pela construção


geométrica, podemos afirmar que L= 2 ⋅ R .
Então, temos que:
# A π ⋅ R2 π ⋅ R2 π ⋅ R2 π ⋅ R2 π
P ( A) = =
= 2
= 2
= =
#W L (2 ⋅ R ) 22 ⋅ R 2 4 ⋅ R 2 4

Ou seja, a probabilidade de o ponto cair dentro da circunfe-


rência é igual a π .
4
Exemplo 19
Suponhamos uma situação em que um quadrado de lado L
está inscrito em uma circunferência de raio R. Se lançarmos um
ponto dentro da circunferência, qual a probabilidade de que o
ponto caia dentro do quadrado? Vejamos a Figura 8.
© U5 – Teoria Elementar de Probabilidade 205

Figura 8 Quadrado de lado L inscrito em circunferência de raio R.

Resolução: como o ponto foi lançado dentro da circunferên-


cia, o Espaço Amostral são todos os locais onde o ponto pode cair;
portanto, temos que nosso Espaço Amostral será definido pela
área da circunferência e n(W) = área da circunferência de raio R.
Como o interesse é determinar a probabilidade de o ponto cair
dentro do quadrado, nosso evento passa a considerar todos os
pontos dentro dele, ou seja, temos um evento do tipo A= {ponto
atirado dentro da circunferência cair no quadrado} e n(A) = área do
quadrado de lado L.
Observações: temos que a área da circunferência é igual a
π ⋅ R 2 e que a área do quadrado é igual a L2 . Note, ainda, que,
pela construção geométrica, podemos estabelecer uma relação
entre o lado L do quadrado e o diâmetro da circunferência por
meio do Teorema de Pitágoras:
4 ⋅ R2
(2 ⋅ R) 2 =L2 + L2 ⇒ 22 ⋅ R 2 =2 ⋅ L2 ⇒ 4 ⋅ R 2 =2 ⋅ L2 ⇒ L2 = =2 ⋅ R 2
2
Assim, temos que:
#A L2 2 ⋅ R2 2
P( A) = =
= =
# S π ⋅ R2 π ⋅ R2 π

Claretiano - Centro Universitário


206 © Probabilidade e Estatística

Exemplo 20
Suponhamos uma determinada circunferência de raio R. Se
um ponto qualquer for atirado dentro dessa circunferência, qual
a probabilidade de o ponto cair mais perto da circunferência pro-
priamente dita do que de seu centro?
Resolução: pelo enunciado, podemos representar o cenário
considerando outra circunferência menor, com raio r igual à meta-
de do raio maior R, de forma que, se o ponto cair dentro da circun-
ferência menor (r), estará mais próximo do centro; caso contrário,
estará mais próximo da circunferência. Vejamos a Figura 9.

Figura 9 Circunferência de raio r com centro em uma circunferência de raio R, com R= 2 ⋅ r .

Como o ponto foi lançado dentro da circunferência de raio


R, o Espaço Amostral são todos os locais onde o ponto pode cair;
portanto, temos que nosso Espaço Amostral será definido pela
área da circunferência e n(W) = área da circunferência de raio R.
Para o cálculo, vamos considerar um Evento Complementar ao do
interesse do exercício, que será o do ponto cair mais próximo do
centro, ou seja, dentro da circunferência de raio menor (r): A =
{ponto atirado cair dentro da circunferência de raio r} e n(A) = área
da circunferência de raio r.
© U5 – Teoria Elementar de Probabilidade 207

Observações: temos que a área da circunferência de raio R é


igual a π ⋅ R e que a área da circunferência de raio r é π ⋅ r . Note,
2 2

ainda, que, pela construção geométrica, localizamos a circunferên-


cia menor com seu raio exatamente igual à metade do raio da cir-
cunferência maior, ou seja, R= 2 ⋅ r .
Assim, temos:

# A π ⋅ r2 r2 r2 r2 r2 1
P( A
=) = = = = = =
#S π ⋅R 2
R 2
(2 ⋅ r ) 2 2
2 ⋅r 2
4⋅r 2
4

Chamando de B o Evento B = {ponto cair mais próximo da


circunferência}, temos:
1 4 −1 3
P( B) =1 − P( A) =1 − = =
4 4 4
Além dos anteriores, existem diversos resultados relaciona-
dos à aplicação dos conceitos das probabilidades frequentistas.
Em especial, quando tratamos de dois ou mais eventos não mutu-
amente exclusivos, que podem ocorrer simultaneamente, temos
as situações de dependência e independência entre os eventos,
que trataremos a seguir.

8. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA


Estudamos anteriormente que, para dois ou mais eventos,
podemos ter as relações de exclusividade ou não exclusividade.
Nos casos de eventos não exclusivos, podemos estabelecer a re-
lação de dependência entre eventos. As probabilidades que estu-
dam as relações de dependência são chamadas de probabilidades
condicionais e são úteis no cálculo da probabilidade de ocorrência
de um particular evento condicionado (dependente) à ocorrência
de outro evento a priori, uma informação preliminar sobre o Fenô-
meno Aleatório.

Claretiano - Centro Universitário


208 © Probabilidade e Estatística

Vejamos um exemplo para entendermos melhor esse con-


ceito e deduzirmos a sua fórmula tradicional para trabalhar com
eventos dependentes (Probabilidade Condicional).
Pegamos, como exemplo, o lançamento de dois dados ho-
nestos. Qual a probabilidade de ocorrência do Evento A = {a soma
dos valores obtidos é igual a 10}? Utilizando os conhecimentos an-
teriores, temos (considerando que os resultados que somam 10
são [4,6], [5,5] e [6,4]):

n( A) 3
P=
( A) =
n(W) 36
Agora, suponhamos que seja fornecida uma informação,
que chamaremos de Evento B, da forma: B= {saiu o número 5 em
pelo menos um dos dados}. Com base nessa informação, o Espaço
Amostral fica reduzido em função da informação, ou seja, os resul-
tados passam a depender da informação dada. Nessa ilustração, o
Espaço Amostral reduzido, com base na informação B, será:

ΩReduzido = {[1,5], [2,5], [3,5], [4,5], [5,1], [5,2], [5,3], [5,4], [5,5],
[5,6], [6,5]}

Então, a probabilidade de que ocorra o Evento A, conside-


rando esse novo Espaço Amostral, será:

n( A) 1
P( A)
= =
n(W Re duzido ) 11
Note que a P(A) mudou de valor; passou de 3 = 1 para 1 ,
36 12 11
ou seja, o valor da probabilidade de ocorrer o Evento A mudou em
função da informação B, ou seja, A e B são eventos dependentes.
Outro exemplo para explicar os eventos dependentes, consideran-
do que A e B sejam dois eventos aleatórios, A ⊂ W e B ⊂ W, com
A e B não disjuntos (ou não mutuamente exclusivos) seria: se a
© U5 – Teoria Elementar de Probabilidade 209

ocorrência de A modificar ou interferir, de alguma forma, na pro-


babilidade de ocorrência de B ou vice-versa, então, A e B são ditos
"eventos dependentes".
Para não necessitar trabalhar com dois espaços amostrais, o
original e o reduzido, existe uma maneira de representar a situa-
ção de dependência utilizando apenas o Espaço Amostral original
(W) e obter os mesmos resultados.
Como no exemplo anterior, no qual utilizamos o lançamento
de dois dados honestos, calcularemos a probabilidade de a soma
dos valores do dado ser igual a 10, sabendo-se que saiu o número
5 em, pelo menos, um dos dados, se partirmos do último cálculo
e efetuarmos a seguinte manipulação algébrica: dividindo tanto o
numerador quanto o denominador por 36 (que é o tamanho do
Espaço Amostral original W), ficaremos com:
1
n( A) 1 36
P ( A) = = ⇒ P ( A) =
n(W Re duzido ) 11 11
36
Avaliando com maior cuidado as duas frações obtidas e os
dois eventos anteriores sobre o lançamento de dois dados hones-
tos, ou seja, A= {soma ser igual a 10} e B= {pelo menos um 5 em um
dos dados}, podemos verificar que:
1
• O numerador 36 pode ser interpretado como a intersec-
ção entre A e B, ou seja, ocorrer a soma 10 E termos, pelo
menos, um número 5. Essa intersecção corresponde exa-
tamente ao resultado [5,5]; assim, o numerador é nada
mais do que P(A∩B).
11
• O denominador 36 pode ser interpretado como a proba-
bilidade de ocorrência do evento informado, ou seja, a
probabilidade de sair, pelo menos, um número 5 em um
dos dados, que são os resultados já descritos anterior-

Claretiano - Centro Universitário


210 © Probabilidade e Estatística

mente: {[1,5], [2,5], [3,5], [4,5], [5,1], [5,2], [5,3], [5,4],


[5,5], [5,6] e [6,5]}. Assim, o denominador nada mais é do
que P(B).
Assim, a probabilidade de ocorrer um Evento A qualquer
condicionado à informação dada a priori B, ou, podemos dizer, a
probabilidade de ocorrer um Evento A dado um Evento B, que de-
notaremos por A\B, é dada por:
P( A ∩ B)
P( A \ B) =
P( B)
Ou, então:
P( A ∩ B)
P( B \ A) =
P( A)

Vejamos, a seguir, alguns exemplos.

Exemplo 21
Em um colégio, foi realizada uma pesquisa sobre atividades
extracurriculares dos alunos. Dos 500 alunos entrevistados, 240
praticavam algum tipo de esporte, 180 frequentavam algum cur-
so de idiomas e 120 realizavam as duas atividades, ou seja, pra-
ticavam algum tipo de esporte e frequentavam algum curso de
idiomas. Se, dos alunos entrevistados, um é escolhido ao acaso,
e sabe-se que este pratica algum esporte, qual a probabilidade de
que ele faça, também, um curso de idiomas?
Resolução: do exposto no enunciado, podemos destacar
dois eventos:
• A= {Aluno escolhido ao acaso que pratica esporte}.
• B= {Aluno escolhido ao acaso que faz curso de idiomas}.
O calculo será sobre a probabilidade do Evento B (fazer idio-
mas), pois a informação dada no enunciado é de que o aluno pra-
tica esporte. Assim:
© U5 – Teoria Elementar de Probabilidade 211

120
P( A ∩ B ) 500 120 1
P( B \ A)= = = = = 0,5= 50%
P( A) 240 240 2
500
Então, a probabilidade de o aluno escolhido fazer idiomas,
dado que ele pratica esportes, é de 50%.

Exemplo 22
Em uma instituição de Ensino Superior, sabe-se que, dos
1.300 alunos matriculados no primeiro ano de seus cursos, 750
cursaram todo o Ensino Médio em escola pública e 500 estudan-
tes possuem renda familiar abaixo de R$700,00. Sabe-se, também,
que, do total de alunos matriculados, 200 cursaram todo o Ensi-
no Médio em escola pública e possuem renda familiar abaixo de
R$700,00. Se um aluno matriculado no primeiro ano veio da esco-
la pública, qual será a probabilidade de ele possuir renda familiar
abaixo de R$700,00?
Resolução: do exposto no enunciado, podemos destacar
dois eventos:
• A= {Aluno veio de escola pública}.
• B= {Aluno possui renda inferior a R$700,00}.
O interesse é calcular a probabilidade de B, pois já sabemos
que o aluno veio de escola pública, conforme informação dada no
enunciado. Assim:
200
P( A ∩ B ) 1300 200 4
P( B \ A=
) = = = = 0, 2667 = 26, 67%
P( A) 750 750 15
1300
Então, a probabilidade de o aluno ter renda inferior a
R$700,00, dado que ele veio da escola pública, é de 26,67%.
Um dos principais estudiosos das probabilidades condicio-
nais foi Thomas Bayes (1702-1761). Por meio dos seus trabalhos,

Claretiano - Centro Universitário


212 © Probabilidade e Estatística

publicados tempos após a sua morte, foram construídos três im-


portantes resultados, que ampliaram demasiadamente a aplicabi-
lidade das probabilidades condicionais.
Com base na fórmula da Probabilidade Condicional citada
anteriormente, podemos deduzir uma maneira de determinar as
probabilidades das intersecções entre eventos dependentes, con-
siderando o fator de dependência entre eles. Essa fórmula ficou
conhecida como a "Regra do Produto das Probabilidades".

Regra do Produto das Probabilidades


Considerando a fórmula da Probabilidade Condicional, po-
demos isolar a probabilidade do numerador da seguinte forma:

P( A ∩ B)
P( A \ B)= ⇒ P( A ∩ B)= P( B) ⋅ P( A \ B)
P( B)
Dizendo de outro modo, dados dois eventos dependentes, a
probabilidade de ocorrência simultânea dos dois é igual à proba-
bilidade de ocorrência do primeiro evento (que é a informação ou
o evento inicial de interesse) multiplicada pela probabilidade de
ocorrência do segundo evento, uma vez que o primeiro evento já
ocorreu.
A fórmula pode ser aplicada em qualquer coleção de eventos
que sejam não mutuamente exclusivos com intersecção definida.
Essa fórmula pode ser representada por:

P( A1 ∩ A2 ∩ A3 ∩  ∩ An ) =
P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 ) ⋅ ⋅ P( An \ A1 ∩ A2 ∩  ∩ An −1 )

Vejamos alguns exemplos de aplicação dela.


Exemplo 23
Em um lote de 12 peças com 4 defeituosas, 3 são selecio-
nadas ao acaso, sendo uma após a outra e sem reposição. Qual a
probabilidade de todas serem defeituosas?
© U5 – Teoria Elementar de Probabilidade 213

Resolução: para aplicar a fórmula do produto, o segredo é


pensar cada evento isoladamente. Assim, como temos 3 peças, te-
mos 3 eventos:
• A1 = {1ª peça selecionada ser defeituosa}.
• A2 = {2ª peça selecionada ser defeituosa}.
• A3 = {3ª peça selecionada ser defeituosa}.
Para termos 3 peças defeituosas, o Evento A1 E o Evento A2
E o Evento A3 devem ocorrer. Desse modo, o que nos interessa é
P(A1∩A2∩A3), que, pela fórmula anterior, é:

P( A1 ∩ A2 ∩ A3=
) P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 )

Considerando os dados do problema, temos:

4
P(A1 ) =
12
3
• P ( A2 \ A1 ) =
11 , dado que A1 ocorreu e uma peça defei-
tuosa foi retirada, sobrando 3 defeitos em 11 peças;

2
• P ( A3 \ A1 ∩ A2 ) =, dado que A e A ocorreram e duas
10 1 2
peças defeituosas foram retiradas, sobrando 2 defeitos
em 10 peças;
Assim, temos:
P( A1 ∩ A2 ∩ A3 ) =
P( A1 ) ⋅ P( A2 \ A1 ) ⋅ P( A3 \ A1 ∩ A2 ) =
4 3 2 1
⋅ ⋅ =
12 11 10 55
Exemplo 24
(PROVÃO, 2000) Em certa cidade o tempo, bom ou chuvoso,
2
é igual ao do dia anterior com probabilidade . Se hoje faz tempo
3
bom, a probabilidade de que chova depois de amanhã será?

Claretiano - Centro Universitário


214 © Probabilidade e Estatística

Resolução: temos os seguintes eventos:


• A = {não choveu hoje}.
• B = {chove amanhã}.
• C = {não chove amanhã}.
• D = {chove depois de amanhã}.
Partindo de hoje, existem duas possibilidades para chegar-
mos até depois de amanhã: chove amanhã E chove depois de ama-
nhã OU não chove amanhã E chove depois de amanhã. Matemati-
camente, temos:
P ( D) = P ( B ∩ D ) + P (C ∩ D) =
P ( B ) ⋅ P ( D \ B ) + P (C ) ⋅ P ( D \ C ) =
1 2 2 1 2 2 4
⋅ + ⋅ = + =
3 3 3 3 9 9 9

Exemplo 25
Um vendedor estima que a probabilidade de ele executar
uma venda durante o primeiro contato com o cliente é de 55%,
melhorando para 60% em um segundo contato, caso não tenha
conseguido vender no primeiro contato. Suponhamos que esse
vendedor faça, no máximo, dois contatos com cada cliente. Se ele
entrar em contato com um novo cliente, qual a probabilidade de
ele efetuar a venda?
Resolução: temos os seguintes eventos:
• A= {vendeu no primeiro contato}.
• B= {não vendeu no primeiro contato}.
• C= {vender no segundo contato}.
Para efetuar a venda, o vendedor deve vender no primeiro
contato OU não vender no primeiro contato E vender no segundo
contato. Matematicamente, temos:
© U5 – Teoria Elementar de Probabilidade 215

P(Vender )= P ( A) + P ( B ∩ C )=
P( A) + P( B) ⋅ P(C \ B)
= 0,55 + 0, 45 ⋅ 0, 60 = 0,82 = 82%

Neste momento, é interessante que você resolva a oitava questão


autoavaliativa ao final desta unidade para fortalecer o seu aprendi-
zado sobre a aplicação da Regra do Produto das Probabilidades.

Da mesma forma que existem eventos dependentes, exis-


tem eventos independentes. Vejamos um exemplo para ilustrar o
conceito de independência: ao jogarmos um dado e uma moeda,
qual a probabilidade de sair o número 2 no dado e de sair cara na
moeda?
No exemplo, o Espaço Amostral corresponde a todas as pos-
sibilidades de juntar as faces da moeda com as faces do dado. As-
sim, Ω= {(cara, 1); (cara, 2); (cara, 3); (cara, 4); (cara, 5); (cara, 6);
(coroa, 1); (coroa, 2); (coroa, 3); (coroa, 4); (coroa, 5); (coroa, 6)}.
Temos 12 resultados possíveis, n(Ω)= 12. Considerando o evento
"sair o número 2 no dado", teremos 2 casos favoráveis, n(A)= 2.
Então:

n( a ) 2 1
P( A=
) = =
n(W) 12 6

Mas se dissermos que ocorreu a saída de cara na moeda, ou


seja, uma informação a priori, qual será a probabilidade de sair 2
no dado? Com essa informação, dos 12 resultados anteriores, fica-
mos, apenas, com aqueles que possuem cara na moeda, ou seja,
um Espaço Amostral reduzido, da seguinte forma: ΩReduzido= {(cara,
1); (cara, 2); (cara, 3); (cara, 4); (cara, 5); (cara, 6)}. Nesse caso, a
n(Ω)= 6 e a probabilidade de sair 2 no dado é:
n( a ) 2 1
P( A=) = =
n(W) 12 6

Claretiano - Centro Universitário


216 © Probabilidade e Estatística

Note que, independentemente da informação sobre a mo-


eda, a probabilidade de sair o número 2 no dado não se alterou.
Sejam A e B dois eventos aleatórios, A ⊂ W e B ⊂ W, com A e
B não disjuntos (ou não mutuamente exclusivos), se a ocorrência
de A não modificar ou não interferir na probabilidade de ocorrên-
cia de B, então, A e B são ditos "eventos independentes".
Tendo eventos independentes, quais as consequências com
relação à Fórmula do Produto das Probabilidades?
Se A e B são independentes, então, P ( A \ B ) = P ( A) . Assim,
se tomarmos a fórmula do produto e tivermos A e B independen-
tes, o resultado será:

P ( A ∩ B )= P ( B ) ⋅ P ( A)

Esse resultado também vale para qualquer coleção de even-


tos independentes. Vejamos mais alguns exemplos.
Exemplo 26
O índice de falha de um sistema elétrico de um equipamento
é de 1 em 10.000. Suponhamos que cada equipamento tenha dois
sistemas idênticos e independentes. Qual a probabilidade de ocor-
rer uma falha no equipamento, ou seja, falharem os dois sistemas?
Resolução: temos dois eventos independentes para repre-
sentar o problema:
• Evento A= {1º sistema falhar}.
• Evento B= {2º sistema falhar}.
Assim, para que o equipamento falhe, devem ocorrer A e B
da seguinte maneira:

1 1 1
P(A ∩ B)= P(A) ⋅ P(B)= ⋅ =
10000 10000 100000000
© U5 – Teoria Elementar de Probabilidade 217

Exemplo 27
As probabilidades de 3 motoristas serem capazes de guiar
até em casa com segurança após ingerirem bebida alcoólica são
1 , 1 e 1 , respectivamente. Qual a probabilidade de todos eles
5 6 2
sofrerem algum acidente?
Resolução: temos três eventos independentes para repre-
sentar o problema:
• Evento A= {1º sofrer acidente}.
• Evento B= {2º sofrer acidente}.
• Evento C= {3º sofrer acidente}.
Desse modo, para satisfação da pergunta do problema, de-
vem ocorrer A e B e C assim:
4 5 1 20 2 1
P ( A ∩ B ∩ C ) = P ( A) ⋅ P ( B ) ⋅ P (C ) = ⋅ ⋅ = = =
5 6 2 60 6 3
Exemplo 28
Uma pessoa pode ir para a direita, para a esquerda e para
frente em cada um dos 5 cruzamentos de um labirinto. Qual a pro-
babilidade de a pessoa atravessar o labirinto corretamente, haven-
do um único caminho correto?
Resolução: temos cinco eventos independentes para repre-
sentar o problema:
• Evento A= {acertar o caminho no cruzamento 1}.
• Evento B= {acertar o caminho no cruzamento 2}.
• Evento C= {acertar o caminho no cruzamento 3}.
• Evento D= {acertar o caminho no cruzamento 4}.
• Evento E= {acertar o caminho no cruzamento 5}.
Desse modo, para satisfação da pergunta do problema, de-
vem ocorrer A e B e C e D e E assim:

Claretiano - Centro Universitário


218 © Probabilidade e Estatística

P( A ∩ B ∩ C ∩ D ∩ E ) =
1 1 1 1 1 1
P( A) ⋅ P( B) ⋅ P(C ) ⋅ P( D) ⋅ P( E ) = ⋅ ⋅ ⋅ ⋅ =
3 3 3 3 3 243
Exemplo 29
A probabilidade de um atirador acertar um alvo colocado a
100 metros é de 70% em uma única tentativa. Qual a probabilida-
de de que, em cinco tentativas, o atirador acerte, no mínimo, uma
vez o alvo?
Resolução: para facilitar a resolução, vamos trabalhar com
um Evento Complementar ao que foi solicitado no exercício. Va-
mos calcular a probabilidade de erro de todas as cinco tentativas:
• Evento A= {errar a tentativa 1}.
• Evento B= {errar a tentativa 2}.
• Evento C= {errar a tentativa 3}.
• Evento D= {errar a tentativa 4}.
• Evento E= {errar a tentativa 5}.
Desse modo, para satisfação do Evento Complementar defi-
nido, devem ocorrer A e B e C e D e E assim:

P( A ∩ B ∩ C ∩ D ∩ E ) =
P ( A) ⋅ P ( B ) ⋅ P (C ) ⋅ P( D) ⋅ P ( E ) = 0,3 ⋅ 0,3 ⋅ 0,3 ⋅ 0,3 ⋅ 0,3 = 0, 00243
Então, tomando o Evento T= {acertar, ao menos, uma tenta-
tiva}, temos:
P (T ) =
1 − 0, 00243 =
0,99757

Antes de prosseguirmos, sugerimos que você resolva a nona


questão autoavaliativa disponível ao final desta unidade para for-
talecer o conceito de eventos independentes.

Além dos resultados tratados aqui, sugerimos que você am-


plie seus conhecimentos com outras resoluções baseadas nos es-
© U5 – Teoria Elementar de Probabilidade 219

tudos de Bayes, que são a Fórmula da Probabilidade Total e o Teo-


rema de Bayes.

9. O ENSINO DAS PROBABILIDADES


Os tópicos trabalhados neste Caderno de Referência de Conteú-
do estão presentes nos currículos da Educação Básica, mais fortemen-
te no Ensino Médio, e são objetos constantes em concursos públicos,
vestibulares e avaliações estratégicas, como o ENEM e o ENADE.
Nesse sentido, é válido ressaltar que devemos valorizar o
que é de mais importante nas probabilidades: a interpretação
dos enunciados. Não adianta decorarmos uma ou duas fórmulas
envolvidas nas probabilidades se não soubermos qual o Espaço
Amostral e qual(is) o(s) evento(s) envolvido(s).
É de fundamental importância que esses conceitos sejam
trabalhados de forma muito detalhada e sistematizada para forta-
lecerem, na mente do aluno, como descobrir os eventos. Conhe-
cendo-se os eventos, não é difícil calcular uma probabilidade, mas,
se não o descobrimos, é impossível efetuar os cálculos, mesmo
conhecendo as fórmulas.
Para ilustrar a presença das probabilidades na Educação Bá-
sica, selecionamos alguns exercícios cobrados no ENEM. Vamos
resolvê-los?

Exemplo 30
(ENEM, 1998) Em um concurso de televisão, são apresentadas
a um participante 3 fichas voltadas para baixo, estando representa-
das, em cada uma delas, as letras T, V e E. As fichas encontram-se
alinhadas em uma ordem qualquer. O participante deve ordenar as
fichas ao seu gosto, mantendo as letras voltadas para baixo, tentan-
do obter a sigla TVE. Ao desvirá-las, para cada letra que esteja na
posição correta, ganhará um prêmio de R$200,00. Qual a probabili-
dade de o participante não ganhar qualquer prêmio?

Claretiano - Centro Universitário


220 © Probabilidade e Estatística

Resolução: como são 3 letras a serem ordenadas, o Espaço


Amostral corresponde à permutação das 3 letras, ou seja, 6 pos-
sibilidades. O participante só não ganhará se errar todas as po-
sições, ou seja, não colocar T na primeira, não colocar V na se-
gunda e não colocar E na terceira, possibilidade VET e ETV. Assim:
2 1.
P(Ganhar)= =
6 3
Exemplo 31
(ENEM, 1998) Nas mesmas condições do Exemplo 30, qual
a probabilidade de o concorrente ganhar, exatamente, o valor de
R$400,00?
Resolução: para ganhar o prêmio, o participante necessi-
ta acertar, exatamente, 2 letras, mas como são só 3 letras, se ele
acertar exatamente 2, necessariamente acertará todas as 3. Assim,
não existe possibilidade de ele acertar exatamente 2. Portanto:
0
P(Ganhar)= = 0 .
6
Exemplo 32
(ENEM, 2000) Um apostador tem três opções para participar
de certa modalidade de jogo, que consiste no sorteio aleatório de
um número dentre dez:
• 1ª opção: comprar três números para um único sorteio.
• 2ª opção: comprar dois números para um sorteio e um
número para um segundo sorteio.
• 3ª opção: comprar um número para cada sorteio, num to-
tal de três sorteios.
Se X, Y, Z representam as probabilidades de o apostador ga-
nhar algum prêmio, escolhendo, respectivamente, a 1ª, a 2ª ou a
3ª opções, qual a relação entre elas?
Resolução: levando-se em conta que apenas um número
será sorteado, podemos considerar, então, que todos os números
possuem a mesma probabilidade de serem sorteados. Considere-
mos, ainda, que os sorteios sejam independentes. Assim:
© U5 – Teoria Elementar de Probabilidade 221

• 1ª opção: temos três números comprados, A, B e C. Para o


apostador ganhar, ou deve ser sorteada A ou B ou C, cujas
probabilidades são iguais a:
1
P(sortear número qualquer) =
10

Então:
1 1 1 3
P (opção1) = P ( A ) + P ( B ) + P ( C ) = + + =
10 10 10 10
• 2ª opção: o apostador está apostando nos números A e
B para o primeiro sorteio e no número C para o terceiro
sorteio (como os sorteios são independentes, pode ser
até um número que já havia sido escolhido no primeiro
sorteio). Assim, ele ganhará se sair A ou B no primeiro ou
se sair C no segundo sorteio:

P(opção 2) = P ( A no sorteio1) + P( B no sorteio1) + P(C no sorteio2) =


1 1 1 3
+ + =
10 10 10 10

• 3ª opção: utilizando a mesma explicação da 2ª opção, te-


mos:

P (opção3) = P ( A no sorteio1) + P( B no sorteio2) + P(C no sorteio3) =


1 1 1 3
+ + =
10 10 10 10

Então, as probabilidades são iguais nas três opções de


aposta.

Exemplo 33
(ENEM, 2001) Uma empresa de alimentos imprimiu em suas
embalagens um cartão de apostas do seguinte tipo:

Claretiano - Centro Universitário


222 © Probabilidade e Estatística

Cada cartão de apostas possui 7 figuras de bolas de futebol


e 8 sinais de "X", distribuídos entre os 15 espaços possíveis, de tal
forma que a probabilidade de um cliente ganhar o prêmio nunca
seja igual a zero. Em determinado cartão, existem duas bolas na
linha 4 e duas bolas na linha 5. Com esse cartão, qual é a probabi-
lidade de o cliente ganhar o prêmio?
Resolução: para ganhar o prêmio, é necessário que o clien-
te encontre uma bola de futebol em cada linha, ou seja, o fato
de o cliente achar uma bola de futebol na linha 2 não aumenta
nem diminui as suas chances de encontrar outra bola de futebol
na linha 3. Em outras palavras, encontrar uma bola em uma linha
não depende de ter encontrado em uma outra linha; são situações
independentes.
Vamos definir um evento para cada linha e calcular a chance
de se encontrar uma bola em cada uma. Considerando os dados
do problema, temos 7 bolas, sendo 2 na linha 4 e duas na linha 5;
portanto, nas linhas 1, 2 e 3, temos 1 bola com certeza, já que a
chance de ganhar não é igual a zero. Assim:
1
1) A = {encontrar uma bola na linha 1} ⇒ P( A) = .
3
1
2) B = {encontrar uma bola na linha 2} ⇒ P( B) = .
4
1
3) C = {encontrar uma bola na linha 3} ⇒ P(C ) = .
3
2
4) D = {encontrar uma bola na linha 4} ⇒ P( D) = .
3
© U5 – Teoria Elementar de Probabilidade 223

2
5) E = {encontrar uma bola na linha 5} ⇒ P( E )= = 1 .
2
Então, como necessitamos que ocorram todos os even-
tos anteriores, temos:

P(Ganhar )= P( A ∩ B ∩ C ∩ D ∩ E )=
1 1 1 2 2 1
P( A) ⋅ P( B) ⋅ P(C ) ⋅ P( D) ⋅ P( E ) = ⋅ ⋅ ⋅ ⋅1 = =
3 4 3 3 108 54
Exemplo 34
(ENEM, 2001) Um município de 628km² é atendido por duas
emissoras de rádio, cujas antenas A e B alcançam um raio de 10km
do município, conforme nos mostra a figura a seguir. Para orçar um
contrato publicitário, uma agência precisa avaliar a probabilidade
que um morador tem de, circulando livremente pelo município,
estar na área de alcance de, pelo menos, uma das emissoras. De
quanto é, aproximadamente, essa probabilidade?

Resolução: este exemplo se trata de um problema envolven-


do Espaço Amostral e eventos geométricos. Pela construção geo-
métrica, temos que o Espaço Amostral é a área do município, ou
seja, 628km2. O Evento Aleatório envolvido é equivalente à área de
alcance das emissoras, somando-se as áreas dos dois semicírculos,
mas, pela construção, sabemos que a união das duas regiões cor-
responde à metade de uma circunferência de raio 10km. Assim:

Claretiano - Centro Universitário


224 © Probabilidade e Estatística

• A = {área de metade da circunferência de raio 10}.


• Ω = {área do município}.

π ⋅102 π ⋅100
P ( Alcançe=
)
n( A)
= 2= 2 = 50 ⋅ π ≅ 0, 08 ⋅ π ≅ 0, 25
n (W) 628 628 628
Ou seja, a probabilidade de um morador estar na área de
alcance é de, aproximadamente, 25%.

Exemplo 35
(ENEM, 2005) As 23 ex-alunas de uma turma que comple-
tou o Ensino Médio há 10 anos se encontraram em uma reunião
comemorativa. Várias delas haviam se casado e tido filhos. A dis-
tribuição das mulheres, de acordo com a quantidade de filhos, é
mostrada no gráfico a seguir.
10

0
Sem filhos 1 Filho 2 filhos 3 filhos

Um prêmio foi sorteado entre todos os filhos dessas ex-alunas.


Qual a probabilidade de que a criança premiada seja filho(a) único(a)?
Resolução: vamos enumerar, no Espaço Amostral, todos os
filhos presentes, representando por A os filhos que são únicos e
por B os que possuem irmãos:
© U5 – Teoria Elementar de Probabilidade 225

Ω = { A, A, A, A, A, A, A, B, B, B, B, B, B, B, B, B, B,
B, B, B, B, B, B, B, B}.

Considerando o Evento F = {filho único}, temos:

n( F ) 7
P=
(F ) =
n(W) 25
Exemplo 36
(ENEM, 2006) A tabela a seguir indica a posição relativa de
quatro times de futebol na classificação geral de um torneio, em
dois anos consecutivos. O símbolo (●) significa que o time indicado
na linha ficou, no ano de 2004, à frente do indicado na coluna, e o
símbolo (*) significa que o time indicado na linha ficou, no ano de
2005, à frente do indicado na coluna.

A B C D
A *
B • * • • *
C • * * *
D • •
Qual a probabilidade de que um desses quatro times, esco-
lhido ao acaso, tenha obtido a mesma classificação no torneio em
2004 e 2005?
Resolução: avaliando o ano de 2004, notamos que todas as
equipes ficaram à frente de A e que a equipe B ficou à frente de
todas as demais (B em primeiro e A em 4º lugar). No ano de 2005,
notamos que todas ficaram à frente de D e que C ficou à frente de
todas as demais (C em primeiro e D em 4º lugar). Assim, não existe
possibilidade de que uma determinada equipe tenha mantido a
mesma posição, ou seja, a probabilidade é igual a zero.

Claretiano - Centro Universitário


226 © Probabilidade e Estatística

Exemplo 37
(ENEM, 2006) Um time de futebol amador ganhou uma taça
ao vencer um campeonato. Os jogadores decidiram que o prêmio
seria guardado na casa de um deles. Todos quiseram guardar a
taça em suas casas. Na discussão para se decidir com quem ficaria
o troféu, travou-se o seguinte dialogo:
Pedro, camisa 6: — Tive uma ideia! Nós somos 11 jogadores, e
nossas camisas estão numeradas de 2 a 12. Tenho dois dados, com
as faces numeradas de 1 a 6. Se eu jogar os dois dados, a soma dos
números das faces que ficarem para cima pode variar de 2 (1 + 1)
a 12 (6 + 6). Vamos jogar os dados, e quem tiver a camisa com o
número do resultado vai guardar a taça.
Tadeu, camisa 2: — Não sei, não... Pedro sempre foi muito esper-
to... Acho que ele está levando alguma vantagem nessa proposta...
Ricardo, camisa 12: — Pensando bem, você pode estar certo! Co-
nhecendo o Pedro, é capaz que ele tenha mais chances de ganhar
que nós dois juntos...
Desse dialogo, o que podemos concluir?
Resolução: vamos detalhar o Espaço Amostral no lançamen-
to de dois dados, colocando, para cada um, a soma dos valores.

DADO 1 DADO 2 SOMA DADO 1 DADO 2 SOMA


1 1 2 4 1 5
1 2 3 4 2 6
1 3 4 4 3 7
1 4 5 4 4 8
1 5 6 4 5 9
1 6 7 4 6 10
2 1 3 5 1 6
2 2 4 5 2 7
2 3 5 5 3 8
2 4 6 5 4 9
© U5 – Teoria Elementar de Probabilidade 227

2 5 7 5 5 10
2 6 8 5 6 11
3 1 4 6 1 7
3 2 5 6 2 8
3 3 6 6 3 9
3 4 7 6 4 10
3 5 8 6 5 11
3 6 9 6 6 12

Assim:
1
P( Soma
= 2)
=
36
5
P ( Soma= 6)
=
36
1
P ( Soma
= 12)
=
36
Conclui-se que Tadeu e Ricardo tinham razão, pois os dois
juntos tinham menos chances de ganhar a guarda da taça do que
Pedro.

Exemplo 38
(ENEM, 2007) A queima de cana aumenta a concentração de
dióxido de carbono e de material particulado na atmosfera, causan-
do alteração do clima e contribuindo para o aumento de doenças
respiratórias. A tabela a seguir apresenta números relativos a pa-
cientes internados em um hospital no período da queima da cana.

Problemas Respiratórios Problemas Respiratórios Outras


Pacientes Total
Devido a queimada Devido a outras causas doenças

Idosos 50 150 60 260

Crianças 150 210 90 450

Claretiano - Centro Universitário


228 © Probabilidade e Estatística

Escolhendo-se aleatoriamente um paciente internado nesse


hospital por problemas respiratórios causados pelas queimadas,
qual a probabilidade de que ele seja uma criança?
Resolução 1: podemos observar que o fato de ter problemas
respiratórios não é independente do tipo de paciente. Assim, po-
demos resolver este exercício utilizando a formação de um Espaço
Amostral reduzido. Como nossa informação é de que o paciente
possui problema respiratório devido à queimada, nosso Espaço
Amostral reduzido, dada a informação, são os 200 pacientes nessa
condição. Chamando de A = {ser criança} o paciente, temos:

150 3
P ( A)= = = 0, 75
200 4
Resolução 2: podemos observar que o fato de ter proble-
mas respiratórios não é independente do tipo de paciente. Assim,
podemos resolver este exercício utilizando a Fórmula da Probabi-
lidade Condicional. Chamando de A = {ser criança} o paciente e a
informação dada a priori de B = {tem problema respiratório devido
a queimadas}, temos:
150
P( A ∩ B ) 710 150 3
P( A \ B)= = = = = 0, 75
P( B) 200 200 4
710
Exemplo 39
(ENEM, 2009) O controle de qualidade de uma empresa fa-
bricante de telefones celulares aponta que a probabilidade de um
aparelho de determinado modelo apresentar defeito de fabrica-
ção é de 0,2%. Se uma loja acaba de vender 4 aparelhos desse
modelo para um cliente, qual é a probabilidade de esse cliente sair
da loja com exatamente dois aparelhos defeituosos?
Resolução: vamos supor 4 eventos independentes (um para
cada aparelho) da seguinte forma:
© U5 – Teoria Elementar de Probabilidade 229

• A1 = {aparelho 1 com defeito} ⇒ P(A1) = 0,2% = 0,002.


• A2 = {aparelho 2 com defeito} ⇒ P(A2) = 0,2% = 0,002.
• A3 = {aparelho 3 com defeito} ⇒ P(A3) = 99,8% = 0,998.
• A4 = {aparelho 4 com defeito} ⇒ P(A4) = 99,8% = 0,998.
Assim, chamando de D = {sair com exatamente 2 defeitos} os
dois possíveis aparelhos defeituosos, temos:
P( D)= P ( A1 ∩ A2 ∩ A3 ∩ A4)= P ( A1) ⋅ P ( A2) ⋅ P ( A3) ⋅ P ( A4)=
= 0, 002 ⋅ 0, 002 ⋅ 0,998 ⋅ 0,998 = (0, 002) 2 ⋅ (0,998) 2

Agora, trabalhamos considerando os dois primeiros apare-


lhos defeituosos, mas isso não é necessário. Podemos ter qualquer
possibilidade de dois defeituosos. Como são apenas 2 em 4, e a
ordem não importa, utilizamos a combinação simples de 4 toma-
dos 2 a 2 para determinar as diferentes possibilidades, da seguinte
forma:

4! 4! 4 ⋅ 3 ⋅ 2 ⋅1 24
Possibilidades
= C4,2
= = = = = 6
2!⋅ (4 − 2)! 2!⋅ 2! 2 ⋅1 ⋅ 2 ⋅1 4
Então, a resposta correta para P(D) é:

6 ⋅ (0, 002) 2 ⋅ (0,998) 2 .


P( D) =

Exemplo 40
(ENEM, 2009) A população brasileira sabe, pelo menos, in-
tuitivamente, que a probabilidade de se acertar as seis dezenas da
Mega Sena não é zero, mas é quase isso! Mesmo assim, milhões
de pessoas são atraídas por essa loteria, especialmente quando o
prêmio se acumula em valores altos.
Até junho de 2009, cada aposta de seis dezenas, pertencen-
tes ao conjunto {01, 02, 03, ..., 59, 60}, custava R$1,50. Considere
que uma pessoa decida apostar, exatamente, R$126,00 e que ela
esteja mais interessada em acertar apenas cinco das seis dezenas

Claretiano - Centro Universitário


230 © Probabilidade e Estatística

da Mega Sena justamente pela dificuldade de acertá-las todas.


Nesse caso, é melhor que essa pessoa faça 84 apostas de seis de-
zenas diferentes, que não tenham cinco números em comum, do
que uma única aposta com nove dezenas, porque a probabilidade
de ela acertar a quina no segundo caso em relação ao primeiro é,
aproximadamente, de?
Resolução: note que a resolução do exercício não está re-
lacionada com a chance de se sortearem os 5 números, já que as
duas apostas levam em conta essa quantidade, e, assim, tanto faz
o tipo de aposta. O que o exercício exige é que se determine de
quantas formas podemos acertar os 5 números, o que significa um
problema de contagem, mais especificamente de combinação sim-
ples. Vejamos:
• 84 apostas de seis números para acertar 5:
Possibilidades 1 =
6!
84 ⋅ C6,5 =84 ⋅ =
5!⋅ (6 − 5)!
6! 6 ⋅ 5!
84 ⋅ =84 ⋅ =
5!⋅1! 5!⋅1
6
84 ⋅ = 84 ⋅ 6 = 504
1
• 1 aposta de nove números para acertar 5:
Possibilidades 2 =
9! 9!
1 ⋅ C9,5 = 1⋅ = 1⋅ =
5!⋅ (9 − 5)! 5!⋅ 4!
9 ⋅ 8 ⋅ 7 ⋅ 6 ⋅ 5! 3024
1⋅ = 1⋅ = 1 ⋅126 =
126
5!⋅ 4 ⋅ 3 ⋅ 2 ⋅1 24
Assim, fazendo a relação, temos:
Possibilidades 1 504
= = 4
Possibilidades 2 126
© U5 – Teoria Elementar de Probabilidade 231

Ou seja, fazer uma aposta de 9 números têm 4 vezes menos


chance de acerto.

Exemplo 41
(ENEM, 2010) A Figura I a seguir mostra um esquema das
principais vias que interligam a cidade A com a cidade B. Cada nú-
mero indicado na Figura II representa a probabilidade de engarra-
famento quando se passa na via indicada. Assim, há uma probabi-
lidade de 30% de engarrafamento no deslocamento do ponto C ao
o ponto B, passando pela estrada E4, e de 50%, quando passando
por E3. Essas probabilidades são independentes umas das outras.
Paula deseja se deslocar da cidade A para a cidade B usando,
exatamente, duas das vias indicadas, percorrendo um trajeto com
a menor probabilidade de engarrafamento possível. Qual é o me-
lhor trajeto para Paula?

Resolução: para ir da cidade A para a cidade B, Paula tem 4


alternativas. Vamos avaliar cada uma delas e calcular a probabili-
dade de engarrafamento, considerando que a chance de engarra-
famento de um trecho independe do trecho anterior ou posterior,
como definido no enunciado. Temos:

Claretiano - Centro Universitário


232 © Probabilidade e Estatística

1) Trajeto 1: sair de A, passando por D e indo pelo traje-


to E2-E6. Temos a seguinte probabilidade de engarrafa-
mento: P(engarrafamento) = 0, 7 ⋅ 0, 6 = 0, 42 = 42%
2) Trajeto 2: sair de A, passando por D e indo pelo traje-
to E2-E5. Temos a seguinte probabilidade de engarrafa-
mento: P(engarrafamento) = 0, 7 ⋅ 0, 4 = 0, 28 = 28%
3) Trajeto 3: sair de A, passando por C e indo pelo traje-
to E1-E4. Temos a seguinte probabilidade de engarrafa-
mento: P(engarrafamento) = 0,8 ⋅ 0,3 = 0, 24 = 24%
4) Trajeto 4: sair de A, passando por C e indo pelo traje-
to E1-E3. Temos a seguinte probabilidade de engarrafa-
mento: P(engarrafamento) = 0,8 ⋅ 0,5 = 0, 40 = 40%
Como podemos perceber, o melhor é o Trajeto 3, pegando as
estradas E1 e E4.

Exemplo 42
(ENEM, 2010) O diretor de um colégio leu, numa revista, que
os pés das mulheres estão aumentando. Há alguns anos, a média
do tamanho dos calçados das mulheres era de 35,5 e, hoje, é de
37,0. Embora essa não fosse uma informação científica, ele ficou
curioso e fez uma pesquisa com as funcionárias do seu colégio,
obtendo os dados dispostos no quadro a seguir:

Número dos Número de


Calçados Funcionárias
39 1

38 10

37 3

36 5

35 6

Escolhendo uma funcionária ao acaso e sabendo que ela tem


calçados maiores que 36,0, qual a probabilidade de ela calçar 38,0?
© U5 – Teoria Elementar de Probabilidade 233

Resolução: podemos observar que existe uma informação


dada a priori sobre o resultado da escolha aleatória, e isso faz nos-
so Espaço Amostral ser reduzido. Como foi informado que o calça-
do é maior que 36, nosso Espaço Amostral reduz-se para:

Número dos Número de


Calçados Funcionárias

39 1
38 10
37 3

Ou seja, de um número de 14 funcionárias, 10 calçam 38.


Assim, a probabilidade de A= {calçar 38} é:

10 5
P( A=
) =
14 7
Exemplo 43
(SECRETARIA DA EDUCAÇÃO DO ESTADO DE SÃO PAULO,
2011) Ao jogar-se um dado comum, qual a probabilidade de que
ele caia com a face 5 ou a face 6 voltadas para cima?
Resolução: o Espaço Amostral resultante do lançamento de
um dado comum é:

W ={1, 2,3, 4,5, 6}

Os eventos envolvidos no exercício são:


#A 1
A = {sair a face 5} e P(=
A) =
#W 6
#B 1
B = {sair a face 6} e P(=
B) =
#W 6
Calcular a probabilidade de ocorrer A ou B é o mesmo que
calcular a probabilidade da união dos dois eventos. Como estes
são eventos mutuamente exclusivos, temos:

Claretiano - Centro Universitário


234 © Probabilidade e Estatística

1 1 2 1
P( A ∪ B ) = P ( A) + P ( B ) = + = =
6 6 6 3
Exemplo 44
(SECRETARIA DA EDUCAÇÃO DO ESTADO DE SÃO PAULO,
2011) Um restaurante oferece, no seu cardápio, 2 saladas distin-
tas, 4 tipos de pratos de carne, 5 variedades de bebidas e 3 so-
bremesas diferentes. Uma pessoa deseja uma salada, um prato
de carne, uma bebida e uma sobremesa. Qual o total de pedidos
diferentes que essa pessoa poderá fazer?
Resolução: pela regra do produto, o total de pedidos é:

Total de Pedidos = 2 x 4 x 5 x 3 = 120

Você notou, no decorrer do estudo desta unidade, que a


aplicação das fórmulas de probabilidade dependem de alguns as-
pectos. Inicialmente, é importante visualizar o Espaço Amostral e
os eventos que retratam o que se quer calcular. De posse dos even-
tos, é fundamental verificar qual o tipo de relação existente entre
eles e, assim, definir qual processo de cálculo utilizar.
O professor de Matemática deve valorizar muito a interpre-
tação das questões juntamente com seus alunos para o bom de-
sempenho deles nos cálculos probabilísticos.

10. QUESTÕES AUTOAVALIATIVAS


Confira, a seguir, as questões propostas para verificar o seu
desempenho no estudo desta unidade:
1) A forquilha mágica é um instrumento que permite detectar água ou minerais
e que se inclina para baixo ao ser mantido acima de um veio desses recursos
naturais. Para testar o sucesso apregoado por um especialista no assunto,
quatro latas foram enterradas, sendo duas cheias de água e duas vazias. O
técnico deverá indicar as duas latas que acredita estarem cheias de água,
utilizando a forquilha mágica. Partindo do princípio de que a forquilha não
funciona, qual a probabilidade de acerto do técnico?
© U5 – Teoria Elementar de Probabilidade 235

2) No lançamento de dois dados honestos, chamando de A o número obtido


no primeiro dado e de B o número obtido no segundo dado, responda: qual
a probabilidade de a equação AX-B=0 fornecer uma solução que pertença ao
conjunto dos números naturais?

3) Em uma classe, há 10 homens e 20 mulheres. Sabe-se que metade dos ho-


mens e metade das mulheres têm olhos castanhos. Ache a probabilidade de
que uma pessoa escolhida ao acaso seja homem ou tenha olhos castanhos.

4) Considerando a palavra "teoria", quantos anagramas podemos formar?


Quantos anagramas formados com essa palavra têm as vogais juntas?

5) Uma linha ferroviária tem 16 estações. Quantos tipos de bilhetes devem ser
impressos se cada tipo deve assinalar a estação de origem e a de destino,
respectivamente?

6) Em uma classe com 10 estudantes, 4 serão sorteados para uma viagem. De


quantas formas pode ser sorteado o grupo, sendo que existem dois alunos
que são casados e só irão juntos?

7) Em uma urna com 9 bolas, sendo 3 brancas, 3 vermelhas, 2 pretas e 1 ama-


rela, foram retiradas 2 bolas de uma só vez. Qual a probabilidade de elas
serem da mesma cor?

8) Ao entrarem na casa de um amigo, 5 pessoas deixam seus guarda-chuvas


com a dona da casa. Quando as pessoas resolvem pedi-los de volta para
sair, a dona da casa constata que todos são aparentemente iguais e resolve
distribuí-los ao acaso. Qual a probabilidade de que exatamente 3 pessoas
recebem, cada um, o seu próprio guarda-chuva?

9) Quatro atiradores atiram simultaneamente em um alvo. Qual a probabilida-


de de o alvo ser atingido se cada atirador acerta 25% dos tiros?

Gabarito
Confira, a seguir, as respostas corretas para as questões au-
toavaliativas propostas:
1) Para entender a resolução do exercício, vejamos a figura a seguir:

Claretiano - Centro Universitário


236 © Probabilidade e Estatística

O operador da forquilha caminha sobre o solo onde estão as placas indicativas


e deve apontar quais as duas com água, utilizando a forquilha. Se conside-
rarmos que a forquilha não funciona e a indicação será aleatória, teremos o
seguinte Espaço Amostral, relacionado com duas latas escolhidas:
Ω = {(L1, L2); (L1, L3); (L1, L4); (L2, L3); (L2, L4); (L3, L4)}, ou seja, n(Ω) =6.
Note que, dos 6 resultados possíveis, apenas um deles (L1, L4) corresponde às
duas latas com água. Assim, chamando A = {acertar as duas latas com água} de
duas possíveis latas com água.

n( A) 1
P=
( A) =
n (W) 6

2) Considerando o lançamento de dois dados honestos, o Espaço Amostral será


definido pelos 36 resultados já mencionados anteriormente. Agora, avalian-
do a questão do exercício, para que A ⋅ X − B = 0 forneça uma solução
que pertença ao conjunto dos números naturais, devemos ter B divisível por
A, de forma a dar um número inteiro, ou seja, o resultado do segundo dado
deve ser divisível pelo resultado do primeiro dado. Dos 36 resultados, temos
os seguintes que satisfazem a condição:
[1,1]; [1,2]; [1,3]; [1,4]; [1,5]; [1,6]; [2,2]; [2,4]; [2,6]; [3,3]; [3,6]; [4,4]; [5,5];
[6,6]
Então, chamando A = {segundo valor é divisível pelo primeiro valor}, temos:
n( A) 14 7
P( A=
) = =
n(W) 36 8

3) Temos dois eventos já definidos pela pergunta do exercício, que são:


• A = {pessoa ser homem}.
• B = {pessoa ter olhos castanhos}.
Como a pergunta é ser homem OU ter olhos castanhos, interessa-nos a União
entre A e B, mas, como são eventos não mutuamente exclusivos (já que exis-
tem homens com olhos castanhos), temos:
10 15 5 20 2
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = + − = =
30 30 30 30 3
4) Anagrama é uma nova "palavra" construída com as mesmas letras de uma
palavra original. Utilizando todas as letras de "teoria", cada novo agrupa-
mento será um novo anagrama. Assim, podemos utilizar Permutação Sim-
ples de 6 elementos.
P6 = 6! = 6 ⋅ 5 ⋅ 4 ⋅ 3 ⋅ 2 ⋅1 = 720 anagramas diferentes.
Considerando agora a segunda pergunta, com todas as vogais juntas, coloque-
mos as vogais EOIA juntas. Sobram, então, as consoantes T e R para permutar,
© U5 – Teoria Elementar de Probabilidade 237

ficando com: P2 = 2! = 2 ⋅1 = 2 anagramas com EOIA juntas.


Contudo, as vogais juntas não necessitam ser EOIA; então, de quantas for-
mas elas podem ficar juntas? É claro, uma permutação de 4 elementos, assim:
P = 4! = 4 ⋅ 3 ⋅ 2 ⋅1 = 24 .
4
Desse modo, devemos ter as vogais juntas E as consoantes permutadas; en-
tão, pelo princípio multiplicativo: Total = 2 x 24 = 48 anagramas têm as vogais
juntas.

5) Como cada bilhete deve ter uma origem e um destino, que, logicamente, de-
vem ser diferentes, podemos escolher qualquer uma das 16 para cada local,
sendo que a ordem importa muito, pois sair de Batatais em direção a São
Paulo não é o mesmo que sair de São Paulo e ir em direção a Batatais, pois,
se você estiver em Batatais, apenas a primeira será de utilidade para você.
Então, como vamos utilizar parte dos elementos e a ordem interessa, temos
um Arranjo Simples, de 16 elementos tomados de 2 em 2:
16! 16! 16 ⋅15 ⋅14!
A16,2
= = = = 240 bilhetes diferentes.
(16 − 2)! 14! 14!

6) Vamos considerar, inicialmente, um caso em que os dois alunos casados não


irão na viagem. Assim, sobram 8 estudantes para escolher 4, de forma que a
ordem não importa, visto que tanto faz sortear primeiro João e depois Maria
ou sortear primeiro Maria e depois João, pois ambos irão na viagem. Assim,
temos um caso de Combinação Simples. Sem os casados, temos:
8! 8! 8 ⋅ 7 ⋅ 6 ⋅ 5 ⋅ 4! 1680
C8,4
= = = = = 70
4!⋅ (8 − 4)! 4!⋅ 4! 4 ⋅ 3 ⋅ 2 ⋅1 ⋅ 4! 24
Pensando agora na ida dos dois casados, se forem, irão os dois, então, sobram
2 vagas para os 8 estudantes restantes (tiramos os dois casados). Assim:
8! 8! 8 ⋅ 7 ⋅ 6! 56
C8,2
= = = = = 28
2!⋅ (8 − 2)! 2!⋅ 6! 2 ⋅1 ⋅ 6! 2
Somando as duas situações (pois são mutuamente exclusivas), temos Total =
70 + 28 = 98 formas de sortear os estudantes para a viagem.

7) Inicialmente, vamos contabilizar o tamanho do Espaço Amostral. Note que o


conjunto Ω será formado por todas as duplas (2 bolas) possíveis de se retirar
da urna com 9 bolas. Como as bolas são retiradas de uma só vez, a ordem
não importa, e, assim, n(Ω) será igual a C9,2.

9! 9! 9 ⋅ 8 ⋅ 7! 72
n(W)= C9,2= = = = = 36
2!⋅ (9 − 2)! 2!⋅ 7! 2 ⋅1 ⋅ 7! 2
Ainda, para termos 2 da mesma cor, pode ser:

Claretiano - Centro Universitário


238 © Probabilidade e Estatística

• Evento A = {2 bolas brancas} e


3! 3 ⋅ 2 ⋅1 6
n( A)= C3,2= = = = 3
2!⋅ (3 − 2)! 2 ⋅1 ⋅1 2
• Evento B = {2 bolas vermelhas} e
3! 3 ⋅ 2 ⋅1 6
n( B)= C3,2= = = = 3
2!⋅ (3 − 2)! 2 ⋅1 ⋅1 2
• Evento C = {2 bolas pretas} e
2! 2! 2 ⋅1 2
n(C )= C2,2= = = = = 1
2!⋅ (2 − 2)! 2!⋅ 0 2 ⋅1 ⋅1 2
Podemos definir um Evento Auxiliar E = {saírem 3 bolas de mesma cor}, que
pode ser traduzido como a união de eventos mutuamente exclusivos defini-
dos anteriormente.
Assim, E = A ∪ B ∪ C e, portanto, pelo axioma [III], podemos somar as possibi-
lidades de cada um. Desse modo, n(E) = 3 + 3 + 1 = 7
n( E ) 7
P=
(E) =
n(W) 36

8) Vamos considerar os seguintes eventos:


• A1 = {primeiro amigo receber o guarda-chuva correto}.
• A2 = {segundo amigo receber o guarda-chuva correto}.
• A3 = {terceiro amigo receber o guarda-chuva correto}.
• A4 = {quarto amigo receber o guarda-chuva errado}.
• A5 = {quinto amigo receber o guarda-chuva errado}.
Queremos que todos os eventos ocorram, ou seja, o que nos interessa é a
intersecção entre eles, e podemos observar que eles são dependentes entre
si. Assim, pela Fórmula do Produto das Probabilidades, temos:
P( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) =
= P( A1) ⋅ P( A2 \ A1) ⋅ P ( A3 \ A1 ∩ A2) ⋅ P ( A4 \ A1 ∩ A2 ∩ A3) ⋅ P ( A5 \ A1 ∩ A2 ∩ A3 ∩ A4)

Temos:
© U5 – Teoria Elementar de Probabilidade 239

1
P( A1) =
5
1
P( A2 \ A1) =
4
1
P( A3 \ A1 ∩ A2) =
3
1
P( A4 \ A1 ∩ A2 ∩ A3) =
2
P( A5 \ A1 ∩ A2 ∩ A3 ∩ A4) =
1

Então:

1 1 1 1 1
P( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) = ⋅ ⋅ ⋅ ⋅1 =
5 4 3 2 120
Contudo, essa resolução parte do pressuposto de que os três primeiros rece-
beram os corretos, mas não necessariamente precisam ser os três primeiros;
poderiam ser, por exemplo, os três últimos. Assim, temos de determinar de
quantas formas podem ocorrer 3 corretos em 5, o que pode ser determinado
por:
5! 5! 5 ⋅ 4 ⋅ 3! 20
C5,3
= = = = = 10
3!⋅ ( 5 − 3) ! 3!⋅ 2! 3!⋅ 2 ⋅1 2

Então, pela regra do produto, a probabilidade procurada é:


1 10 1
P(exatamente 3 corretos) = 10 ⋅ = =
120 120 12
9) O alvo a ser atingido significa que, pelo menos, um dos 4 deve acertar. Para
facilitar o cálculo, vamos considerar um Evento Complementar do tipo A =
{todos os 4 errarem o alvo}.
Chamando:
• E1 = {atirador 1 errar o alvo} – P(E1) = 75% = 0,75.
• E2 = {atirador 2 errar o alvo} – P(E2) = 75% = 0,75.
• E3 = {atirador 3 errar o alvo} – P(E3) = 75% = 0,75.
• E4 = {atirador 4 errar o alvo} – P(E4) = 75% = 0,75.
Notamos, então, que o Evento A é a intersecção desses quatro eventos que
são independentes entre si. Então:
P ( A) = P ( E1) ⋅ P ( E 2) ⋅ P ( E 3) ⋅ P ( E 4)
= 0, 75 ⋅ 0, 75 ⋅ 0, 75 ⋅ 0, 75 = 0,3164 = 31, 64%
Assim, chamando de B = {pelo menos um acertar} a possibilidade de, pelo
menos, um acerto, temos:
P( B) =
1 − P ( A) =
1 − 0,3164 =
0, 6836 =
68,36%

Claretiano - Centro Universitário


240 © Probabilidade e Estatística

11. CONSIDERAÇÕES
Finalizamos, aqui, o conteúdo de Probabilidade e Estatística
e lembramos a você que o objetivo deste CRC não é esgotar os tó-
picos, o que seria quase impossível, mas, sim, dar uma diretriz do
que julgamos ser essencial.
É importante que você procure complementar os seus es-
tudos consultando as referências bibliográficas indicadas, muitas
delas disponíveis na Biblioteca Virtual da SAV e algumas na Biblio-
teca Digital Pearson. Procure novos exercícios e aplicações, novos
desafios, contando sempre com a equipe de professores e tutores
para auxiliá-lo nos estudos.

12. E-REFERÊNCIAS
DANTAS, C. A. B. Probabilidade: um curso introdutório. Disponível em: <http://books.
google.com.br/bkshp?hl=pt-BR&tab=wp>. Acesso em: 5 mar. 2012.
MAGALHÃES, M. N. Probabilidade e variáveis aleatórias. Disponível em: <http://books.
google.com.br/bkshp?hl=pt-BR&tab=wp>. Acesso em: 5 mar. 2012.

13. REFERÊNCIAS BIBLIOGRÁFICAS


MEYER, P.; LOUREN∩O FILHO, R. Probabilidade: aplicações à Estatística. Rio de Janeiro:
LTC, 2006.
MORETTIN, L. Estatística básica: probabilidade e inferência. São Paulo: Pearson Prentice
Hall, 2010.
OLIVEIRA, F. Estatística e probabilidade: exercícios resolvidos e propostos. 2. ed. São Pau-
lo: Atlas, 2007.
SPIEGEL, M.; SCHILLER, J.; SRINIVASAN, R. Teoria e problemas de probabilidade e estatís-
tica. 2. ed. Porto Alegre: Bookman, 2004.

Você também pode gostar