Estatística Aplicada: Autores: Prof. Edwin F. F. Silva Colaboradores: Prof. Santiago Valverde

Estatística Aplicada
Autores: Prof. Edwin F. F. Silva

Prof. Wesley Cândido de Melo
Colaboradores: Prof. Santiago Valverde
Prof. Jean Carlos Cavaleiro
Prof. Daniel Scodeler Raimundo
Professores conteudistas: Edwin F. F. Silva e Wesley Cândido de Melo
Edwin F. F. Silva
Possui licenciatura em Física pela Universidade Católica de Brasília (2005); especialização em Higiene das radiações
ionizantes (Senacap, 2011); em Metodologia do Ensino e Aprendizagem em Matemática (2009); pós-graduação em
Transporte (em andamento) pela Universidade de Brasília. Atualmente, é professor da Faculdade Fortium, ministrando
aulas de cálculo e estatística nos cursos de Sistema de Informações e Administração, e da Universidade Paulista, no
curso de Engenharia. Atua em pesquisas relacionadas à poluição sonora, na área de polos geradores de viagens e
também como corretor de questões dos cursos de graduação a distância da UNIP e como tutor do curso de RH da
UNIP Interativa.
Wesley Cândido de Melo
Possui licenciatura em Física pela Universidade Católica de Brasília (2006); especialização em Matemática
e Estatística pela FACITEC (2008); pós-graduação em Transporte (em andamento) pela Universidade de Brasília.
Atualmente, é professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gestão de RH
e Segurança Privada; da Faculdade JK, nos cursos de Administração e Radiologia. Atua também como corretor de
questões dos cursos de graduação a distância da UNIP e como tutor do curso de RH da UNIP Interativa. É pesquisador
vinculado ao grupo de pesquisa em Poluição sonora com ênfase em Ruídos aeronáuticos no curso de Física da
Universidade Católica de Brasília.
Dados Internacionais de Catalogação na Publicação (CIP)
S586e Silva, Edwin F.
Estatística aplicada / Edwin F. Silva; Wesley Cândido de Melo. –

São Paulo: Editora Sol, 2012.
112 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e

Pesquisas da UNIP, Série Didática, ano XVII, n. 2-064/12, ISSN 1517-9230.
1. Estatística. 2. Distribuição de frequências. 3. Probabilidades.

I. Título.
CDU 519.2
U502.71 – 19
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor
Prof. Fábio Romeu de Carvalho

Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre

Vice-Reitora de Unidades Universitárias
Prof. Dr. Yugo Okida

Vice-Reitor de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez

Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy

Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
Material Didático – EaD
Comissão editorial:
Dra. Angélica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Kátia Mosorov Alonso (UFMT)
Dra. Valéria de Carvalho (UNIP)
Apoio:
Profa. Cláudia Regina Baptista – EaD
Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico:
Prof. Alexandre Ponzetto
Revisão:
Andréia Gomes
Geraldo Teixeira Jr.
Sumário
Estatística Aplicada
APRESENTAÇÃO.......................................................................................................................................................7
INTRODUÇÃO............................................................................................................................................................7
Unidade I
1 HISTÓRIA DA ESTATÍSTICA...............................................................................................................................9
1.1 Introdução à estatística.........................................................................................................................9
1.2 Importância da estatística..................................................................................................................11
1.3 Elementos fundamentais da estatística....................................................................................... 12
1.3.1 População e amostra.............................................................................................................................. 12
1.4 Fases do método estatístico.............................................................................................................. 13
1.5 Dados estatísticos................................................................................................................................. 13
1.6 Formas iniciais de tratamento dos dados................................................................................... 15
1.7 Notações por índices........................................................................................................................... 16
1.7.1 Notação sigma (∑).................................................................................................................................. 16
1.8 Séries estatísticas.................................................................................................................................. 19
2 APRESENTAÇÃO DE DADOS – GRÁFICOS E TABELAS......................................................................... 21
2.1 Elementos básicos das tabelas......................................................................................................... 27
3 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MODA E MEDIANA PARA
DADOS SIMPLES................................................................................................................................................... 27
3.1 A média aritmética simples (x)........................................................................................................ 28
3.2 A média aritmética ponderada xp.................................................................................................. 30
3.3 A mediana (Md)..................................................................................................................................... 32
3.4 A moda...................................................................................................................................................... 35
3.5 Posição relativa da média, moda e mediana.............................................................................. 37
4 MEDIDAS DE DISPERSÃO PARA DADOS SIMPLES............................................................................... 37
4.1 Amplitude total...................................................................................................................................... 39
4.2 Desvio médio absoluto........................................................................................................................ 40
4.3 Variância................................................................................................................................................... 41
4.4 Desvio padrão......................................................................................................................................... 46
4.5 Coeficiente de variação...................................................................................................................... 47
Unidade II
5 DISTRIBUIÇÃO DE FREQUÊNCIAS.............................................................................................................. 53
5.1 A construção de uma distribuição de frequências para dados contínuos..................... 54
5.2 A construção de uma distribuição de frequências para dados discretos....................... 60
5.3 Representações gráficas de dados agrupados.......................................................................... 61
6 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE FREQUÊNCIA.................70
6.1 As medidas de posição.........................................................................................................................71
6.1.1 A média........................................................................................................................................................ 71
6.1.2 A mediana................................................................................................................................................... 72
6.1.3 A moda......................................................................................................................................................... 73
6.2 As medidas de dispersão numa distribuição de frequência................................................. 74
6.2.1 O desvio médio......................................................................................................................................... 74
6.2.2 Variância...................................................................................................................................................... 75
6.2.3 Desvio padrão............................................................................................................................................ 76
7 INTRODUÇÃO À PROBABILIDADE.............................................................................................................. 81
7.1 Teorias dos conjuntos, espaço amostral e eventos.................................................................. 82
8 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS................................................. 92
8.1 Origens da probabilidade................................................................................................................... 93
8.1.1 Métodos objetivos................................................................................................................................... 93
8.1.2 Método subjetivo..................................................................................................................................... 97
8.2 Principais teoremas de probabilidade........................................................................................... 97
APRESENTAÇÃO
O objetivo deste material é fazer com que o aluno tenha condições de interpretar um conjunto
de observações de forma clara e objetiva, a fim de distinguir as limitações e as vantagens do uso de
amostras, assim como os métodos para sua obtenção; tenha habilidade para descrever e interpretar
dados por meio de figuras (tabelas e gráficos), estimativas pontuais e de variabilidade; calcular o intervalo
de confiança da proporção e média, assim como identificar sua aplicação; coletar e interpretar dados
de forma sistematizada e imprimir credibilidade a análises quantitativas dos fenômenos de realidade
investigada.
Assim, esperamos contribuir da melhor forma possível com seu aprendizado.
Com nossos cumprimentos,
Equipe organizadora.
INTRODUÇÃO
Desde a Antiguidade, a estatística faz parte da vida das pessoas, mesmo que de forma indireta, mas o
certo é que essa ciência está presente na vida das pessoas o tempo todo. Quando abrimos um jornal, por
exemplo, lá está uma série de gráficos e tabelas que nos auxiliam no entendimento de determinado tema,
ou quando lemos uma reportagem que traz como tema a probabilidade de o mercado financeiro fechar
em alta ou em baixa, ou, ainda, virando a página desse mesmo jornal, temos a manchete divulgando os
dados do Censo 2010.
Diante desses fatos, nos perguntamos de que forma a estatística pode nos ajudar, seja no levantamento
de dados para uma empresa saber como vão suas vendas, seja para saber os riscos de investir nas ações
de uma empresa, ou, ainda, como o governo pode determinar as características dos vários aspectos,
sociais, econômicos e ambientais dos estados e até mesmo de nosso país.
São perguntas como essas que a estatística nos ajuda a responder, e ainda não podemos pensar
nessa ciência como se ela se limitasse a apenas compilar tabelas de dados e os ilustrar graficamente.
Dessa forma, é de sua importância conhecer as inúmeras variáveis associadas a ela, pois em qualquer
ramo da sociedade contemporânea estão presentes os processos estatísticos. E o estudante que não
souber trabalhar com esses conceitos estará em desvantagem no mercado de trabalho.
Para tirar o máximo proveito da interpretação de um determinado fenômeno, deve-se seguir algumas
etapas, como, por exemplo, planejar a obtenção de dados, interpretar e analisar os dados obtidos e
apresentar os resultados de maneira a facilitar a tomada de decisões razoáveis.
É fundamental que o texto produzido neste material leve o aluno a pensar em situações do seu
cotidiano e que dessa forma ele possa associar a teoria com a prática vivenciada em seu dia a dia.
Pensando nisso, ele foi dividido em duas unidades, nas quais serão abordados, na primeira unidade:
séries estatísticas, gráficos estatísticos, medidas de tendência central, medidas de dispersão, entre outros
7
Unidade I
temas; já na segunda unidade, serão apresentados: dados tabulares, distribuição de frequência, medidas
de posição e variabilidade numa distribuição de frequência, probabilidade, bem como alguns de seus
teoremas, entre outros temas.
8
ESTATÍSTICA APLICADA
Unidade I
Como a União realiza a distribuição de renda para os Estados, Municípios e o Distrito Federal? Como
saber quem deve receber mais ou menos verbas? Como saber se determinado trecho de uma via ou
rodovia é ou não perigoso?
São questões como essas que a disciplina Estatística procura responder.
1 HISTÓRIA DA ESTATÍSTICA
Na história do desenvolvimento humano, a sociedade primitiva se deparou com os primeiros

problemas para saber o tamanho da sua população, a quantidade de terras e suas riquezas, por isso teve a
necessidade de contá-las. Em decorrência disso, os governantes das grandes civilizações antigas fizeram
indiretamente um estudo estatístico para saber os bens que seu Estado possuía e como a população
desse Estado estava distribuída.
No Antigo Egito, aproximadamente 3040 a.C., Heródoto pediu que fosse feito um estudo sobre a
riqueza da população, com o objetivo de saber a quantidade de recursos econômicos e humanos para
realizar a construção das pirâmides. Na China, aproximadamente 2238 a.C., o imperador Yao pediu que
fosse feito um estudo da população, com objetivos industriais e comerciais.
A palavra “estatística” foi sugerida pelo alemão Gottifried Achemmel (1719/1772) e é associada à
palavra latina status (Estado).
Essa ciência teve acelerado desenvolvimento a partir do século XVII, com os estudos de Bernoulli,
Fermat, Laplace, Gauss e outros que estabeleceram suas características atuais.
Saiba mais
Para uma abordagem mais detalhada da história da estatística, ler o
artigo: “Conceitos iniciais e breve histórico da estatística”, disponível em:
<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_
inicias-historico-somatorio.pdf>. Acesso em: 12 jul. 2012.
1.1 Introdução à estatística
A todo instante, nos noticiários, em revistas, jornais, internet, ouvimos falar na palavra “estatística”,
o que é possível perceber o quanto é importante conhecermos a fundo essa ciência. Algumas de
suas aplicabilidades podem ser observadas nas pesquisas de opinião pública e nos dados publicados
9
Unidade I
diariamente na imprensa. Na realidade, a estatística contempla muitos outros aspectos, sendo de vital
importância na interpretação de processos em que exista variabilidade.
De acordo com Dervalmar, é possível distinguir duas concepções para a palavra “estatística”. No
plural, “estatísticas” indica qualquer coleção de dados quantitativos ou, ainda, ramo da matemática que
trata da coleta, da análise, da interpretação e da apresentação de massa de dados numéricos. Assim,
por exemplo, as estatísticas demográficas referem-se aos dados numéricos sobre o quantitativo de
nascimentos, falecimentos, matrimônios, desquites etc. As estatísticas econômicas estão relacionadas
aos dados numéricos como emprego, produção, vendas e com outras atividades ligadas aos vários
setores da vida econômica.
No singular, “estatística” indica a atividade humana especializada, ou um corpo de técnicas, ou ainda

uma metodologia desenvolvida para a coleta, a classificação, a apresentação, a análise e a interpretação
de dados quantitativos e a utilização desses dados para a tomada de decisões.
Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os
fenômenos coletivos.
Para fins didáticos, é comum os livros-textos apresentarem a estatística em duas grandes áreas,
embora não se trate de áreas isoladas: estatística descritiva e estatística inferencial.
• estatística descritiva: é aquela que tem por objetivo descrever e analisar determinada população,
utilizando métodos numéricos e gráficos para se determinarem padrões em um conjunto de
dados, e, assim, apresentar a informação em uma forma conveniente;
• estatística inferencial: é aquela que tem por objetivo analisar e interpretar os dados coletados de
uma determinada população, na maioria das vezes, a partir de resultados observados na amostra.
Constitui o conjunto de métodos para a tomada de decisões nas situações em que há incerteza,
variações ou outras generalizações acerca de um conjunto maior de dados.
Exemplo 1: O gráfico a seguir apresenta a participação relativa das bandeiras de cartões de crédito,
no quarto trimestre de 2010.
Master Card
Visa 38,4%
52,2%
Outras
9,4%
Figura 1 - Participação relativa das bandeiras (quantidade de transações)
10
Por meio do gráfico, é possível ver claramente que mais da metade das transações são feitas com
a bandeira Visa e que aproximadamente 40% são feitas com a bandeira MasterCard. Como o gráfico
descreve os tipos de bandeiras de cartões utilizadas em todas as transações do quarto trimestre de 2010,
o gráfico é um exemplo de estatística descritiva.
Exemplo 2: Índice Nacional de Preços ao Consumidor (INPC)
Sua apresentação envolve a sintetização, em um único dado, dos aumentos dos produtos de uma
cesta básica. Trata-se de um exemplo de estatística inferencial.
Exemplo 3: Análise de mercado
Quando uma empresa pretende lançar um produto, precisa conhecer as preferências dos consumidores
no mercado de interesse. Faz-se necessária uma pesquisa de mercado.
Exemplo 4: Ocorrência de terremotos
Os geólogos estão continuamente coletando dados sobre a ocorrência de terremotos. Gostariam de inferir
quando e onde ocorrerão tremores e qual a sua intensidade. Trata-se, sem dúvida, de uma questão complexa
que exige longa experiência geológica, além de cuidadosa aplicação de métodos estatísticos.
1.2 Importância da estatística
Com o desenvolvimento humano e tecnológico, temos presenciado grandes descobertas na área

da saúde, da engenharia, da economia etc.; por outro lado, também observamos os problemas que
se espalham pelo mundo, por exemplo, a ameaça com a degradação do meio ambiente, as epidemias
(H1N10) causando grandes preocupações para os governantes e para a população mundial. Como
ajudar pesquisadores, cientistas, engenheiros etc. a se nortearem com o que deve ser feito tanto para
criar novas possibilidades como também para solucionar os problemas existentes?
O método estatístico lida com informações, associando os dados ao problema, mostrando como e o
que coletar para obter conclusões a partir de todos os dados, de tal forma que essas conclusões possam
ser entendidas por outras pessoas. Assim, esse método auxilia os vários profissionais no planejamento e
na tomada de decisões.
Saiba mais
O artigo “A elaboração de estatísticas de mortalidade segundo causas

múltiplas” apresenta uma aplicação da estatística mostrando a sua
importância para a tomada de decisões. Disponível em: <http://www.
scielosp.org/pdf/rbepid/v3n1-3/03.pdf>. Acesso em: 15 jul. 2012.
11
Unidade I
Vejamos alguns exemplos:
O governo anualmente divulga o censo sobre a dinâmica da população brasileira, apresentando seu
crescimento demográfico, suas características e como vivem os brasileiros.
As grandes empresas fazem levantamentos sobre vendas, produção, inventário, folha de pagamento
e outros dados, a fim de verificar se a empresa está crescendo, como seu crescimento está em relação a
outras empresas e como tomar decisões futuras.
A análise dos dados é muito importante para fazer um planejamento adequado.
Saiba mais
Para mais informações sobre o Censo, acesse o site do IBGE:

<http://www.ibge.gov.br>.
1.3 Elementos fundamentais da estatística
1.3.1 População e amostra
Para o pesquisador, o estudo de qualquer fenômeno, seja ele natural, econômico, social ou biológico,
necessita da coleta e da análise de dados estatísticos. A coleta de dados é parte inicial de qualquer
pesquisa.
• População: é o conjunto de todos os itens (pessoas, coisas e objetos) que interessam ao estudo de
um fenômeno coletivo.
• Amostra: é qualquer subconjunto não vazio de uma população.
• Amostragem: é o meio de escolha da amostra e consiste na seleção criteriosa dos elementos a

serem submetidos ao estudo.
• Parâmetro: é a denominação de uma característica numérica estabelecida para toda uma população.
• Estimador: é a característica numérica estabelecida para toda a amostra.
Exemplo: pesquisas sobre tendências de votação.
Em épocas de eleição, é comum a realização de pesquisas com o objetivo de conhecer as tendências

do eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que as
características da população à qual os resultados da pesquisa serão estendidos sejam tão próximas
12
quanto possível. A escolha da amostra, o questionário, a entrevista, a sintetização dos dados e a

representação dos resultados são as etapas desse tipo de pesquisa.
Parâmetro é uma Fenômeno coletivo População

proporção de votos são todos
para o candidato (Eleições para Prefeitura os eleitores
A obtida na de um município). habilitados do
população município.
Amostra
Estimador é
uma proporção
de votos para Amostra é um grupo
o candidato A numérico de eleitores
obtida na amostra selecionado na
população do município
Figura 2
1.4 Fases do método estatístico
Em uma pesquisa, quando se deseja empreender um estudo estatístico completo, existem fases do
trabalho que devem ser trabalhadas para se chegar aos resultados finais do estudo.
As principais fases são:
• definição do problema – delimitação do problema;

• planejamento – organização das ações que serão realizadas na pesquisa de campo;
• coleta de dados – ir a campo buscar as informações;
• apuração dos dados – organização das informações coletadas;
• apresentação dos dados – gráficos e tabelas;
• análise e interpretação dos dados – por meio da linguagem matemática (média, mediana,
moda, desvio padrão, percentuais etc.).
Observe quais são as fases principais do método estatístico – compõem a organização de um projeto,
sua execução e apresentação final.
1.5 Dados estatísticos
Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses

números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado
candidato ganhar as eleições etc. Esses números, portanto, serão chamados de dados estatísticos, os
quais precisarão ser organizados e sumarizados para sua correta interpretação.
O dado bruto significa que os dados não estão numericamente organizados e processados.
É o processamento e a organização dos dados que os transformam em informação, enfatizando
13
Unidade I
seus aspectos mais importantes. A informação, portanto, é resultado de um tratamento dos

dados.
Para organizar e processar os dados estatísticos, podem-se utilizar resumos visuais e numéricos,
como gráficos, mapas, tabelas e modelos numéricos.
A mensuração ou a observação de itens como índices de preços, renda mensal per capita de um Estado
etc. dão origem aos dados estatísticos. Como esses itens originam valores que tendem a apresentar
certo grau de variabilidade quando são medidos sucessivas vezes, iremos chamá-los, então, de variáveis.
É importante identificar os quatro tipos de variáveis: variáveis contínuas, variáveis discretas, variáveis
nominais e variáveis ordinais.
• Variáveis contínuas: podem assumir qualquer valor num intervalo contínuo (dado contínuo), ou
seja, será um número real. Exemplos: altura, peso, velocidade etc.
• Variáveis discretas: em geral, originam-se da contagem de itens e só podem assumir valores
inteiros. Exemplos: número de alunos em sala de aula, número de professores que trabalham na
escola etc.
• Variáveis nominais: são aquelas que existem com o objetivo de definir categorias, e as observações,
mensurações e análises são feitas levando-se em conta essas mesmas categorias. Exemplos de
categoria seriam: separação por sexo, estado civil, esporte predileto, cor etc.
• Variáveis ordinais: quando existe o desejo de dispor os elementos observados segundo uma
ordem de preferência ou desempenho, atribuem-se valores relativos para indicar essa ordem.
Exemplo: primeiro, segundo, terceiro grau de escolaridade etc.
As variáveis discretas e contínuas são ditas variáveis quantitativas porque envolvem dados numéricos.
Já as variáveis nominais e ordinais precisam ser transformadas em valores numéricos para serem objeto
da análise estatística, e são ditas variáveis qualitativas. Por exemplo: em um departamento da empresa
JJ, que tem 36 funcionários, fez-se uma pesquisa para verificar alguns dados. Classifique as variáveis,
conforme os dados da tabela a seguir.
Tabela 1
Estado civil Grau de instrução Nº filhos Salário (X. min) Idade (anos-meses)
Ensino
Solteiro - 4,00 23 03
Fundamental
Casado Ensino 1 4,56 32 10

Fundamental
Casado Ensino Superior 3 19,40 48 11
Solteiro Ensino Médio - 10,53 25 08
Solteiro Ensino Médio - 16,22 31 05
14
Resolução
Variável qualitativa nominal: estado civil.
Variável qualitativa ordinal: grau de instrução.
Variável quantitativa discreta: número de filhos.
Variável quantitativa contínua: salário e idade.
Variáveis discretas e contínuas = variáveis quantitativas.
Variáveis nominais e ordinais = variáveis qualitativas.
E ainda:
Dados qualitativos: consistem em atribuir qualidade ou atributo à variável pesquisada.
Dados quantitativos: consistem em números que representam contagens ou medidas.
1.6 Formas iniciais de tratamento dos dados
Em geral, quando nos propomos a buscar ou construir informações a partir de dados, deparamo‑nos,
inicialmente, com um conjunto de dados brutos que pouco nos dizem. É preciso organizá-los
minimamente para que comecem a fazer algum sentido, viabilizando sua análise.
Exemplo 1: a tabela a seguir apresenta as notas de 40 estudantes da disciplina de estatística.
Tabela 2
50 96 75 87 65 45 72 10
32 54 25 69 72 30 81 20
24 45 80 90 64 95 23 90
80 35 96 47 65 70 73 63
60 20 45 89 20 90 80 70
Essa tabela é chamada de tabela primitiva ou dados brutos, pois os dados coletados estão dispostos
conforme a ordem da coleta e não na ordem de numeração.
Observando os dados anteriores, tabela primitiva, fica difícil visualizar em torno de que valor tendem
a se concentrar as notas dos estudantes, qual a maior ou qual menor nota, e ainda quantos alunos se
acham abaixo de uma dada nota.
15
Unidade I
Uma primeira forma de organização dos dados brutos é o chamado rol. Obtemos o rol quando
organizamos os dados brutos em ordem crescente ou decrescente de grandeza.
Ainda com respeito à tabela de nota dos 40 estudantes da disciplina de estatística, vejamos como fica:
Tabela 3
10 20 20 20 23 24 25 30
32 35 45 45 45 47 50 54
60 63 64 65 65 69 70 70
72 72 73 75 80 80 80 81
87 89 90 90 90 95 96 96
Agora, podemos saber, com relativa facilidade, qual a menor nota (10) e qual a maior nota (96). Para
determinar a amplitude do rol, basta realizar a diferença entre o maior e o menor número do rol, ou seja,
para o exemplo, a amplitude de variação foi de 96 – 10 = 86.
Exemplo 2: seja A = {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} o conjunto das notas dos alunos, determine o rol
e a amplitude do rol:
{10, 7, 3, 9, 1, 5, 10, 4, 2, 8} à dado bruto
{1, 2, 3, 4, 5, 7, 8, 9, 10, 10} à rol
Amplitude = {maior valor do rol – menor valor do rol}
à A = 10 – 1 = 9
Limites de classe: são os números extremos de cada classe; sendo assim, temos um limite inferior
e um superior, que denominamos de amplitude de variação.
A = Lsup. - Linf.
1.7 Notações por índices
A notação por índices é bastante utilizada na estatística, sendo importante esclarecer seu significado.
O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x, x1,
x2, x3, x4, ..., xn. “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2, 3, 4,..., n.
1.7.1 Notação sigma (∑)
A maioria dos processos estatísticos vai exigir o cálculo da soma de um conjunto de números. A letra
maiúscula grega sigma (∑) é utilizada para representar o somatório.
16
Assim, se determinada variável y tiver os valores 3, 5, 7, 9 e 11, o ∑y será:
∑y = 3 + 5 + 7 + 9 + 11
∑y = 35
Por outro lado, se o consumo semanal de arroz por x, durante um mês, foi 2 kg, 4 kg, 3 kg, 5 kg, o
total consumido por x no mês teria sido:
∑x = 2 + 4 + 3 + 5
∑x = 14, x teria consumido 14 kg de arroz durante o mês referido.
A notação sigma possui algumas propriedades que precisamos desenvolver para facilitar os conteúdos
que estudaremos nesta disciplina.
n
A)  x1   xi   x , isso significa que devemos somar as n observações de x, começando com
i1
a primeira.
Por exemplo, num conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos:
n 6
 xi   xi  2  4  6  8  10  12
i1 i1
 xi  42
Por outro lado, é possível utilizar essa notação quando se pretende analisar a soma de apenas uma
parte dos dados disponibilizados, podendo-se, portanto, abreviar a soma de um conjunto de dados.
Dessa forma, podemos ter:
3
x1  x2  x 3   xi
1 11
x8  x 9  x10  x11   xi
i8
B) Se cada valor da variável x é multiplicado ou dividido por uma constante, temos que isso será
igual ao valor da constante multiplicado ou dividido pela somatória de x.
 c.x  c. x
17
Unidade I
Assim,
4
 4 xi  4 x1  4 x2  4 x3  4 x4
i1
4
 4( x1  x2  x 3  x 4 )  4  xi
i1
Por exemplo: se xi = {2, 4, 6, 8, 10, 12}, n = 6, e cada valor de x é multiplicado pela constante
c = 2, temos:
 cx  c x
6 6
 cxi c xi 2(2)  2(4)  2(6)  2(8)  2(10)  2(12) 
i1 i1
 2(2)  2(44 )  2(6)  2(8)  2(10)  2(12)
6 6
 2xi  2 xi  2(42)  84
i1 i1
C) O somatório de uma constante c será igual ao produto da constante pelo número de vezes (n) que
ela se repete. Assim, temos:
n
 ci  nc
ii
Por exemplo, numa determinada observação, o conjunto de dados de xi = {7, 7, 7, 7, 7, 7}, n = 6,

temos que xi é uma constante c que se repete. Então, temos:
xi  ci
6 6
 xi   ci  nc  7  7  7  7  7  7  6(7)  42
i1 i1
D) O somatório de uma soma ou de uma diferença de duas variáveis será igual à soma ou diferença
dos somatórios individuais das duas variáveis. Assim, temos:
n n n
 ( xi  yi )   xi   yi
i1 i1 i1
n n n
 ( xi  yi )   xi   yi
i1 i1 i1
18
Por exemplo:
i X Y (X-Y)
1 8 5 3
2 3 2 1
 (x  y)  9
3 4 0 4
4 5 4 1
 x   y  20  11  9
- - - -
Σ 20 11 9
Figura 3
E) O somatório de um conjunto de dados x ao quadrado nos obriga a elevar cada elemento de xi ao

quadrado para efetuar a soma. Assim, temos:
n
 xi2  x12  x22  x23  ...  xn2
i1
Por exemplo, numa dada observação, o conjunto de dados de xi = {2, 4, 6, 8, 10}, n = 5; temos, então:
5
 xi2  22  42  62  82  102 
i1
 4  16  36  64  100  220
F) O somatório ao quadrado de um conjunto de dados será obtido tomando-se a soma dos valores
de xi e elevando-se ao quadrado. Assim, temos:
n
(  xi )2  ( x1  x2  x 3  ...  xn )2
i1
Por exemplo, se temos um mesmo conjunto xi = {2, 4, 6, 8, 10}, n = 5, tal qual no exemplo do item
E, teremos um resultado distinto. Vejamos, neste caso:
5
(  xi )2  (2  4  6  8  10)2  (30)2  900
i1
2
n  n 
Não confunda ∑ xi2 com   xi  , pois, conforme se observa no exemplo anterior, seus resultados
 i 
serão diferentes. i
1.8 Séries estatísticas
Uma série estatística define-se como qualquer tabela na qual haja distribuição de um conjunto de
dados estatísticos em função da época, do local ou da espécie. Ou, ainda, no sentido mais amplo, série é
19
Unidade I
uma sucessão de números referidos a qualquer variável. Caso os números expressem dados estatísticos,
a série será chamada de série estatística.
As tabelas são utilizadas para apresentar séries estatísticas. Os três caracteres presentes na tabela
que as apresenta são:
• a época (fator temporal ou cronológico) a que se refere o fenômeno estudado;

• o local (fator espacial ou geográfico) onde o fenômeno acontece;
• o fenômeno (espécie de fato ou fator específico) que é descrito de forma categórica.
As séries são divididas em dois grupos:
1. Séries homógradas: onde há variação discreta ou descontínua na variável descrita. Podem ser
do tipo temporal, geográfica ou específica.
• Série temporal: os dados são observados de acordo com a época de ocorrência (fator cronológico).
Isso significa que o tempo é variável e o local e a espécie (fenômeno) são elementos fixos. Essa
série também é chamada de histórica ou evolutiva. Exemplo:
Tabela – PIB Brasileiro de 2010 a 2015
Tamanho do Posição na economia

Ano PIB (nominal) crescimento (real) mundial
2015 R$ 5,904 trilhões -3,847% 9°
2014 R$ 5,521 trilhões 0,5% 7°
2013 R$ 5,316 trilhões 3,015% 7°
2012 R$ 4,806 trilhões 1,915% 7°
2011 R$ 4,375 trilhões 4% 6°
2010 R$ 3,887 trilhões 7,529% 7°
• Série geográfica: apresenta como elemento variável o fator geográfico. A localidade é o elemento
variável e a época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial
ou de localização. Exemplo:
Tabela – Variação do PIB dos países em 2015 (em % sobre o ano anterior)
Países Variação do PIB (%)

China 6,9
EUA 2,4
Reino Unido 2,2
França 1,2
Alemanha 1,7
Brasil - 3,8
20
• Série específica: o caráter variável é apenas o fato ou espécie, o tempo e o local são fixos.
Também é chamada de série categórica. Exemplo:
Tabela – PIB por setor econômico – 4º trimestre de 2015
Setor Valor corrente (R$) Variação trimestral Variação anual

Brasil 1,481 Trilhão -1,7% -2,5%
Agropecuária 64,264 Bilhões -2,0% +2,1%
Indústria 295,223 Bilhões -6,7% -4,7%
Serviços 907,708 Bilhões -2,9% -1,6%
Famílias 937,195 Bilhões -4,5% -1,8%
Governo 289,137 Bilhões -0,4% -1,1%
Investimento 268,430 Bilhões -15,0% -11,2%
2. Séries heterógradas: são aquelas nas quais o fenômeno/fato apresentam gradações ou

subdivisões. Embora seja fixo, o fenômeno varia em intensidade.
A distribuição de frequências é uma série heterógrada e será vista com detalhes mais adiante.
2 APRESENTAÇÃO DE DADOS – GRÁFICOS E TABELAS
A representação gráfica das séries estatísticas tem por finalidade sintetizar os resultados obtidos e,
assim, chegar a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da
série. O gráfico mais apropriado ficará a critério do pesquisador, respeitando os elementos de clareza,
simplicidade e veracidade (NOGUEIRA, 2009).
Diretrizes para a construção de um gráfico:
• o título do gráfico deve ser o mais claro e completo possível, sendo necessário acrescentar subtítulos;
• a orientação geral dos gráficos deve ser da esquerda para a direita;
• as quantidades devem ser representadas por grandezas lineares;
• sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 (zero);
• só devem ser incluídas no desenho as coordenadas indispensáveis para guiar a vista na leitura, um
tracejado muito cerrado dificulta o exame do gráfico;
• a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima;
• os títulos e as marcações do gráfico dispor-se-ão de maneira que sejam facilmente legíveis,

partindo da margem horizontal inferior ou da margem esquerda.
21
Unidade I
Leitura e interpretação de um gráfico:
• declarar qual o fenômeno ou fenômenos representados, a região considerada, o período de tempo,

a fonte dos dados etc.;
• examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua execução, no
conjunto e nos detalhes;
• analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o máximo e
o mínimo, as mudanças mais bruscas;
• investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato exposto é
estacionário;
• procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproximado etc.
Eis os tipos mais comuns de gráficos:
Gráfico em linha
500
400
300
Série 1
200
Série 2
100
0
1 2 3 4 5 6 7
Figura 4
Gráfico em colunas
População
100
80
60
População
40
20
0
1940 1950 1960 1970
Figura 5
22
Gráfico em barras
É semelhante ao gráfico em colunas, porém os retângulos são dispostos horizontalmente.
População do Brasil
1970
1960
População do
1950 Brasil
1940
0 20 40 60 50 100
Figura 6
Gráfico em setores
Anos Faturamento de uma empresa (em milhões)

2008 3
2009 4
2010 5
Total 12
Figura 7
É a representação gráfica de uma série estatística, em círculo, por meio de setores. É utilizado
principalmente quando se pretende comparar cada valor da série com o total.
Total __________360º
Parte___________ xº
• Para 2008: 12 - 360º

3 - xº
xº = 90º
• Para 2009: 12 - 360º

4 - xº
xº = 120º
• Para 2010: 12 - 360º

5 - xº
xº = 150º
23
Unidade I
2008
2009
2010
Figura 8
Gráfico polar
É a representação de uma série por meio de um polígono. Movimento mensal de compras de uma
agência em 1972.
Tabela 4
Meses Valores (R$ 1.000,00)

Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Jan
Dez 20 Fev
15
Nov Mar
10
5 Série 1
Out 0 Abr
Set Mai
Ago Jun
Jul
Figura 9
24
Gráfico carta geográfica
É a representação gráfica de um mapa geográfico indicando um acontecimento, por exemplo,

a previsão de tempo para determinado dia em determinado Estado ou país. A figura a seguir é um
cartograma que informa a produção de petróleo segundo suas regiões geográficas.
Cartograma 1.2 – Produção de petróleo,

segundo regiões geográficas (milhões b/d) – 2003
Europa e Ex-União Soviética
7,9
14,2
22,6 7,9
América do
Norte
8,4 Ásia-Pacífico
Oriente
Médio
África
6,7
Américas
Central e do Sul
Figura 10
Nota: inclui óleo de xisto, óleo de areias betuminosas – o LGN, exceto para o Brasil.
Para o Brasil, inclui LGN e não inclui óleo de xisto e óleo de areias betuminosas.
Pictograma
É a representação gráfica mais utilizada na atualidade por jornais e revistas, pois é um gráfico de
forma atraente e de fácil interpretação. Mostra o fenômeno estudado inserido com um gráfico de linha,
coluna, barra ou de setor, conforme o exemplo a seguir, em que um outdoor aponta a verba gasta com
publicidade junto com um gráfico de linha para mostrar seu desempenho anual.
25
Unidade I
Figura 11
Publicidade em alta
Institucional De utilidade
167 pública 532,1
Orçamento prevê 158,1
aumento de 20%
em gastos da 425,1
administração direta
120,2
Valor da 294,7
publicidade
Em R$ Milhões
80,1 152,6
2007 2008 2009 2010 2007 2008 2009 2010
Figura 12
Saiba mais
Aplicação de gráficos de controle de Soma Acumulada (CUSUM) para

monitoramento de um processo de usinagem. Disponível em: <http://
dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>.
Acesso em: 20 jul. 2012.
26
2.1 Elementos básicos das tabelas
Uma forma de sintetizar os valores que uma ou mais variáveis podem assumir é por meio de uma
tabela.
Uma tabela é constituída dos seguintes elementos:
Quadro 1
Título É o conjunto de informações que precede a tabela e contém a indicação dos fatores: o
quê? Quando? Onde?
Cabeçalho É a parte superior da tabela que especifica o conteúdo das colunas.
Corpo da tabela É o espaço que contém as informações sobre o fenômeno observado.
Fonte É a indicação da entidade responsável pelo levantamento dos dados.
Título Produção de petróleo em barris/dia

Total
Estado e Região Cabeçalho
Barris/dia
Rio de Janeiro 1.597.387
Espírito Santo 193.962
Coluna
indicadora Amazonas 52.964
Bahia 49.472
Rio Grande do Norte 60.861
Sergipe 42.072
São Paulo 16.983
Alagoas 6.300
Ceará 7.530
Paraná (xisto) 3.393
Rodapé
Figura 13
3 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MODA E MEDIANA PARA

DADOS SIMPLES
No desenvolvimento de um estudo estatístico, muitas vezes é inviável examinar todos os elementos

da população de interesse para tirar conclusões; pensando nisso, há medidas que possibilitam
condensar as informações para esclarecer a fase analítica da estatística descritiva. A inferência
estatística nos dá elementos para generalizar, de maneira segura, as conclusões obtidas da amostra
para a população.
Quando se trata de amostra, a preocupação central é que ela seja representativa.
27
Unidade I
Assim que decidimos extrair informações por meio de um levantamento amostral, temos
imediatamente dois problemas:
• definir cautelosamente a população de interesse;

• selecionar a característica que iremos pesquisar.
Portanto, temos situações profissionais em que nos bastam poucos dados ou estatísticas de dados
simples. Por outro lado, têm-se também situações em que um número maior de elementos deve ser
investigado e tratado como distribuições de frequência.
Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral buscamos
medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado
conjunto de números. E as medidas mais usadas nesse sentido são as chamadas medidas de tendência
eventual ou central, que são a média, a mediana e a moda.
Sabe-se que esses valores serão medidos de forma distinta conforme um grande conjunto de dados
ou um pequeno conjunto de dados. Também o cálculo desses valores será afetado caso as variáveis
sejam discretas ou contínuas.
Em estatística, a média é o valor médio de uma distribuição ou de um conjunto de dados,

determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos os
valores da distribuição. Existem diversas formas de calcular a média de um conjunto de números,
por exemplo, algumas delas são: média aritmética, média aritmética ponderada, média geométrica e
média harmônica.
Observação
Neste módulo, trataremos do cálculo dessas estatísticas para os

chamados dados simples ou conjuntos de dados com menos de 30
elementos.
3.1 A média aritmética simples (x)
A média aritmética é um dos valores mais representativos de um conjunto de dados. Obtém-se o

valor da média aritmética dividindo-se o somatório dos valores do conjunto de dados pelo número de
valores total desse conjunto.
Na média aritmética, temos como símbolo: x (lê-se “x traço” ou “x barra”).
Assim, temos que, para a amostra, se calcula o valor médio utilizando-se os seguintes parâmetros:
28
n x ⇒ Média aritmética da amostra (estimativa)

 xi , onde n ⇒ Número de dados da amostra
i1
x
n xi ⇒ Cada variável da amostra
Vamos, agora, tomar um exemplo de média aritmética. Supondo um conjunto de dados

x i = {2, 4, 6, 8, 10,12}, onde n = 6, temos:
n
 xi 2  4  6  8  10  12
i1
x  7
n 6
Exemplo 1:
Uma amostra das notas das provas de matemática dos estudantes da 7ª série de uma grande escola
de São Paulo xi, em que:
xi = {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} e n = 12, temos:
n
 xi 87  42  64  58  90  90  85  63  47  74  100  94
i1
x   74, 5
n 12
A nota média na prova de matemática dos estudantes da 7ª série dessa escola de São Paulo, por
amostragem, é 74,5.
Observação
São as propriedades que a média aritmética simples possui que a fazem

a medida de tendência central mais usada e mais importante de todas.
São propriedades da média aritmética:
• em um conjunto de dados, é sempre possível o cálculo da média, independentemente de quais

elementos compõem esse conjunto de dados;
• em um determinado conjunto de dados, o valor da média será único e corresponderá a uma constante;
• todos os valores de determinado conjunto de dados irão afetar a média, se um valor se modifica,
a média aritmética também se modificará; somando-se ou subtraindo-se uma determinada
constante c a cada elemento de um determinado conjunto de dados xi = x1, x2, x3, ..., xn, a média
29
Unidade I
aritmética ficará aumentada ou diminuída dessa constante c; se, por outro lado, multiplicarmos
cada elemento desse conjunto de dados por uma constante c, a nova média será também
multiplicada por essa constante c; se dividirmos cada elemento do conjunto de dados por essa
mesma constante c, a média será dividida por c.
Assim, se temos um conjunto xi = x1, x2, x2, ..., xn, a média será:
n
 x1 , logo:
i1
x1 
n
n n
 (c  x i )  xi nc
i1 i1
x2   x2    x2  x1  c
n n n
• a soma algébrica dos desvios dos números de um conjunto de dados em torno da média é zero,
isso pode ser representado da seguinte forma:
 xi  x  0
Por exemplo, se temos um conjunto de dados xi = (2, 4, 6, 8, 10), onde n = 5, temos que:
5
 xi 2  4  6  8  10
i1
x  6
5 5
Se aplicarmos a fórmula acima, temos:
 xi  x   xi  6  (2  6)  (4  6)  (6  6)  (8  6)  (10  6)
 xi  x  4  2  0  2  4
 xi  x  0
Observação
A média aritmética é a mais utilizada em nosso dia a dia. É obtida

dividindo-se a soma das observações pelo número delas.
3.2 A média aritmética ponderada xp
Num conjunto de dados em que cada elemento ou cada observação possui a mesma importância,
o cálculo da média aritmética simples mostrará bem a população ou a amostra estudada. No
entanto, se queremos atribuir pesos distintos ou importâncias distintas aos elementos de um
30
conjunto de dados, a estatística a ser adotada é a média aritmética ponderada, em que a cada
valor xi deverá ser atribuído um determinado peso pi. A expressão estatística para o cálculo da
média ponderada é:
n
 xipi
i1
xp  n
 pi
i1
Supondo que um estudante tenha de efetuar uma série de quatro exames para obter sua média
final e passar de ano, cada exame possui um peso diferente na composição dessa média, conforme a
tabela a seguir:
Exame Nota Peso  xipi

i1
1 68 0,30 xp  n
, logo
2 89 0,20  pi
i1
3 45 0,40 (0, 30)68  (0,20)89  (0, 40)45  0,10(100)
xp 
4 100 0,10 0, 30  0,20  0, 40  0,10
1,00 xp  20, 4  17,8  18  10  66,2
Figura 14
A nota média será, então, 66,2, resultado diferente do que seria obtido se utilizássemos a média
aritmética simples.
Num conjunto de dados, em que cada elemento ou cada observação possui importância diferente,
utilizamos a média aritmética ponderada.
Exemplificando as médias aritmética e ponderada:
Média aritmética – exemplo: um aluno tirou as notas 5, 8 e 6 em três provas. A sua média aritmética
será (5 + 8 + 6)/3 = 6,33
Média ponderada – exemplo: um aluno fez um teste (peso 1) e duas provas (peso 2),
tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua média (ponderada)
será [(1 x 8) + (2 x 5) + (2 x 6) ]/5 = 6. Se o teste e a prova tivessem o mesmo peso (e
não importa qual o valor do peso, importa apenas a relação entre os pesos), a média seria,
aproximadamente, 6,33.
Distribuição por frequência é a tabela em que se organizam grandes quantidades de dados,

determinando o número de vezes que cada dado ocorre – frequência (fi) – e a porcentagem com que
aparece – frequência relativa (fr).
31
Unidade I
Observação
∑fi = n número total de observações;
xi = valor da variável ou pontos médios de classes;
k = número de classes ou de valores individuais diferente da variável.
Exemplo: em uma turma, a nota atribuída a 28 alunos, referente a um teste de estatística, foi
disposta em ordem crescente: 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10.
Observando que algumas notas se repetem, podemos utilizar o número de observações ou frequência
de cada um deles como o peso ou fator de ponderação.
Assim:
(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)
x = ---------------------------------------------------------------------------------------------------- = 6,29
4+7+5+5+4+2+1
Utilizando uma tabela para representar a distribuição de frequência, temos:
Tabela 5
xi fi xi fi
4 4 4 x 4 = 16
5 7 5 x 7 = 35
6 5 6 x 5 = 30 ∑x f 176
7 5 7 x 5 = 35 x = -----------i----i--- = -------------- = 6,29
n 28
8 4 8 x 4 = 32
9 2 9 x 2 = 18
10 1 10 x 1 = 10
∑ 28 176
3.3 A mediana (Md)
Outra medida importante de um conjunto de dados é a mediana. A mediana divide determinado

conjunto de dados que deverá estar ordenado em dois grupos iguais, em que metade terá valores
menores, e metade terá valores maiores que a mediana.
Antes de calcular a mediana, é preciso organizar os valores num rol em ordem crescente, para então
contar até a metade dos valores e encontrar a mediana. Em geral, após organizarmos os dados em um
rol, podemos calcular a posição da mediana com a fórmula a seguir:
32
(n+1)
Posição mediana = --------------
2
Em que n é o número de dados observados. Por exemplo, para um conjunto de dados

xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13, temos primeiro que organizar esses
dados em um rol e depois encontrar a posição da mediana para então saber qual será a
mediana. Senão, vejamos:
rolxi - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9}
(n+1) 13+1
Posição mediana = -------------- = -------------- = 7 (7º posição)
2 2
Md = 5
A mediana é outra medida de posição definida como o número do meio, quando as medidas são
organizadas em ordem ascendente ou descendente. Em outras palavras, a mediana de um conjunto de
termos ordenados é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de
mesmo número de elementos.
Observação
Se o número de elementos for ímpar, então a mediana será exatamente

o valor “do meio”. Se o número de elementos for par, então a mediana será
exatamente a média “dos dois valores do meio”.
Para determinar a mediana:
• organize o conjunto de dados em um rol;

• para um conjunto de dados cujo n = ímpar, a mediana será o valor do meio;
• para um conjunto de dados cujo n = par, a mediana será a média dos dois valores do meio.
Para um conjunto de dados xi = {6, 4, 8, 3, 2, 9, 7, 1}, em que n = 8, temos, então:
rolxi = {1, 2, 3, 4, 6, 7, 8, 9}
(n+1) 8+1
Posição mediana = -------------- = -------------- = 4,5
2 2
A mediana será o valor que está a meio caminho dos dois valores médios; nesse caso, entre 4 e 6.
Como fazer? Deve-se tirar a média entre os dois valores do meio para obter o valor da mediana.
33
Unidade I
Assim, temos:
4+6
Md = -------------- = 5
2
Observação
Quando usamos a mediana?
Empregamos a mediana quando:
• desejamos obter o ponto que divide a distribuição em partes iguais;

• há valores extremos que afetam de maneira acentuada a média;
• a variável em estudo é salário.
Em teoria da probabilidade e em estatística, a mediana é uma medida de tendência

central, um número que representa as observações de determinada variável, de tal forma que
esse número, a mediana, de um grupo de dados ordenados, separa a metade inferior da amostra,
população ou probabilidade de distribuição, da metade superior. Mais concretamente, 1/2 da
população terá valores inferiores ou iguais à mediana, e 1/2 da população terá valores superiores
ou iguais à mediana.
 n  1
Em casos de populações (n) ímpares, a mediana será o elemento de posição central  .
 2 
Para os casos de populações (n) pares, a mediana será o resultado da média simples dos elementos
 n  n  1
de posição central    e   . Por exemplo, para as seguintes séries, temos:
 2  2 
Exemplo 1
1, 3, 5, 7, 9, o n da série é ímpar, temos:
 n  1
 
2 
 5  1
 
2 
3º posição
A mediana é igual a 5, pois é a 3ª posição da série.
34
Exemplo 2
1, 2, 4, 7, 9, 10, o n da série é par, temos:
 n  n  1
   e  
2 2 
 6  6  1
   e  
2 2 
3ee4°4
3°
A média será a média entre o 3° e o 4° elemento da série, que será:
3° = 4
4° = 7
 4  7
Md  
 2 
Md = 5,5
Md 5, 5
3.4 A moda
Muitas vezes, em um conjunto de dados, existem valores que se repetem com frequência maior.
A moda é justamente esse valor ou esses valores que mais se repetem em um conjunto de dados. É
possível haver estatísticas que não possuam moda ou que possuam mais de uma moda.
No exemplo que demos anteriormente, para um conjunto de dados xi = {1, 2, 3, 4, 6, 7, 8, 9}, não
existe moda, e diz-se que o conjunto ou distribuição é amodal.
A moda é uma estatística muito mais descritiva e sua importância cresce à medida que um valor ou grupo
de valores se repete mais que outros, e nesse sentido a moda indicaria o valor típico daquele conjunto de
dados com maior ocorrência. Por exemplo, o conjunto de dados xi = {2, 2, 7, 9, 9, 9, 10, 10, 11, 12, 18} tem
moda igual a 9, porque o número 9 é aquele com maior frequência, repetindo-se três vezes.
Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maior
frequência em uma série. Por exemplo: o salário modal dos professores de uma escola é o salário mais
comum, isto é, o salário recebido pelo maior número de empregados dessa escola.
A moda pode apresentar mais de um valor, diferentemente da média ou da mediana. É especialmente

útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não
ser bem definidas.
A moda de {pera, pera, banana, limão, limão, limão, pêssego} é limão.

35
Unidade I
A série {1, 3, 4, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.
A série {1, 3, 2, 5, 8, 7, 4, 9} não apresenta moda.
Exemplo
Sabendo-se que a produção leiteira diária de uma vaca, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 litros, pede-se que se encontre a média, a moda e a mediana para a produção diária de leite
dessa vaca.
Média
n
 xi 10  14  13  15  16  18  12 98
i1
x    14
n 7 7
Logo, x = 14 litros de leite em média por dia, o que significa uma produção de 98 litros de leite em
média por semana.
Observação
A média pode ser um número diferente de todos os valores da amostra

que ela representa.
Moda
Como não possui um valor que aparece com maior frequência que os outros, não há valor de moda
para esse exemplo.
Mediana
Ordenando os dados de forma crescente, temos: 10 - 12 - 13 - 14 - 15 – 16 – 18
 n  1
Posição mediana   
 2 
 7  1
Posição mediana   
 2 
Posição mediana  4
Mediana será o 4° elemento da série, que é igual a 14 litros de leite por dia.
36
Observação
Cada frequência acumulada é a soma das frequências anteriores à

classe.
f1a = f1
f2a = f1a + f2
f3a = f2a + f3
f4a = f3a + f4
...........
fna = f(n-1)a + fn
3.5 Posição relativa da média, moda e mediana
Em uma distribuição de frequências simétricas, as medidas de média, mediana e moda coincidem.

Já quando a assimetria torna-se diferente, essa diferença é tanto maior quanto é a assimetria.
Resumidamente, temos:
(a) (b) (c)
x = Md = Mo Mo Md x x Md Mo
Figura 15 - Distribuições: (a) simétrica, (b) assimétrica e (c) assimétrica negativa.
a) x = xmd = Mo à curva simétrica

b) Mo< xmd < x à curva assimétrica positiva
c) x < xmd < Mo à curva assimétrica negativa
4 MEDIDAS DE DISPERSÃO PARA DADOS SIMPLES
Observamos que a moda, a mediana, e a média podem ser usadas para condensar, num único número,
aquilo que é “médio” ou “típico” de um conjunto de dados. No entanto, a informação fornecida pelas
medidas de posição necessita, em geral, ser complementada pelas medidas de dispersão. Essas medidas
são usadas para indicar o quanto os dados se apresentam dispersos em torno da região central. Dessa
forma, caracterizam o grau de variação existente no conjunto de valores. As medidas de dispersão mais
utilizadas são:
• amplitude total;
37
Unidade I
• desvio padrão;
• variância;
• coeficiente de variação.
Note que, quanto maiores forem as medidas de dispersão, mais heterogêneos são os dados e, ao
contrário, quanto menores forem essas medidas, mais homogêneo é o conjunto.
Vejamos a seguir alguns exemplos que mostram a necessidade de conhecermos as medidas de dispersão.
Exemplo 1
Sabe-se que em Honolulu (Havaí) e em Houston (Texas) a temperatura média diária é quase a
mesma, em torno de 23,9 ºC. Pergunta-se: será que, por isso, podemos inferir que a temperatura seja
basicamente a mesma em ambas as localidades? Ou não será possível que, enquanto uma cidade é
melhor para natação, a outra o seja para atividades externas?
A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1 ºC
e 26,7 ºC. Por outro lado, a temperatura em Houston pode diferir sazonalmente (nas estações do ano),
isto é, apresentar-se baixa em janeiro (cerca de 4,4 ºC) e alta em julho e agosto (bem perto de 37,8 ºC).
Logo, podemos perceber uma oscilação significativa. Desnecessário dizer que as praias em Houston não
estão cheias de gente o ano todo.
Exemplo 2
Suponha que, numa particular cidade, tanto ladrões quanto professores secundários tenham uma
renda média mensal de R$ 900,00. Será que essa informação indica que as duas distribuições de renda
são, necessariamente, semelhantes? Muito ao contrário, poder-se-ia descobrir que elas diferem, e
muito, num outro aspecto importante, que é o fato de as rendas dos professores concentrarem-se ao
redor de R$ 900,00 (serem constantes, homogêneas), enquanto as dos ladrões espalham-se mais (são
descontínuas, heterogêneas), o que reflete, portanto, maiores oportunidades para prisões, desemprego,
pobreza e, em alguns casos, fortunas excepcionais.
Os fatos mostram que precisamos, além de uma medida de tendência central, de um índice que
sinalize o grau de dispersão dos dados em torno da média. Esse índice é uma medida indicativa do que
costumamos chamar de variabilidade ou dispersão.
Retornando ao exemplo 1, poderíamos concluir que a distribuição de temperatura em Houston

(Texas) tem maior variabilidade do que a distribuição de temperaturas em Honolulu (Havaí). Da mesma
forma, podemos dizer que a distribuição de rendas entre professores apresenta menos variabilidade do
que a distribuição de rendas entre ladrões.
Assim, quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto
de dados, faz-se necessário dispor não apenas de informações relativas às medidas de posição. É preciso
38
que se disponha de informações relativas à variabilidade (dispersão) daqueles números que compõem o
referido conjunto de dados. Essas medidas de variabilidade ou dispersão indicam se os dados observados
estão próximos ou separados uns dos outros.
Diferente das medidas de posição, as medidas de dispersão não são autoexplicativas, sua aplicabilidade
depende da comparação de populações ou de amostras do mesmo tamanho e da mesma característica
para que se obtenha alguma informação importante a partir daquela determinada variabilidade.
As principais medidas de dispersão são: a amplitude total (ou intervalo), o desvio médio, a variância
e o desvio padrão. A média serve de referência para todas essas medidas, exceto para o intervalo (ou
amplitude total). À proporção que essas medidas se elevam, isso representa um aumento da dispersão,
o que significa que, se a medida for igual a zero, não existe dispersão.
As medidas de variabilidade, que têm a média aritmética como ponto de referência, são importantes
porque nos permitem avaliar o grau de dispersão das observações em relação a essa mesma média,
isto é, permitem-nos avaliar o quão distante os dados de um determinado grupo de observações estão
da média calculada, dando-nos uma noção mais precisa da situação de determinada população ou
amostra, além de condições de tirar conclusões e informações importantes daqueles dados disponíveis.
Exemplo 3
Um estudante de economia resolve fazer uma pesquisa sobre os salários médios dos funcionários
de determinado setor industrial em São Paulo. Nessa pesquisa, esse estudante conseguiu os seguintes
dados em termos de salários mínimos mensais:
xi = {1.0; 1.5; 2.0; 2.0; 2.0; 2.5; 3.0; 3.0; 80.0; 85.0}
Ao calcular o salário médio desse setor, ele chegou ao valor médio de 18,2 salários mínimos por mês.
Ora, mas esse dado, sem o cálculo de sua dispersão em relação à média aritmética, pouco nos diz sobre
a realidade dessa população, e acabamos por ter uma visão distorcida do padrão de vida da maior parte
dos funcionários desse setor analisado pelo estudante. As medidas de variabilidade ou dispersão nos
permitem perceber essa distorção.
Temos, como principais medidas de dispersão, intervalo, desvio médio, variância e desvio padrão.
As medidas mais comuns de variabilidade para dados quantitativos são a variância; a sua raiz
quadrada e o desvio padrão. A amplitude total, a distância interquartílica e o desvio absoluto são mais
alguns exemplos de medidas de dispersão.
4.1 Amplitude total
O intervalo ou amplitude total de determinado conjunto de dados é obtido pela diferença entre o
maior e o menor valor nesse conjunto de números. Indica, portanto, a distância entre a maior e a menor
observação de um conjunto de dados. Assim, temos:
39
Unidade I
Amplitudetotal = Valormáximo - Valormínimo
Por exemplo, num conjunto de dados xi = {2, 3, 3, 5, 5, 5, 8, 10, 12}, em que n = 9, a amplitude total
será:
Atotal = Vmáximo - Vmínimo = 12 - 2 = 10
Em alguns casos, o intervalo ou amplitude total pode ser expresso simplesmente pela indicação
do menor e do maior número do conjunto de dados. No caso do exemplo anterior, a amplitude total
poderia ser expressa simplesmente pela identificação do menor e do maior número, indicada como
sendo de (2 a 12) ou (2 – 12).
A grande vantagem da amplitude total é que ela apresenta certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados é relativamente grande. No entanto, como a amplitude total
apenas leva em conta os dois extremos do conjunto de números, em alguns casos ela pode ser uma
medida enganosa quanto à indicação da dispersão de um conjunto de números, tendo, portanto, uma
utilidade limitada.
O intervalo de determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor
nesse conjunto de números.
4.2 Desvio médio absoluto
O desvio médio absoluto inaugura o estudo das medidas de variabilidade que têm a média como
ponto de referência.
O chamado desvio nada mais é que a diferença entre cada valor de determinado conjunto de
dados e a média desse mesmo conjunto de números (xi - x). O valor absoluto de um número será
ele próprio, sem o sinal que lhe é associado, e é indicado por meio de duas linhas verticais que o
enquadram.
Assim, |-67| = 67; |9| = 9.
É preciso calcular primeiro a média aritmética dos dados disponíveis, que em geral se apresentam
como dados amostrais.
O desvio médio absoluto será calculado pela média dos desvios dos valores a contar da média,
ignorando o sinal (+ ou -) do desvio, ou seja, convertendo os valores dos desvios em valores absolutos,
considerando-os todos desvios positivos. Assim, temos:
n
Dmédio =  xi  x
i1
n
40
Em que n é o número de observações.
Vamos, agora, tomar um exemplo de desvio médio. Num conjunto de dados amostrais xi = {2, 4, 6, 8, 10, 12},
em que n = 6, determine o desvio médio. Temos, então:
Dmédio =  xi  x
n
Precisamos, primeiro, calcular a média, para então passarmos ao cálculo do desvio médio. Relembrando
a fórmula do cálculo da média aritmética, temos:
x
 xi  x  2  4  6  8  10  12  7  x  7
n 6
Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos:
xi - x
2–7 -5 Dmédio =  xi  x 
5  3  1  1  3  5
4–7 -3 n 6
6–7 -1
Dmédio = 5  3  1  1  3  5  3
8–7 1 6
10 – 7 3
Dmédio = 3
12 – 7 5
Σ 0
Figura 16
O valor encontrado anteriormente representa a diferença média de cada observação e a média da

distribuição, mas também nesse caso só seria possível obter mais informações a partir do desvio médio
comparando com outras populações ou amostras de mesmas características. Por exemplo, se outro
conjunto de dados, com as mesmas características e tamanho, apresentasse um desvio médio absoluto
igual a 2,4, ou seja, menor que o desvio médio absoluto calculado no exemplo anterior, poder-se-ia dizer
que esse segundo conjunto de valores é mais homogêneo do que o nosso exemplo, já que a diferença
de cada um dos seus elementos em relação à média aritmética é menor. Teríamos, assim, uma dispersão
menor.
O desvio é que a diferença entre cada valor de determinado conjunto de dados é a média desse
mesmo conjunto de números.
4.3 Variância
Como no cálculo do desvio médio, para o cálculo da variância, precisaremos utilizar o desvio de
cada elemento de um conjunto de dados em relação à média aritmética (xi - x). No entanto, ao invés de
41
Unidade I
trabalharmos com os valores absolutos (em módulo), agora os desvios são elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invés de dividirmos por n, dividimos por n – 1 (que é o total
da amostra menos uma unidade).
A variância irá nos dizer o grau de dispersão de determinado grupo de dados com relação à média
aritmética desses números. Assim, a variância populacional poderá ser calculada da seguinte forma:
σ2: Variância populacional;

xi: Cada observação do conjunto de
 2

 ( xi   )2
, onde
dados populacional;
n µ: Média da população;
n: Número de observações.
A variância amostral poderá ser calculada pela seguinte fórmula:
s2: Variância da amostra;

xi: Cada observação do conjunto
amostral;
s 2

 ( xi  x )2 , onde
x: Média da amostra;
n 1 n: Número de observações da
amostra.
Por exemplo, seja determinado conjunto de dados xi = {1, 3, 5, 7, 9, 11, 13}, em que n = 7. Calcule a
variância desse conjunto de dados, supondo:
• que esse conjunto de dados representa toda uma população;

• que esse conjunto de dados representa uma amostra.
A) Para calcular a variância desse conjunto de dados, considerando que ele representa toda uma
população, devemos utilizar a seguinte fórmula:
 2

 ( xi   )2
n
Devemos passar ao cálculo da média desse conjunto de dados para, então, proceder ao cálculo da
variância. Sendo assim, temos:

 xi   
n
1  3  5  7  9  11  13
  7 (média populacional)
7
7
42
Partindo da média, podemos agora calcular os desvios e partir para o cálculo da variância populacional,
já que supomos que o conjunto de dados representava toda a população. Assim, temos:
µ xi - µ (xi - µ)2
7 7–1=6 62
2 
 (xi  )2
7 7–3=4 42 N
7 7–5=2 2 2
6  42  22  ( 2)2  ( 4 )2  ( 6)2
2
2 
7 7–7=0 0 7
7 7–9=-2 (-2)2 2 36  16  4  4  16  36
   16
7
7 7 – 11 = - 4 (-4)2
2  16
7 7 – 13 = - 6 (-6)2
Σ 0 112
Figura 17
Desse modo, a variância populacional desse conjunto de dados seria igual a 16.
B) Se, por outro lado, temos o mesmo conjunto de dados e supondo que ele representa apenas dados
amostrais, devemos calcular a variância amostral de outra forma, partindo do cálculo da média
para, então, calcularmos a variância.
Como vimos no item 2, a expressão para o cálculo da média aritmética em uma amostra é a mesma
do cálculo da média para uma população, mas utilizaremos para as amostras outra notação. Vejamos:
x
 xi  x  7 (média amostral).
n
Normalmente, a média amostral aproxima-se da média populacional quanto maior o tamanho da
amostra, mas não se iguala a ela.
Passemos, então, ao cálculo da variância amostral. Utilizaremos os mesmos passos do cálculo da

variância populacional. Dessa forma:
s2 
 (xi  x)2
n 1
x xi - x (xi - x)2
7 7–1=6 62
S2

 ( xi  x )2
7 7–3=4 42 n 1
7 7–5=2 22 62  42  22  ( 2)2  ( 4 )2  ( 6)2
S2 
7 7–7=0 0 7 1
7 7–9=-2 (-2)2 36  16  4  4  16  36 112
S2  
7 1 6
7 7 – 11 = - 4 (-4)2
S2  18,666...
7 7 – 13 = - 6 (-6)2
Σ 0 112
Figura 18
43
Unidade I
A variância amostral desse conjunto de dados é igual a 18,666.
Como a média aritmética, a variância possui algumas propriedades importantes que devemos colocar
em destaque e que facilitam o cálculo de alguns problemas mais complexos.
A) Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de dados, o valor

da variância não se altera.
Por exemplo, um conjunto de dados xi = {2, 4, 6, 8}, em que n = 4, e a média é igual a 5. A variância
desse conjunto será dada como segue:
2
 
 ( xi   )2
 2 
(2  5)2  (4  5)2  (6  5)2  (8  5)2
n 4
 2

 3   1  12  32 9  1  1  9 20
2 2
  5
4 4 4
Se somarmos uma constante c = 4 a cada um dos elementos do conjunto de dados, temos um novo
conjunto de dados yi = {6, 8, 10, 12}, em que a média será igual a 9. A variância será, então:
2
22 
 ( yi  2 ) 
6  9  8  9  10  9  12  9
2 2 2 2
n 4
22 
 3   1  1  3
2 2 2 2

9  1  1  9 20
 5
4 4 4
Sendo assim, demonstramos que 2  22 =, ou seja, ao somarmos uma constante a cada elemento
de um conjunto de dados, a variância permanece a mesma.
B) Ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
variância ao multiplicarmos a variância do conjunto de dados original por c2.
Assim, a nova variância será representada da seguinte forma:
22  c2 .12
C) Ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrária c, obtemos
a nova variância dividindo-se a antiga variância por c2.
Assim, podemos apresentar a nova variância da seguinte forma:

12
22 
c2
D) A variância de uma constante é igual a zero.
44
Existe uma fórmula alternativa e reduzida para o cálculo da variância populacional, deduzida da
fórmula original, que é:
 2

 xi2
 2
n
Para a variância amostral, também existe uma fórmula alternativa bastante utilizada que não exige
o cálculo da média e que decorre da fórmula anterior:
s2x 
 xi2  (  xi )2 n
n 1
Lembrete
Relembrando as propriedades de variância:
• ao somarmos uma constante a cada elemento de um conjunto de dados, a variância permanece

a mesma;
• ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
variância ao multiplicarmos a variância do conjunto de dados original por c2;
• ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrária c, obtém-se
a nova variância dividindo-se a antiga variância por c2;
• variância de uma constante é igual a zero.
Saiba mais
Para aprofundamento do tema desta unidade, seguem alguns links que

podem auxiliá-lo:
“Métodos quantitativos e estatísticos para a tomada de decisão”.

Disponível em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/
download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>.
“Estatística exploratória”. Disponível em: <http://www.cin.ufpe.br/~psb/

EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>.
45
Unidade I
4.4 Desvio padrão
Obtém-se o desvio padrão extraindo-se a raiz quadrada da variância. Assim como a variância e
o desvio médio, o desvio padrão também representa uma medida de variabilidade absoluta, e indica
o desvio de cada um dos números xi de um dado conjunto de observações em relação à média μ. É
também chamado por alguns autores de desvio da raiz média quadrática.
Matematicamente, o desvio padrão poderá ser representado da seguinte forma:
Desvio padrão populacional Desvio padrão amostral

 (xi  )2 s
 (xi  x)2
n n 1
Por exemplo, um conjunto de dados amostrais xi = {2, 4, 6}, em que n = 3 e a média é igual a 4.
Vamos, então, calcular o desvio padrão para a amostra:
s
 (xi  x)2  (2  4 )2  (4  4 )2  (6  4 )2

n 1 3 1
( 2)2  0  22 8
s   4 2
2 2
Esse conjunto de dados irá apresentar um desvio padrão igual a 2.
As propriedades da variância também são aplicáveis ao desvio padrão. No entanto, existem duas
propriedades que serão distintas no caso do desvio padrão por causa de sua característica de raiz
quadrada média positiva da variância.
Assim, ao multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padrão será igual ao antigo multiplicado pela constante. Temos, então:
σ2 = c . σ1
Por outro lado, se dividirmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padrão será igual ao anterior dividido pela constante c. Assim, temos:
1
2 
c
As demais propriedades da variância serão as mesmas para o desvio padrão.
46
4.5 Coeficiente de variação
Em estatística descritiva, o coeficiente de variação serve para indicar se o desvio padrão é

grande ou pequeno em relação à média aritmética da série que está sendo estudada; portanto, é
uma comparação entre o desvio padrão e a média aritmética de uma pesquisa que vai determinar
em porcentagem o quanto houve de desvio em relação à média. O coeficiente de variação é
calculado por:
s , onde:
Cv =
x
S = desvio padrão;
x = média aritmética, que pode ser de uma série populacional ou amostral.
Por exemplo, no item 4.4, foi determinado o desvio padrão de uma série amostral, portanto, vamos
calcular o coeficiente de variação dessa série, que será:
S
Cv =
x
2
Cv =
4
Cv = 0, 5
Cv = 50%
Nesse exemplo, o coeficiente de variação é grande, indica que a variabilidade foi a metade em
relação à média dessa série.
As propriedades da variância se aplicam ao desvio padrão, exceto:
• quando multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padrão será igual ao antigo multiplicado pela constante;
• quando dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio
padrão será igual ao anterior dividido pela constante c.
Em probabilidade e estatística, o desvio padrão é a medida mais usada da dispersão estatística.

Não é senão como a raiz quadrada da variância, ou, ainda, é a raiz quadrada da média aritmética dos
quadrados dos desvios, tomados a partir da média aritmética. É definido dessa forma de modo a dar-nos
uma medida da dispersão que seja:
• um número que não seja negativo;

• use as mesmas unidades de medida que os nossos dados.
47
Unidade I
Faz-se uma distinção entre o desvio padrão (sigma) do total de uma população ou de uma variável
aleatória e o desvio padrão s de um subconjunto em amostra.
O termo desvio padrão foi introduzido na estatística por Karl Pearson, em seu livro Sobre a dissecção
de curvas de frequência assimétricas, de 1894.
Exemplo
Utilizando-se o exemplo apresentado anteriormente, temos que a produção leiteira diária de uma
vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio
padrão (S), a variância (S2) e 5 o coeficiente de variação (CV).
Solução
Amplitude
R = 18 – 10 = 8 litros de leite, ou seja, a maior variação do número de litros de leite produzido por
dia pela vaca é de 8 litros.
Observação
Sabemos que a média para esses dados é: x = 14 litros de leite por dia.
Desvio padrão
n
  x1  x 
2
s i1

 x1  x 2   x2  x 2  ...   xn  x 2 
n 1 n 1
10  14 2  14  14 2  13  14 2  15  14 2  16  14 2  18  14 2  12  14 2 

7 1
 4 2  02   12  12  22  4 2   22   16  0  1  1  4  16  4


42

6 6 6
7 ≅ 2,65 litros de leite por semana
Variância
S2 = (S)2 = (2,65)2 ≅ 7 (litros de leite)2
Coeficiente de variação
48
S 2, 65
cv= = = 0,1893 ou seja, existe uma variabilidade de 18,93% dos dados em relação à média.
x 14
Saiba mais
Dica de leitura:
“Análise do risco na avaliação de projetos de investimentos: uma

aplicação do método de Monte Carlos”. Disponível em: <http://www.
regeusp.com.br/arquivos/c6-Art7.pdf>. Acesso em: 18 jul. 2012.
Resumo
Nesta unidade, vimos que a estatística utiliza métodos matemáticos

para solucionar problemas reais de tomada de decisão quando há incerteza.
Em situações nas quais poderíamos contar unicamente com a sorte,

temos um instrumento que nos possibilita aumentar as chances de tomar
a melhor decisão.
Utiliza ferramentas matemáticas definidas e, mesmo lidando com

grande número de dados, essas ferramentas resumem a análise em tabelas
ou gráficos. Na prática, a estatística pode ser empregada como base
conceitual e fundamental em várias outras ciências, inclusive em análises
gerenciais.
Foram apresentados também os cálculos de medidas de tendência

central (média, mediana, moda), as quais são utilizadas para representar
a série pesquisada. Vimos que, por meio delas, podemos observar o
comportamento da variável que as originou, isto é, nos dá uma ideia da
tendência de todo um conjunto de dados. E, ainda, foram apresentadas de
forma resumida as ideias de simetria e assimetria em função das medidas
de tendência central.
Foram abordadas questões a respeito da distribuição de frequência

e suas representações gráficas, estudo das medidas de dispersão e
variabilidade; e, por fim, foi apresentado um estudo de introdução ao cálculo
da probabilidade que nos ajuda a entender o significado de fenômenos
aleatórios para o entendimento do que é provável e presumível e ainda os
vários tipos de fenômenos em distribuição de probabilidade.
49
Unidade I
Exercícios
Questão 1 (ENEM/2011 – adaptada). Uma equipe de especialistas do centro meteorológico de uma

cidade mediu a temperatura do ambiente, sempre no mesmo horário, durante 15 dias intercalados,
a partir do primeiro dia de um mês. Esse tipo de procedimento é frequente, uma vez que os dados
coletados servem de referência para estudos e verificação de tendências climáticas ao longo dos meses
e anos. As medições ocorridas nesse período estão indicadas a seguir:
Dia do mês Temperatura

(em ºC)
1 15,5
3 14
5 13,5
7 18
9 19,5
11 20
13 13,5
15 13,5
17 18
19 20
21 18,5
23 13,5
25 21,5
27 20
29 16
Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a:
A) 17oC, 17oC e 13,5oC.
B) 17oC, 18oC e 13,5oC.
C) 17oC, 13,5oC e 18oC.
D) 17oC, 18oC e 21,5oC.
E) 17oC, 13,5oC e 21,5oC
Resposta correta: Alternativa B.
50
Análise das alternativas
Com os dados fornecidos, tem-se a seguinte tabela de frequências:
xi 13,5 14 15,5 16 18 18,5 19,5 20 21,5

fi 4 1 1 1 2 1 1 3 1
1) Para calcular a média tem-se:
13, 5.4 14.1 15, 5.1 16.1 18.2 18, 5.1 19, 5.1 20.3 215
, .1 255
X 17
4 1 1 1 2 1 1 3 1 15
A média é 17oC.
2) A mediana (valor do oitavo termo) é 18oC.
3) A moda é 13,5oC.
Sendo assim,
A) Alternativa incorreta.
Justificativa: de acordo com os cálculos.
B) Alternativa correta.
C) Alternativa incorreta.
D) Alternativa incorreta.
E) Alternativa incorreta.
Questão 2 (ENEM/2011). A participação dos estudantes na Olimpíada Brasileira de Matemática das

Escolas Públicas (OBMEP) aumenta a cada ano. O quadro indica o percentual de medalhistas de ouro,
por região, nas edições da OBMEP de 2005 a 2009.
51
Unidade I
Região 2005 2006 2007 2008 2009

Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro-Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%
Disponível em: http://www.obmep.org.br. Acesso em: abr. 2010 (adaptado).
Em relação às edições de 2005 a 2009 da OBMEP, qual o percentual médio de medalhistas de ouro
da região Nordeste?
A) 14,6%.
B) 18,2%.
C) 18,4%.
D) 19,0%.
E) 21,0%.
Resolução desta questão na plataforma.
52
Unidade II
5 DISTRIBUIÇÃO DE FREQUÊNCIAS
Ao longo de nosso estudo, observamos que, para extrair dos dados estatísticos de que dispomos a
correta análise e interpretação, o primeiro passo deverá ser a correta organização e sumarização desses
dados; caso contrário, esses números não farão qualquer sentido.
Além disso, dependendo do tamanho do nosso conjunto de dados, podemos organizá-los em um

rol de dados simples, ou seja, por ordem de grandeza (crescente ou decrescente), ou em rol (novamente
ordenando o conjunto de dados) e, posteriormente, tabelando sua distribuição de frequências.
A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a

quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com
características semelhantes – as classes ou categorias.
A distribuição de frequência é a organização de dados em classes ou intervalos, para determinar o número

de observações ou a percentagem de observações de cada classe, chamada de frequência de classes.
Para apresentar esses dados, podemos utilizar gráficos e tabelas, bem como as medidas de posição
e variabilidade para interpretá-los, mas não sem organizá-los previamente em uma distribuição, sem a
qual ficaria impossível o cálculo de algumas das medidas necessárias, como média, variância etc.
Tabela 6
Idade de 100 estudantes formandos do curso de

Gestão de uma Universidade em dez/2006
Idade Número de estudantes (fi)
20 a 22 5
22 a 24 12
24 a 26 11
26 a 28 16
28 a 30 20
30 a 32 14
32 a 34 8
34 a 36 8
36 a 38 4
38 a 40 2
Total = 100
53
Unidade II
A tabela anterior é uma distribuição de frequências das idades dos estudantes que estão se formando
no curso de Gestão de determinada universidade fictícia. A primeira classe corresponderia ao grupo de
formandos em Gestão no ano de 2006 e que tem entre 20 e 22 anos. A frequência dessa classe corresponde
a 5, porque existem 5 estudantes cuja idade faz parte dessa classe.
Representação dos intervalos reais:
Intervalo fechado nas duas extremidades

a b
Que será [a,b], ou ainda {x ∈ ℝ | a ≤ x ≤ b}.
Intervalo aberto nas duas extremidades

a b
Que será ]a,b[, ou ainda {x ∈ ℝ | a < x < b}.
Intervalo fechado à esquerda e aberto à direita

a b
Que será [a,b[, ou ainda [a,b) = {x ∈ ℝ | a ≤ x < b}.
Intervalo aberto à esquerda e fechado à direita

a b
Que será (a,b], ou ainda ]a,b] = {x ∈ ℝ | a < x ≤ b}.
Saiba mais
Para mais informações a respeito da Teoria dos Conjuntos, ler o material

“Elementos de Lógica Matemática e Teoria dos Conjuntos”. Disponível em:
<http://www.ciul.ul.pt/~amfern/am1/documents/logTeoConj.pdf>. Acesso em:
24 jul. 2012.
5.1 A construção de uma distribuição de frequências para dados contínuos
Para se construir determinada distribuição de frequências, é preciso, em primeiro lugar, definir o tipo
de variável em questão, para depois definir os passos que devem ser seguidos para a construção dessa
54
distribuição. Vamos supor o conjunto de dados a seguir, referente às idades de uma amostra de 100
alunos formandos em Gestão de uma universidade:
Tabela 7
Dados das idades dos estudantes formandos de Gestão da Universidade

20 20,4 20,5 21 21 22 22 22 22,1 22,2
22,3 22,5 22,6 22,7 22,8 22,9 23 24 24,1 24,2
24,3 24,4 24,5 25 25 25,3 25,5 25,7 26 26
26,2 26,3 26,4 26,5 26,6 26,7 26,8 26,9 27 27
27,1 27,2 27,3 27,4 28 28 28 28 28 28
28,2 28,3 28,5 29 29 29 29 29,1 29,1 29,2
29,3 29,4 29,5 29,5 30 30 30 31 31 31
31 31,1 31,2 31,3 31,4 31,5 31,6 31,6 32 32
32 32 32,3 33 33 33 34 34 34 34
34 34,5 35 35 36 36 37 37,5 38 40
Como podemos observar, os dados já estão dispostos em ordem crescente de grandeza, em um rol,
muito embora se trate de um conjunto de números superior a trinta observações. Essa amostra diz
respeito às idades dos alunos de determinada universidade fictícia que estão se formando no curso de
Gestão. Estamos considerando, portanto, uma variável quantitativa contínua.
Uma variável quantitativa contínua é aquela que pode assumir qualquer valor num intervalo
contínuo, ou seja, um valor numérico que pertence ao conjunto dos números reais (ℝ).
Como vimos, tratar um conjunto de dados sob a forma de uma distribuição de frequências significa
organizá-los em intervalos de classes. Precisamos, então, definir o número de classes, o tamanho dessas
classes, para então enquadrar os dados nas classes pela simples contagem desses dados amostrais.
A primeira coisa que devemos fazer ao nos depararmos com um conjunto de dados como esse
apresentado na tabela 7 é procurar calcular a amplitude total (ou intervalo). Nesse caso, será muito mais
fácil, já que os números estão dispostos em um rol. Conforme vimos, a amplitude total (ou intervalo)
poderá ser calculada da seguinte forma:
Atotal = Vmáximo – Vmínimo
Atotal = 40 - 20 = 20
No caso do nosso exemplo, a amplitude total será igual a 20. O valor da amplitude total será
importante porque, juntamente com o número de classes, definirá a chamada “amplitude de classes”.
Mas como, então, estabelecer o número de classes? A teoria estatística tem se desenvolvido ao
longo dos anos e chegou ao consenso de que é aconselhável estabelecer o número de classes entre um
55
Unidade II
mínimo de cinco e um máximo de vinte classes. Uma distribuição de frequências que possua mais de
vinte classes torna a apresentação dos dados muito confusa e de difícil avaliação. Se estabelecermos um
número de classes inferior a cinco, podemos correr o risco de ocultar informações importantes sobre os
dados disponíveis.
Quando se quer determinar o número de classes em função do conjunto de dados disponíveis, basta
tirarmos a raiz quadrada de n, em que n corresponderia ao total de observações (seja da população ou
da amostra). Sendo assim, temos:
Númeroclasses = n
No caso do exemplo apresentado anteriormente, temos um total de observações n = 100; portanto,

o número de classes será igual a 10. Vejamos:
Nclasse = n
N=
classe =
100 10
Observação
Regra da raiz: dar prioridade ao seu uso quando os dados não superam
os 60 elementos.
Númeroclasse = n
Regra de Sturges
Númeroclasse = 1 + 3,3.logn
Uma vez estabelecido o número de classes, é preciso pensar qual será o tamanho de cada classe, ou,
dito de outra forma, faz‑se necessário determinar a amplitude de classe dessa distribuição de frequências.
Para isso, calculamos a amplitude total dessa distribuição, a qual corresponde a uma medida absoluta
de variabilidade.
A amplitude de classes será calculada, então, tomando-se o valor da amplitude total e dividindo-se
pelo número de classes.
Assim, temos:
Amplitudetotal
Amplitudeclasses = -------------------------------
Númeroclasses
56
Seguindo o exemplo em que estamos trabalhando, já fizemos o cálculo da amplitude total e do

número de classes; podemos, então, passar para o cálculo da amplitude de classes do exemplo. Temos:
A
A classes = total
Nclasses
20
=
A classes = 2
10
A amplitude das classes da distribuição de frequências que estamos procurando construir em nosso
exemplo será igual a dois. Isso representa o intervalo ou o tamanho de cada classe no qual iremos
dispor nossos dados. É importante ressaltar que uma distribuição de frequência não obrigatoriamente
apresenta uma única amplitude de classes, posto que mantenha a composição estrutural da distribuição.
Temos agora o número de classes, a amplitude de classes, e podemos então calcular o intervalo de
classes. O intervalo de classes é composto por um limite inferior (número menor) e por um limite
superior (número maior). Os limites inferiores e superiores podem ou não estar incluídos no intervalo
de classes, existindo uma simbologia própria dentro da estatística para se expressar isso. Então, vejamos
exemplos a partir da tabela 6:
A) 20 |—| 22: diz-se que é um intervalo fechado à esquerda e à direita, pois tanto o 20 quanto o 22
participam do intervalo;
B) 22 —| 24: diz-se que esse é um intervalo aberto à esquerda e fechado à direita, já que o limite
inferior, 22, não participa do intervalo, ao passo que o limite superior participa;
C) 20 |— 22: caso o exemplo se apresentasse assim, teríamos um intervalo de classe fechado à
esquerda e aberto à direita, já que o limite inferior participa do intervalo, mas o limite superior
não;
D) 20 — 22: aqui, teríamos um intervalo de classe aberto à esquerda e à direita, em que nem o limite
inferior nem o limite superior participam do intervalo.
Após o cálculo do número e da amplitude de classes, devemos definir o limite inferior e o limite
superior de cada classe, começando com o menor valor. Em nosso exemplo, podemos calcular as classes
da seguinte forma:
Para a primeira classe:
• limite inferior: 20;

• limite superior: 20 + amplitude de classe = 20 + 2 = 22.
Para a segunda classe:
• limite inferior: limite superior da classe anterior = 22;

• limite superior: limite inferior da segunda classe + amplitude de classes = 22 + 2 = 24.
57
Unidade II
E assim sucessivamente até a classe de número 10, em nosso exemplo, que terá como limite inferior
38 e como limite superior 40. É importante frisar que determinado valor não pode pertencer a mais de
uma classe, mas, por outro lado, para cada valor deve haver uma classe, não permitindo a existência de
lacunas na fixação dessas mesmas classes.
Uma vez definido o número e a amplitude total de classes, a partir delas podemos estabelecer
a amplitude de classes e também definir os limites superior e inferior de cada classe. Resta agora
confrontar nossas classes com as observações de que dispomos na tabela 7.
Mediante contagem, devemos construir nossa distribuição de frequência fixando cada observação
numa classe determinada. Quando indicamos o número de observações existentes em dado intervalo,
temos a chamada frequência absoluta simples (fi).
A frequência absoluta é o número de vezes que o dado aparece naquele determinado conjunto de
números, ou seja, em uma amostra ou população da pesquisa a ser estudada.
É importante destacar que nenhuma classe poderá apresentar frequência absoluta igual a zero.
Assim, uma primeira construção que podemos fazer para nos levar à tabela 6 é estabelecer os intervalos
de frequência em cada classe, só que agora colocando a notação estatística em cada intervalo de classe.
Então, temos:
Tabela 8
Distribuição de frequência das idades

Classes Frequência absoluta simples
20 |- 22 5
22 |- 24 12
24 |- 26 11
26 |- 28 16
28 |- 30 20
30 |- 32 14
32 |- 34 8
34 |- 36 8
36 |- 38 4
38 |- 40 2
∑ 100
É importante ressaltar que, na construção da distribuição de frequências anterior, devemos respeitar

os valores estabelecidos para cada intervalo de classe, ou seja, para o primeiro intervalo de classe, há
o valor do limite inferior e do limite superior, que serão indicados pelo intervalo fechado à esquerda e
pelo intervalo aberto à direita, ou seja, tem que colocar a quantidade de frequência compreendida entre
20 (limite inferior) e menor que 22 (limite superior); existem cinco valores compreendidos no primeiro
intervalo de classe.
58
No segundo intervalo de classe, que tem 22 como limite inferior e 24 como limite superior, será
colocada a quantidade de frequência compreendida entre 22 e menor que 24; existem doze valores,
e assim se vai determinando a quantidade de frequência para cada classe, até chegar à última classe,
conforme a tabela 8.
A seguir, devemos calcular as frequências absolutas simples acumuladas (fi, A).
Frequência absoluta simples acumulada indica o número de observações acumuladas até o limite
superior de uma classe. Por exemplo, na terceira classe, teríamos 28 alunos com idade entre 20 e
26 anos formando‑se em Gestão. Vejamos como ficaria a nova tabela, incluindo a nova notação da
frequência acumulada:
Tabela 9
Classes Frequência absoluta Frequência absoluta

simples (fi) simples acumulada (fi, A)
20 |- 22 5 5
22 |- 24 12 17
24 |- 26 11 28
26 |- 28 16 44
28 |- 30 20 64
30 |- 32 14 78
32 |- 34 8 86
34 |- 36 8 94
36 |- 38 4 98
38 |- 40 2 100
∑∑ 100
Outro dado importante que podemos extrair da construção de uma distribuição de frequências é a
frequência relativa simples (fi, R), que nos mostra a participação relativa do número de observações em
uma dada classe, e deverá ser calculada da seguinte forma:
fi
fi ,R  , geralmente expresso em percentual.
fi
A soma das frequências relativas de todas as classes será igual a 1, se expressa em forma fracionária,
ou a 100%, se expressa em percentual. No caso da distribuição de frequências que estamos construindo,
temos agora a seguinte tabela:
59
Unidade II
Tabela 10
Classes fi fi, A fi, R

20 |- 22 5 5 0,05
22 |- 24 12 17 0,12
24 |- 26 11 28 0,11
26 |- 28 16 44 0,16
28 |- 30 20 64 0,20
30 |- 32 14 78 0,14
32 |- 34 8 86 0,08
34 |- 36 8 94 0,08
36 |- 38 4 98 0,04
38 |- 40 2 100 0,02
∑ 100 1
O cálculo da frequência relativa de cada intervalo de classe

da tabela acima que será expressa na unidade de percentagem
será:
fi
fR 
 fi
5
fR   0, 05
100
Para expressar esse valor na unidade de porcentagem,
basta multiplicá-lo por 100%:
fR = 0,5 x 100%
fR = 5%
5.2 A construção de uma distribuição de frequências para dados discretos
Na construção de frequência para dados discretos, basta criar uma coluna representando a posição
de cada frequência e na frente estabelecer a quantidade de vezes em que a frequência aparece dentro
da amostra ou da população de uma série de estudo ordenadamente. Por exemplo:
X: {0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 1, 3, 2, 2, 0}
Fazendo o rol da pesquisa, temos:
X: {0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3}
60
Tabela 11
xi fi
0 8
1 5
2 5
3 2
Pode-se dizer, então, que distribuição de frequências é uma maneira de representar uma coleção
de dados classificando-os de modo a mostrar o quanto cada dado se repete. É importante considerar,
na distribuição de frequência, a possibilidade de apresentar as chamadas distribuições especiais.
Como exemplo, pode-se citar a distribuição de frequências de probabilidades e de frequências de
amostragens.
5.3 Representações gráficas de dados agrupados
Como mencionado anteriormente, a confecção de gráficos permite melhor visualização dos dados,
mostrando mais claramente as diferenças existentes. Os gráficos mais comuns são o gráfico de setor,
de coluna ou de barra e o gráfico de curva. O tipo de gráfico a ser utilizado depende do que se deseja
enfatizar.
Assim, o gráfico de coluna ou de barra mostra diferenças entre os valores absolutos; o gráfico
de curva é utilizado quando se deseja mostrar variações ao longo do tempo, e o gráfico de setor,
também conhecido como “gráfico de pizza”, é utilizado quando se deseja ressaltar diferenças entre
proporções. Esses gráficos podem ser facilmente feitos em planilhas eletrônicas, por exemplo, no
Excel.
No caso de dados agrupados, ou de distribuições de frequência, a representação gráfica utilizada é

o histograma ou, ainda, o polígono de frequência.
Lembrete
Histograma: é a representação gráfica de uma distribuição de

frequência por meio de retângulos justapostos, em que a base colocada no
eixo horizontal corresponde à amplitude dos intervalos de classe e a altura
é proporcional à frequência das classes.
Polígono de frequências: é a representação gráfica de uma distribuição

de frequência por meio de um polígono. Cada vértice do polígono tem como
abscissa o ponto médio de classe e ordenada proporcional à frequência
dessa classe.
61
Unidade II
Exemplo: salários de funcionários de determinada empresa:
Tabela 12
Intervalos Salários fi (fi Ac.)

15750 -- 29000 22375 238 238
29000 -- 42250 35625 144 382
42250 -- 55500 48875 35 417
55500 -- 68750 62125 29 446
68750 -- 82000 75375 16 462
82000 -- 92250 88625 6 468
92250 -- 108500 101875 4 472
108500 -- 121750 115125 1 473
121750 -- 135000 128375 0 473
A) Histograma
240 238
220
200
180
160 144
140
fi
120
100
80
60
40 35 29
20 16 6 4 1 0
0
22.375 35.625 48.875 62.125 75.375 88.625 101.875 115.125 128.375
Salários
Figura 19
Observação
A área de um histograma é proporcional à soma das frequências.
62
B) Polígono de frequência
240 238
220
200
180
160 144
140
fi
120
100
80
60
40 35
29
20 16
6 4 1
0 0 0
22.375 35.625 48.875 62.125 75.375 88.625 101.875 115.125 128.375
Salários
Figura 20
Lembrete
Estatística descritiva é o nome dado ao conjunto de técnicas analíticas
utilizadas para resumir o conjunto de todos os dados coletados numa dada
investigação a relativamente poucos números e gráficos.
A estatística descritiva envolve basicamente:
Distribuição de frequência: é o conjunto das frequências relativas observadas para um dado

fenômeno estudado, sendo sua representação gráfica o histograma (diagrama em que o eixo horizontal
representa faixas de valores da variável aleatória e o eixo vertical representa a frequência relativa).
Por uma consequência da Lei dos Grandes Números, quanto maior o tamanho da amostra, mais a
distribuição de frequência tende para a distribuição de probabilidade.
50
Frequência relativa (%)
40
30
20
10
0
A B C E F
Faixas da variável aleatória
Figura 21 – Histograma
Medidas da tendência central: são indicadores que permitem que se tenha uma primeira ideia, um
resumo de como se distribuem os dados de um experimento, informando o valor (ou faixa de valores) da
variável aleatória que ocorre mais tipicamente. Ao todo, são três os parâmetros:
63
Unidade II
• média: é a soma de todos os resultados dividida pelo número total de casos, podendo ser
considerada como um resumo da distribuição como um todo;
• moda: é o evento ou a categoria de eventos que ocorreu com maior frequência, indicando o valor
ou a categoria mais provável;
• mediana: é o valor da variável aleatória a partir do qual metade dos casos se encontra acima dele
e metade, abaixo.
50

40 Tendência
30 central
20
10
0
A B C E F
Medidas de dispersão: são medidas da variação de um conjunto de dados em torno da média, ou

seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identificar até que ponto os
resultados se concentram ou não ao redor da tendência central de um conjunto de observações. Incluem
a amplitude, o desvio médio, a variância, o desvio padrão, o erro padrão e o coeficiente de variação, cada
um expressando diferentes formas de quantificar a tendência que os resultados de um experimento
aleatório têm de se concentrarem ou não em determinados valores (quanto maior a dispersão, menor a
concentração e vice-versa).
50
40
30 Dispersão
20
10
0
A B C E F
A ideia básica é a de se estabelecer uma descrição dos dados relativos a cada uma das variáveis,
dados esses levantados por meio de uma amostra.
Façamos alguns exemplos para tornar as definições e suas aplicações técnicas mais claras:
Exemplo 1
A empresa JCC fez levantamento entre 30 funcionários para descobrir o número de filhos dos seus
funcionários. Foram encontrados os seguintes valores:
64
1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Responda às questões a seguir, para x = 2 e x = 4.
Obs.: X é o número de funcionários, então vamos responder:
A) Quantos empregados têm dois filhos?

B) Quantos empregados têm menos de dois filhos?
C) Quantos empregados têm mais de dois filhos?
D) Quantos empregados têm quatro filhos?
E) Quantos empregados têm menos de quatro filhos?
F) Quantos empregados têm mais de quatro filhos?
Solução
Rol (dados em ordem crescente):
0 0 1 1 1 1 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 4 4 4 4 4 5 5 5
Tabela 13 – Distribuição de frequências
X F fr f% F↓ F↑ F% ↓ F% ↑
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
Como analisar a situação:
A questão “A” – quantos empregados têm dois filhos – pode ser observada pela frequência absoluta
simples “F”. Observe a segunda coluna, 10 funcionários apontaram ter 2 filhos.
A questão “B” – quantos empregados têm menos de dois filhos – pode ser observada na coluna F ↓
(frequência absoluta acumulada “abaixo de”, a qual aponta que 6 funcionários têm menos de dois filhos
(2 têm zero filho e 4 têm um filho).
65
Unidade II
Obs. Se a pergunta fosse quantos funcionários têm de 2 filhos para baixo, a resposta seria 16.
A questão “C” – quantos empregados têm mais de dois filhos – pode ser observada na coluna de F ↑
(frequência absoluta acumulada “acima de”). Ou seja, funcionários com 3, 4 ou 5 filhos são 14 no total.
Se a pergunta fosse de dois para cima, a resposta seria 24, pois incluiria os funcionários com 2 filhos.
Seguindo o mesmo processo, o aluno agora pode responder, para quatro filhos, às questões D, E e F.
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
_____________________________________________________________________________
Resposta:
D=5
E = 22
F=3
Exemplo 2
Determinado laboratório realizou exames de urina em um grupo de pacientes com o objetivo de

encontrar a quantidade de creatina (em miligramas por 100 mililitros) em pacientes com apresentação
de problemas renais. Os dados encontrados foram:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
Solução
Rol (dados em ordem crescente)
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
66
Amplitude total (dá uma ideia do campo de variação dos dados)
A = LS - LI = (2,34) - (1,08) = 1,26
Fazendo uma análise dos resultados da quantidade de creatinina encontrada na urina dos 84
pacientes, verificou-se que ocorreu uma variação de 1,26 no seu campo (de 1,08 a 2,34).
Estabelecer o número de classes (c):
c = 1+3,3.log n
c = 1+3,3.log(84)
c ≅ 7,35
c=7
Estabelecer o intervalo de classe (i): i = A/c = (1,26)/7 = 0,18
Construção da tabela:
Tabela 14
Classes fi Pm fr f% F% ↓ F% ↑ F↓ F↑
1,08 |— 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 |— 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 |— 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 |— 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 |— 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 |— 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 |—| 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
Observações:
1. A representação de cada classe deve ser feita pelo ponto médio (Pm), o qual se obtém pela fórmula:
Pm = (Lt +Ls ) / 2
Obs. Como teste, solicita-se ao aluno que calcule cada um dos Pm na tabela, faça uma espécie de
conferência.
2. fi: representa o número de elementos de cada classe. Ou, em outras palavras, é a quantidade de
vezes que cada classe apareceu na análise;
67
Unidade II
fr: mede a representatividade relativa de cada valor encontrado em fi, ou o quanto cada valor
significa em relação à unidade;
f%: representa o peso percentual de cada item em relação ao todo.
3. 1,08 |— 1,26 na leitura de intervalo, significa que é um intervalo fechado à esquerda (pertencem
à classe valores iguais ao extremo inferior – ou seja, inclui 1,08 no intervalo) e aberto à direita (não
pertencem à classe valores iguais ao extremo superior – o limite superior não faz parte do intervalo, é
abaixo dele).
4. Não necessariamente o último número será o limite superior da última classe, mas obrigatoriamente
as classes devem conter todos os elementos.
Algumas considerações ou conclusões
a) Considerando os valores anteriores, quantos pacientes apontaram resultados no intervalo entre

[1,44; 1,62[?
R.: (Frequência absoluta simples) 32 pacientes.
b) Para ampliar a análise, aponte a quantidade de pacientes com creatinina inferior ao intervalo
[1,80; 1,98[
Observe a tabela: (Frequência absoluta acumulada)
Tabela 15
Classes fi Pm fr f% F% ↓ F% ↑ F↓ F↑
1,08 |— 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 |— 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 |— 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 |— 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 |— 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 |— 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 |—| 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
R.: 68 pacientes.
Atenção: para dados agrupados ou distribuição de frequências.
Elementos principais:
a) Classe: é cada um dos intervalos em que os dados são agrupados.

68
b) Limites de classes: são os valores extremos de cada classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe.
c) Amplitude: é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode
ser referida ao total de dados ou a uma das classes em particular.
• Amplitude total (At ): é calculada pela seguinte expressão:
At = Max. (rol) – Min. (rol).
• Amplitude das classes (h): é a relação entre a amplitude total e o número de classes, conforme
mostra a expressão a seguir:
Max (rol)-Min(rol)
h = -------------------------------------------
n
em que n é o número de intervalos de classe.
d) Ponto médio de classe (xi): é calculado pela seguinte expressão:
L +l
xi = ------i--------i---
2
e) Frequência absoluta (fi): frequência absoluta de uma classe de ordem i é o número de dados
que pertencem a essa classe.
f) Frequência relativa (fri): frequência relativa de uma classe de ordem i é o quociente da frequência
absoluta dessa classe (fi) pelo total, ou seja,
f
fri = ----------i -----
Total
Observação
A soma de todas as frequências absolutas é igual ao total.
g) Frequência acumulada (fi): frequência acumulada de uma classe de ordem i é a soma das
frequências até a classe de ordem i.
h) Frequência relativa acumulada (fri): frequência relativa acumulada de uma classe de ordem i
é a soma das frequências relativas até a classe de ordem i.
69
Unidade II
6 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE

FREQUÊNCIA
Vamos agora usar os conhecimentos obtidos no item 4 para aprender a calcular as medidas de posição
e variabilidade em uma distribuição de frequência. Para isso, continuaremos utilizando o exemplo que
trabalhamos no item 5 – da distribuição de frequência das idades dos alunos formandos em Gestão de
uma universidade fictícia.
Tabela 16
Idade de 100 estudantes formandos do curso de

Gestão de uma Universidade em dez/2006
Idade Número de estudantes
20 a 22 5
22 a 24 12
24 a 26 11
26 a 28 16
28 a 30 20
30 a 32 14
32 a 34 8
34 a 36 8
36 a 38 4
38 a 40 2
Total = 100
Podemos, também, aproveitar uma série de informações que construímos a partir dos dados brutos
que tínhamos no item 5, tal como disposto na tabela a seguir, e, partindo dessas informações, construir
as medidas de posição e variabilidade para uma distribuição de frequência.
Tabela 17
Classes fi fi, A fi, RA

20 |- 22 5 5 0,05
22 |- 24 12 17 0,12
24 |- 26 11 28 0,11
26 |- 28 16 44 0,16
28 |- 30 20 64 0,20
30 |- 32 14 78 0,14
32 |- 34 8 86 0,08
34 |- 36 8 94 0,08
36 |- 38 4 98 0,04
38 |- 40 2 100 0,02
∑ 100 1
70
6.1 As medidas de posição
6.1.1 A média
No item 2, como trabalhávamos com um conjunto de dados pequeno para calcular a média desse
grupo de números, era necessário organizá-los em um rol, identificar os valores de xi, fazer o somatório
e então calcular a média a partir da fórmula apresentada.
No entanto, quando se tem uma distribuição de frequências, nem sempre dispomos dos valores de
todas as observações ou a amostra é por vezes tão grande que não é viável fazer o cálculo da mesma
maneira que fazemos quando os dados estão dispostos em um rol. Geralmente, quando estamos diante
de uma distribuição de frequência, o que dispomos é do número de observações em cada classe, mas não
dos valores em si de xi. Portanto, as observações em dada distribuição de frequência serão representadas
pelo ponto médio de cada classe. A fórmula para o cálculo do ponto médio será:
Limiteinf erior  Limitesup erior
Pmédio = Xi 
2
Para o cálculo da média aritmética, usa-se uma fórmula que deriva da fórmula de cálculo da média
ponderada para determinar a média de uma distribuição de frequência; substituem-se os pesos pelas
frequências de classes e xi pelo ponto médio, representado por xi.
Assim, temos que a média numa distribuição de frequências é:
x : Média aritmética da distribuição de

frequência;
x
 fiXi , onde fi : Frequência absoluta simples;
n xi : Ponto médio de cada classe;
n : Número de observações.
Em nosso exemplo de distribuição de frequência das idades, podemos calcular a média a partir da
construção de uma nova tabela.
Tabela 18
Classes fi fi, A fi, A Xi fi, Xi

20 |- 22 5 5 0,05 21 105
22 |- 24 12 17 0,12 23 276
24 |- 26 11 28 0,11 25 275
26 |- 28 16 44 0,16 27 432
28 |- 30 20 64 0,20 29 580
30 |- 32 14 78 0,14 31 434
32 |- 34 8 86 0,08 33 264
34 |- 36 8 94 0,08 35 280
36 |- 38 4 98 0,04 37 148
38 |- 40 2 100 0,02 39 78
∑ 100 1 2872
71
Unidade II
Calculando a média aritmética para o exemplo, em que n = 100, temos, então:
x
 fiXi
n
(5.21)  (12.23)  (11.25)  (16.27)  (20.29)  (14.31)  (8.33)  (8.35)  (4.37)  2.39
x
100
105  276  275  432  580  434  264  280  148  78 2872
x 
100 100
x  28, 72
A idade média dos estudantes de Gestão da universidade AB que se formaram no ano de 2016 seria
de 28,72 anos, de acordo com a distribuição de frequência aqui construída.
6.1.2 A mediana
Como vimos também no item 2, a mediana é o elemento que ocupa a posição central num
determinado conjunto de dados ordenados.
Em uma distribuição de frequências de uma variável contínua, devem-se seguir alguns passos para
calcular a mediana. Da mesma forma que, nos dados organizados em um rol, precisamos primeiro
identificar a posição da mediana.
n
O primeiro passo é calcular a ordem , e parte-se para a frequência acumulada para
2
identificar a classe que contém a mediana. Feito isso, utiliza-se a seguinte fórmula para o cálculo
da mediana:
 MD : Limite inferior da classe da mediana;

n : tamanho da amostra;
n Σƒ: Soma das frequências acumuladas anteriores à da
~ (   f ).h
x   MD  2 , onde mediana;
FMD h : Amplitude da classe da mediana;
FMD: Frequência da classe da mediana.
Para a distribuição de frequência, temos de seguir os passos citados anteriormente para calcular
n 100
a mediana. Pelo exemplo anterior, primeiro, calculamos= = 50 , conforme indicado na tabela
a seguir: 2 2
72
Tabela 19
Classes fi fi, A fi, R Xi fi, Xi

20 |- 22 5 5 0,05 21 105
22 |- 24 12 17 0,12 23 276
24 |- 26 11 28 0,11 25 275
26 |- 28 16 44 0,16 27 432
28 |- 30 20 64 0,20 29 580
30 |- 32 14 78 0,14 31 434
32 |- 34 8 86 0,08 33 264
34 |- 36 8 94 0,08 35 280
36 |- 38 4 98 0,04 37 148
38 |- 40 2 100 0,02 39 78
∑ 100 1 2872
a) Identificar a classe da mediana a partir da frequência acumulada, procurando descobrir onde a

observação de número 50 está alocada. Em nosso exemplo, ela estará na quinta classe, que possui
limite inferior de 28 e limite superior de 30.
b) Calcular a mediana por meio de:

n
~ (   f ).h
x   MD  2
FMD
, onde  MD = 28 ; n = 100;  f  44; F MD
= 20; h = 2
~
x  28 
50  44   2
20
~
x  28  0, 6
~
x  28, 6
A mediana de nossa distribuição de frequência será 28,6 anos, ou seja, 50% dos alunos que se
formaram em Gestão nessa universidade têm, no máximo, 28,6 anos.
6.1.3 A moda
Para calcular a moda, é preciso identificar o intervalo de classes de maior frequência, pois é nele que
ela se encontra.
Depois disso, aplica-se a chamada fórmula de Czuber, descrita a seguir, para o cálculo da moda, que
nos dirá qual a observação mais frequente daquela distribuição. O cálculo da moda será:
73
Unidade II
Mod: Valor da moda;

L1: Limite inferior da classe modal;
D1:Diferença entre a frequência
da classe modal e a frequência da
D1 classe anterior;
Mod  L1  ( ).h
D1D2 , onde D2:Diferença entre a frequência
da classe modal e a frequência da
classe posterior;
h: Amplitude de classe.
Calculemos, então, a moda para a nossa distribuição de frequência das idades dos alunos de Gestão
da universidade AB que se formaram em 2016. A classe modal será a quarta classe, pois é aquela que
apresenta a maior frequência. Temos, então:

Mod  28  
20  16 
 .2
 20  16   20  14  
 4  4
Mod  28    .2  28   28, 8
 4  6 5
A moda seria, portanto, de 28,8 anos, o que significa que a maior quantidade de alunos formando-se
no curso de Gestão dessa universidade fictícia teria 28,8 anos.
6.2 As medidas de dispersão numa distribuição de frequência
6.2.1 O desvio médio
Recapitulando o item 4, o desvio médio indica a diferença entre cada observação e a média aritmética
de determinado conjunto de dados.
No caso de uma distribuição de frequência, essa diferença será calculada da seguinte forma:
Dmédio: Desvio médio absoluto;

Xi: Ponto médio de cada classe;
x : Média da distribuição de
Dmédio =  Xi  x .fi , onde frequência;
n fi : Frequência absoluta;
n: Total de observações.
Em nosso exemplo, temos, então:
74
Tabela 20
Classes fi fi, A fi, R Xi fi, Xi Xi - x |Xi - x|.fi

20 |- 22 5 5 0,05 21 105 -7,72 38,6
22 |- 24 12 17 0,12 23 276 -5,72 68,64
24 |- 26 11 28 0,11 25 275 -3,72 40,92
26 |- 28 16 44 0,16 27 432 -1,72 27,52
28 |- 30 20 64 0,20 29 580 0,28 5,6
30 |- 32 14 78 0,14 31 434 2,28 31,92
32 |- 34 8 86 0,08 33 264 4,28 34,24
34 |- 36 8 94 0,08 35 280 6,28 50,24
36 |- 38 4 98 0,04 37 148 8,28 33,12
38 |- 40 2 100 0,02 39 78 10,28 20,56
∑ 100 1 2872 12,8 351,36
Dmédio =  Xi  x .fi
n
351, 36
Dmédio = = 3, 5136
100
Dmédio = 3,51
Logo, o desvio médio de nossa distribuição de frequência será de 3,51. A média, a diferença da idade
de cada formando em relação à média aritmética da distribuição das idades, será de 3,51.
6.2.2 Variância
Como vimos no item 4, a variância também é uma medida de dispersão que tem a média como
ponto de referência.
A variância nos indica o grau de variabilidade de determinada distribuição de frequência com relação
à sua média aritmética.
Quando se trata de uma distribuição de frequência de dados populacionais, temos:
σ2: Variância populacional;

 2

 ( Xi   )2 fi
, onde
µ: Média populacional;
n fi: Frequência absoluta simples;
n: Tamanho da população.
75
Unidade II
Para o caso da variância de valores amostrais, devemos usar:
s2: Variância amostral;

s 2

 ( Xi  x )2 fi
, onde
x : Média aritmética amostral;
n 1 fi: Frequência absoluta simples;
n: Total de observações da amostra.
No caso da distribuição de frequência das idades, é preciso acrescentar mais duas colunas à tabela
para calcular, em nosso exemplo, a variância amostral:
s 2

 ( Xi  x )2 fi
n 1
Tabela 21
Classes fi fi, A fi, R Xi fi, Xi Xi - x |Xi - x|.fi (Xi - x)2 (Xi - x)2fi
20 |- 22 5 5 0,05 21 105 -7,72 -38,60 59,5984 297,992
22 |- 24 12 17 0,12 23 276 -5,72 -68,64 32,7184 392,621
24 |- 26 11 28 0,11 25 275 -3,72 -40,92 13,8384 152,222
26 |- 28 16 44 0,16 27 432 -1,72 -27,52 2,9584 47,3344
28 |- 30 20 64 0,20 29 580 0,28 5,6 0,0784 1,568
30 |- 32 14 78 0,14 31 434 2,28 31,92 5,1984 72,7776
32 |- 34 8 86 0,08 33 264 4,28 34,24 18,3184 146,547
34 |- 36 8 94 0,08 35 280 6,28 50,24 39,4384 315,507
36 |- 38 4 98 0,04 37 148 8,28 33,12 68,5584 274,234
38 |- 40 2 100 0,02 39 78 10,28 20,56 105,678 211,357
∑ 100 1 2872 1912,16
Assim, temos:
1912,16
s2   19, 315
100  1
Logo, a variância amostral de nosso exemplo é 19,315.
6.2.3 Desvio padrão
Para calcular o desvio padrão, basta extrair a raiz quadrada do valor da variância, seja ela populacional
ou amostral.
  2
76
Já o desvio padrão amostral será dado como segue:
s = s2
No exemplo acima, o nosso desvio padrão seria então:
=s =
19, 315 4, 395
Lembrando que: em estatística, um histograma é uma representação gráfica da distribuição de

frequências de um conjunto de medições, normalmente um gráfico de barras verticais.
O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles
corresponde ao intervalo de classe, e a sua altura, à respectiva frequência. Quando o número de dados
aumenta indefinidamente e o intervalo de classe tende a zero, a distribuição de frequência passa para
uma distribuição de densidade de probabilidades.
A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador

da distribuição de dados. Tanto podem indicar se uma distribuição aproxima-se de uma função normal
como de uma mistura de populações, quando se apresentam bimodais.
Informações técnicas sobre como elaborar um histograma, bem como sua interpretação, são
encontradas em literaturas clássicas de estatística.
Exemplo 1
Uma análise em 34 famílias que tenham quatro filhos, considerando a variável a quantidade de
filhos do sexo masculino, temos a seguinte distribuição:
Tabela 22
Nº de meninos (xi) fi xi-x (xi-x)2 (xi-x)2.fi

0 2 (0 - 2,3) = - 2,3 (- 2,3)2 = 5,29 2(5,29) = 10,58
1 6 (1 - 2,3) = - 1,3 (- 1,3) = 1,69
2
6(1,69) = 10,14
2 10 (2 - 2,3) = - 0,3 (- 0,3) = 0,09
2
10(0,09) = 0,9
3 12 (3 - 2,3) = 0,7 (0,7) = 0,49
2
12(0,49) = 5,88
4 4 (4 - 2,3) = 1,7 (1,7) = 2,89
2
4(2,89) = 11,56
 x i  x 
2
 fi  34  fi  39, 06
Para reflexão:
Pede-se para calcular a amplitude, o desvio padrão (S), a variância (S2) e o coeficiente de
variação (cv).
77
Unidade II
Solução
Amplitude:
R= 4 – 0 = 4 meninos
Ou seja, podemos dizer que a maior variação encontrada nesse conjunto de dados seria de quatro meninos.
Obs. Sabemos que a média para esse conjunto de dados é x = 2,3 filhos. Mas como chegamos a essa média?
Quantos filhos homens estão presentes na distribuição?
1 x 6 + 2 x 10 + 3 x 12 + 4 x 4
----------------------------------------------------------------- = 2,3
34
Desvio padrão:
n
 fi  xi  x 
2
f  x  x   f2  x2  x   ...  fn  xn  x 
2 2 2
s i1
 1 1 
n 1 n 1
2 0  2, 3  6 1  2, 3  10 2  2, 3  12 3  2, 3  4 4  2, 3 
2 2 2 2 2

34  1
2  2, 3  6  1, 3  10  0, 3  12 0, 7  4 17

,  
2 2 2 2 2

33
2 5, 29  6 169

,   10 0, 09  12 0, 49  4 2, 89

33
10, 58  10,14  0, 9  5, 88  11, 56 39, 06

 
33 33
 11836
,  1, 088  1 filho
Como interpretar essa situação?
Podemos dizer que o número médio de filhos homens por família de quatro filhos é de 2,3, com uma
margem de erro de aproximadamente um filho. Significando que a maior parte das famílias com quatro
filhos apresentam:
78
2,3 oscilando 1 para mais ou 1 para menos.
Ou seja:
pode ir de 1,3 a 3,3,
que pode ser traduzido da seguinte maneira:
As famílias com quatro filhos apresentam aproximadamente entre 1 e 3 filhos homens.
Variância:
S2 = (S)2 = (1,088)2 ≅ 1,1837 (filhos homens)2
Coeficiente de variação:
S 1, 088
cv    0, 4730
x 2, 3
O que isso significa?
Significa que existe uma variabilidade nos dados de 47,30% em relação à média, podendo ser
considerada uma alta variabilidade.
Exemplo 2
A JCC – fábrica de peças e rolamentos – apresenta a seguinte distribuição de frequência referente

aos salários dos seus funcionários:
Tabela 23
Custos R$ Pm (Xi) fi (xi - x) (xi - x)2 fi(xi - x)2

Classes de fr.
450 |— 550 500 8 (500-754,68) = - 254,68 (-254,68)2 = 64861,90 8(64861,90) = 518895,2
550 |— 650 600 10 (600-754,68) = - 154,68 (-154,68)2 = 23925,90 10(23925,90) = 239259,0
650 |— 750 700 11 (700-754,68) = - 54,68 (-54,68) = 2989,90
2
11(2989,90) = 32888,9
750 |— 850 800 16 (800-754,68) = 45,32 (45,32) = 2053,90
2
16(2053,90) = 32862,4
850 |— 950 900 13 (900-754,68) = 145,32 (145,32) = 21117,90
2
13(21117,90) = 274532,7
950 |— 1050 1000 5 (1000-754,68) = 245,32 (245,32) = 60181,90
2
5(60181,90) = 300909,5
1050 |— 1150 1100 1 (1100-754,68) = 345,32 (345,32) = 119245,90
2
1(119245,90) = 119245,9
 fi  xi  x 
Total 64 2
=1518593,6
79
Unidade II
Para reflexão:
• calcule a amplitude;
• o desvio padrão (S);
• a variância (S2);
• e o coeficiente de variação (cv).
Solução
Amplitude:
R= 1150 – 450 = 700
Como analisar:
Observe que a maior diferença existente entre os salários dos operários dessa fábrica é de R$ 700,00,
conforme calculamos.
Observação: como se chegou à média x = 754,69
500 * 8 + 600 * 10 + 700 * 11 + 800 * 16 + 900*13 + 1.000*5 + 1100 * 1/64
4.000 + 6.000 + 7.700 + 12.800 + 11.700 + 5.000 + 1100/64
48.300/64 = 754,68.
Desvio padrão:
n
 fi  xi  x 
2
f  x  x   f2  x2  x   ...  fn  xn  x 
2 2 2
s i1
 1 1 
n 1 n 1
8500  754,68  10 600  754,68  11700  754,68  16 800  754,668  13900  754,68  5 1000  754,68  11100  754,68
2 2 2 2 2 2 2
 
64  1
8  254, 68  10  154, 68  11 54, 68  16 45, 32  13145, 32  5 245, 32  1345, 32
2 2 2 2 2 2 2
 
63
8 6486190
,   10 23925, 90  112989, 90  16 2053, 90  1321227,990  5 6018190
,   1119245, 90
 
63
518895, 2  239259, 0  32888, 90  32862, 40  274532, 70  300909, 5  119245, 90 1518593, 60
   24104, 66  155, 26 (reais)
63 63
80
Como analisar?
A média de salários da fábrica é R$ 754,68, podendo variar aproximadamente R$ 155,26, ou seja, a

maior parte dos operários recebe entre R$ 599,42 e R$ 909,94.
(754,68 – 155,26 = 599,42)

(754,68 + 155,26 = 909,94)
Variância:
S2 = (S)2 = (155,26)2 ≅ 24104,66 (reais)2
Coeficiente de variação:
S 155, 26
cv    0, 2057
x 754, 68
Isso significa que há uma variabilidade de 20,57% dos salários em relação à média.
Saiba mais
Os artigos “Caracterização de perdas comerciais – uma ferramenta

de gestão de recuperação de receitas” e “Gerenciando incertezas no
planejamento logístico: o papel do estoque de segurança” fazem uma
abordagem detalhada da aplicação das medidas de dispersão. Eles estão
disponíveis, no formato PDF, nos endereços: <ftp://labattmot.ele.ita.br/ele/
jrsantos/Leitura/Fraude_Energia_Eletrica/CITENEL2005_72.pdf> e <http://
tfscomunicacao.com.br/imgs/sala_estudo/273_arquivo.pdf>.
7 INTRODUÇÃO À PROBABILIDADE
Quando estudamos algum fenômeno pelo método estatístico, na maioria das vezes é preciso
estabelecer uma distinção entre o modelo matemático que construímos para tentar explicar tal
fenômeno e o fenômeno em si.
A maioria dos fatos estudados pela estatística apresenta resultados de difícil previsibilidade, dados
que variam de uma observação para outra, mesmo em condições normais de experimentação. Para
analisar, interpretar e explicar tais fenômenos é preciso utilizar a probabilidade.
A palavra “probabilidade” deriva do latim probare (provar ou testar). Informalmente, “provável” é

uma das muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por
algumas palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.
81
Unidade II
Tal como ocorre com a teoria da mecânica, que atribui definições precisas a termos de uso diário,
como “trabalho” e “força”, também a teoria das probabilidades tenta quantificar a noção de provável.
A probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de

determinado evento. O evento é o resultado que se espera de determinado experimento. Ele pode ser
cara (no caso do lançamento de uma moeda), um número compreendido de 1 a 6 (no caso do lançamento
de um dado), chuva (no caso da observação do tempo) etc.
A probabilidade de ocorrer determinado evento será sempre um número entre 0 e 1, indicando

aproximadamente a chance de ocorrência desse mesmo evento. Quanto mais próxima de 1, maior é a
probabilidade de ocorrer esse evento; quanto mais próxima de zero, menor a chance de o evento ocorrer. Quando
a probabilidade de determinado evento é zero, diz-se que esse é um evento impossível. Sendo assim, temos:
0 ≤ P (A) ≤ 1
7.1 Teorias dos conjuntos, espaço amostral e eventos
Um conjunto é definido como um grupo de objetos ou itens que apresentam características comuns.
São exemplos de conjuntos os habitantes de São Paulo, os estudantes de Gestão da UNIP, o número de
consoantes do alfabeto, o número de vogais do alfabeto etc.
Saiba mais
A teoria de conjuntos pode ser estudada em detalhes em livros
básicos de matemática, como em MENEZES, P. B. Matemática discreta
para computação e informática. Porto Alegre: Instituto de Informática da
UFRGS: Sagra Luzzato, 2004. (Série Livros Didáticos – nº 16).
Podemos descrever os elementos de um conjunto de três formas: enumerando cada um deles entre
chaves, indicando suas características comuns, também entre chaves.
Conjunto A = {a, e, i, o, u} ou
Conjunto A = {conjunto das vogais do alfabeto};
Conjunto B = {todos os números inteiros maiores que 23}.
Em um conjunto finito, podemos identificar todos os seus subconjuntos. O número de subconjuntos

de um conjunto finito será obtido por meio da seguinte fórmula:
Nsubconjuntos = 2n, em que n = número de elementos do conjunto.
Por exemplo, num conjunto como o dado a seguir, calcule a quantidade de subconjuntos e faça a
sua apresentação:
A = {2, 4, 6, 8}
82
A quantidade de subconjuntos de A será:
Nsubconjuntos = 2n = 24 = 16
Os subconjuntos do conjunto A serão, portanto:
A = {{ }, {2}, {4}, {6}, {8}, {2,4}, {2,6}, {2,8}, {4,6}, {4,8}, {6,8}, {2,4,6}, {2,6,8}, {2,4,8},
{4,6,8}, {2,4,6,8}}
Observação
Um conjunto vazio pode ser representado por { } ou ∅. Um conjunto

é chamado de vazio quando não possuir nenhum elemento.
Por exemplo, o conjunto dos números naturais antecessores ao 0 (zero) é

considerado vazio, pois nos números naturais não existe antecessor de zero.
Ora, se trazemos esses conceitos para a probabilidade, podemos definir então o que seria espaço
amostral e evento. Na teoria das probabilidades, temos o chamado experimento, uma experiência que
poderá ser repetida sob as mesmas condições indefinidamente.
Para cada experimento, existe um conjunto S formado por todos os possíveis resultados desse
experimento. Esse conjunto é denominado de espaço amostral.
Por exemplo, ao lançar um dado e observar o número da face que fica para cima, teríamos o seguinte
conjunto de resultados possíveis desse experimento e, portanto, o seguinte espaço amostral:
S = Ω = {1, 2, 3, 4, 5, 6}, em que Ω é o espaço amostral.
O espaço amostral poderá ser representado pela letra ômega. Sendo o espaço amostral o conjunto
de todos os resultados possíveis de uma dada experiência, a probabilidade do espaço amostral deverá
ser igual a 1 ou 100%, pois ao menos um dos resultados deve ocorrer.
P (evento qualquer espaço amostral Ω) = 1,00
Os eventos são os resultados de um experimento. No caso do exemplo, de lançar um dado, seriam

exemplos de eventos:
A: ocorrer face igual a 6;
B: ocorrer face igual a 5.
83
Unidade II
O evento é geralmente simbolizado por meio de uma letra maiúscula.
Poderíamos simbolizar graficamente o espaço amostral e o evento por meio do diagrama de Venn,
para que possamos visualizar melhor a diferença entre esses dois importantes conceitos da Teoria das
Probabilidades.
Evento
Espaço amostral
Figura 24
O que significa, então, a figura anterior? Para entendermos melhor, vamos relembrar algumas
relações que se estabelecem entre dois ou mais conjuntos e que tipo de classificação didática isso gera,
para entender as implicações que podem ocorrer para a teoria das probabilidades.
Dois ou mais conjuntos que não possuam elementos em comum são chamados conjuntos disjuntos.
Por exemplo, sejam os conjuntos a seguir:
A = {3, 5, 7} e B = {9, 11} são dois conjuntos que claramente não apresentam nenhum elemento
em comum e podem ser representados pelo diagrama de Venn, como segue:
A B
3 5 11
9
7
Figura 25
Como A e B não possuem elementos em comum, o resultado da união desses conjuntos irá gerar um
novo conjunto cujo número de elementos será dado pela soma dos elementos de A e dos elementos de
B. Temos, então:
n(A ∪ B) = n(A) + n(B)

n(A ∪ B) = 5
Se dois ou mais conjuntos apresentam elementos em comum, teremos o caso de conjuntos não
disjuntos. Nesse caso, o número de elementos da união dos dois conjuntos será dado pela soma dos
elementos de cada conjunto, subtraindo-se os elementos que estes possuem em comum.
A = {2, 4, 6, 8, 10} e B = {8, 10, 12}

n(A ∪ B) = n(A) + n(B) - n(A ∩ B);
n(A ∪ B) = 5 + 3 – 2 = 6
Podemos verificar esse resultado comparando-o ao diagrama de Venn, que irá apresentar claramente
os elementos da união dos dois conjuntos A e B.
84
A B
2
4 8
12
10
6
Figura 26
Esses conceitos de conjuntos são importantes porque nos permitem, por exemplo, definir novos
eventos utilizando essas operações de união e interseção. Assim:
a) (A ∪ B) → quando A ocorre, ou B ocorre, ou ambos ocorrem, temos este evento;
b) (A ∩ B) → evento só ocorre se A e B ocorrerem simultaneamente.
A → evento quando A ocorre.
A partir disso, podemos definir os eventos como complementares, mutuamente exclusivos, não
mutuamente exclusivos e coletivamente exaustivos.
Diz-se que dois eventos são complementares quando completam determinado espaço amostral.
É importante ressaltar que os eventos complementares não devem apresentar elementos em comum.
A soma das probabilidades de eventos complementares é sempre igual a 1. Podemos representar dois
eventos complementares com o diagrama que segue:
A’
Figura 27
Por exemplo: podemos considerar como eventos complementares ocorrer cara ou coroa no
lançamento de uma moeda; atender ou não à porta. O espaço amostral dos dois experimentos,
respectivamente, será:
Ω = {cara, coroa}
Em que:
A: ocorrer cara;
B: ocorrer coroa.
Ω2 = {atender, não atender}
85
Unidade II
Em que:
C: atender à porta;
D: não atender à porta.
Em ambos os experimentos, podemos observar que a soma das probabilidades será igual a 1, porque
os eventos completam o espaço amostral. Assim, no caso dos dois exemplos anteriores, teremos:
1
P( A ) =
2
1
P(B)   P( A )  P(B)  1
2
1
P(C) =
2
1
P(D)   P(C)  P(D)  1
2
Dois ou mais eventos que não possuem elementos comuns, ou que não podem ocorrer simultaneamente,
são ditos eventos mutuamente excludentes. Diferentemente dos eventos complementares, eles não
necessariamente completam o espaço amostral. Sendo assim, podemos dizer que todos os eventos
complementares são mutuamente exclusivos, mas nem todos os eventos mutuamente exclusivos são
complementares. Também é importante ressaltar que, na teoria dos conjuntos, os eventos mutuamente
exclusivos são os chamados conjuntos disjuntos.
Isso significa que:
(A ∩ B) = ø
Para ilustrar graficamente dois eventos mutuamente exclusivos, podemos mais uma vez nos valer
de um diagrama de Venn.
Ω: Espaço amostral
A B
Figura 28
Por exemplo: no lançamento de um dado, ocorrer as faces 1, 2, 3, 4, 5, 6. São seis eventos mutuamente
excludentes, já que dois não podem ocorrer simultaneamente, então a ocorrência de um exclui a
ocorrência do outro. Se restringirmos esse experimento a apenas duas faces, teremos:
86
Experimento: lançamento de um dado
Ω = {1, 2, 3, 4, 5, 6}; (espaço amostral)
A: ocorrer a face 2;
B: ocorrer a face 4.
Temos aqui dois eventos mutuamente exclusivos e que não são complementares.
Quando dois eventos apresentam elementos em comum ou podem ocorrer simultaneamente, diz-se
que eles são eventos não mutuamente excludentes. Esses eventos podem ser representados por meio de
um diagrama de Venn, como segue:
Ω : Espaço amostral
A B
Figura 29
Podemos nos valer da distribuição de frequências do item 4 para dar exemplo de dois eventos que
sejam não mutuamente excludentes. Vejamos, então, a distribuição de frequência das idades dos alunos
formandos do curso de Gestão de uma Universidade AB:
Tabela 24 – Distribuição de frequência das idades
Classes Frequência absoluta simples

20 |- 22 5
22 |- 24 12
24 |- 26 11
26 |- 28 16
28 |- 30 20
30 |- 32 14
32 |- 34 8
34 |- 36 8
36 |- 38 4
38 |- 40 2
∑ 100
Tomando-se a distribuição de frequência acima, podemos dar exemplo de dois eventos não
mutuamente exclusivos:
87
Unidade II
A: apresentar idade entre 20 e 26 anos no momento da formatura;

B: apresentar idade entre 22 e 30 anos no momento da formatura.
Como entre esses dois eventos existem elementos em comum, ou seja, os intervalos de 22 a 26
anos, eles não são mutuamente excludentes. É importante ressaltar que os eventos não mutuamente
exclusivos, na teoria dos conjuntos, são os conjuntos não disjuntos.
Os eventos podem ser ainda coletivamente exaustivos. Isso ocorre quando os eventos em questão
ocuparem todo o espaço amostral, tornando impossível qualquer outro resultado além daqueles eventos
dados. São considerados eventos coletivamente exaustivos os eventos complementares, mas nem sempre
os eventos coletivamente exaustivos serão complementares. Além disso, os eventos coletivamente
exaustivos serão, em alguns casos, mutuamente excludentes.
Podemos, então, representar graficamente eventos coletivamente exaustivos com o diagrama a seguir:
Ω: Espaço amostral
A B C
Assim, são exemplos de eventos coletivamente exaustivos, no caso de um experimento de lançar

uma moeda:
A: ocorrer cara;
B: ocorrer coroa.
Outro exemplo seria ao se fazer a experiência de retirar cartas de um baralho, definir como eventos:
A: carta de copas;
B: carta de paus;
C: carta de ouros;
D: carta de espadas.
Temos anteriormente dois exemplos de eventos coletivamente exaustivos.
Mayer (2000) diz que, em teoria das probabilidades, o espaço amostral ou espaço amostral universal,
geralmente denotado S, Ω ou U (de “universo”), de um experimento ou teste aleatório é o conjunto
de todos os resultados possíveis. Por exemplo, se o experimento é lançar uma moeda e verificar a face
voltada para cima, o espaço amostral é o conjunto {cara, coroa}. Para o lançamento de um dado de seis
faces, o espaço amostral é {1, 2, 3, 4, 5, 6}. Qualquer subconjunto de um espaço amostral é comumente
chamado um evento, enquanto o subconjunto de um espaço amostral contendo apenas um único
elemento é chamado eventos elementares.
88
Para alguns tipos de experimentos, podem existir dois ou mais espaços amostrais possíveis plausíveis.
Por exemplo, quando retirada uma carta de um baralho de 52 cartas, uma possibilidade poderia ser o
valor dela (Ás até o Rei), enquanto outra poderia ser o naipe (copa, ouro, espada ou paus). Uma descrição
completa dos resultados, entretanto, especifica ambas: denominação e naipe, e um espaço amostral
descrevendo cada carta individualmente pode ser construído por meio do produto cartesiano dos dois
espaços amostrais citados.
Espaços amostrais aparecem naturalmente em uma introdução elementar à probabilidade, mas são
também importantes em espaços de probabilidade. Um espaço de probabilidade (Ω, F, P) incorpora um
espaço amostral de resultados, Ω, mas define um conjunto de eventos de interesse, o - álgebra F, para o
qual a medida de probabilidade P é definida.
Vamos a alguns exemplos:
Exemplo 1
Vamos imaginar um grupo de 100 pessoas. Dessas, 70 apresentam sangue RH positivo e 45,
tipo O. Escolhendo-se, ao acaso, uma pessoa desse grupo, qual é a probabilidade de o sangue dessa
pessoa escolhida ser de tipo diferente de O?
Solução
Total do grupo: 100 pessoas
RH positivo: 70 pessoas
Tipo O = 45 pessoas
Vamos considerar x o número de pessoas que têm sangue RH positivo e também sangue tipo O.
Representando os conjuntos por meios de diagramas de Euler-Venn, temos:
70 - x + x + 45 - x = 100.
RH+ 0
70 - x x 45 - x
Figura 30
Assim, temos:
70 + 45 - x = 100.
Então, x = 115 - 100 = 15.
89
Unidade II
Então, o número de pessoas que têm sangue do tipo diferente de O será:
70 - 15 = 55.
Podemos dizer que, num total de 100 pessoas, temos 55 possibilidades (chances) de escolha.
Então, podemos dizer que a probabilidade de o sangue dessa pessoa ser de tipo diferente de O é
55/100 = 55%.
De outra maneira, mais rápida: como 45 têm sangue tipo O; então, o número de pessoas que têm
sangue do tipo diferente de O é:
100 - 45 = 55.
Exemplo 2
Maria vai sair com suas amigas e, para escolher a roupa que usará, separou duas saias e quatro
blusas. De quantas maneiras ela pode se arrumar?
Solução
O chamado Princípio Fundamental da Contagem (PFC) diz: “se alguma escolha pode ser feita de M
diferentes maneiras e alguma escolha subsequente pode ser feita de N diferentes maneiras, há MxN
diferentes maneiras pelas quais essas escolhas podem ser feitas sucessivamente”. Observe a tabela a
seguir:
Tabela 25
Blusa 1 Blusa 2 Blusa 3 Blusa 4

Saia 1 Saia 1 e blusa 1 Saia 1 e blusa 2 Saia 1 e blusa 3 Saia 1 e blusa 4
Saia 2 Saia 2 e blusa 1 Saia 2 e blusa 2 Saia 2 e blusa 3 Saia 2 e blusa 4
Contando as possibilidades, vemos que Maria pode se arrumar de oito maneiras distintas. De fato,
a ação é constituída de duas etapas sucessivas. A primeira (vestir a saia) pode ser realizada de duas
maneiras distintas. Para cada uma dessas possibilidades, a segunda (vestir a blusa) pode ser realizada de
quatro maneiras distintas. Assim, pelo Princípio Fundamental da Contagem, o número de efetuar a ação
completa é 2 × 4 = 8.
Exemplo 3
Há três estradas ligando as cidades A e B, e quatro estradas ligando as cidades B e C. De quantas

formas distintas pode-se ir de A a C, passando por B?
90
Solução
A ação é realizada em duas etapas sucessivas. A primeira (ir de A até B) pode ser realizada de três
maneiras. Para cada uma dessas possibilidades, a segunda (ir de B até C) pode ser realizada de quatro
maneiras. Então, pelo PFC, o número de maneiras de ir de A até C é: 3 × 4 = 12.
Exemplo 4
Uma prova de Estatística tem dez questões do tipo C ou E. Caso todas as questões sejam respondidas
ao acaso, qual o número de formas de preencher o cartão de resposta?
Solução
O PFC é também conhecido como princípio multiplicativo e pode ser generalizado para ações
constituídas de mais de duas etapas sucessivas.
Observação
Para determinar o nº total de elementos do espaço amostral, usamos o

raciocínio:
K x K x K x K x K x K…K; portanto, podemos resumir assim:
R vezes _______________________ n(S) = kR
K à número de possibilidades de ocorrência do experimento.
R à número de vezes que se repete o experimento.
Como as probabilidades de ocorrência do experimento são duas, certo ou errado, basta elevarmos
ao número de vezes que o experimento se repete. Assim, o resultado procurado é: 2 × 2 × 2 × 2 × 2 ×
2 × 2 × 2 × 2 × 2 = 210 = 1024.
Exemplo 5
De quantas maneiras podemos arrumar cinco pessoas em fila indiana?
Solução
Ao selecionarmos uma das pessoas para ocupar a primeira posição na fila, temos cinco possibilidades;
para o segundo lugar, temos quatro escolhas; para o terceiro lugar, sobram três pessoas a serem
selecionadas; para o quarto lugar, duas; e, para o último lugar na fila, sobra apenas uma pessoa ainda
não escolhida.
91
Unidade II
Então, pelo Princípio Fundamental da Contagem, temos: 5 × 4 × 3 × 2 × 1 = 120. Assim, obtemos o

número de formas de ordenar (“embaralhar”) cinco elementos distintos. Ou, ainda, podemos calcular o
número de permutações simples de cinco elementos, ou seja, P5 = 120.
Exemplo 6
Ao lançarmos dois dados, a probabilidade de obtermos resultados cuja soma é sete é:
Tabela 26
1+1 1+2 1+3 1+4 1+5 1+6

2+1 2+2 2+3 2+4 2+5 2+6
3+1 3+2 3+3 3+4 3+5 3+6
4+1 4+2 4+3 4+4 4+5 4+6
5+1 5+2 5+3 5+4 5+5 5+6
6+1 6+2 6+3 6+4 6+5 6+6
Solução
Para cada dado lançado ao acaso, temos seis possibilidades de resultado. Então, pelo PFC, o número
de elementos do meu espaço amostral é 6 × 6 = 36. Como pode ser observado na tabela 26, o nº de casos
favoráveis é o nº de elementos dos conjuntos de pares ordenados {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}, ou
seja, é seis. Assim, a probabilidade é P = 6/36 = 1/6.
8 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS
Como vimos, a probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência
de determinado evento.
A forma clássica de calcular a probabilidade é por meio da relação entre o número de casos favoráveis
e o número de casos possíveis. Os casos favoráveis são aqueles resultados que se espera que aconteçam;
já os casos possíveis são todos os elementos que compõem o espaço amostral.
Logo, em determinado espaço amostral Ω, a probabilidade de um dado evento A, P(A), será uma
função definida em Ω, em que cada evento estará associado a um número real, e assim irá satisfazer
aos axiomas a seguir.
Observação
I) 0 ≤ P ≤ 1 à A probabilidade está sempre no intervalo fechado 0 e 1

ou 0% ou 100%.
92
II) P(Ω) = 1 à Para todo evento certo, temos P(Ω) = 1 ou 100%.
III) Se A e B forem eventos mutuamente exclusivos, (A ∩ B) = ø, então

P(A ∪ B) = P(A) + P(B).
8.1 Origens da probabilidade
Na realidade, existem três modos diferentes de calcular ou estimar as probabilidades. São eles os
métodos clássico, empírico e subjetivo, sendo que os métodos clássicos e empíricos são considerados
métodos objetivos.
8.1.1 Métodos objetivos
• Método clássico
Quando estamos diante de experimentos que têm resultados igualmente prováveis, aplica-se o
chamado método clássico. Nesse caso, a probabilidade de ocorrer cada evento (resultado) é uma função
do número de resultados possíveis.
1
Pevento = ------------------------------------------------------------------
Número de resultados possíveis
Por exemplo, no experimento em que lançamos um dado ocorrer qualquer das faces nesse lançamento
é igualmente provável. Então, qual seria a probabilidade de ocorrer qualquer dessas faces?
1
Pqualquer face = -------------------------------------
Número de faces
1
Pqualquer face = ----
6
Aplicando-se o método clássico a experimentos que envolvam dois ou mais resultados associados,
com igual probabilidade de ocorrência desses resultados, terão a definição clássica de probabilidade que
demos no início deste item, em que a probabilidade será:
Resultados favoráveis
P = -----------------------------------------------
Resultados possíveis
Verifique e compreenda: favoráveis/possíveis!
Por exemplo, a probabilidade de obter quatro ases num baralho de 52 cartas. Nesse caso, temos de
identificar o número de resultados favoráveis, ou seja, aqueles resultados esperados. No caso, são quatro
resultados favoráveis, dentro de quatro resultados possíveis; então, temos:
93
Unidade II
4 = 0,0769 = 7,6%
P = --------
52
Isso significa que, se houver uma repetição significativa desse experimento, ou seja, de se retirar
quatro ases de um baralho de 52 cartas, um evento como esse tem probabilidade de ocorrer 7,6% das
vezes.
Chance
Existe uma maneira diferente de se exprimirem as probabilidades: em vez de se comparar o número

de casos favoráveis ao número de casos possíveis, compara-se o número de resultados favoráveis ao
número de casos desfavoráveis. Isso pode ser expresso das duas formas a seguir:
Número de resultados favoráveis ou

Chance = -------------------------------------------------------------------------
Número de resultados desfavoráveis
Chance = número de resultados favoráveis está para número de resultados desfavoráveis.
Por exemplo, numa sala de aula, temos um total de 50 alunos, 22 homens e 28 mulheres. Quais
seriam, então, a probabilidade e a chance a favor de se selecionar, aleatoriamente, dessa sala uma
mulher?
Probabilidade:
ε: Retirar pessoas de uma sala de aula
Ω: 22 homens e 28 mulheres
Evento A: selecionar uma mulher
28 28
P A     P  A   0, 56  56%
22  28 50
A probabilidade de se retirar uma mulher é, portanto, de 56%.
Chance
Evento A: selecionar uma mulher
Nº de casos favoráveis = --------------

Chance = ------------------------------------------------- 28 = --------------
14 ou 14/11
Casos desfavoráveis 22 11
As chances de retirar uma mulher da sala são, portanto, de 14 para 11.
94
• Método empírico ou frequencial
Quando tratamos de situações em que os resultados não são igualmente prováveis, podemos tentar
estimar as probabilidades, obtendo alguns dados empíricos. Uma estimativa das probabilidades baseada
justamente nesses dados empíricos é que será obtida por meio de experimentos aleatórios ou por meio
de dados históricos. É importante ressaltar que, neste caso, a probabilidade será uma estimativa do
verdadeiro valor.
Por exemplo, se tivermos um experimento em que lançamos um dado 100 vezes, se dessas 100
vezes obtivermos a face quatro 40 vezes, num próximo lançamento do dado seria razoável supor que a
40
probabilidade estimada futura da face quatro como sendo P 4    40% , se esse experimento se
der a condições idênticas. 100
Da mesma maneira, quando é testada uma vacina em um grupo de 1000 pessoas, por exemplo, e
esta apresenta sucesso em 700 delas, se o teste é repetido, devemos esperar uma probabilidade estimada
700 7
de sucesso futuro da vacina P  s     70% , sob condições idênticas para a ocorrência desse
1000 10
resultado. Sendo assim, podemos calcular a estimativa da probabilidade de um evento futuro baseado
no método empírico por meio da seguinte fórmula:
Número de ocorrências de A
P(A) = ------------------------------------------------------------
Número total de observações
Se, por outro lado, em vez da possibilidade de obter os dados amostrais por meio da realização de um
experimento, dispusermos de dados históricos em uma distribuição de frequência, ou na forma de dados
publicados, ou como resultado de testes prévios, ou como informações que foram acumuladas em algum
arquivo importante, podemos também calcular a probabilidade estimada pelo método frequencial. Mas,
para isso, é preciso que partamos da premissa de que o passado é representativo do futuro.
Por exemplo, suponhamos que uma distribuidora de chocolates acompanha suas vendas durante
noventa dias. O objetivo dessa distribuidora seria projetar as vendas para o futuro, a fim de planejar seus
estoques. Desse acompanhamento, resultou a distribuição de frequência a seguir:
Tabela 27
Número de chocolates vendidos, em Kg.

Período de 90 dias
Quilos vendidos Número de dias
20 10
30 20
40 20
50 30
60 10
Total 90
95
Unidade II
Nesse caso, também podemos adotar o método empírico, procurando determinar qual o percentual
de vezes em que ocorreu tal evento. Por exemplo, em vinte dias, o distribuidor de chocolates vendeu 40
quilos de chocolate, dos 90 dias totais de nossa observação. Então, a estimativa de probabilidade dessa
20 2
ocorrência é P 40   .
90 9
A probabilidade é, portanto, a partir do método empírico, uma proporção da ocorrência de
um evento ou a frequência relativa do evento. Assim, para as demais classes, as probabilidades
serão dadas como na tabela a seguir, da distribuição de frequências, utilizando agora a seguinte
fórmula:
P (A): Probabilidade de ocorrer o evento A;

f fA: Frequência absoluta do evento A;
P( A )  A , onde
 fA ∑fA: Total de observações.
Tabela 28
Probabilidade
Quilos vendidos Número de dias fA
(ƒA)
∑ fA
1
20 10 9
2
30 20 9
2
40 20 9
1
50 30 3
50 10 1
9
Total 90
É importante ressaltarmos algumas observações quando utilizamos o método empírico para calcular
a probabilidade.
I. Quando se calcula a probabilidade a partir do método empírico, obtemos apenas uma

estimativa do verdadeiro valor da probabilidade. Não temos dados suficientes para determinar seu
valor exato.
II. O tamanho da amostra é fundamental para determinar a estimativa da probabilidade. Quanto

maior o número de observações e, portanto, a amostra, melhor a estimativa da probabilidade.
III. A probabilidade só é válida para um conjunto de condições idênticas àquelas geradoras dos dados
amostrais.
96
8.1.2 Método subjetivo
Nos itens anteriores, propusemo-nos a calcular probabilidades que se originavam de fatos, fosse
por meio do método clássico ou do empírico. No entanto, ao longo do estudo da estatística, surgiram
diversas situações em que os eventos não eram nem passíveis de um estudo objetivo e muito menos
igualmente prováveis. Nesse caso, então, faz-se necessário atribuir-se subjetivamente uma probabilidade.
Por exemplo:
à Você encontrará o amor da sua vida amanhã?

à Quando os operários do metrô farão nova greve?
à Uma mulher com câncer de mama se recuperará completamente?
Nesses casos, mesmo que não seja possível efetuar o experimento, pode-se imaginar um grande
número de situações idênticas e questionar-se qual será o percentual dessas situações que produzirá o
evento desejado.
O método subjetivo é semelhante ao método empírico, a única diferença é que, em geral, os dados
não podem ser coletados. A probabilidade subjetiva serve como um esforço não apenas para quantificar,
mas para confirmar nossa crença a respeito de algo.
Probabilidade subjetiva é uma avaliação pessoal do grau de viabilidade de um evento. Existem,

obviamente, algumas desvantagens importantes que esse método apresenta:
I. as estimativas subjetivas são, em geral, difíceis de defender quando postas em dúvida;

II. as estimativas subjetivas podem ser tendenciosas.
8.2 Principais teoremas de probabilidade
I. Digamos que temos um evento A qualquer, e um conjunto Φ que representa o conjunto vazio.
Suponhamos ainda que A e Φ sejam disjuntos; então, temos:
A 
P  A  B  P  A   P   
P  A   P  A   P   A    A
Por tan to  P    0
Sendo assim, temos que o primeiro teorema importante de probabilidade é o seguinte:
Se Φ é o conjunto vazio, então P(Φ) = 0
II. Sejam dois eventos A e A, em que A é complemento de A, em que o espaço amostral Ω pode ser
escrito da seguinte forma: Ω = A ∪ A. Além disso, A e A são mutuamente exclusivos.
97
Unidade II
Sendo assim, temos:

A  A    m..exclusivos
 
P A  A  P A  P A 

P   P  A   P A  P   1
1  P A   P A 

P A  1  P A
Se A é complemento de A, então P(A) = 1 - P(A)
III. Se, por outro lado, temos o seguinte conjunto B = A ∪ (A ∩ B), em que A e A ∩ B são mutuamente
exclusivos, então:
P B  P  A   P A  B  
 
P A  B  P B  P  A 
P B  P  A   0
P B  P  A 
IV. Teorema da soma: se A e B são dois eventos quaisquer, então:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Verifique, matematicamente, essas propriedades utilizando a teoria dos conjuntos!
Quando há mais de um resultado possível, então:
nº de elementos do evento A
P(evento A) = -------------------------------------------------------------
nº de resultados possíveis
Vamos ver alguns exemplos:
Exemplo 1
Qual a probabilidade de se extrair um dos quatro reis de um baralho de 52 cartas?
4
P(reis) = ------
52
98
Exemplo 2
Três esportistas A, B e C estão em uma competição de natação. A e B têm as mesmas chances de

ganhar a competição, e cada um tem duas vezes mais chances de ganhar do que C. Pede-se calcular as
probabilidades de A ou C ser o vencedor.
Solução
Sejam p(A), p(B) e p(C) as probabilidades individuais de A, B e C vencerem.
De acordo com os dados da questão, temos:
p(A) = p(B) = 2.p(C).
Seja
p(A) = k.
Então,
p(B) = k
p(C) = k/2.
Temos: p(A) + p(B) + p(C) = 1, de acordo com o teorema do evento certo.
Logo, temos:
k 5k 2
k  k   1  1 k 
2 2 5
k + k + k/2 = 1\k = 2/5.
Assim, p(A) = k = 2/5, p(B) = 2/5 e p(C) = 2/10 = 1/5.
A probabilidade de A ou C vencer será a soma dessas probabilidades, ou seja, 2/5 + 1/5 = 3/5.
Exemplo 3
Um dado é viciado, de modo que cada número par tem duas vezes mais chances de aparecer num
lançamento que qualquer número ímpar. Determine a probabilidade de em um lançamento aparecer
um número primo.
99
Unidade II
Solução
De acordo com a questão, temos:
p(2) = p(4) = p(6) = 2.p(1) = 2.p(3) = 2.p(5).
Seja p(2) = k. Poderemos escrever:
p(2) + p(4) + p(6) + p(1) + p(3) + p(5) = 1, ou seja: a soma das probabilidades dos eventos elementares
é igual a 1.
Então, substituindo, vem:
k k k 9k 2
k  k  k     1  1 k 
2 2 2 2 9
Assim, temos:
p(2) = p(4) = p(6) = 2/9
p(1) = p(3) = p(5) = 2/18 = 1/9.
O evento sair número primo corresponde a sair o 2, ou o 3 ou o 5.
Assim, p(2) + p(3) + p(5) = 2/9 + 1/9 + 1/9 = 4/9.
Exemplo 3
(ITA/1993) Possuo três jarros idênticos e desejo ornamentá-los com dezoito rosas, sendo dez
vermelhas e oito amarelas. Desejo que um dos jarros tenha sete rosas e os outros dois, no mínimo, cinco
rosas. Cada um deverá ter, pelo menos, duas rosas vermelhas e uma amarela. Quantos arranjos florais
poderei fazer usando as dezoito rosas?
Solução
Sejam os jarros J1, J2 e J3.
Pelos dados do enunciado, temos:
a) Um dos jarros deverá ter 7 rosas; seja J1 este jarro. Poderemos ter as seguintes combinações,
lembrando que existe outra condição dada no enunciado, de que cada jarro tenha no mínimo duas rosas
vermelhas e uma amarela:
5 A + 2 V (cinco rosas amarelas e duas vermelhas).

100
4 A + 3 V (quatro rosas amarelas e três vermelhas).
3 A + 4 V (três rosas amarelas e quatro vermelhas).
2 A + 5 V (duas rosas amarelas e cinco vermelhas).
1 A + 6 V (uma rosa amarela e seis vermelhas).
b. Nos outros dois jarros, J2 e J3, deverão ser distribuídas as 18 – 7 = 11 rosas restantes, obedecendo‑se ao
critério de que em cada jarro haja no mínimo cinco rosas, sendo pelo menos duas vermelhas e uma amarela.
Vamos supor seis rosas no jarro 2 e cinco rosas no jarro 3.
Temos então de, partindo das cinco composições possíveis para o jarro J1 (item a), dividir
convenientemente as rosas restantes, observando-se as regras dadas e as suas quantidades.
c. Veja a tabela a seguir, em que V = rosa vermelha e A = rosa amarela.
Tabela 29
Jarro 1 Jarro 2 Jarro 3 Total

Situação 7 rosas 6 rosas 5 rosas 18 rosas
01 5A + 2V 1A + 5V 2A + 3V 18
02 5A + 2V 2A + 4V 1A + 4V 18
03 4A + 3V 1A + 5V 3A + 2V 18
04 4A + 3V 2A + 4V 2A + 3V 18
05 4A + 3V 3A + 3V 1A + 4V 18
06 3A + 4V 2A + 4V 3A + 2V 18
07 3A + 4V 3A + 3V 2A + 3V 18
08 3A + 4V 4A + 2V 1A + 4V 18
09 2A + 5V 4A + 2V 2A + 3V 18
10 2A + 5V 3A + 3V 3A + 2V 18
11 1A + 6V 4A + 2V 3A + 2V 18
Na tabela anterior, em cada linha, as rosas vermelham somam dez e as rosas amarelas somam oito,
conforme enunciado. E, ainda, fixamos o jarro 3 como sendo aquele que receberia o número mínimo de
rosas (cinco), restando as seis rosas para serem distribuídas convenientemente no jarro 2, já que no jarro
1 deveriam ficar sete rosas, ou seja: 7 + 6 + 5 = 18, que é o número total de rosas. Vemos, da tabela, que
existem 11 possibilidades que satisfazem ao problema dado.
Análise combinatória: diagrama da árvore
Assim, a melhor forma de esquematizar a solução desta questão é construir uma árvore de possibilidades,
conforme figura a seguir, tendo em mente o cumprimento das condições impostas nos itens a e b.
101
Unidade II
1A + 5V 2A + 3V 1
5A + 2V
2A + 4V 1A + 4V 2
1A + 5V 3A + 2V 3
4A + 3V 2A + 4V 2A + 3V 4
3A + 3V 1A + 4V 5
0 2A + 4V 3A + 2V 6
3A + 4V 3A +3V 2A + 3V 7
4A +2V 1A + 4V 8
4A +2V 2A + 3V 9
2A + 5V
3A +3V 3A + 2V 10
1A + 6V 4A +2V 3A + 2V 11
Figura 31
Ou seja, são possíveis 11 arranjos florais, obedecendo às condições dadas no enunciado do problema.
Saiba mais
Para uma abordagem mais aprofundada dos conteúdos apresentados

neste capítulo, leia: A probabilidade e variáveis aleatórias, de Marcos
Magalhães Nascimento. São Paulo: Edusp, 2006.
Para se aprofundar no tema probabilidade de forma diferenciada, leia

o artigo “O ensino de probabilidade através de um jogo de dados e da
metodologia de resolução de problemas”. Disponível em: <http://www.mat.
feis.unesp.br/docentes2008/jose_marcos/Minicurso.pdf>. Acesso em: 25
jul. 2012.
Resumo
Ao longo desta unidade, foram apresentados as características das

tabelas de distribuição de frequência, os tipos de frequências e suas
representações gráficas (histograma e polígono de frequência) e as medidas
de posição numa distribuição de frequência. Foram vistas as ideias de
medidas de dispersão numa distribuição de frequência, que nos fornecem
instrumentos para determinação dos intervalos padrões de alta ou média
variação para as pesquisas em geral, e como verificar os desvios em relação
102
à normalidade, ou seja, o quanto os dados estão dispersando em relação às

medidas de tendência central.
Foram apresentadas as noções do cálculo da probabilidade, a fim de

auxiliar na compreensão dos fenômenos aleatórios do que é provável e
do que é presumível. E também como calcular a probabilidade de eventos
das mais variadas situações, e foi feito um estudo a respeito dos vários
tipos de fenômenos aleatórios em distribuição de probabilidade, gráficos e
fórmulas para sua generalização, com o intuito de facilitar a compreensão
e o entendimento dos cálculos.
Exercícios
Questão 1 (ENADE-MATEMÁTICA/2008). Há 10 postos de gasolina em uma cidade. Desses 10,

exatamente dois vendem gasolina adulterada. Foram sorteados aleatoriamente dois desses 10
postos para serem fiscalizados. Qual é a probabilidade de que os dois postos infratores sejam
sorteados?
A) 1/45.
B) 1/20.
C) 1/10.
D) 1/5.
E) 1/2.
Resposta correta: alternativa A.
Análise das alternativas
Para encontrarmos a alternativa correta, devemos utilizar a teoria das probabilidades e desenvolver
os cálculos de acordo com os dados do enunciado do exercício.
Sabendo que há 10 postos de gasolina em uma cidade e, desses 10, exatamente dois vendem gasolina
adulterada e que foram sorteados aleatoriamente dois desses 10 postos para serem fiscalizados, devemos
considerar a ocorrência de dois eventos sucessivos (evento composto), ou seja, a escolha aleatória de um
posto seguida da escolha aleatória de outro posto.
No primeiro evento (evento A), há a possibilidade de se escolherem dois postos que vendem gasolina
adulterada em 10 postos possíveis, logo:
103
Unidade II
n( A ) 2
P=
(A) =
n(U) 10
No segundo evento (evento B), há a possibilidade de se escolher somente um posto (dois menos um)
que vende gasolina adulterada em 9 (10 menos 1) postos possíveis. Como esse evento é posterior ao
evento A, devem-se desconsiderar as escolhas do evento A. Assim,
n(B) 1
P=
(B) =
n(U) 9
Como se deseja calcular a probabilidade de que os dois postos infratores sejam sorteados, temos que
considerar a regra da multiplicação (um evento e outro evento), ou seja, a ocorrência dos eventos A e B. Logo,
2 1 2 1
=
P( AeB) P=
( A ).P(B) .= =
10 9 90 45
1
Então: P( A eB) =
45
Sendo assim,
A) Alternativa correta.
B) Alternativa incorreta.
C) Alternativa incorreta.
D) Alternativa incorreta.
E) Alternativa incorreta.
Questão 2 (ENEM/2011). Todo o país passa pela primeira fase de campanha de vacinação contra
a gripe suína (H1N1). Segundo um médico infectologista do Instituto Emílio Ribas, de são Paulo, a
104
imunização “deve mudar” no país a história da epidemia. Com a vacina, de acordo com ele, o Brasil tem
a chance de barrar uma tendência de crescimento da doença, que já matou 17 mil no mundo. A tabela
apresenta dados específicos de um único posto de vacinação.
Campanha de vacinação contra gripe suína

Quantidades de
Datas da vacinação Público-alvo pessoas vacinadas
8 a 19 de março Trabalhadores da súde e indígenas 42
22 de março a 2 de abril Portadores de doenças crônicas 22
5 a 23 de abril Adultos saudáveis entre 20 e 29 anos 56
24 de abril a 7 de maio População com mais de 60 anos 30
10 a 21 de maio Adultos saudáveis entre 30 e 39 anos 50
Disponível em: http://img.terra.com.br. Acesso em 26 abr. 2010 (adaptado
Escolhendo-se aleatoriamente uma pessoa atendida nesse posto de vacinação, a probabilidade de

ela ser portadora de doença crônica é:
A) 8%.
B) 9%.
C) 11%.
D) 12%.
E) 22%.
Resolução desta questão na plataforma.
105
Unidade II
FIGURAS E ILUSTRAÇÕES
Figura 1
Relatório sobre a Indústria de Cartões de Pagamentos Adendo Estatístico 2010. Disponível em: <http://
www.bcb.gov.br/htms/spb/Relatorio_Cartoes_Adendo_2010.pdf> Acesso em: 12 abr. 2012.
Figura 10
Oferta mundial de petróleo – 2003. Disponível em: <http://www.dnpm.gov.br/assets/

galeriadocumento/sumariomineral2004/PETR%C3%93LEO%202004.pdf>. Acesso em: 17 jul. 2012.
Figura 11
Revista Veja. São Paulo: Abril, ano 39, n. 41, 18 out. 2006, p. 54-5.
Figura 13
Petrobras. Disponível em: <http://www.petrobras.com.br/pt/quem-somos/perfil/atividades/exploracao-

producao-petroleo-gas/>. Acesso em: 25 jul. 2012.
REFERÊNCIAS
Textuais
AMARAL. E.; OLIVEIRA, C. B. C. Caracterização de perdas comerciais – uma ferramenta de gestão de

recuperação de receitas. Disponível em: <ftp://labattmot.ele.ita.br/ele/jrsantos/Leitura/Fraude_Energia_
Eletrica/CITENEL2005_72.pdf >. Acesso em: 25 jul. 2012.
BRUNI, A. L.; FAMÁ, R.; SIQUEIRA, J. O. Análise do risco na avaliação de projetos de investimentos:
uma aplicação do método de Monte Carlos. Caderno de Pesquisa em Administração, São Paulo, v. 1,
n. 6, 1 trim. 1998. Disponível em: <http://www.regeusp.com.br/arquivos/c6-Art7.pdf>. Acesso em:
25 jul. 2012.
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2007.
DANTE, L. R. Matemática – contexto e aplicação. São Paulo: Ática, 2007.
DERVALMAR. C. R. T. F. Apostila do curso de graduação em Administração na Modalidade a Distância

da Universidade Aberta do Brasil – UAB e Universidade Aberta do Maranhão. Disponível em: <http://
www.ebah.com.br/content/ABAAAejrMAF/estatistica-descritiva>. Acesso em: 20 jul. 2012.
DOMINGUES, M.; DOMINGUES, J. Estatística exploratória. Disponível em: <http://www.cin.ufpe.

br/~psb/EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>. Acesso em: 25 jul. 2012.
106
FERREIRA, J. C. Elementos de lógica matemática e teoria dos conjuntos. Disponível em: <http://www.
ciul.ul.pt/~amfern/am1/documents/logTeoConj.pdf>. Acesso em: 24 jul. 2012.
FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 6. ed. São Paulo: Atlas, 2009.
GARCIA, E. S.; LACERDA, L. S.; BENÍCIO, R. A. Gerenciando incertezas no planejamento logístico: o

papel do estoque de segurança. Disponível em: <http://tfscomunicacao.com.br/imgs/sala_estudo/273_
arquivo.pdf>. Acesso em: 25 jul. 2012.
GITMAN, L. J. Princípios de Administração – uma visão estatística. São Paulo: Atlas, 2001.
IEZZI, G.; HASSAN, S.; DEGENSZAJN, D. Fundamentos de matemática elementar 11 – matemática

comercial, matemática financeira e estatística descritiva. São Paulo: Atual, 2005.
LAURENTI, R.; BUCHALLA, C. M. A elaboração de estatísticas de mortalidade segundo causas múltiplas.

Rev. Bras. Epidemiol, v. 3, n. 1-3, 2000. Disponível em: <http://www.scielosp.org/pdf/rbepid/v3n1-3/03.
pdf>. Acesso em: 15 jul. 2012.
LOPES, J. M. O ensino de probabilidade através de um jogo de dados e da metodologia de resolução de

problemas. Disponível em: <http://www.mat.feis.unesp.br/docentes2008/jose_marcos/Minicurso.pdf>.
MEYER, P. L. Probabilidade: aplicações à Estatística. Rio de Janeiro: Livros Técnicos e Científicos (LTC),
2000.
MARTINS, G. A.; DONAIRE, D. Princípios de Estatística. São Paulo: Atlas, 2004.
MENEZES, P. B. Matemática discreta para computação e informática. Porto Alegre: Instituto de

Informática da UFRGS: Sagra Luzzato, 2004. (Série Livros Didáticos, n. 16).
MORETTIN, P. A.; BUSSAB, W. O. Estatística básica. São Paulo: Saraiva, 2004.
NASCIMENTO, N. M. A probabilidade e variáveis aleatórias. 2. ed. São Paulo: Edusp, 2006.
NETO, A. S. et al. A aplicação de gráficos de controle de Soma Acumulada (CUSUM) para

monitoramento de um processo de usinagem. In: SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO,
XIV, 2009, Botucatu, SP. Anais... Botucatu, SP: Unesp – Departamento de Engenharia de
Produção, 2009.
NERY, N.; PATU, G. Judiciário, em guerra por aumento, lidera gastos com pessoal. Folha
de S. Paulo, São Paulo, 6 set. 2011. Disponível em: <http://espaco-vital.jusbrasil.com.br/
noticias/2829649/folha-de-sp-judiciario-em-guerra-por-aumento-lidera-gastos-com-pessoal>.
107
NOGUEIRA, P. J. S. Apostila de Estatística. Universidade Bandeirante de São Paulo. Disponível em:
<http://pt.scribd.com/doc/80708751/Estatistica-descritiva-UNIBAN>. Acesso em: 20 jul. 2012.
OLIVEIRA, F. E. M. Estatística geral e aplicada. São Paulo: Atlas, 2007.
SILVA, T. Tendência central, dispersão e posição. Disponível em: <https://woc.uc.pt/fpce/getFile.

do?tipo=2&id=9123>· Acesso em: 25 jul. 2012.
SILVA, W. C. M. Conceitos iniciais e breve histórico da estatística. Disponível em: <http://mundobr.pro.

br/uneal/wp-content/uploads/2010/04/01.conceitos_inicias-historico-somatorio.pdf>. Acesso em: 25
jul. 2012.
STEVENSON, W. J. Estatística aplicada à Administração. São Paulo: Harbra, 2001.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 2010.
YASSIN, N. Métodos quantitativos e estatísticos para a tomada de decisão. Disponível em:

<http://www.santahelena.ueg.br/posgraduacao/mba/2007/download/metodosquantitativos/
METODOS_QUANTITATIVOS_PARTE_I.pdf>. Acesso em: 25 jul. 2012.
VIEIRA, S. Elementos de Estatística. São Paulo: Atlas, 2006.
Sites
<http://www.ibge.gov.br>.
Exercícios
Unidade I
Questão 1
INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame

Nacional do Ensino Médio (ENEM) 2011: 2º dia. Caderno 5 – Amarelo. Questão 148. Disponível em:
<http://download.inep.gov.br/educacao_basica/enem/provas/2011/05_AMARELO_GAB.pdf>. Acesso
em: 12 ago. 2012.
Questão 2

em: 12 ago. 2012.
108
Unidade II
Questão 1

Nacional de Desempenho dos Estudantes (ENADE) 2008: Matemática. Questão 13. Disponível em:
<http://download.inep.gov.br/download/Enade2008_RNP/MATEMATICA.pdf>. Acesso em: 12 ago.
2012.
Questão 2

em: 12 ago. 2012.
109
110
111
112
Informações:
www.sepi.unip.br ou 0800 010 9000

Estatística Aplicada: Autores: Prof. Edwin F. F. Silva Colaboradores: Prof. Santiago Valverde

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística Aplicada: Autores: Prof. Edwin F. F. Silva Colaboradores: Prof. Santiago Valverde

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Aplicada

Autores: Prof. Edwin F. F. Silva

Wesley Cândido de Melo

Dados Internacionais de Catalogação na Publicação (CIP)

S586e Silva, Edwin F.

Estatística aplicada / Edwin F. Silva; Wesley Cândido de Melo. –

112 p., il.

Nota: este volume está publicado nos Cadernos de Estudos e

1. Estatística. 2. Distribuição de frequências. 3. Probabilidades.

Prof. Fábio Romeu de Carvalho

Profa. Melânia Dalla Torre

Prof. Dr. Yugo Okida

Profa. Dra. Marília Ancona-Lopez

Unip Interativa – EaD

Profa. Elisabete Brihy

Material Didático – EaD

Assim, esperamos contribuir da melhor forma possível com seu aprendizado.

Com nossos cumprimentos,

São questões como essas que a disciplina Estatística procura responder.

Na história do desenvolvimento humano, a sociedade primitiva se deparou com os primeiros

1.1 Introdução à estatística

No singular, “estatística” indica a atividade humana especializada, ou um corpo de técnicas, ou ainda

Figura 1 - Participação relativa das bandeiras (quantidade de transações)

Exemplo 2: Índice Nacional de Preços ao Consumidor (INPC)

Exemplo 3: Análise de mercado

Exemplo 4: Ocorrência de terremotos

1.2 Importância da estatística

Com o desenvolvimento humano e tecnológico, temos presenciado grandes descobertas na área

O artigo “A elaboração de estatísticas de mortalidade segundo causas

Vejamos alguns exemplos:

A análise dos dados é muito importante para fazer um planejamento adequado.

Para mais informações sobre o Censo, acesse o site do IBGE:

1.3 Elementos fundamentais da estatística

1.3.1 População e amostra

• Amostra: é qualquer subconjunto não vazio de uma população.

• Amostragem: é o meio de escolha da amostra e consiste na seleção criteriosa dos elementos a

• Estimador: é a característica numérica estabelecida para toda a amostra.

Exemplo: pesquisas sobre tendências de votação.

Em épocas de eleição, é comum a realização de pesquisas com o objetivo de conhecer as tendências

quanto possível. A escolha da amostra, o questionário, a entrevista, a sintetização dos dados e a

Parâmetro é uma Fenômeno coletivo População

1.4 Fases do método estatístico

As principais fases são:

• definição do problema – delimitação do problema;

1.5 Dados estatísticos

Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses

seus aspectos mais importantes. A informação, portanto, é resultado de um tratamento dos

Casado Ensino 1 4,56 32 10

Variável qualitativa nominal: estado civil.

Variável qualitativa ordinal: grau de instrução.

Variável quantitativa discreta: número de filhos.

Variável quantitativa contínua: salário e idade.

Variáveis discretas e contínuas = variáveis quantitativas.

Variáveis nominais e ordinais = variáveis qualitativas.

Dados qualitativos: consistem em atribuir qualidade ou atributo à variável pesquisada.

Dados quantitativos: consistem em números que representam contagens ou medidas.

1.6 Formas iniciais de tratamento dos dados

Exemplo 1: a tabela a seguir apresenta as notas de 40 estudantes da disciplina de estatística.

{10, 7, 3, 9, 1, 5, 10, 4, 2, 8} à dado bruto

{1, 2, 3, 4, 5, 7, 8, 9, 10, 10} à rol

Amplitude = {maior valor do rol – menor valor do rol}

1.7 Notações por índices

1.7.1 Notação sigma (∑)