Estatística

Estatística
Hudson Félix
5 de dezembro de 2022
Hudson Félix Estatística

CONTEÚDO PROGRAMÁTICO
1 A NATUREZA DA ESTATÍSTICA.
2 POPULAÇÃO E AMOSTRA.
3 SÉRIES ESTATÍSTICA.
4 GRÁFICOS ESTATÍSTICOS.
5 DISTRIBUIÇÃO DE FREQUÊNCIAS.
6 MEDIDAS DE POSIÇÃO.
7 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE.
8 MEDIDAS DE ASSIMETRIA. MEDIDAS DE CURTOSE.
9 PROBABILIDADE.
10 DISTRIBUIÇÃO BINOMIAL E NORMAL.
11 CORRELAÇÃO E REGRESSÃO.
12 NÚMEROS-ÍNDICES.
13 Apêndice: INSTRUMENTAL MATEMÁTICO.

CAPÍTULO 1. A NATUREZA DA ESTATÍSTICA
Estatística é um ramo da matemática aplicada
No século XVIII , Godofredo Achenwall, deu o nome a nova
ciência(método) de Estatística.
Definição (método):
É um conjunto de meios dispostos convenientemente para se chegar a um
fim que deseja. Onde temos:

1. Método Experimental
Consiste em manter constantes todas as causas ( fatores), menos um, e
variar está causa de modo que o pesquisador possa descobrir seus efeitos,
caso existam.
Exemplo: Crescimento do pé de feijão

Fatores que interferem: água, sol, algodão, adubo químico.
observando qual desses fatores influênciam os demais, sendo assim,
temos:
Água, sol e algodão produzem o crescimento do pé de feijão

Sol, algodão e adubo químico não produzem o crescimento do pé de
feijão.
água, sol e adubo químico produzem o crescimento do pé de feijão.
Com isso, vemos que a água é necessária e suficiente para o crescimento

do pé de feijão.

2. Definição(Estatítica):
É uma parte da matemática aplicada que fornece métodos para a coleta,
organização, descrição (Estatística descritiva), análise e a interpretação
de dados ( Estatística indutiva ou inferencial) e para utilização dos
mesmos na tomada de decisões.
Método Estatístico
É a forma de utilizar dados para estudar um problema, no qual, houve
uma possibilidade de manter as causas constantes, admite todas essas
causas presentes variando-as, registrando essas variações e procurando
determinar, no resultado final, que influências cabem a cada uma delas.
O método estatístico é composto por 5 fases:

1. Coleta
Direta: A coleta é direta quando é obtida diretamente da fonte,
como no caso da empresa que realiza uma pesquisa para saber a
preferência dos consumidores pela sua marca. Há três tipos de
coleta direta.
Contínua: A coleta de dados é contínua quando os dados são
obtidos ininterruptamente, automaticamente e na vigência de um
determinado período: um ano, por exemplo. Os registros de
nascimento, de casamento, de óbito podem ser considerados como
uma forma de coleta direta contínua.
Ocasional: A coleta de dados é ocasional quando os dados forem
colhidos esporadicamente, atendendo a uma conjuntura qualquer ou
a uma emergência. A coleta de dados em um surto epidêmico e o
registro de pedidos de um determinado artigo que uma grande
empresa recebe em um dia de greve são formas de coleta ocasional.
Períodica: A coleta de dados é periódica quando é realizada em
períodos curtos, determinados, de tempos em tempos. O
recenseamento demográfico, a cada dez anos, e o censo industrial,
anualmente, são exemplos de coleta periódica.

1. Coleta - continuação
Indireta: A coleta dos dados é indireta quando inferida a partir dos
elementos conseguidos pela coleta direta, ou através do
conhecimento de outros fenômenos que, de algum modo, estejam
relacionados com o fenômeno em questão. É feita, portanto, por
deduções e conjeturas, podendo ser realizada
por analogia – quando o conhecimento de um fenômeno é induzido a
partir de outro que com ele guarda relações de casualidade.
por proporcionalização – quando o conhecimento de um fato se
induz das condições quantitativas de uma parte dele.
por indícios – quando são escolhidos fenômenos sintomáticos para
discutir um aspecto geral da vida social.

2. Crítica
Após os dados serem obtidos eles são analisados para conferir se há erros,
para que não ocorram distorções que interfiram no resultado final.
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de
possíveis falhas e imperfeições, a fim de não incorrermos erros grosseiros
ou de certo vulto, que possam influir sensivelmente nos resultados.
Externa: A crítica é externa quando visa às causas dos erros por
parte do informante, por distração ou má interpretação das
perguntas que lhe foram feitas.
Interna: É interna quando visa observar os elementos originais dos
dados da coleta.
Por exemplo, ao aplicar o questionário, temos que fazer uma crítica para
verificar se as respostas obtidas condizem com a nossa necessidade
(crítica interna). No caso de haver erros, precisamos saber o motivo da
sua ocorrência para futura correção, verificamos se o pesquisado estava
desatento ou se a questão foi mal formulada etc. (crítica externa).

3. Apuração
Antes de começar a analisar os dados, é conveniente que lhes seja dado
algum tratamento prévio, a fim de torná-los mais expressivos. Esta etapa,
apuração ou sumarização, consiste em resumir os dados, através de sua
contagem e agrupamento. É um trabalho de condensação e de tabulação
dos dados, que chegam ao analista de forma desorganizada, tornando
impossível a tarefa de apreender todo o significado pela simples leitura.
Há várias formas de se fazer a apuração, dependendo das necessidades e
dos recursos disponíveis do interessado: manual, mecânica,
eletromecânica e eletrônica:
Apuração é manual: É quando não se recorre a qualquer máquina
para ser realizada.
Apuração Mecânica: É Quando a apuração for feita com o auxílio
de máquinas mecânicas, como as de somar e de calcular.

3. Apuração - continuação
Apuração eletromecânica: É realizada com máquinas diferentes
das anteriores pelo fato de suas engrenagens internas serem movidas
a energia elétrica.
Apuração Eletrônica: As máquinas eletrônicas efetuam as
operações através de impulsos elétricos dispensando qualquer tipo de
engrenagem, o que lhes confere uma velocidade infinitamente maior
que a das anteriores.
Resumidamente temos que através da apuração tem-se a oportunidade
de condensar os dados, de modo a obter um conjunto compacto de
números, o qual possibilita distinguir melhor o comportamento do
fenômeno na sua totalidade.
A apuração nada mais é que a soma e o processamento dos dados
obtidos. Contudo, a contrapartida da melhor apreciação dos dados em
seu conjunto é a perda correspondente de detalhes, uma vez que se trata
de um processo de sintetização.

4. Apresentação
Tabelas: É uma apresentação numérica dos dados. Consiste em
dispor os dados em linhas e colunas distribuídas de modo ordenado,
seguindo algumas regras práticas adotadas pelos diversos sistemas
estatísticos. De maneira mais formal, define-se como tabela a
disposição escrita que se obtém, fazendo-se referir uma coleção de
dados numéricos a uma determinada ordem de classificação.
Gráficos: Constitui uma apresentação geométrica. Embora a
apresentação tabular seja de extrema importância, no sentido de
facilitar a análise numérica dos dados, não permite ao analista obter
uma visão tão rápida, fácil e clara do fenômeno e sua variação como
a conseguida através de um gráfico.

5. Análise de dados
O objetivo último da estatística é tirar conclusões sobre o
todo(população) a partir das informações fornecidas por parte
representativa do todo(amostra). Assim, realizadas as fases anteriores
(Estatítica Descritiva), fazemos uma análise dos resultados obtidos,
através dos métodos da (Estatística Indutiva ou inferencial), que tem
por base a indução ou inferência, e tiramos desses resultados conclusões e
previsões.
Obs.:
Estatística Descritiva se preocupa com a coleta, organização,
classificação, apresentação, interpretação e análise de dados
experimentais.
Estatística Indutiva se preocupa com as hipóteses e conclusões sobre a
população.

CAPÍTULO 2. POPULAÇÃO E AMOSTRA
Variável
É o conjunto de resultados possíveis de um fenômeno. Onde podemos ter:
Qualitativas: Valores expressos em atributos(características), sendo
nominal(sexo, cor dos olhos) ou ordinal(classe social, grau de
instrução).
Quantitativas: Valores Expressos em números, sendo contínua
(peso, altura) ou discreta ( número de filhos, número de
carros).

População e Amostra
População: É um conjunto de elementos que existe pelo menos algo
comum neles, por exemplo, alunos de uma determinada escola,
população de um país qualquer. Onde temos:
População Finita: É aquela que se consegue enumerar todos os
elementos que a formam. Refere-se a um universo limitado em uma
dada unidade de tempo. Exemplificando pode-se dizer que a
quantidade de automóveis produzidos por uma fábrica em um mês, a
população de uma cidade e o número de alunos de uma sala de aula
são exemplos de uma população finita.
População Infinita: É aquela cujos elementos não podem ser
contados. Refere-se a um universo não delimitado. Os resultados
(cara ou coroa) obtidos em sucessivos lances de uma moeda, o
conjunto dos números inteiros, reais ou naturais são exemplos de
populações infinitas.
Amostra: É um subconjunto finito de uma população, por exemplo, a
sala de aula do sexto ano de uma determinada escola.

Amostragem
A amostragem – inspeção de parte da população – é mais econômica
mais rápida (reduz o número de dados), incomoda menos (consulta
menor número de pessoas) e Ao conjunto de entes portadores de, pelo
menos, uma característica comum denominamos população estatística ou
universo estatístico. Uma amostra é um subconjunto finito de uma
população. pode até apresentar resultados mais confiáveis: é que poucas
consultas permitem contar com pessoal especializado, mais bem
qualificado. temos três tipos de amostragem:
Amostragem aleatória (ao acaso): Todos os elementos da
população têm igual possibilidade de serem selecionados para
constituir a amostra. No nosso exemplo, poderíamos atribuir um
número a cada aluno da escola e escolher ao acaso 50 números para
obter os 50 alunos que constituem a amostra.
Amostragem sistemática: Os elementos são selecionados para a
amostra por um sistema preestabelecido. No caso dos alunos,
considerando-os ainda numerados, poderíamos escolher os números
segundo uma lei de formação: 2,4,6,8 e, assim, sucessivamente, até
obtermos os 50 alunos.

Amostragem estratificada: É utilizada quando a população está
dividida em estratos ou grupos diferenciados. No exemplo dos
alunos da escola podemos considerar cada série de escolaridade
como um estrato e assim escolher, em cada uma, um determinado
número de alunos, isto é, uma amostra dentro de cada estrato. A
escolha das amostras poderá ser feita por um dos dois processos
anteriores. O número de elementos das amostras de cada estrato
não precisa ser igual, mas deve respeitar as mesmas proporções. Se
escolhermos uma amostra de 1ª série com muitos alunos e uma de
2ª série com poucos, correremos o risco de ter resultados que não
são representativos da população.

CAPÍTULO 3. SÉRIES ESTATÍSTICAS

3.1 Tabelas
É o quadro que resume um conjunto de observações. onde:
Corpo: Conjuto de linhas e colunas que contém informações sobre a
variável em estudo
Cabeçalho: Parte superior da tabela que especifica o conteúdo das
colunas.
Coluna Indicadora: parte da tabela que espedifica o conteúdo das
linhas.
Linhas: Retas imaginárias que facilitam a leitura, no sentido
horizontal, de dados que se inscrevem nos seus cruzamentos com as
colunas.
Casa ou Célula: Espaço destinado a um só número.
Título: Conjunto de informações, as mais completas possíveis,
respondendo às perguntas: o quê?, quando?. Onde?, localizado no
topo da tabela.
Existindo ainda elementos complementares da tabela, colocados de
preferência no seu rodapé, como fonte, notas e chamadas.

Exemplo

3.2 Séries Estatísticas
Se define, como toda a tabela que apresenta a distribuição de um
conjunto de dados estatíticos em função da época, do local e da espécie.
Onde se apresentam três elementos ou fatores: o tempo, o espaço e a
espécie.
Podendo se classicar em série histórica, geográfica e específica.

Históricas (cronológicas, temporais ou marchas
Descrevem os valores da variável, em determinado local, discriminados
segundo intervalos de tempo variáveis.

Geográficas(espaciais, territorias ou de localização
Descrevem os valores da variável, em determinado instante, discriminados
segundo regiões.

Específicas ou categóricas
Descrevem os valores da varável, e determinado tempo e local,
discriminados segundo especificações ou categorias.

3.3 Séries Conjugadas / Tabela de duas entradas
Séries Conjungadas nada mais é que se apresentar,em uma única
tabela, a variação de mais de uma váriavel. Assim, conjungando duas
séries em uma única tabela, obtemos uma tabela de duas entradas.

3.4 Distribuição de frequência
A se tratar em um pŕoximo capíulo, pois é um conceito estatístico de
suma importância.

3.5 Dados Absolutos e dados relativos
Dados Absolutos: São os dados estatísticos resultantes da coleta direta
da fonte.
Dados Relativos: São o resultado de comparações por quociente
(razões) que se estabelecem entre dados absolutos e têm por finalidade
realçar ou facilitar as comparações entre quantidades. em geral, temos os
dados relativos traduzidos em:

3.5.1 As percentagens

3.5.2 Os índices. Indices Econômicos
São razões entre duas grandezas tas que uma não inclui a outra.
Exemplos:

3.5.3 Os coeficientes:
São razões entre o número de ocorrências e o número total ( soma do
número de ocorrências e não ocorrências)
Exemplos

3.5.4 As taxas:
São os coeficientes multiplicados por uma potência de 10 (10, 100, 1000,
...) para torna o resultado mais inteligível.
Exemplos: Taxa de mortalidade(coeficiente de mortalidade x 1000),
Taxa de natalidade(coeficiente de natalidade x 1000)

CAPÍTULO 4. GRÁFICOS ESTATÍTICOS
4.1 GRÁFICOS ESTATÍTICOS

É uma forma de apresentação de dados estatísticos, Cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressaomais
ráipida e vivado fenômeno em estudo, ja que os gráficos falam mais
rápido à compreensão que as séries.
Nessa representação gráfica deve se obdecer alguns requisitos:
Simplicidade: tornar o gráfico mais simples possível, o destituindo
de detalhes mais técnicos.
Clareza: tentar tornar o gráfico da forma mais simples possível de
interpretaão, visualmente não tornando duviduso algum dado.
Veracidade: Trazer a verdade do estudo.
Dentre os Gráficos existentes temos em destaque os diagramas, Gráfico
polar os cartogramas e os pictogramas.

4.2 Diagramas
São gráficos geométricos de, no máximo, duas dimensões; para sua
construção, em geral, fazemos o uso do sistema cartesiano.
Onte podemos destacar:
4.2.1 Gráfico em linha ou em curva

Este tipo de gráfico se utiliza da linha poligonal para representar a série
estatística. Sendo uma aplicação do processo de representação das
funções num sistema de coordenadas cartesianas. Vejamos o seguinte
exemplo:

Vamos tomar os anos como abscissas(eixo x) e as quantidades como
ordenadas(eixo y), assim temos:
O gráfico em linha(em curva)

4.2.2 Gráfico em colunas ou em barras
É a representação de uma série por meio de retângulos, dispostos
verticalemente(em colunas)(com retângulos com mesma base) ou
horizontalmente(Em barras)(com retângulos com mesma altura)

Em colunas

Em barras

4.2.3 Gráfico em colunas ou barras múliplas
Normalmente usado para representar simultaneamente dois ou mais
fenômenos estudados com o propósito de comparação.

4.2.4 Gráfico em setores
Tem como característica principal sua representação através de um
círculo, onde se há uma grande facilidade na comparação das partes com
o todo(círculo).

4.3 Gráfico Polar
É o gŕafico ideal para representar Séries temporais cíclicas ou seja, que
apresentam certa periodicidade.

4.4 Cartogramas
É a representação sobre uma carta geográfica.

4.5 Pictogramas
Constitui um dos processos gráficos que melhor fala ao público, plea sua
forma ao mesmo tempo atraente e sugestiva, usando para o gráfico
figuras, o que seria em outras palavras um gráfico de barras, onde no
lugar de barras a figuras.

CAPÍTULO 5. DISTRIBUIÇÃO DE FREQUÊNCIA
5.1 Tabela Primitiva ROL

É a forma que podemos ordenar os dados, ou seja, ao colher esses dados
construimos uma tabela primitiva, e a partir daí organizamos de forma
crescente ou decresecente esses dados, no qual chamamos de rol.
Vejamos:
Tabela Primitiva
Rol

5.2 Distribuição de frequência
No exemplo trabalhado, a variável estatura, será observada e estudada
mais facilmente quando os valores estiverem ordenados em uma coluna e
sendo colocado, ao lado de cada valor, o número de vezes que aparece
repetido. Denomina-se frequência o número de alunos que fica
relacionado a um determinado valor da variável. A tabela, assim obtida,
recebe o nome de distribuição de frequência.

No entanto, o processo apresentado é ainda inconveniente, exigindo muito
espaço, mesmo quando o número de valores da variável é de tamanho
razoável. Sendo possível, a solução mais aceitável, pela própria natureza
da variável contínua, é o agrupamento dos valores em vários intervalos.
Quando os valores da variável estão sendo agrupados em intervalos,
sendo que, em Estatística prefere-se denominar os intervalos de classes.
Chamando de frequência de uma classe o número de valores da variável
pertencente à classe, os dados podem ser dispostos como na tabela a
seguir denominada distribuição de frequência com intervalo de classe.

Ao se agrupar os valores da variável em classes, ganha-se em simplicidade
, mas perde-se em pormenores. O que se pretende com a construção
desta nova é realçar o que há de essencial nos dados e, também, tornar
possível o uso de técnicas analíticas para sua total descrição, até porque
a Estatística tem por finalidade específica analisar o conjunto de valores,
desinteressando-se por casos isolados.
Obs.:
Como o objetivo, desde o início, é a obtenção de uma distribuição de
frequência com intervalo de classe, torna-se necessário fazer uma
tabulação, com cada traço correspondendo a um valor.
Quando os dados estão organizados em uma distribuição de
frequência, são usualmente denominados dados agrupados.

5.3 Elementos de uma distribuição de frequência
5.3.1 Classe
Classe de frequência ou, simplesmente, classes são intervalos de variação
da variável.
As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k
( onde k é de o número total de classes da distribuição). O número total
de valores da variável é simbolizado por n.
5.3.2 Limites de classe

Denominam-se limites de classe os extremos de cada classe.
O menor número é o limite inferior da classe (li ) e o maior número, o
limite superior da classe (Li ). Na segunda classe, por exemplo, tem-se:
l2 = 154 e L2 = 158.
obs.:

5.3.3 Amplitude de um intervalo de Classe
Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe
é a medida do intervalo que define a classe.
O intervalo de classe i é simbolizado por hi e é obtido pela diferença
entre seus limites. hi = Li − li . No exemplo empregado, o tamanho do
intervalo da segunda classe (h2 ) vale:
h2 = L2 − l2 = 158 − 154 ⇒ h2 = 4cm. Todas as outras classes do
exemplo também têm intervalo de 4 cm, pois esse é o intervalo entre
cada um dos limites inferiores e os limites superiores correspondentes.
5.3.4 Amplitude total da distribuição
Amplitude total da distribuição (AT) é a diferença entre o limite superior
da última classe (limite superior máximo) e o limite inferior da primeira
classe (limite inferior mínimo): AT = L(max.) − l(min.)
No exemplo utilizado, tem-se: AT = 174 − 150 ⇒ AT = 24cm. Obs.: É
evidente que, se as classes possuem o mesmo intervalo, verificamos a
relação:
hi = k ⇒ 4 = 6
AT 24

5.3.5 Amplitude Amostral
Amplitude amostral (AA) é a diferença entre o valor máximo e o valor
mínimo da amostra: AA = x(max.) − x(min.)
No exemplo utilizado, tem-se: AA = 173 − 150 = 23 ⇒ AA = 23cm.
5.3.6 Ponto Médio de uma classe
Ponto médio de uma classe (xi ) é, como o próprio nome indica, o ponto
que divide o intervalo de classe em duas partes iguais.
Para se obter o ponto médio de uma classe, calcula-se a semissoma dos
limites da classe (média aritmética).
xi = li +L
2
i
Assim, o ponto médio da segunda classe, no exemplo citado

anteriormente, é
xi = li +L
2 ⇒ x2 =
i l2 +L2
2 ⇒ x2 = 154+158
2 = 156 ⇒ x2 = 156cm
Obs.: O ponto médio de uma classe é o valor que a representa.

5.3.7 Frequência Simples ou absoluta
Frequência simples ou frequência absoluta ou, simplesmente, frequência
de uma classe ou de um valor individual é o número de observações
correspondentes a essa classe ou a esse valor.
A frequência simples é simbolizada por fi ( lê-se: f índice i ou frequência
da classe i). Assim, no exemplo utilizado anteriormente, tem-se:
f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3.
A soma de todas as frequências é representada pelo símbolo de somatório.
k
X
fi
i=1
É evidente que
k
X
fi = n
i=1

Para a distribuição em estudo, tem-se
6
X
fi = 40
i=1
Não havendo possibilidade de engano, usa-se:

X
fi = 40
Pode-se, agora, dar à distribuição de frequência das estaturas dos
quarenta alunos do colégio A, a seguinte representação tabular técnica.

5.4 Número de classes/Intervalos de classe
A primeira preocupação que se tem, na construção de uma distribuição
de frequência, é a determinação do número de classes e,
consequentemente, da amplitude e dos limites dos intervalos de classe.
Para a determinação do número de classes de uma distribuição pode-se
lançar mão da Regra de Sturges , que permite calcular o número de
classes em função da variável: i ∼
= 1 + 3, 3 · log n, sabendo que i é o
número de classe e n é o número total de dados.
Essa regra possibilitou a obtenção da tabela abaixo.

Além da Regra de Sturges, existem outras fórmulas empíricas que
pretendem resolver o problema da determinação do número de classes
que deve ter a distribuição. No entanto, a verdade é que essas fórmulas
não levam a uma decisão final; esta vai depender de um julgamento
pessoal, que deve estar ligado à natureza dos dados, da unidade
empregada para expressá-los, etc. Decidido o número de classes que deve
ter a distribuição, compete agora resolver o problema da determinação da
amplitude do intervalo de classe, o que se consegue dividindo a amplitude
pelo número de classes: h = AT i . Quando o resultado não é exato,
deve-se arredondá-lo para mais. Outro problema que surge é a escolha
dos limites dos intervalos, os quais deverão ser tais que forneçam, na
medida do possível, para os pontos médios, números que facilitem os
cálculos – números naturais.
No exemplo utilizado, tem-se: para n = 40 ⇒ i = 6.
Logo: h = 173−150
6 6 = 3, 8 = 4 , isto é, seis classes de intervalos
= 23
iguais a 4.

5.5 Tipos de Frequências
Frequências simples ou absolutas (fi ) são os valores que realmente
representam o número de dados de cada classe.
X
fi = n
Frequências relativas (fr ) são os valores das razões entre as frequências
simples e a frequência total.
fi
fri = P
fi
Logo, no exemplo utilizado, a frequência da terceira classe é:
f3 11
fr3 = P ⇒= = 0, 275 ⇒ fr3 = 0, 275
fi 40

Evidentemente:
X
fri = 1
ou 100%
Obs.: O propósito das frequências relativas é o de permitir a análise ou
facilitar as comparações.
Frequência acumulada (Fi ) é o total das frequências de todos os
valores inferiores ao limite superior do intervalo de uma dada classe.
Fk = f1 + f2 + ... + fk
ou
k
X
Fk = fi
i=1
Assim, no exemplo apresentado, anteriormente, a frequência acumulada

correspondente
P3 à terceira classe é:
F3 = i=1 fi = f1 + f2 + f3 ⇒ F 3 = 4 + 9 + 11 ⇒ F3 = 24

o que significa existirem 24 alunos com estatura inferior a 162 cm (limite
superior do intervalo da terceira classe).
Frequência acumulada relativa (Fri ) de uma classe é a frequência
acumulada da classe, dividida pela frequência total da distribuição.
Fi
Fri = P
fi
Assim, para a terceira classe, temos:
F3 24
Fr3 = P ⇒ Fr3 = = 0, 600 ⇒ Fr3 = 0, 600
f3 40

Resumindo : Tabela com as frequências estudadas

Observação:
O conhecimento dos vários tipos de frequência ajuda para que se possa
responder a muitas questões com relativa facilidade, como as seguintes:
a) Quantos alunos tem estatura entre 154 cm, inclusive, e 158 cm? Esses
são os valores da variável que formam a segunda classe. Como f2 = 9, a
resposta é 9 alunos.
b) Qual é a porcentagem de alunos cujas estaturas são inferiores a 154
cm? Esses valores são os que formam a primeira classe. Como
fri = 0, 100, obtém – se a resposta multiplicando a frequência relativa
por 100 : 0, 100 · 100 = 10. Logo, a porcentagem de alunos é 10%.
c) Quantos alunos têm estatura abaixo de 162 cm? É evidente que as
estaturas consideradas são aquelas que formam as classes de ordem 1, 2 e
3. Assim, o número de alunos é dado por:
3
X
f1 + f2 + f3 = fi = F3 = 24
i=1
Portanto, 24 alunos têm estatura abaixo de 162 cm.

d) Quantos alunos têm estatura não-inferior a 158 cm? O número é dado
por:
6
X
fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27
i=3
ou então:
6
X
fi − F − 2 = n − F2 = 40 − 13 = 27
i=1

5.6 Distribuição de frequência sem intervalos de classe
Quando se trata de variável discreta de variação relativamente pequena,
cada valor pode ser tomado como um intervalo de classe (intervalo
degenerado) e, nesse caso, a distribuição é chamada distribuição sem
intervalos de classe, tomando a seguinte forma:

Exemplo:
Seja X a variável “número de cômodos das casas ocupadas por vinte
famílias entrevistadas”.

Completada com os vários tipos de frequência, tem-se:

5.7 Representação gráfica de uma distribuição
Uma distribuição de frequência pode ser representada graficamente pelo
histograma, pelo polígono de frequência e pelo polígono de frequência
acumulada (Ogiva de Galton). Qualquer um dos gráficos mencionados
pode ser construído utilizando o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocam-se os valores da variável; e na linha vertical (eixo das
ordenadas), as frequências.

5.7.1 Histograma
O histograma é formado por um conjunto de retângulos justapostos,
cujas bases se localizam sobre o eixo horizontal, de tal modo que seus
pontos médios coincidam com os pontos médios dos intervalos de classe.

Observações:
As larguras dos retângulos são iguais às amplitudes dos intervalos de
classe.
As alturas dos retângulos devem ser proporcionais às frequências das
classes, sendo a amplitude dos intervalos igual. Isso permite que se
tomem as alturas numericamente iguais às frequências.
O histograma goza da seguinte propriedade: á área de um
histograma é proporcional à soma das frequências.
Quando se usam as frequências relativas obtém-se um gráfico de
área unitária.
Quando se pretende comparar duas distribuições, o ideal é fazê-lo
pelo histograma de frequências relativas.

5.7.2 Polígono de frequência
O polígono de frequência é um gráfico em linha, sendo as frequências
marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos
pontos médios dos intervalos de classe.

Observação:
Para realmente se obter um polígono (linha fechada), deve-se completar
a figura, ligando os extremos da linha obtida aos pontos médios da classe
anterior à primeira e da posterior à última, da distribuição.

Exemplo 1:
Construir o histograma associado à tabela abaixo, que representa as
alturas (em cm) dos alunos da turma A, do Colégio Progresso, em 2018.
Resposta: Histograma de Frequências Simples

Exemplo 2:
A seguir observem como ficam os histogramas para as frequências
simples e acumuladas crescentes, referentes às médias dos alunos da
turma A, do Colégio União, em julho de 2018.

3) Observem o polígono de frequência que representa o exemplo anterior.

5.7.3 Polígono de frequência acumulada
O polígono de frequência acumulada é traçado marcando-se as
frequências acumuladas sobre perpendiculares ao eixo horizontal,
levantadas nos pontos correspondentes aos limites superiores dos
intervalos de classe.
Exemplo: Um exercício completo Análise do desempenho dos alunos do
Professor Paulo. 1ª etapa: Levantamento dos dados brutos (Tabela
primitiva)

2ª etapa: Construção de rol

3ª etapa: Construção da tabela de frequência

4ª etapa: Construção da tabela de frequência com intervalos de classe

5ª etapa: Representação gráfica (polígono de frequência)
Obs.: Concluindo o estudo, o polígono de frequência parece demonstrar

que o resultado do trabalho do professor Paulo é satisfatório, pois há
mais alunos acima do intervalo 4 a 6 do que abaixo dele.

5.8 A curva de frequência
5.8.1 A curva de frequência. Curva polida

A tendência da análise de populações cada vez mais amplas é de que a
linha poligonal se torne uma curva. Essa curva recebe a denominação de
curva de frequência. Enquanto o polígono de frequência apresenta a
imagem real do fenômeno estudado, a curva de frequência exibe a
imagem tendencial.
Após o traçado de um polígono de frequência, é desejável, muitas vezes,
que se lhe faça um polimento, de modo a mostrar o que seria tal
polígono com um número maior de dados. Esse procedimento não mostra
uma certeza absoluta de que a curva obtida – curva polida – seja tal qual
a curva resultante de um grande número de dados.
No entanto, pode-se afirmar que ela assemelha-se mais à curva de
frequência do que o polígono de frequência obtido de uma amostra
limitada. O polimento, geometricamente, corresponde à eliminação dos
vértices da linha poligonal. Consegue-se isso com o emprego de uma
fórmula bastante simples, a qual, a partir das frequências reais, nos
fornece novas frequências – frequências calculadas –
que se localizarão, como no polígono de frequências, nos pontos médios.
A fórmula para se determinar a frequência calculada (fci ) é:
fi−1 + 2fi + fi+1
fci =
4
Onde:
fci é a frequência calculada da classe considerada.
fi é a frequência simples da classe considerada.
fi−1 é a frequência simples da classe anterior à classe considerada.
fi+1 é a frequência simples da classe posterior à classe considerada.
fci é a frequência calculada da classe considerada. fi é a frequência
simples da classe considerada. fi−1 é a frequência simples da classe
anterior à classe considerada. fi+1 é a frequência simples da classe
posterior à classe considerada.
0+2·4+9 17
fc1 = = = 4, 25
4 4
4 + 2 · 9 + 11 33
fc2 = = = 8, 25
4 4

9 + 2 · 11 + 8 39
fc3 = = = 9, 75
4 4
11 + 2 · 8 + 5 32
fc4 = = =8
4 4
8+2·5+3 21
fc5 = = = 5, 25
4 4
5+2·3+0 11
fc6 = = = 2, 75
4 4

5.8.2 As formas das curvas de frequência
As curvas em forma de sino caracterizam-se pelo fato de apresentarem
um valor máximo na região central.
São muitos os fenômenos que oferecem distribuições em forma de sino: a
estatura de adultos, o peso de adultos, a inteligência medida em testes
mentais, os preços relativos. Tais curvas podem ser simétricas ou
assimétricas.
Curva Simétrica – Essa curva caracteriza-se por apresentar valor

máximo no ponto central e os pontos equidistantes desse ponto terem a
mesma frequência. As curvas em forma de sino caracterizam-se pelo fato
de apresentarem um valor máximo na região central.

Curva Assimétrica – Na prática, não são encontradas distribuições
perfeitamente simétricas. As distribuições obtidas de medições reais são
mais ou menos assimétricas, em relação à frequência máxima. Assim, as
curvas correspondentes a tais distribuições apresentam a cauda de um
lado da ordenada máxima mais longa do que o outro. Se a cauda mais
alongada fica à direita, a curva é chamada assimétrica positiva ou
enviesada à direita. Se a curva se alonga à esquerda, a curva é chamada
assimétrica negativa ou enviesada à esquerda.

curvas em forma de jota
As curvas em forma de jota são relativas a distribuições extremamente
assimétricas, caracterizadas por apresentarem o ponto de ordenada
máxima em uma das extremidades.
São curvas comuns aos fenômenos econômicos e financeiros: distribuição
de vencimentos ou rendas pessoais.

curvas em forma de U
As curvas em forma de U são caracterizadas por apresentarem
ordenadas máximas em ambas as extremidades.
Como exemplo de distribuição que dá origem a esse tipo de curva
pode-se citar a de mortalidade por idade.

Distribuição Retangular
Essa distribuição, muito rara na verdade, apresenta todas as classes com
a mesma frequência. Tal distribuição seria representada por um
histograma em que todas as colunas teriam a mesma altura ou por um
polígono de frequência reduzido a um segmento de reta horizontal.

CAPÍTULO 6. MEDIDAS DE POSIÇÃO
6.1 Introdução
O estudo feito sobre distribuições de frequência permite descrever, de
maneira geral, os grupos dos valores que uma variável pode assumir.
Desse modo, pode-se localizar a maior concentração de valores de uma
distribuição, isto é, se ela se localiza no início, no meio ou no final, ou,
ainda, se há uma distribuição por igual. No entanto, para ressaltar as
tendências características de cada distribuição, isoladamente, ou em
comparação com outras, necessita-se introduzir conceitos que se
expressem através de números, que possibilitem traduzir essas tendências.
Esses conceitos denominam-se elementos típicos da distribuição e são as
medidas de posição;
medidas de variabilidade ou dispersão;
medidas de assimetria;
medidas de curtose.
A maioria das vezes em que os dados estatísticos são analisados
procura-se obter um valor para representar um conjunto de dados.
Esse valor deve sintetizar o comportamento do conjunto do qual ele é
proveniente. Nem sempre os dados estudados têm um bom
comportamento, isto pode fazer com que um único valor possa
representa- lo ou não perante o grupo. As medidas de posição mais
relevantes são as medidas de tendência central, que recebem tal
denominação porque os dados observados tendem, em geral, a se agrupar
em torno dos valores centrais. Dentre as medidas de tendência central,
destacam-se as seguintes:
Médias;
Moda;
Mediana.
Cada uma com um significado diferenciado, no entanto tendo como
utilidade representar um conjunto de dados. As outras medidas de
posição são as separatrizes , que englobam:
a própria mediana;
os quartis ;
os percentis.
.

6.2 Médias
6.2.1 Média aritmética (x)

É o quociente da divisão da soma dos valores de todos os dados do
conjunto pela quantidade deles.
P
xi x1 + x2 + ... + xn
x= =
n n
sendo:
x a média aritmético
xi os valores da variável
n o número de valores

Exemplo: Média de dados não-agrupados
Sabendo-se que as vendas diárias da empresa A, durante uma semana,
foram de 10, 14, 13, 15, 16, 18 e 12 unidades. Determinar a média de
vendas nesta semana feitas pela empresa A.
10 + 14 + 13 + 15 + 16 + 18 + 12 98
P
xi x1 + ... + xn
x= = = = = 14
n n 7 7
Observação:
Às vezes, a média pode ser um número diferente de todos os da série de
dados que ela representa. É o que acontece quando temos os valores 2,4,
6 e 8, para os quais a média é 5. Esse será o número representativo dessa
série de valores, embora não esteja representado nos dados originais.
Neste caso, costuma-se dizer que a média não tem existência concreta.

6.2.2 Média Aritmética Ponderada xp
É uma média aritmética na qual será atribuído um peso a cada valor da
série.
Exemplo: O capital da empresa está sendo formado pelos acionistas, por
financiamentos e por debêntures. Cada tipo tem um custo diferente para
a empresa, definido pela sua taxa anual. Calcule a taxa de juros média do
capital da empresa, considerando os dados apresentados na tabela
seguinte.
x1 · p1 + x2 · p2 + x3 · p3
xp =
p1 + p2 + p3
12% · 100000 + 8% · 600000 + 14% · 400000
xp =
1000000 + 60000 + 400000
6.2.3 Média Aritmética Para Dados Agrupados sem Intervalos de Classes
As frequências são as quantidades de vezes que a variável ocorre na
coleta de dados, elas funcionam como fatores de ponderação, o que leva
a se calcular
P a média
P aritmética ponderada.
x = nxi ·fi ou x = Pxif·fi i
Exemplos: 1-Após ter sido realizado um trabalho bimestral, o professor
efetuou o levantamento das notas obtidas pelos alunos, observou a
seguinte distribuição e calculou a média de sua turma.

2-Consideremos a distribuição relativa a 34 famílias de quatro filhos,
tomando para variável o número de filhos do sexo masculino.
Nesse caso, como as frequências são números indicadores da intensidade

de cada valor da variável, elas funcionam como fatores de ponderação, o
que nos leva a calcular a média aritmética ponderada, dada pela fórmula.
P
xi · f i
x= P
fi
O mais prático de obtenção da média aritmética ponderada é abrir, na
tabela, uma coluna correspondente aos produtos xi · fi .

Temos, então: P
xi · fi = 78 e fi = 34
P
logo P
x = Pxif·fi i = x = 34
78
= 2, 29 ⇒ x = 2, 3
Observação: Sendo x uma variável discreta, como interpretar o resultado
obtido, 2 meninos e 3 décimos de meninos? O valor médio 2,3 meninos
sugere, nesse caso, que o maior número de famílias tem 2 meninos e 2
meninas, sendo porém, a tendência geral de uma leve superioridade
numérica em relação ao número de meninos.

6.2.4 Média Aritmética Para Dados Agrupados com Intervalos de Classes
(x)
Convenciona-se que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio, e determina-se a
média aritmética ponderada por meio da fórmula.
P P
xi · fi xi · fi
x= ou x = P
n fi
onde xi é o ponto médio da classe.
Exemplos:
Consideremos a distribuição:

Vamos, inicialmente, abrir uma coluna para os pontos médios e o outra
para os produtos xi · fi
P
x= Pxi ·fi =x = 6440
= 161 ⇒ x = 161cm
fi 40

6.2.5 Desvio em Relação à Média
Denomina-se desvio em relação à média, a diferença entre cada elemento
de um conjunto de valores e a média aritmética.
Designando o desvio por di , tem – se: di = xi − x
Exemplo:
Sabendo-se que a produção leiteira diária da vaca A, durante uma
semana, foi de 10,14,13,15,16,18 e 12 litros, tem-se, para produção
média da semana:
x = 10+14+13+15+16+18+12
7 7 = 14
= 98
d i = xi − x
d1 = x1 − x ⇒ d1 = 10 − 14 = −4
d2 = x2 − x ⇒ d2 = 14 − 14 = 0
d3 = x3 − x ⇒ d3 = 13 − 14 = −1
d4 = x4 − x ⇒ d4 = 15 − 14 = 1
d5 = x5 − x ⇒ d5 = 16 − 14 = 2
d6 = x6 − x ⇒ d6 = 18 − 14 = 4
d7 = x7 − x ⇒ d7 = 12 − 14 = −2

6.2.6 Propriedades da Média
1ª propriedade:
A somaP algébrica dos desvios tomados em relação à média é nula.
di = (xi − x) = 0
Pk
i=1 di = 0
No
P7 exemplo anterior, tem-se:
i=1 di = (−4) + 0 + (−1) + 1 + 2 + 4 + (−2) = 0
2ª propriedade:
Somando-se (ou subtraindo-se) uma constante (c) a de todos os valores
de uma variável, a média do conjunto fica aumentada (ou diminuída)
dessa constante.
yi = xi ± c ⇒ y = x ± c
Somando 2 a cada um dos valores da variável do exemplo anterior,
tem-se:
y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 18
Daí:
P7
i=1 = 12 + 16 + 15 + 17 + 18 + 20 + 14 = 112
Como n = 7, vem
7 = 16 ⇒ y = 16 = 14 + 2 ⇒ y = x + 2.
y = 112

Multiplicando-se (ou dividindo-se) todos os valores de uma variável por
uma constante (c), a média do conjunto fica multiplicada (ou dividida)
por essa constante.
yi = xi · c ⇒ y = x · c
ou
yi = xci ⇒ y = xc
Multiplicando por 3 cada um dos valores da variável do exemplo dado,
obtém-se:
y1 = 3, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54 e y7 = 36.
Daí:
P7
i=1 = 3 + 42 + 39 + 45 + 48 + 54 + 36 = 294
Como n = 7 , tem-se:
7 = 42 ⇒ y = 42 = 14 · 3 ⇒ y = x · 3.
y = 294
obs:
A média é utilizada quando
deseja-se obter a medida de posição que possui maior estabilidade.
houver necessidade de um tratamento algébrico ulterior.

6.3 Moda
Denomina-se moda o valor que ocorre com maior frequência em uma
série de valores.
Dessa forma, o salário modal dos empregados de uma empresa é o salário
mais comum, isto é, o salário recebido pelo maior número de empregados
dessa empresa.

6.3.1 Moda Mo Para Dados Não-Agrupados
Primeiramente os dados devem ser ordenados (colocados em rol) para,
em seguida, se observar o valor que tem maior frequência. Quando se
trata de valores não-agrupados, a moda é facilmente reconhecida: basta,
de acordo com a definição, procurar o valor que mais se repete.
Exemplos:
Calcular a moda dos seguintes conjuntos de dados.

X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8} Mo = 6
Este conjunto é unimodal, pois apresenta uma única moda.

Y = {1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6} Mo = 2 e Mo = 4
Este conjunto é Bimodal, pois apresentam duas modas.

Z = {1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5} Mo = 2 e Mo = 3 e Mo = 4
Este conjunto é Plurimodal, pois apresenta mais de duas modas.

Pode-se, entretanto, encontrar séries nas quais não exista valor modal,
isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso
da série: 3,5,8,10,12,13 que não apresenta moda (amodal)
W = {1, 2, 3, 4, 5, 6}, Este conjunto é amodal porque não apresenta um
valor predominante, ou seja, não tem moda.
Observação:
A moda é utilizada quando se deseja obter uma medida rápida e

aproximada de posição ou quando a medida de posição deva ser o
valor mais típico da distribuição. É uma medida pouco utilizada.
Já a média aritmética é a medida de posição que possui maior
confiabilidade numérica, além de ser mais intuitiva, do ponto de
vista matemático.

6.3.2 Moda (Mo ) Para Dados Agrupados sem Intervalos de Classe
3.2-Moda (Mo ) Para Dados Agrupados sem Intervalos de Classe Uma vez
agrupados os dados, é possível determinar imediatamente a moda: basta
fixar o valor da vaiável de maior frequência. Na distribuição da tabela
abaixo, à frequência máxima (12) corresponde o valor 3 da variável. Logo
Mo = 3.

6.3.3 Moda (Mo ) Para Dados Agrupados Com Intervalos de Classe
A classe que apresenta a maior frequência é denominada classe modal.
Pela definição, pode-se afirmar que a moda, neste caso, é o valor
dominante que está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o
ponto médio da classe modal. Esse valor denomina-se moda bruta.
Tem-se:
l ∗ + L∗
Mo =
2
Onde
l ∗ é o limite inferior da classe modal.
L∗ é o limite superior da classe modal.
Assim para a distribuição

temos que a classe modal é i = 3, l ∗ = 158 e L∗ = 162
Como
l ∗ + L∗
Mo =
2
vem
158 + 162 320
Mo = = = 160
2 2
Logo
Mo = 160cm
Observação:
Existem, para o cálculo da moda, outros métodos mais elaborados, como
por exemplo, o que faz uso da fórmula de Czuber.
D1
Mo = l ∗ + xh∗
D1 + D 2
Na Qual
l ∗ é o limite inferior da classe modal h∗ é a amplitude da classe modal
D1 = f ∗ − f (ant) D2 = f ∗ − f (post)
Assim para a distribuição
D1 = 11 − 9 = 2 e D2 = 11 − 8 = 3
D1 2 8
Mo = l ∗ + xh∗ ⇒ Mo = 158 + x4 ⇒ Mo = 158 +
D1 + D 2 2+3 5
⇒ Mo = 158 + 1, 6 = 159, 6
Logo
Mo = 159, 6

6.3.4 As Expressões Gráficas da Moda

6.4 Mediana
A mediana é a medida de posição definida como o número que se
encontra no centro de uma série de números, estando estes dispostos
segundo uma ordem. Ou seja, a mediana de um conjunto de valores,
ordenados segundo uma ordem de grandeza, é um valor situado de tal
modo no conjunto que o separa em dois subconjuntos de mesmo número
de elementos.

6.4.1 Mediana (Md ) Para Dados Não-Agrupados
Para se descobrir o elemento mediano de uma série devem-se seguir os
procedimentos abaixo:
Se N(número de elemntos do conjunto) for ímpar a mediana é o
termo de ordem P dado pela razão:
N +1
P=
2
e N(número de elemntos do conjunto) for par, a mediana é a média
aritmética dos termos de ordem, em um primeiro passo de P1(média
aritmética simples) e, em seguida, pelarazão P2(termo subsequente
da ordem P).
N N
P1 = e P2 = +1
2 2

Exemplos:
1- Determine o valor da mediana da série que é composta pelos seguintes
elementos: 56, 65, 58, 62, e 90.
Colocar os elementos em ordem: 56, 58, 62, 65 e 90
N = 5 (ímpar)
N +1 5+1
P= = = 3 ⇒ 3 elemento ⇒ Md = 62
2 2
2- Em uma pesquisa realizada a respeito de erros por folha, cometidos por
digitadores, revelou as seguintes quantidades: 12, 13.15, 13, 12, 18, 16, 20.
Determinar a quantidade mediana de falhas.
Colocar os dados em ordem: 12, 12, 13, 13, 15, 16, 18 e 20. N = 8 (par)
N 8
P1 = = =4
2 2
, 4° Elemento ⇒ Md = 13
N
P2 = +1=4+1=5
2
, 5° Elemento ⇒ Md = 15

Observações:
O valor da mediana pode coincidir ou não com um elemento da série.
Quando o número de elementos da série é ímpar, há coincidência. O
mesmo não acontece, porém, quando esse número é par.
Se uma lista de valores tem um número ímpar de elementos, a
mediana é o valor do meio, quando a lista se apresenta ordenada; se
a lista tem número par de elementos, então a mediana é a média dos
dois números mais próximos do meio.
A mediana e a média aritmética não têm, necessariamente, o mesmo
valor.

outro modo
Organizar os dados em um ROL
e fazer as média dos termos centrais.
12, 12, 13, 13, 15, 16, 18, 20

termos centrais:
13, 15
Efetuamos a média aritmética
13 + 15 28
= = 14
2 2

Exemplo:
Dada a série de valores 5, 13, 10, 2, 18, 15, 6, 16, 9, determine a média e a
mediana:
Colocando os elementos em ordem:
2, 5, 6, 9, 10, 13, 15, 16, 18
Média: x = 2+5+6+9+10+13+15+16+18
9 = 10, 4
Mediana: Md = 10

A mediana depende da posição dos valores dos elementos na série
ordenada. Essa é uma das diferenças marcantes entre a mediana e a
média (que se deixa influenciar, e muito, pelos valores extremos.
Exemplos:
5, 7, 10, 13, 15 ⇒ x = 10 e Md = 10
5, 7, 10, 13, 65 ⇒ x = 20 e Md = 10
Obs.: A média do segundo conjunto de valores é maior do que a do

primeiro, por influência dos valores extremos, ao passo que a
mediana permanece a mesma.
A mediana é designada, muitas vezes, por valor mediano.

6.4.2 Mediana (Md) Para Dados Agrupados sem Intervalos de Classe
Se os dados se agrupam em uma distribuição de frequência, o cálculo da
mediana se processa de modo muito semelhante àquele dos dados não
agrupados,implicando, porém, a determinação prévia das frequências
acumuladas. Precisa-se determinar um valor tal que divida a distribuição
em dois grupos que contenham o mesmo número de elementos. Para o
caso de uma distribuição,
P porém, a ordem, a partir de qualquer um dos
extremos, é dada por 2 fi .
Neste caso, é o bastante identificar a frequência acumulada
imediatamente superior à metade da soma das frequências. A mediana
será o valor da variável que corresponde à tal frequência acumulada.
Exemplo:

P
Sendo 2 fi = 342 = 17, a menor frequência acumulada que supera esse
valor é 18, que corresponde ao valor 2 da variável, sendo este o valor
mediano. Logo Md = 2 meninos.
Observação:
No caso
P de existir uma frequência acumulada (Fi ), tal que será dada por
Fi = 2 fi , a mediana dada por Md = xi +xi+1 , isto é, a mediana será a
média aritmética entre o valor da variável correspondente a essa
frequência acumulada e o seguinte.
Exemplo:
P
Temos: 2 fi = 82 = 4 = F3
Logo: Md = xi +x2 i+1 ⇒ Md = 15+16
2 = 31
2 = 15, 5
Donde: Md = 15, 5

6.4.3 Mediana (Md ) Para Dados Agrupados com Intervalos de Classe
Neste caso, o problema consiste em determinar o ponto do intervalo em
que está compreendida a mediana. Para tento, temos inicialmente que
determinar a classe na qual se acha a mediana – classe mediana. Tal
classe será, evidentemente, aquela correspondente
P à frequência
acumulada imediatamente superior a 2 fi Feito isto, um problema de
interpolação resolve a questão, admitindo-se, agora, que os valores se
distribuam uniformemente em todo o intervalo de classe. Assim,
considerando a distribuição da tabela abaixo, acrescida das frequências
acumuladas,
P
fi
temos: 2 = 40
2 = 20

Como há 24 valores incluídos nas três primeiras classes da distribuição e
como se pretende determinar o valor que ocupa o 20º lugar, a partir do
início da série, observa-se que este deve estar localizado na terceira classe
(i = 3), supondo que as frequências dessas classes estejam
uniformemente distribuídas. Como existem 11 elementos nessa classe e o
intervalo de classe é igual a 4, deve-se tomar, a partir do limite inferior, a
distância : , e a mediana será dada por:
Md = 158 + 11 7
· 4 = 158 + 28
11 = 158 + 2, 54 = 160, 54 Logo:
Md = 160, 5cm.
Passos para o cálculo da mediana: 1º) Determinam-se as frequências
acumuladas. P
2°) Calcula-se 2 fi
3°) Marca-se a classe correspondente
P à frequência acumulada
fi
imediatamente superior à 2 - classe mediana – e, em seguida,
emprega-se a fórmula.
P
fi
∗ 2 − F (ant) · h∗
Md = l +
f∗

na qual: l ∗ é o limite inferior da classe mediana. F (ant) é a frequência
acumulada da classe anterior à classe mediana. f ∗ é a frequência simples
da classe mediana. h∗ é a amplitude do intervalo da classe mediana.
Exemplo:
P
fi
2 2 = 20
= 40
Logo, a classe mediana é a de ordem 3. Então: l ∗ = 158, F (ant) = 13,
f ∗ = 11 e h∗ = 4. Substituindo esses valores na fórmula, obtém-se:
Md = 158 + (20−3)·4
11 · 4 = 158 + 28
11 = 158 + 2, 54 = 160, 54
Logo: Md = 160, 5cm.
Observações: P
No caso de existir uma frequência acumulada exatamente igual a 2 fi , a
mediana será o limite superior da classe correspondente.
Quando uma distribuição de números é razoavelmente simétrica, sem
valores extremamente altos ou baixos, os valores da média e da mediana,
em geral, são muito próximos um do outro.
Há ocasiões em que a mediana constitui melhor medida de tendência
central do que a média.
Exemplo:
Suponha que os valores abaixo representem vendas de pizza de muçarela
por um período de 9 dias. 36,35,37,29,39,36,340,35,36 Observe que,
certo dia, um grande ônibus com amantes de pizza de muçarela chegou
ao estabelecimento; as vendas desse tipo de pizza foram muito maiores
naquele dia.
Calculando a média desses valores obtém-se: . Entretanto, nenhum dos
valores está próximo de 69, 22. Ordenando então a relação: 340 – 39 –
37 – 36 – 36 – 36 – 35 – 35 – 29 .
Verifica-se então que a mediana é 36. Nesse caso, o valor da mediana dá
uma ideia muito melhor do número provável das vendas em determinado
dia. Em geral, quando uma relação de valores contém um valor extremo
(muito acima ou muito abaixo dos outros valores da lista), a média não é
uma medida muito representativa. A mediana constitui melhor medida de
tendência central. Mas a média é mais fácil de calcular, sendo, por isso,
utilizada com maior frequência.

6.4.4 Emprego da Mediana
Emprega-se a mediana quando:
deseja-se obter o ponto que divide a distribuição em partes iguais.
existem valores extremos que afetam de uma maneira acentuada a
média.
a variável em estudo é salário.
6.5 Posição Relativa da Média, Mediana e Moda.

Quando uma distribuição é simétrica, as três medidas coincidem. Porém,
a assimetria torna-as diferentes e essa diferença é tanto maior quanto
maior é a assimetria. Assim, em uma distribuição em forma de sino,
tem-se:
x < Md = Mo , no caso da curva simétrica
< Mo = Md < x, no caso da curva assimétrica positiva.
x < Md < Mo , no caso da curva assimétrica negativa.

6.6 Comparação Entre Média, Mediana e Moda

6.7 As Separatrizes
Outras medidas de posição, como os quartis, os decis e os percentis,
embora sejam medidas de posição, possuem uma característica muito
especial: separam os conjuntos em quantidades de iguais valores. Por
isso, essas medidas podem ser chamadas de separatrizes.
Alguns estudiosos de Estatística preferem chamar as separatrizes de

medidas de posição e a média, a mediana e a moda (que também são
medidas de posição), preferem chamar de medidas de tendência central.
Os autores não concordam quanto a melhor maneira de considerá-las.
Quartis, decis e percentis são medidas de posição, isto é, semelhantes às

medidas de tendência central, indicam uma determinada localização em
relação ao conjunto de dados em estudo. Entretanto, separam o conjunto
em 4 partes iguais (quartis), 10 partes iguais (decis) ou 100 partes iguais
(percentis), ou seja, em partes que apresentam o mesmo número de
valores. Por isso, alguns autores preferem as medidas de posição (quartis,
decis e percentis) de separatrizes (juntamente com a mediana).

6.7.1 Os Quartis
Denominam-se quartis os valores de uma série que a dividem em quatro
partes.
Existem, portanto, três quartis:
a) O primeiro quartil (Q1 ) – valor situado de tal modo na série que uma
quarta parte (25%) dos dados é menor que ele e as três quartas partes
restantes (75%) são maiores.
b) O segundo quartil (Q2 ) – evidentemente, coincide com a mediana

(Q2 = Md ).
c) O terceiro quartil (Q3 ) – valor situado de tal modo que as três quartas
partes (75%) dos termos são menores que ele e uma quarta parte (25%)
é maior.

Quando os dados são agrupados, para determinar os quartis usa-se a
mesma técnica
P do cálculo da mediana, bastando substituir, na fórmula da
mediana, 2 fi por:
P
k fi
4
sendo K o número de ordem do quartil. Assim, tem-se:
P
fi
∗ [ 4 − F (ant)] · h∗
Q1 = l +
f∗
P
fi
∗ [ 2 − F (ant)] · h∗
Q2 = l +
f∗
P
∗ [3 4
fi
− F (ant)] · h∗
Q3 = l +
f∗

Exemplo

6.7.2 Os percentis
Denominam-se percentis os noventa e nove valores que separam uma
série em 100 partes iguais.
Indicam-se: P1 , P2 , P3 , ..., P25 , ..., P50 , ..., P75 , ..., P99
É evidente que : P50 = Md ; P25 = Q1 e P75 = Q3
O cálculo de um percentil P segue a mesma técnica do cálculo da mediana,
no entanto, a fórmula 2 fi será substituída por:
P
k fi
100
sendo k o número de ordem do percentil.

Logo, P8 = 153, 2cm. Significa que 8% possuem estatura inferior a
153, 2%.

CAPÍTULO 7. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
7.1 Dispersão ou Variabilidade

As medidas de dispersão ou variabilidade são empregadas para descobrir
o grau de variabilidade ou dispersão dos valores observados em torno da
média aritmética. Servem para medir a representatividade da média e
destacam o nível de homogeneidade ou heterogeneidade dentro de cada
grupo estatístico analisado. Quando se trata de interpretar dados
estatísticos é necessário ter-se uma ideia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas. Assim, não é o bastante
dar uma das medidas de posição para caracterizar perfeitamente um
conjunto de valores. “Se uma pessoa comeu dois salgadinhos e outra não
comeu nenhum, em média cada uma comeu um salgadinho.” Essa frase,
que tem relação com a Estatística, não agradou muito àquele que ficou
com fome. Ao se fazer a média, há sempre informação que se perde. A
média, apesar de ser uma medida muito usada em Estatística, é muitas
vezes insuficiente para caracterizar uma distribuição. A moda e a mediana
também são medidas que não informam muito sobre como as variáveis se
alteram. Por isso, foi preciso e ncontrar outro indicador que informasse
sobre a maneira como os dados se distribuem em torno da média.
Exemplo:
Um empresário deseja comparar o desempenho de dois empregados, com
base na produção diária de determinada peça, durante cinco dias.
Empregado A: 70, 71, 69, 70, 70 ⇒ 70

Empregado B: 60, 80, 70, 62, 83 ⇒ 71
O desempenho médio do empregado A é de 70 peças produzidas

diariamente, enquanto que a do empregado B é de 71 peças. Com base
na média aritmética, verifica- se que o desempenho de B é melhor do que
o de A. No entanto, observando bem os dados, percebe-se que a
produção de “A” varia apenas de 69 a 71 peças, ao passo que a de “B”
varia de 60 a 83 peças, o que revela que o desempenho de A é bem mais
uniforme do que o de B. Portanto, para qualificar os valores de uma dada
variável, ressaltando a maior ou menor dispersão ou variabilidade entre
esses valores e a sua medida de posição, a Estatística recorre às medidas
de dispersão. Dessas medidas, serão destacadas neste estudo a amplitude
total, a variância, o desvio padrão e o coeficiente de variação.

7.2 Amplitude Total
7.2.1 Dados não-agrupados

A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x(max) − x(min)
Exemplos:
a) Para os valores: 40, 45, 48, 52, 54, 62 e 70 Tem-se: AT = 70 − 40 = 30

b) Para a situação sugerida anteriormente.
Empregado A: 70, 71, 69, 70, 70 ⇒ 70

Empregado B: 60, 80, 70, 62, 83 ⇒ 71
Empregado A ⇒ AT = 71 − 69 = 2
Empregado B ⇒ AT = 83 − 60 = 23

Resumo

7.2.2 Dados agrupados
7.2.2.1 Sem intervalo de classe

Neste caso, tem-se: AT = x(máx) – x(mín) Considerando a tabela abaixo.
AT = 4 − 0 = 4

7.2.2.2 Com intervalos de classe
Neste caso, a amplitude total é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe.

Considerando a tabela abaixo.
AT= 174 – 150 = 24, logo AT = 24 cm. A amplitude total tem o

inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários, o que quase sempre
invalida a idoneidade do resultado. Ela é apenas uma indicação
aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total
quando se quer determinar a amplitude da temperatura em um dia ou no
ano, no controle de qualidade ou como uma medida de cálculo rápido, e
quando a compreensão popular é mais importante que a exatidão e a
estabilidade.

7.3 Desvio Médio (Dm )
Vamos verificar o desvio do valor que representa a produção diária de
cada empregado em relação à média aritmética. O desvio médio é
calculado pela média aritmética dos valores absolutos dos desvios.
Exemplo:
Empregado A: 70, 71, 69, 70, 70 ⇒ 70

Empregado B: 60, 80, 70, 62, 83 ⇒ 71
|70−70|+|71−70|+|69−70|+|70−70|+|70−70|
Dm = 5 = 0+1+1+0+0
5 = 25 = 0, 4
|60−71|+|80−71|+|70−71|+|62−71|+|83−71|
Dm = 5 = 11+9+1+9+12
5 = 42
5 = 8, 4
Há duas medidas estatísticas, a variância e o desvio padrão, que

informam sobre a maior ou menor dispersão dos dados em torno da
média. Para obter essas med idas de dispersão, parte-se da diferença que
cada valor tem em relação à média. Essa diferença chama-se desvio.O
significado do desvio em Estatística é o mesmo atribuído a esse termo na
linguagem comum.

Quando se diz, por exemplo, que um navio desviou de sua rota, isso
significa que havia um percurso a ser seguido e que o navio se desviou
dele. Em Estatística, considerando a Média Aritmética como referência,
ela seria o valor provável para todos os dados, mas eles se desviam da
média

7.4- Variância (Var )
O desvio médio é uma boa medida de dispersão porque dá a distância
média de cada número em relação à média. No entanto, para muitas
finalidades, é mais conveniente elevar ao quadrado cada desvio e tomar a
média de todos esses quadrados. Essa grandeza é chamada variância.
Exemplo:
Empregado A: 70, 71, 69, 70, 70 ⇒ 70

Empregado B: 60, 80, 70, 62, 83 ⇒ 71
2
+|71−70|2 +|69−70|2 +|70−70|2 +|70−70|2 02 +12 +12 +02 +02
Var = |70−70| 5 = 5 =
5 = 0, 4
2
|60−71|2 +|80−71|2 +|70−71|2 +|62−71|2 +|83−71|2 112 +92 +12 +92 +122
Var = 5 = 5 =
121+81+1+81+144
5 = 428
5 = 85, 6

Notas:
Dado um conjunto de dados, a variância é uma medida de dispersão
que mostra o quão distante cada valor desse conjunto está do valor
central (médio).
Quanto menor é a variância, mais próximos os valores estão da
média; mas quanto maior ela é, mais os valores estão distantes da
média.

7.5- Desvio Padrão (DP )
7.5.1 Introdução
A variância é uma boa medida de dispersão, mas tem uma desvantagem:
é difícil interpretar o valor numérico da variância. Uma variância de 85,6
significa uma grande dispersão ou uma pequena dispersão? Parte do
problema se deve à questão das unidades: a variância é medida em uma
unidade que é o quadrado da unidade de medida. Em geral, é mais
conveniente calcular a raiz quadrada da variância, chamada desvio
padrão. Quanto maior for o desvio padrão, maior será a heterogeneidade
entre os valores que estão sendo analisados. Isso significa, portanto, que
quanto maior for o desvio padrão, maior será a variação entre os valores.

Exemplo:
Empregado A: 70, 71, 69, 70, 70 ⇒ 70
Empregado B: 60, 80, 70, 62, 83 ⇒ 71
2 2 2 2 2
02 +12 +12 +02 +02
Var = |70−70| +|71−70| +|69−70| +|70−70| +|70−70|
= =
√ √
5 5
2
= 0, 4 ⇒ D p = V ar = 0, 4 ∼
= 0, 63
5
|60−71|2 +|80−71|2 +|70−71|2 +|62−71|2 +|83−71|2 2 2 2 2

+122
Var = = 11 +9 +15 +9 =
5 √ √
121+81+1+81+144
5 5 = 85, 6 ⇒ Dp =
= 428 Var = 85, 6 ∼
= 9, 25
Observações:
Quanto menor o desvio padrão, mais os valores da variável se

aproximam de sua média.
Quanto maior o desvio padrão, mais significativa a heterogeneidade

entre os elementos de um conjunto, ou seja, maior será a variação
entre os valores.

7.5.2 Aplicação prática do desvio padrão
O desvio padrão é um parâmetro muito usado em Estatística e indica o
grau de variação de um conjunto de elementos.
Exemplificando:
Se medirmos a temperatura máxima durante três dias em uma cidade e

obtivermos os seguintes valores, 28º, 29º e 30º, podemos dizer que a
média desses três dias foi 29º.Em outra cidade, as temperaturas máximas
nesses mesmos dias podem ter sido 22º, 29º e 35º. No segundo caso, a
média dos três dias também foi 29º.
As médias têm o mesmo valor, mas os moradores da primeira cidade
viveram três dias de calor, enquanto os da segunda tiveram dois dias de
calor e um de frio.Para diferenciar uma média da outra, foi criada a
noção de desvio padrão, que serve para dizer o quanto os valores dos
quais se extraiu a média são próximos ou distantes da própria média. No
exemplo acima, o desvio padrão da segunda cidade é muito maior que o
da primeira. Uma das aplicações mais comuns do desvio padrão é para
cálculo da classificação no vestibular. Se dois candidatos ao mesmo curso
tiram nota 7 em provas diferentes, o peso desse resultado vai depender
do desvio padrão de cada exame.
7.5.3 Aplicação da Fórmula de Desvio Padrão
rP
p (xi − x)2
Dp = Var ⇒ Dp =
n
Tanto o desvio padrão como a variância são usados como medidas de
dispersão ou variabilidade. O uso de uma ou de outra dependerá da
finalidade que se tenha em vista. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística e em combinações de amostras.Se
bem que a fórmula dada para o cálculo do desvio seja a que torna mais
fácil a sua compreensão, ela não é uma boa fórmula para fins de
computação, pois em geral, a média aritmética x é um número
fracionário, o que torna pouco prático o cálculo das quantidades (xi − x)2 .
Os cálculos podem ser simplificados fazendo uso da igualdade:
(xi )2
X X P
(xi − x)2 = (xi )2 −
n

Assim, substituindo (xi − x)2 por seu equivalente obtém-se:
P
r rP
xi2
P P
X
2 ( xi )2 xi 2
Dp = xi − ⇒ Dp = −( )
n n n

7.5.4 Desvio Padrão (Dp ) com dados não-agrupados
Exemplo: Considerar o conjunto de valores da variável
x : 40, 45, 48, 52, 54, 62, 70.
O modo mais prático para se obter o desvio padrão é formar uma tabela
com duas colunas: uma para xi e outra para xi2 . Assim:

com n = 7, tem-se:
rP
xi2
P
xi 2
Dp = −( )
n n
20293 371 2 p
r
√
Dp = −( ) = 2899 − 532 = 2899 − 2809
7 7
√
= 90 = 9, 486
Logo, o desvio padrão é 9,49

7.5.5 Desvio Padrão (DP ) com dados agrupados
7.5.5.1 Sem intervalos de classe

Como, neste caso, tem-se a presença de frequências, deve-se levá-las em
consideração,
q resultando a fórmula:
fi xi2 fi xi 2
P P
Dp = n −( n )
Exemplo:
Considerando a distribuição da tabela abaixo, calcular o desvio padrão.
O modo mais prático para se calcular o desvio padrão é abrir, na tabela

dada, uma coluna para os produtos fi xi e outra para fi xi2 , lembrando que
para se obter fi xi2 , basta multiplicar cada fi xi pelo seu respectivo xi .
Assim:
rP
xi2
P
xi 2
Dp = −( )
n n
165 63
r
− ( )2 = 5, 5 − 4, 41 = 1, 09 = 1, 044
p p
Dp =
30 30
Logo: DP = 1, 04.

7.5.5.2 Com intervalos de classe
Exemplo:
rP
xi2
P
xi 2
Dp = −( )
n n
1038080 6440 2 √ √
r
DP = −( ) = 25952 − 25921 = 31 = 5, 567
40 40
Logo, o desvio padrão é 5, 57cm.
7.5.6 Desvio Padrão (DP ) pelo processo breve
Baseados na mudança da variável x por outra y, tal que:
xi − x0
yi =
h
pode-se obter um processo breve de cálculo com a aplicação da seguinte
fórmula.
rP
fi yi2
P
fi xi 2
Dp = h · −( )
n n

Exemplo:
rP
0 10
r
fi yi2
P
fi xi 2
) =4· − ( )2 = 4 · 2 − 0, 0625
p
Dp = h · −(
n n 40 40
4· 1, 9375 = 4 · 1, 3919
p
Logo DP = 5, 57cm.

Fases para o cálculo do desvio padrão pelo processo breve:
1 Abrimos uma coluna para os valores xi (ponto médio);
2 Escolhemos um dos pontos médios (de preferência o de maior
frequência) para o valor de x0 ;
3 Abrimos uma coluna para os valores de y1 e escrevemos zero na
linha correspondente a classe onde se encontra o valor de x0 ; a
sequência −1, −2, −3, ..., logo acima do zero, e a sequência
1, 2, 3, ..., logo abaixo;
4 Abrimos uma coluna para os valores do produto fi yi , conservando os
sinais + ou −, e, em seguida, somamos algebricamente esses
produtos;
5 Abrimos uma coluna para os valores do produto fi yi2 , obtidos
multiplicando cada fi yi ;
pelo seu respectivo yi , e, em seguida, somamos esses produtos;
6 Aplicamos a fórmula.

7.6 Coeficiente de Variação (CV )
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio
padrão de duas unidades pode ser considerado pequeno para uma série de
valores cujo valor médio é 200; no entanto, se a média for igual a 20, o
mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos
dados limita o seu emprego quando desejamos comparar duas ou mais
séries de valores, relativamente à sua dispersão ou variabilidade, quando
expressas em unidades diferentes.Para contornar essas dificuldades e
limitações, podemos caracterizar a dispersão ou variabilidade dos dados
em termos relativos a seu valor médio, medida essa denominada
coeficiente de variação (CV ).

Exemplo:
Considerando a distribuição da tabela abaixo, na qual a média é 161cm e
o desvio padrão é igual a 5, 57cm, calcular o coeficiente de variação (CV ).
Desvio padrao 5, 57
Cv = · 100 = · 100 = 0, 03459 · 100 = 3, 459
Media 161
Logo CV = 3, 5%.

Nota:
Se bem que, para qualificar a dispersão de uma distribuição, seja mais
proveitoso o coeficiente de variação, não devemos deduzir daí que a
variância e o desvio padrão careçam de utilidade. Pelo contrário, são
medidas muito úteis no tratamento de assuntos relativos à inferência
estatística.
Observações:
O coeficiente de variação fornece a variação dos dados obtidos em

relação à média. Quanto menor for o seu valor, mais homogêneos serão
os dados. O coeficiente de variação é considerado baixo (apontando um
conjunto de dados bem homogêneos) quando for menor ou igual a 25%.
O fato de o coeficiente de variação ser dado em valor relativo nos permite
comparar séries de valores que apresentam unidades de medida distintas.

Exemplo:
Compare a variabilidade relativa do tempo de reação de um analgésico A
com a variabilidade do peso das pessoas que se submeteram à dosagem
desse analgésico. As médias e os desvios padrão foram.
Analgésico A: Média =3 min e DP = 0, 71

Peso das pessoas: Média =58,25 kg e DP = 5, 17
Solução:
Vamos calcular o coeficiente de variação para cada item observado.

Cálculo para o tempo de reação do analgésico.
Cv = 100 · 0,71
3 = 23, 67%
Cálculo para o peso das pessoas
Cv = 100 · 5,17
58,25 = 8, 88%

Comparando o coeficiente de variação do tempo de reação do analgésico
e o do peso das pessoas, podemos concluir que os dados referentes ao
peso são mais consistentes que os dados referentes ao tempo de reação
do analgésico, ou ainda, que os dados referentes ao peso são mais
homogêneos que os do tempo de reação do analgésico.
Observações:

CAPÍTULO 8. Medidas de Assimetria. Medidas de Curtose
8.1 Medidas de Assimetria
8.1.1 Introdução
As medidas de assimetria indicam o grau de assimetria de uma
distribuição de frequências unimodal em relação a uma linha vertical que
passa por seu ponto mais elevado. Sendo a distribuição simétrica, a
média e a moda coincidem; sendo a distribuição assimétrica à esquerda
ou negativa, a média é menor que a moda; e sendo assimétrica à direita
ou positiva, a média é maior que a moda.
Uma distribuição de frequências com classes é simétrica quando:
Média = Mediana = Moda.

Graficamente, uma distribuição simétrica tem associada a si uma curva de
frequências unimodal apresentando duas “caudas” simétricas em relação a
uma linha vertical que passa por seu ponto mais alto (eixo de simetria).

Uma distribuição assimétrica tem associada a si uma curva de
frequências unimodal que apresenta a partir do seu ponto mais alto, uma
“cauda” mais longa para a direita (assimetria positiva) ou para a
esquerda (assimetria negativa).Nas distribuições assimétricas os valores
da moda, da mediana e da média divergem sendo que a média sempre
estará do mesmo lado que a cauda mais longa.
Uma distribuição de frequências com classes é assimétrica à esquerda ou
negativa quando:
Média < Mediana < Moda.

Uma distribuição de frequências com classes é assimétrica à direita ou
positiva quando:
Média > Mediana > Moda.

Para fazer a classificar do tipo de assimetria através de cálculo, tem-se a
seguinte relação:

Exemplos: 1-Determinar os tipos de assimetria das distribuições abaixo.
Calcular a média ( x), a mediana (Md ), a moda (M0 ) e o desvio

padrão(s) para cada distribuição.
Calcular o tipo de assimetria.

Construir os gráficos das distribuições anteriores.
2- Dada a figura a seguir, pode-se afirmar que
A) a moda é maior do que a mediana e menor do que a média.

B) a moda é menor do que a mediana e maior do que a média.
C) a moda é menor do que a mediana e menor do que a média.
D) a mediana é maior do que a média e menor do que a moda.
Resposta: Letra B.
8.1.2 Coeficiente de Assimetria
Um coeficiente de assimetria quantifica o desvio de uma distribuição em
relação a uma distribuição simétrica e o sinal resultante do seu cálculo
indica o tipo de assimetria da distribuição.
Coeficiente de Assimetria de Person
3(x − Md )
AS =
Dp
ou
3(x − Md )
AS =
S
Obs.: Desvio Padrão: Dp ou S
Se 0, 15 < |AS | < 1, a assimetria é considerada moderada; |AS | > 1, é

forte.

Exemplo:
Calcular o coeficiente de assimetria.

8.2 Medidas de Curtose
8.2.1 Introdução
Denomina-se curtose o grau de achatamento de uma distribuição em
relação a uma distribuição padrão, denominada curva normal (curva
correspondente a uma distribuição teórica de probabilidade). Embora seja
comum explicar a curtose como o “grau de achatamento” de uma
distribuição de frequências, o que as medidas de curtose buscam indicar
realmente é o grau de concentração de valores da distribuição em torno
do centro desta distribuição. Numa distribuição unimodal, quanto maior
for a concentração de valores em torno do centro da mesma, maior será o
valor de sua curtose. Graficamente, isso será associado a uma curva com
a parte central mais afilada, mostrando um pico de frequência simples
mais destacado, mais pontiagudo, caracterizando a moda da distribuição
de forma mais nítida.

Uma distribuição de frequência pode ser classificada como
Mesocúrtica – quando apresenta uma medida de curtose igual à da

distribuição normal.
Platicúrtica – quando apresenta uma medida de curtose menor que a da
Leptocúrtica – quando apresenta uma medida de curtose maior que a da

8.2.2 Coeficiente de Curtose
Uma fórmula para a medida da curtose é
Q3 − Q1
C=
2(P90 − P10 )
Essa fórmula é conhecida como coeficiente percentílico de curtose. Esse
coeficiente é definido como o quociente entre a amplitude
semi-interquatílica e a amplitude entre o 10º e o 90º percentis.
O valor deste coeficiente para a curva normal é 0, 26367....,C ∼

= 0, 263
Assim sendo, ao se calcular o coeficiente percentílico de curtose de
umadistribuição qualquer tem-se:
Quando C ∼
= 0, 263 diz-se que a distribuição é mesocúrtica.
Quando C < 0, 263 diz-se que a distribuição é platicúrtica.
Quando C > 0, 263 diz-se que a distribuição é leptocúrtica.

Exemplo:
Sabendo-se que uma distribuição apresenta as medidas a seguir:
Q1 = 24, 4cm; Q3 = 41, 2cm ; P10 = 20, 2cm e P90 = 49, 5cm, tem – se:
C= Q3 −Q1
2(P90 −P10 ) = 41,2−24,4
2(49,5−20,2 = 16,8
58,6 = 0, 2866 ⇒ C = 0, 287
Como 0, 287 > 0, 263, conclui-se que a distribuição é platicúrtica, em

relação à normal.

CAPÍTULO 9 PROBABILIDADE
9.1 Introdução
Embora o cálculo das probabilidades pertença ao campo da Matemática,
sua inclusão neste curso se justifica pelo fato de a maioria dos fenômenos
de que trata a Estatística ser de natureza aleatória ou probabilística.
Consequentemente, o conhecimento dos aspectos fundamentais do
cálculo de probabilidades é uma necessidade essencial para o estudo de
Estatística Indutiva ou Inferencial. Lembrando,também, que a Estatística
é um ramo da Matemática. O estudo das probabilidades foi motivado
inicialmente pelos jogos, encontrando posteriormente aplicações em
outros campos, como a genética, a medicina, a economia, a política e
outros setores da atividade humana em que há necessidade de prever a
ocorrência de determinado fato.

9.2 A linguagem das probabilidades
A teoria das Probabilidades utiliza uma linguagem muito própria que é
preciso assimilar.
Experimento aleatório: Experimento aleatório é todo experimento que,
mesmo repetido, várias vezes, sob condições semelhantes, apresenta
resultados imprevisíveis, dentre os resultados possíveis.
Exemplos:
a) Lançamento de uma moeda.
b) Lançamento de um dado.
c) Loteria de números.
d) Extração de uma carta de baralho.
e) Abrir um livro ao acaso e ver o número de página.
f) Escolher um aluno ao acaso e perguntar-lhe quantos irmãos tem.

Espaço Amostral: Espaço amostral de um experimento aleatório é o
conjunto de todos os resultados possíveis desse experimento.
Notação: S
Exemplos:
a) No lançamento de uma moeda, temos S = cara, coroa b) No
lançamento de um dado (perfeito), temos S = 1,2,3,4,5,6
Evento: Evento é todo subconjunto de um espaço amostral S de um
experimento aleatório.
Notação: E
Exemplos:
a) No lançamento de duas moedas
E1 : aparecem faces iguais
E1 = {(c, c), (k, k)}; portanto, o número de elementos do evento E1 é
n(E1 ) = 2.
E2: aparece cara em pelo menos 1 face E2 = {(c, c), (c, k), (k, c)};
portanto, o número de elementos do evento E2 é n(E2 ) = 3.

b) No lançamento de dois dados
E1 : aparecem números iguais
E1 = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}; portanto, o número de
elementos do evento E1 é n(E1 ) = 6.
E2 : o primeiro número é menor ou igual a 2.
E2 = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2),
(2,3),(2,4),(2,5),(2,6)};
portanto, o número de elementos do evento E2 é n(E2 ) = 12.
Alguns eventos particulares, através de exemplos:

Evento certo: evento que possui os mesmos elementos do espaço
amostral, (E = S).
E3 : a soma dos resultados nos dois dados é menor ou igual a 12.
Evento impossível: evento igual ao conjunto vazio.
E4 : o número do primeiro dado é igual a 7.
E4 = ∅
Evento simples (ou elementar): evento que possui um único elemento.
E5 : a soma dos resultados nos dois dados é igual a 12. E5 = {(6, 6)}

Evento complementar: se A é um evento de um espaço amostral S, o
evento complementar de A indicado por A, AC ou A é tal, que
AC = S − A.
Ex.: a) A probabilidade de se realizar um evento é 1/5, a probabilidade
de que ele não ocorra é 1 − 1/5 = 4/5.
b) Sabendo que a probabilidade de tirar o 4 no lançamento de um dado é
1/6. Logo, a probabilidade de não tirar o 4 no lançamento de um dado é
1 − 1/6 = 5/6.
Eventos mutuamente exclusivos: quando a realização de um evento
exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda,
o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos,
já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são
mutuamente exclusivos, a probabilidade de que um ou outro se realize é
igual à soma das probabilidades de que cada um se realize. p = p1 + p2 .

Ex.: Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é:
p = 1/6 + 1/6 = 2/6 = 1/3, pois os dois eventos são mutuamente
exclusivos.
Dois eventos são mutuamente exclusivos quando a ocorrência de um
implica a não-ocorrência do outro. Se A e B são eventos mutuamente
exclusivos, então A ∩ B = ∅
Eventos independentes: Dois eventos independentes quando a
realização ou a não-realização de um dos eventos não afeta a
probabilidade da realização do outro e vice-versa. Quando lançamos dois
dados, o resultado obtido em um deles independe do resultado no outro.
Se dois eventos são independentes, a probabilidade de que se realizem
simultaneamente é igual ao produto das probabilidades de realização dos
dois eventos. p = p1 × p2 .
Ex.: No lançamento de dois dados, qual é a probabilidade de se obter 1
no primeiro dado e 5 no segundo dado?
p = 1/6 × 1/6 = 1/36.

9.3 Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de
acontecer, ou seja , que S é um conjunto equiprovável.
Chamamos de probabilidade de um evento A o número real P(A), tal que:
n(A)
P(A) =
n(S)
Onde:
n(A) = é o número de elementos do evento A.
n(S) = é o número de elementos do espaço amostral S.
Ou melhor, se em um fenômeno aleatório as possibilidades são
igualmente prováveis, então a probabilidade de ocorrer um evento A é:
numero de casos favoraveis

P(A) =
numero de casos possiveis

Exemplos:
Considerando o lançamento de um dado, calcular
a) a probabilidade do evento A “obter um número ímpar na face superior”.
S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6
A = {1, 3, 5} ⇒ n(A) = 3
n(A) 3 1
P(A) = = = ou 50%
n(S) 6 2
b) a probabilidade do evento B “obter um número menor ou igual a 6 na

face superior”.
S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6
B = {1, 2, 3, 4, 5, 6} ⇒ n(B) = 6
n(B) 6
P(A) = = = 1 ou 100%
n(S) 6

c) a probabilidade do evento C “obter o número 4 na face superior”.
S = {1, 2, 3, 4, 5, 6}(S) = 6
C = {4} ⇒ n(C ) = 1
n(C ) 1
P(A) = =
n(S) 6
d) a probabilidade do evento D “obter um número maior que 6 na face

superior”.
S = {1, 2, 3, 4, 5, 6}(S) = 6
D = {} ⇒ P(D) = 06 = 0
Pelos exemplos, pode-se concluir que, sendo n(S) = n:
a) a probabilidade de um evento E qualquer é um número P(E ), tal que
0 ≤ P(E ) ≤ 1.
b) a probabilidade do evento certo é igual a 1: P(S) = 1.
c) a probabilidade de um evento elementar E qualquer é, lembrando que
n(E ) = 1 :
1
P(E ) =
n
d) a probabilidade do evento impossível é igual a zero: P(∅) = 0.
CAPÍTULO 10. DISTRIBUIÇÃO BINOMIAL E NORMAL

10.1 Variável aleatória
Definição: Tomando S um espaço amostral, e tomando por um número
cada ponto amostral, assim sendo, definimos uma função variável
aleatória representada por uma letra maiúscula, e seus valores
representados por letras minúsculas.
Exemplo:
Seja um lançamento de uma moeda o espaço
S=(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co), e X representando o número de
caras, e assim sendo, cada ponto amostral de X tomando um número,
teremos:

10.2 Distribuição de probabilidade
Tomemos a seguinte distribuição de frequência do número de acidentes
diários em um estacionamento:
Em um dia, temos as seguintes probabilidades:

não acorrer acidente é:
30 = 0, 73
p = 22
ocorrer um acidente é:
5
p = 30 = 0, 17

ocorrerem dois acidentes é:
2
p = 30 = 0, 07
ocorrerem três acidentes é:
1
p = 30 = 0, 03
Daí temos:
chamamos essa tabela de distribuição de probabilidade.

Assim,

Logo, podemos escrever
Note, que se tomando a distribuição de probabilidade, temos uma

correspondência unívoca entre os valores de X e os valores da variável P.
Assim definimos uma função, a função probabilidade de domínio
xi (i = 1, 2, ..., n) e de conjunto imagem pi (i = 1, 2, 3, ..., n), e
representamos como
f (x) = P(X = xi )
A função P(X = xi ) determina a distribuição de probabilidade da
variável aleatória X.

Assim, associando cada X a um único P(X), temos:

10.3 Distribuição Binomial
Considerando-se um experimento aleatório, observa-se a probabilidade
deocorrer um evento E (sucesso), assim como seu complementar E’
(insucesso), em n tentativas independentes. A probabilidade de
ocorrerem k sucessos e (n − k) fracassos é dada pelo termo geral do
Binômio de Newton (p + q)n .
P = kn · p k · q n−k Sendo p a probabilidade de sucesso em cada tentativa

e q = 1 − p a probabilidade de fracasso. “Sucesso” e “fracasso” aqui

apenas apresentam ocorrências que se excluem e se complementam.
Se ocorre um sucesso, não ocorre um fracasso, e vice-versa.

Sucesso e fracasso cobrem todas as possibilidades, não há ocorrência
diferente dessas.

Exemplos:
a) Uma moeda é lançada 6 vezes seguidas. Determine a probabilidade de
se obter cara 4 vezes nos 6 lançamentos.
Sendo p a probabilidade de se obter cara, p = 12 , e q a probabilidade de
se obter coroa, q = 1 − 12 = 12 . Como n = 6 e k = 4, tem – se :
P = kn · p k · q n−k
10.4 Distribuição normal. Curva normal

Estatística

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Exemplo: Crescimento do pé de feijão

Água, sol e algodão produzem o crescimento do pé de feijão

Com isso, vemos que a água é necessária e suficiente para o crescimento

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

4.1 GRÁFICOS ESTATÍTICOS

Hudson Félix Estatística

4.2.1 Gráfico em linha ou em curva

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

5.1 Tabela Primitiva ROL

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

5.3.2 Limites de classe

Hudson Félix Estatística

Hudson Félix Estatística

Assim, o ponto médio da segunda classe, no exemplo citado

Hudson Félix Estatística

Hudson Félix Estatística

Não havendo possibilidade de engano, usa-se:

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Hudson Félix Estatística

Assim, no exemplo apresentado, anteriormente, a frequência acumulada