Você está na página 1de 20

Matemática | Material Complementar

Prof. Altevir Carneiro | fb.com/profaltevir

EDITAL ANTERIOR | PRF 2013 | Matemática


 Noções de estatística.

ESTATÍSTICA
Exprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma
característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os
chamados dados referentes a esses elementos.

Podemos dizer, então, que:


A Estatística é a ciência que fornece métodos para a coleta, organização, descrição, análise e
interpretação de dados para a utilização dos mesmos na tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a
análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido de organização e


descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.),
desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que
permitam conclusões que transcendam os dados obtidos inicialmente.

Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa
(por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento,
produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação.

O diagrama abaixo resume caminho percorrido ao se fazer estatística.

VARIÁVEIS
A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:
 para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;
 para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos
números naturais: 0, 1, 2, 3, ..., n;
 para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um
número infinito de valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos acima


nos dizem que uma variável pode ser:

-1-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

a) qualitativa: quando seus valores são expressos por atributos: sexo (masculino – feminino), cor
da pele (branca, preta, amarela, vermelha, parda), etc. Uma variável qualitativa que pode ser
ordenada recebe o nome de variável ordinal, como por exemplo: classificação (primeiro,
segundo, terceiro), patente (sargento, tenente, major), etc. Quando não pode ser ordenada, a
variável qualitativa recebe o nome de variável nominal.
b) quantitativa: quando seus valores são expressos em números (salários dos operários, idade dos
alunos de uma escola, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer
valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir
valores pertencentes a um conjunto enumerável recebe o nome de variável discreta.

Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto IN = {1,
2, 3, ..., 58, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325, etc. Logo, é uma variável discreta. Já
o peso desses alunos é uma variável contínua, pois um dos alunos tanto pode pesar 72 kg, como 72,5
kg, como 72,54 kg, etc., dependendo esse valor da precisão da medida.

De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a


variáveis discretas.

Designamos as variáveis por letras latinas, em geral, as últimas:


x, y, z

Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um dado fenômeno. Fazendo uso da
letra x para indicar a variável relativa ao fenômeno considerado, temos:
𝑥 ∈ {2, 3, 5, 8}
O diagrama abaixo resume a classificação das variáveis estatísticas

POPULAÇÃO E AMOSTRA
Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos
população estatística ou universo estatístico.

Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma
característica comum: são os que estudam.

Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características dos
elementos de alguma população, esta característica deve estar perfeitamente definida. E isto se dá
quando, considerado o elemento qualquer, podemos afirmar, sem ambiguidade, se esse elemento
pertence ou não à população. É necessário, pois, existir um critério de constituição da população, válido
para qualquer pessoa, no tempo ou no espaço.

Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de Ensino Fundamental,
precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam carteiras das
escolas, ou devemos incluir também os que já passaram pela escola? É claro que a solução do problema
vai depender de cada caso em particular.

-2-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as


observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte
proveniente da população em estudo denominamos amostra.

Uma amostra é um subconjunto finito de uma população.

Como vimos anteriormente, a Estatística Indutiva tem por objetivo tirar conclusões sobre as populações,
com base em resultados verificados em amostras retiradas dessa população.

Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa da
população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz
respeito ao fenômeno que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão
ser usadas sejam obtidas por processos adequados.

Há casos, como o de pesquisas sociais, econômicas e de opinião, em que os problemas de amostragem


são de extrema complexidade. Mas existem também casos em que os problemas de amostragem são
bem mais fáceis. Como exemplo, podemos citar a retirada de amostras para controle de qualidade dos
produtos ou materiais de determinada indústria.

MEDIDAS DE POSIÇÃO

O estudo que fizemos sobre a Estatística até esse momento, especialmente sobre as distribuições de
frequência, nos permite descrever, de modo geral, os grupos dos valores que uma variável pode assumir.
Dessa forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se
ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.

Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou em


confronto com outras, necessitamos introduzir conceitos que se expressem através de números, que nos
permitam traduzir essas tendências. Esses conceitos são denominados elementos típicos de
distribuição e são as:

a) medidas de posição;
b) medidas de variabilidade ou dispersão;
c) medidas de assimetria;
d) medidas de curtose.

-3-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Dentre os elementos típicos, destacamos, nesta seção as medidas de posição – estatísticas que
representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo
horizontal (eixo das abscissas).

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal
denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores
centrais. Dentre as medidas de tendência central, destacamos:

a) a média aritmética;
b) a mediana;
c) a moda.

As outras medidas de posição são as separatrizes, que englobam:

a) a própria mediana;
b) os quartis;
c) os percentis.

MÉDIA ARITMÉTICA – DADOS NÃO AGRUPADOS

Sejam x1, x2, ..., xn, portanto n valores da variável X. A média aritmética simples, ou simplesmente
média de X, representada por 𝒙 ̅ é definida por:

ou simplesmente

onde n é o número de elementos do conjunto.

Exemplo:
Determinar a média aritmética simples dos valores: 3, 7, 8, 10, 11.

Observação: O símbolo 𝜇 (mi) é usado para denotar a média de uma população e 𝑥̅ (x barra) para
denotar a média de uma amostra.

VANTAGENS E DESVANTAGENS DA MÉDIA


1. É uma medida de tendência central que, por uniformizar os valores de um conjunto de dados,
não representa bem os conjuntos que revelam tendências extremas.
2. Não necessariamente tem existência real, isto é, nem sempre é um valor que faça parte do
conjunto de dados, para bem representá-lo, embora pertença obrigatoriamente ao intervalo entre
o maior e o menor valor.
3. É facilmente calculada.
4. Serve para compararmos conjuntos semelhantes.

-4-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Importante: Nem sempre a média é o valor da variável que ocorre com maior frequência e, não é,
necessariamente, o ponto central da distribuição (ponto que divide as observações exatamente na
metade). A média pode ser tomada como o “centro de gravidade”, isto é, o ponto de qualquer distribuição
em torno do qual se equilibram as discrepâncias (resíduos, afastamento ou desvios) positivas e
negativas.

PROPRIEDADES DA MÉDIA
P1) A média de um conjunto de dados que não varia, ou seja, cujos valores são uma constante,
é a própria constante.
Exemplo:
Considere os seguintes dados: 16, 16, 16, 16, 16, 16.
Sua média é 𝒙̅ = 𝟏𝟔

P2) A soma algébrica dos desvios tomados em relação à média é nula.


Exemplo:
Considere os seguintes dados: 10, 14, 13, 15, 16, 18, 12.
Sua média é

𝟏𝟎 + 𝟏𝟒 + 𝟏𝟑 + 𝟏𝟓 + 𝟏𝟔 + 𝟏𝟖 + 𝟏𝟐
̅=
𝒙 = 𝟏𝟒
𝟕

Chamamos de desvio em relação à média a diferença denotada por Di definida por


̅
𝒅𝒊 = 𝒙𝒊 − 𝒙

Assim, no exemplo dado, temos:


̅ = 𝟏𝟎 − 𝟏𝟒 = −𝟒
𝒅𝟏 = 𝒙𝟏 − 𝒙 ̅ = 𝟏𝟒 − 𝟏𝟒 = 𝟎
𝒅𝟐 = 𝒙𝟐 − 𝒙
̅ = 𝟏𝟑 − 𝟏𝟒 = −𝟏
𝒅𝟑 = 𝒙𝟑 − 𝒙 ̅ = 𝟏𝟓 − 𝟏𝟒 = 𝟏
𝒅𝟒 = 𝒙𝟒 − 𝒙
̅ = 𝟏𝟔 − 𝟏𝟒 = 𝟐
𝒅𝟓 = 𝒙𝟓 − 𝒙 ̅ = 𝟏𝟖 − 𝟏𝟒 = 𝟒
𝒅𝟔 = 𝒙𝟔 − 𝒙
̅ = 𝟏𝟐 − 𝟏𝟒 = −𝟐
𝒅𝟕 = 𝒙𝟕 − 𝒙
Observando a soma dos desvios, temos:
−𝟒 + 𝟎 − 𝟏 + 𝟏 + 𝟐 + 𝟒 − 𝟐 = 𝟎

P3) Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável,
a média do conjunto fica aumentada (ou diminuída) dessa constante.
Exemplo:
Considere os seguintes dados: 10, 14, 13, 15, 16, 18, 12.
Sua média é

𝟏𝟎 + 𝟏𝟒 + 𝟏𝟑 + 𝟏𝟓 + 𝟏𝟔 + 𝟏𝟖 + 𝟏𝟐
̅=
𝒙 = 𝟏𝟒
𝟕

Somando uma constante, por exemplo, o 3, em cada dado, temos: 13, 17, 16, 18, 19, 21, 15.
Sua média é

𝟏𝟑 + 𝟏𝟕 + 𝟏𝟔 + 𝟏𝟖 + 𝟏𝟗 + 𝟐𝟏 + 𝟏𝟓
̅=
𝒙 = 𝟏𝟕
𝟕

Assim, podemos observar que a nova média é igual a média anterior, acrescida do valor da
constante. Isto é,

𝟏𝟕 = 𝟏𝟒 + 𝟑

P4) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
(c), a média do conjunto fica multiplicada (ou dividida) por essa constante.
Exemplo:
Considere os seguintes dados: 10, 14, 13, 15, 16, 18, 12.
Sua média é

-5-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

𝟏𝟎 + 𝟏𝟒 + 𝟏𝟑 + 𝟏𝟓 + 𝟏𝟔 + 𝟏𝟖 + 𝟏𝟐
̅=
𝒙 = 𝟏𝟒
𝟕

Multiplicando por uma constante, por exemplo, por 2, cada um dos dados, temos: 20, 28, 26, 30,
32, 36, 24.
Sua média é

𝟐𝟎 + 𝟐𝟖 + 𝟐𝟔 + 𝟑𝟎 + 𝟑𝟐 + 𝟑𝟔 + 𝟐𝟒
̅=
𝒙 = 𝟐𝟖
𝟕

Assim, podemos observar que a nova média é igual a média anterior, multiplicada pelo valor da
constante. Isto é,

𝟐𝟖 = 𝟏𝟒 ∙ 𝟐

MEDIANA – DADOS NÃO AGRUPADOS

A mediana é outra medida de posição definida como o número que se encontra no centro de uma série
de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um
conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo número de elementos.

A mediana de um conjunto de dados ordenados é o termo do conjunto que o divide em duas partes
iguais, isto é, divide o conjunto em dois subconjuntos com o mesmo número de elementos tais que a
cada um deles pertencem todos os elementos menores ou todos os elementos maiores que a mediana.

A mediana é geralmente simbolizada por Me ou por Md.

1º Caso: número de dados ímpar


𝑛+1
A mediana será o valor da variável que ocupa a posição .
2

2º Caso: número de dados par


𝑛 𝑛+2
A mediana será a média entre os valores das variáveis que ocupam a posição e .
2 2

Por exemplo, consideremos os pesos ao nascer, em kg, de 9 cordeiros, dados abaixo:

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,5 4,0

9+1
Nesse caso, como n = 9 (ímpar), a mediana será o dado que ocupa a 5ª posição, pois =5 .
2

Assim, Me = 3,1, ou seja, o peso mediano é 3,1 kg.

Suponhamos agora que fossem 10 cordeiros, com os seguintes pesos:

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

10 10+2
Nesse caso, como n = 10 (par), a mediana será a média entre o 5º e o 6º dados, pois =5 e =6
2 2
.
Assim:
3,1 + 3,2
𝑀𝑒 = = 3,15
2

Assim, Me = 3,15, ou seja, o peso mediano é 3,15 kg.

-6-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Importante: Observe que os dados já estão em ordem crescente. Caso isso não aconteça, devemos
primeiro colocar os dados em ordem crescente, para depois determinar o valor da mediana.

Importante: Observe ainda que a Mediana não é influenciada por valores extremos (é uma medida
robusta).

VANTAGENS E DESVANTAGENS DA MEDIANA


1. Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a
modificação de alguns desses dados. Observe, por exemplo, que os conjuntos C e D abaixo
possuem o mesmo valor mediano (Me = 16), embora sejam bem diferentes.
Conjunto C : 10, 13, 15, 16, 18, 20 e 21.
Conjunto D : 1, 10, 13, 16, 18, 20 e 68.
2. Não é influenciada por valores extremos (grandes) do conjunto de dados. O valor mediano (38)
dos conjuntos E e F abaixo não foi influenciado pelos valores grandes (95 e 120) do conjunto F,
o que não acontece com a média.
Conjunto E : 29, 31, 33, 34, 38, 42, 45, 50 e 51.
Conjunto F : 29, 31, 33, 34, 38, 42, 45, 95 e 120.
3. Quando há valores repetidos, a interpretação do valor mediano não é tão simples.
Admitindo como resultado da aplicação de um teste a um conjunto de alunos, as seguintes notas:
2, 2, 5, 5, 5, 5, 7, 7, 5, 8, 8, 5,
O valor mediano seria a nota 5 e, no entanto, só existem 2 notas menores e 4 maiores do que 5.
Esta desvantagem, unida ao fato da inadequabilidade da sua expressão para o manejo
matemático, faz com que, em análises estatísticas, a mediana seja menos utilizada do que a
média.

MODA – DADOS NÃO AGRUPADOS

Denominamos moda o valor que ocorre com maior frequência em uma série de valores. Desse modo,
por exemplo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria.

De acordo com o comportamento das observações, podemos ter:


o Conjunto amodal: não existe moda, pois todos os valores do conjunto ocorrem com a mesma
frequência.
Por exemplo, no conjunto 2, 2, 3, 3, 4, 4, 7, 7, 5 e 5, todos os elementos têm a mesma frequência
(2).

o Conjunto modal (ou unimodal): existe uma única moda.


Por exemplo, a moda do conjunto 3, 4, 4, 8, 4, 5, 4, 3, 5, 4, 9, 4, 3 e 6, é Mo = 4.

o Conjunto bimodal: existem duas modas.


Por exemplo, o conjunto 3, 5, 5, 5, 5, 10, 10, 10, 10 e 15, é bimodal, pois possui duas modas,
Mo = 5 e Mo = 10.

o Conjunto multimodal: existem mais de duas modas.


Por exemplo, o conjunto 2, 2, 2, 4, 4, 5, 5, 5, 6, 6, 8, 8, 8, 9 e 10, é multimodal, pois possui três
modas,
Mo = 2, Mo = 5 e Mo = 8.

Por exemplo, vamos retomar o caso dos pesos ao nascer, em Kg, de 10 cordeiros, dados a seguir:
2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

Observamos que Mo = 3,2, ou seja, a moda é o peso de 3,2 Kg. (unimodal)

-7-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

VANTAGENS E DESVANTAGENS DA MODA


1. Não depende de todos os valores da série, nem de sua ordenação, podendo mesmo não se alterar
com a modificação de alguns deles. Como exemplo, observe as séries A e B.
Série A: 6, 1, 7, 7, 7, 15, 7, 5, 8, 12, 7, 11.
Série B: 11, 7, 7, 12, 5, 5, 56, 7, 7, 58, 60, 7, 15.
As séries A e B possuem a mesma moda (Mo = 7), embora sejam bem diferentes.
2. Não é influenciada por valores extremos (grandes) da série. Observe, por exemplo, que a moda
(Mo = 12) da série abaixo não foi influenciada pelos valores grandes ( 88, 89 e 100) da série:
Série: 7, 8, 8, 8, 9, 9, 12, 12, 12, 12, 12, 12, 13, 15, 16, 88, 89 e 100.
3. Sempre tem existência real, ou seja, sempre é representada por um elemento do conjunto de
dados, excetuando o caso de classes de frequências, quando trabalhamos com subconjuntos
(dados agrupados) e não com cada elemento isoladamente. Veja, por exemplo, que a moda da
série abaixo é Mo = 15, e 15 é um elemento da série.
Série: 7, 9, 13, 13, 15, 15, 15, 15, 18 e 20.

MEDIDAS DE POSIÇÃO

MÉDIA ARITMÉTICA
(DADOS AGRUPADOS SEM INTERVALOS DE CLASSE)

Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética
dos valores x1, x2, x3, ..., xn, ponderados pelas respectivas frequências absolutas: f1, f2, f3, ..., fn. Assim,

∑𝒏𝒊=𝟏 𝒙𝒊 ∙ 𝒇𝒊
̅=
𝒙
∑𝒏𝒊=𝟏 𝒇𝒊

ou simplesmente

∑ 𝒙𝒊 ∙ 𝒇𝒊
̅=
𝒙
∑ 𝒇𝒊

Exemplo:
Determinar a média da distribuição:

Neste caso, a nota corresponde à variável X pesquisada. Na primeira coluna estão os valores xi da
variável e, na segunda coluna, suas respectivas frequências fi. Assim, temos a seguinte tabela:

xi fi x i . fi
0 2 0
1 10 10
2 20 40
3 47 141
4 46 184
Total 125 375
Daí:

-8-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

∑ 𝑥𝑖 ∙ 𝑓𝑖 375
𝑥̅ = = ⇒ 𝑥̅ = 3
∑ 𝑓𝑖 125

MEDIANA
(DADOS AGRUPADOS SEM INTERVALOS DE CLASSE)

Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe,
usaremos a mesma técnica que utilizamos no caso dos dados não agrupados, para determinar a posição
da mediana. Depois de determinada a posição da mediana, basta tomar como referência a primeira
frequência acumulada que ultrapasse essa posição. O dado correspondente à essa frequência acumulada
será a mediana.
Exemplos:
a) Dada a distribuição:

Como n = 11, n é impar, logo a mediana (Me) será o elemento de posição:

𝑛 + 1 11 + 1
= = 6º
2 2

Será, portanto, o 6º dado. Para identifica-lo, a partir da distribuição dada, construímos a coluna Fi das
frequências acumuladas, somando as frequências simples fi até cada linha (1; 1+3=4; 1+3+5=9 e
1+3+5+2=11). A primeira frequência acumulada que ultrapassar o número 6 corresponde à linha que
contém o 6º dado. Assim,

O valor do dado xi que se encontra nessa linha será o valor da mediana. No nosso exemplo, temos
Me = 3

Importante: Observe que a mediada é o xi correspondente à classe que contiver a ordem calculada.

b) Seja:

Como n = 42, n é par, logo a mediana (Me) será a média entre os elementos de posição:

𝑛 42
= = 21º
2 2

-9-
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

e
𝑛 + 2 42 + 2
= = 22º
2 2

Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela frequência acumulada:

Assim, o 21º corresponde a 87 e o 22º corresponde a 87. Então,

87 + 87
𝑀𝑒 = = 87
2
Me = 87

𝑛 𝑛+2
ATENÇÃO: é preciso ter cuidado quando, numa quantidade par de dados, as posições e forem
2 2
correspondentes a duas linhas diferentes da tabela dada. Quando isso acontecer, os dados xi utilizados
𝑛
para calcular a mediana serão diferentes. Isso vai acontecer quando a posição corresponder a um
2
𝑛+2
valor exato da coluna das frequências acumuladas (Fi), e a posição corresponder a linha seguinte.
2

MODA
(DADOS AGRUPADOS SEM INTERVALOS DE CLASSE)

Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe, a moda
será o dado (xi) que corresponde à maior frequência (fi).

Assim, por exemplo, para a distribuição

a moda será 245, pois corresponde à maior frequência, que é 17. Então,

Mo = 245

MEDIDAS DE POSIÇÃO

MÉDIA ARITMÉTICA
(DADOS AGRUPADOS COM INTERVALOS DE CLASSE)

Em geral, quando a variável é contínua, os dados são agrupados em intervalos. Neste caso, utilizamos
a mesma técnica dos dados agrupados sem intervalos, tomando o ponto médio de cada classe como seu
respectivo valor da variável xi. As fórmulas são as mesmas:

∑𝒏𝒊=𝟏 𝒙𝒊 ∙ 𝒇𝒊
̅=
𝒙
∑𝒏𝒊=𝟏 𝒇𝒊
ou simplesmente

- 10 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

∑ 𝒙𝒊 ∙ 𝒇𝒊
̅=
𝒙
∑ 𝒇𝒊

Exemplo:
Determinar a média da distribuição:

A partir dos dados, temos a seguinte tabela:

classes xi fi
x i . fi
Renda Familiar (ponto médio) Nº de Familias
2⊢4 3 5 15
4⊢6 5 10 50
6⊢8 7 14 98
8 ⊢ 10 9 8 72
10 ⊢ 12 11 3 33
Total 40 268

Daí:

∑ 𝑥𝑖 ∙ 𝑓𝑖 268
𝑥̅ = = ⇒ 𝑥̅ = 6,7
∑ 𝑓𝑖 40

𝑥̅ = 6,7

MEDIANA
(DADOS AGRUPADOS COM INTERVALOS DE CLASSE)

Quando os dados corresponderem a uma variável contínua e estiverem agrupados numa distribuição de
frequência com intervalos de classe, o cálculo da mediana será por fórmula, seguindo os passos abaixo:

1º PASSO:
𝑛
Calcula-se a ordem . Como a variável é contínua, não se preocupe se n é par ou ímpar.
2

2º PASSO:
Usando a frequência acumulada (Fi), identifique a classe que contém a mediana (classe mediana).
𝑛
Lembre-se que corresponde ao primeiro valor da coluna Fi que ultrapassa o resultado de .
2

3º PASSO:
Use a fórmula:

𝑛
( − 𝐹𝐴𝑁𝑇 ) ∙ ℎ
𝑀𝑒 = 𝑙𝑀𝑒 + 2
𝑓𝑀𝑒

onde:
𝑙𝑀𝑒 : limite inferior da classe mediana;
𝑛: tamanho da amostra ou número de dados;
𝐹𝐴𝑁𝑇 : frequência acumulada até a classe anterior à classe mediana (linha anterior);
ℎ: amplitude do intervalo da classe mediana;
𝑓𝑀𝑒 : frequência da classe mediana.

- 11 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Exemplo:
Dada a distribuição amostral, calcular a mediana.

1º PASSO:
𝑛 58
Calcula-se a ordem . Como n = 58, temos = 29º
2 2

2º PASSO:
Identifica-se a classe mediana, que corresponde à linha da tabela que possui a primeira frequência
acumulada que ultrapasse o 29. No nosso caso, a linha do 35, o que significa que a classe mediana
é a 3ª linha da tabela.

3º PASSO:
Aplica-se a fórmula, considerando:

𝑙𝑀𝑒 = 55 (é o valor de início do intervalo da classe mediana)


𝑛 = 58 (é o número de dados pesquisados – soma da coluna fi )
𝐹𝐴𝑁𝑇 = 17 (é o valor da coluna Fi imediatamente anterior à classe mediana)
ℎ = 10 (é o tamanho do intervalo da classe mediana – basta fazer 65 – 55 = 10)
𝑓𝑀𝑒 = 18 (é o número de dados ( fi ) da classe mediana)

𝑛
( − 𝐹𝐴𝑁𝑇 ) ∙ ℎ
𝑀𝑒 = 𝑙𝑀𝑒 + 2
𝑓𝑀𝑒
58
( − 17) ∙ 10
𝑀𝑒 = 55 + 2
18
(29 − 17) ∙ 10
𝑀𝑒 = 55 +
18
12 ∙ 10
𝑀𝑒 = 55 +
18
120
𝑀𝑒 = 55 +
18
120
𝑀𝑒 = 55 +
18
𝑀𝑒 = 55 + 6,67
𝑀𝑒 = 61,67

- 12 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

MODA
(DADOS AGRUPADOS COM INTERVALOS DE CLASSE)

Para dados agrupados em classes, há diversas fórmulas para o cálculo da Moda.

1º PROCESSO – FÓRMULA DE CZUBER


1º PASSO:
Identifica-se a classe modal (aquela que possuir maior frequência).
2º PASSO:
Aplica-se a fórmula:
∆1
𝑀𝑜 = 𝑙 + ∙ℎ
∆1 + ∆2
onde:
𝑙: limite inferior da classe modal;
∆1 : diferença entre a frequência da classe modal e a imediatamente anterior;
∆2 : diferença entre a frequência da classe modal e a imediatamente posterior;
ℎ: amplitude do intervalo da classe modal;

Exemplo:
Determinar a moda para a distribuição

1º PASSO:
Identifica-se a classe modal. Nesse caso, é a 3º classe, pois apresenta a maior frequência: 17.

2º PASSO:
Aplica-se a fórmula, considerando:
𝑙=2 (é o valor de início do intervalo da classe modal)
∆1 = 17 − 10 = 7 (diferença entre a frequência da classe modal e a imediatamente anterior)
∆2 = 17 − 8 = 9 (diferença entre a frequência da classe modal e a imediatamente posterior)
ℎ=1 (é o tamanho do intervalo da classe mediana – basta fazer 3 – 2 = 1)

∆1
𝑀𝑜 = 𝑙 + ∙ℎ
∆1 + ∆2

7
𝑀𝑜 = 2 + ∙1
7+9

𝑀𝑜 = 2,44

2º PROCESSO – FÓRMULA DE PEARSON


A moda pela Fórmula de Pearson é dada por:

𝑀𝑜 = 3 ∙ 𝑀𝑒 − 2 ∙ 𝑥̅

Ou seja, a moda é aproximadamente a diferença entre o triplo da mediana e o dobro da média. Esta
fórmula dá uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média.

- 13 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA


Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria torna-as diferentes
e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma distribuição em forma de
sino, temos:

 𝑥̅ = 𝑀𝑒 = 𝑀𝑜 no caso da curva simétrica;

 𝑀𝑜 < 𝑀𝑒 < 𝑥̅ no caso da curva assimétrica positiva;

 𝑥̅ < 𝑀𝑒 < 𝑀𝑜 no caso da curva assimétrica negativa;

A figura abaixo mostra as formas das curvas de acordo com os valores da média, da moda e da mediana.

MEDIDAS DE DISPERSÃO

As medidas de posição (média, mediana, moda...) descrevem apenas uma das características dos
valores numéricos de um conjunto de observações, o da tendência central. Porém, nenhuma delas
informa sobre o grau de variação ou dispersão dos valores observados. Em qualquer grupo de dados os
valores numéricos não são semelhantes e apresentam desvios variáveis em relação a tendência geral de
média.

As medidas de dispersão servem para avaliar o quanto os dados são semelhantes, descreve então o
quanto os dados distam do valor central. Desse jeito, as medidas de dispersão servem também para
avaliar qual o grau de representação da média.

É fácil demonstrar que apenas a média é insuficiente para descrever um grupo de dados. Dois grupos
podem ter a mesma média, mas serem muito diferentes na amplitude de variação de seus dados. Por
exemplo:

- Grupo A (dados observados): 50; 50; 50; 50; 50.


- Grupo B (dados observados): 48; 49; 50; 51; 52.
- Grupo C (dados observados): 5; 10; 15; 20; 200.

A média dos três grupos é a mesma (50), mas no grupo “A” não há variação entre os dados, enquanto
no grupo “B” a variação é pequena e no grupo “C” a variação e maior. Dessa forma, uma maneira mais
completa de apresentar os dados (além de aplicar uma medida de tendência central como a média) é
aplicar uma medida de dispersão. As principais medidas de dispersão são a variância e o desvio padrão.

- 14 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Variância (V)

Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada
valor desse conjunto está do valor central (média).

Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais
os valores estão distantes da média.

Considere que 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 são os n elementos de uma amostra e que 𝒙


̅ é a média aritmética desses
elementos. O cálculo da variância amostral (V) é dado por:

∑𝒏𝒊=𝟏 (𝒙𝒊 − 𝒙
̅)𝟐
𝑽=
𝒏−𝟏

Se quisermos calcular a variância populacional (V), consideraremos todos os elementos da população,


e não apenas de uma amostra. Nesse caso, o cálculo possui uma pequena diferença. Observe:

∑𝒏𝒊=𝟏 (𝒙𝒊 − 𝒙
̅)𝟐
𝑽=
𝒏

Desvio Padrão (DP)

O desvio padrão é capaz de identificar o “erro” em um conjunto de dados, caso quiséssemos substituir
um dos valores coletados pela média aritmética.

O desvio padrão aparece junto à média aritmética, informando o quão “confiável” é esse valor. Ele é
apresentado pelo intervalo:
[𝒙
̅ − 𝑫𝑷; 𝒙
̅ + 𝑫𝑷]

O cálculo do desvio padrão é feito a partir da raiz quadrada positiva da variância, ou seja:

𝑫𝑷 = √𝑽

Vamos agora aplicar o cálculo da variância e do desvio padrão em um exemplo:


Considere que, em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas
as notas acima da média em todas as disciplinas. Para tanto, considerou a amostra de uma turma do 9º
ano do Ensino Fundamental, ao longo de um ano. Os dados obtidos foram:

Quantidade de alunos acima da média


9º ano
1º Bimestre 2º Bimestre 3º Bimestre 4º Bimestre
8 13 9 4
Para facilitar os cálculos, vamos dispor os dados coletados em uma tabela, sempre com a seguinte
estrutura:

nº de alunos
(𝒙𝒊 − 𝒙
̅) ̅)𝟐
(𝒙𝒊 − 𝒙
(𝒙𝒊 )
8
13
9
4
34

- 15 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

Inicialmente, calculamos a média:


∑ 𝑥𝑖 34
𝑥̅ = = = 8,5
𝑛 4
Com o valor da média, calculamos a segunda coluna da tabela, fazendo “dado menos média” (observe
que a soma dessa coluna (𝒙𝒊 − 𝒙
̅) será sempre igual a zero.

nº de alunos
(𝒙𝒊 − 𝒙
̅) ̅)𝟐
(𝒙𝒊 − 𝒙
(𝒙𝒊 )
8 8 – 8,5 = –0,5
13 13 – 8,5 = 4,5
9 9 – 8,5 = 0,5
4 4 – 8,5 = –4,5
TOTAL 34 0

Agora, tomamos os resultados da coluna (𝒙𝒊 − 𝒙


̅) e elevamos cada um deles ao quadrado, preenchendo
a terceira coluna da tabela:

nº de alunos
(𝒙𝒊 − 𝒙
̅) ̅)𝟐
(𝒙𝒊 − 𝒙
(𝒙𝒊 )
8 8 – 8,5 = –0,5 (−0,5)2 = 0,25
13 13 – 8,5 = 4,5 (4,5)2 = 20,25
9 9 – 8,5 = 0,5 (0,5)2 = 0,25
4 4 – 8,5 = –4,5 (−4,5)2 = 20,25
TOTAL 34 0 41

Com a tabela preenchida e os totais calculados, podemos calcular a variância, lembrando que, nesse
caso, trata-se de uma amostra:

∑𝒏𝒊=𝟏 (𝒙𝒊 − 𝒙
̅)𝟐
𝑽=
𝒏−𝟏

41
𝑉=
4−1

41
𝑉=
3

𝑉 = 13,67

Conhecida a variância, vamos calcular agora o desvio padrão:

𝑫𝑷 = √𝑽

𝐷𝑃 = √13,67

𝐷𝑃 = 3,7

- 16 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

EXERCÍCIOS
01. Ano: 2008 / Banca: CESPE / Órgão: TJ-DFT
A tabela acima apresenta a distribuição de frequência absoluta das notas
dadas por 125 usuários de um serviço público, em uma avaliação da
qualidade do atendimento. Considerando essas informações, julgue os
próximos itens.
A média, a moda e a mediana dos valores apresentados na tabela são
superiores a 2,8 e inferiores a 3,3.
( ) Certo ( ) Errado

02. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE


A tabela abaixo apresenta a distribuição de frequências das idades de
um grupo de crianças. A média das idades dessas crianças, em anos, é
a) 5,0
b) 5,2
c) 5,4
d) 5,6
e) 5,8

03. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE


(MESMO TEXTO DA QUESTÃO 02)
A mediana da distribuição de frequências apresentada é
a) 5,5 b) 5,6 c) 5,7 d) 5,8 e) 5,9

04. Ano: 2016 Banca: ESAF Órgão: ANAC


Os valores a seguir representam uma amostra
331546248
Então, a variância dessa amostra é igual a
a) 4,0 b) 2,5. c) 4,5. d) 5,5 e) 3,0

05. Ano: 2010 Banca: CESGRANRIO Órgão: BNDES


Em uma pesquisa de preços de determinado produto, foram obtidos os
valores, em reais, de uma amostra aleatória colhida em 6
estabelecimentos que o comercializam. A variância dessa amostra é
a) 1,50 b) 1,75
c) 2,00 d) 2,25
e) 2,50

06. Ano: 2010 Banca: FGV Órgão: SEAD-AP


Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A
variância da quantidade de empregados dessas cinco empresas é igual a:
a) 0,8 b) 1,2 c) 1,6 d) 2,0 e) 2,4

07. Ano: 2010 Banca: CESGRANRIO Órgão: IBGE


No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão
apresentadas no rol abaixo.
5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
a) 3,1 b) 2,8 c) 2,5 d) 2,2 e) 2,0

- 17 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

08. Ano: 2009 Banca: CESPE Órgão: CEHAP-PB


O custo médio nacional para a construção de habitação com padrão de acabamento normal, segundo
levantamento realizado em novembro de 2008, foi de R$ 670,00 por metro quadrado, sendo R$
400,00/m2 relativos às despesas com materiais de construção e R$ 270,00/m2 com mão-de-obra. Nessa
mesma pesquisa, os custos médios regionais apontaram para os seguintes valores por metro quadrado:
R$ 700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e R$ 630,00
(Nordeste).
Sistema Nacional de Pesquisa de Custos e Índices da Construção
Civil. SINAPI/IBGE, nov./2008 (com adaptações).
O desvio padrão dos custos médios regionais por metro quadrado foi
a) inferior a R$ 30,00.
b) superior a R$ 30,01 e inferior a R$ 40,00.
c) superior a R$ 40,01 e inferior a R$ 50,00.
d) superior a R$ 50,01.

RESPOSTAS
01) C 02) C 03) A 04) C 05) C 06) B 07) B 08) A

EXERCÍCIOS COMPLEMENTARES
01. CESPE - PRF/PRF/2008
Ficou pior para quem bebe
O governo ainda espera a consolidação dos dados do primeiro mês de aplicação da Lei Seca para avaliar
seu impacto sobre a cassação de CNHs. As primeiras projeções indicam, porém, que as apreensões
subirão, no mínimo, 10%. Antes da vigência da Lei Seca, eram suspensas ou cassadas, em média,
aproximadamente 155.000 CNHs por ano. Se as previsões estiverem corretas, a média anual deve subir
para próximo de 170.000. A tabela a seguir mostra esses resultados nos últimos anos (fonte:
DENATRAN).

Veja, ed. 2.072, 6/8/2008, p. 51 (com adaptações).

Para que a média de CNHs suspensas ou cassadas, de 2003 a 2008, atinja o valor previsto de 170.000,
será necessário que, em 2008, a quantidade de CNHs suspensas ou cassadas seja um número
a) inferior a 180.000.
b) superior a 180.000 e inferior a 200.000.
c) superior a 200.000 e inferior a 220.000.
d) superior a 220.000 e inferior a 240.000.
e) superior a 240.000.
02. CESPE - PRF/PRF/2003

- 18 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

O gráfico acima ilustra o número de acidentes de trânsito


nos estados do Acre, Mato Grosso do Sul, Amazonas,
Espírito Santo e Minas Gerais, no ano de 2001. Com base
nessas informações, julgue o item seguinte.
A média aritmética de acidentes de trânsito nos cinco
estados citados é superior a 7.000.
( ) Certo ( ) Errado

03. CESPE - AA (PRF)/PRF/2012


A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas,
incluindo o condutor, por veículo de passeio circulando em determinado município, Q P
obtida como resultado de uma pesquisa feita nesse município para se avaliar o (%)
sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos 1 50
de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. 2 20
Com base nessas informações, julgue o seguinte item. 3 15
Em média, cada veículo de passeio que circula no referido município transporta duas 4 10
pessoas. Portanto, se, em determinado momento, houver 10 mil veículos 5 5
circulando nesse município, a quantidade esperada de pessoas que estão sendo transportadas por todos
esses veículos, incluindo-se os condutores, será igual a 20 mil.
( ) Certo ( ) Errado

04. CESPE - PRF/PRF/2003


O gráfico acima ilustra o número de acidentes de trânsito
nos estados do Acre, Mato Grosso do Sul, Amazonas,
Espírito Santo e Minas Gerais, no ano de 2001. Se, no
ano de 2004, com relação ao ano de 2001, o número de
acidentes de trânsito no Acre crescesse 10%, o do Mato
Grosso do Sul diminuísse 20%, o do Amazonas
aumentasse 15% e os demais permanecessem
inalterados, então a média aritmética da série numérica
formada pelo número de acidentes de trânsito em cada
estado, em 2004, seria maior que a mediana dessa
mesma série.
( )Certo ( ) Errado

05. CESPE - PRF/PRF/2013


Considerando os dados apresentados no gráfico, julgue o
item seguinte.
A média do número de acidentes ocorridos no período de
2007 a 2010 é inferior à mediana da sequência de dados
apresentada no gráfico.
( ) Certo ( ) Errado

06. CESPE - AA (PRF)/PRF/2012


A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas, Q P
incluindo o condutor, por veículo de passeio circulando em determinado município, (%)
obtida como resultado de uma pesquisa feita nesse município para se avaliar o 1 50
sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos 2 20
de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. 3 15
Com base nessas informações, julgue o seguinte item. 4 10
Como a moda da distribuição descrita representa a maior frequência observada, seu 5 5
valor é igual a 50%.
( ) Certo ( ) Errado

- 19 -
FOCUSCONCURSOS.COM.BR
Matemática | Material Complementar
Prof. Altevir Carneiro | fb.com/profaltevir

07. CESPE - PRF/PRF/2003


O gráfico acima ilustra o número de acidentes de
trânsito nos estados do Acre, Mato Grosso do Sul, VALOR
Amazonas, Espírito Santo e Minas Gerais, no ano ESTATÍSTICA (acidentes por
de 2001. dia)
Se, no ano de 2004, com relação ao ano de 2001, Média 10
o número de acidentes de trânsito no Acre Mediana 8
passasse para 2.500, o número de acidentes de Desvio padrão 12
trânsito no Espírito Santo fosse reduzido para Primeiro quartil 5
10.000, o de Minas Gerais fosse reduzido para Terceiro quartil 15
13.000 e os demais permanecessem inalterados,
então o desvio-padrão da série numérica formada
pelo número de acidentes de trânsito em cada
estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes
de trânsito em cada estado em 2001.
( ) Certo ( ) Errado

08. CESPE - AA (PRF)/PRF/2012


A tabela acima apresenta as estatísticas produzidas em um levantamento acerca do número diário de
acidentes que envolvem motocicletas em determinado local. Com base nessas informações, julgue o
próximo item.
A variância da distribuição do número diário de acidentes com motocicletas no referido local é inferior a
100.
( ) Certo ( ) Errado

09. CESPE - PRF/PRF/2003


O gráfico acima ilustra o número de acidentes de
trânsito nos estados do Acre, Mato Grosso do Sul,
Amazonas, Espírito Santo e Minas Gerais, no ano
de 2001.
Se, no ano de 2004, com relação ao ano de 2001,
o número de acidentes de trânsito em cada um dos
estados considerados aumentasse de 150, então o
desvio-padrão da série numérica formada pelo
número de acidentes de trânsito em cada estado
em 2004 seria superior ao desvio-padrão da série
numérica formada pelo número de acidentes de
trânsito em cada estado em 2001.
( ) Certo ( ) Errado

RESPOSTAS
01) D 02) C 03) C 04) C 05) E
06) E 07) E 08) E 09) E

- 20 -
FOCUSCONCURSOS.COM.BR

Você também pode gostar