Você está na página 1de 13

FACULDADE DE CIÊNCIAS ECONÓMICAS E EMPRESARIAIS

DEPARTAMENTO DE AGRICULTURA E TURISMO

Ficha de Leitura Métodos Quantitativos Ano de 2020

Unidade Temática 4: Resumo Numérico de Dados

Medidas Numéricas de Dados

Medidas de tendência central

O tratamento e interpretação torna-se difícil para quem pretende colocar uma informação como um todo, razão pela qual
costuma-se calcular algumas medidas que resumidamente traduzem as importantes características das distribuições de
frequências.

Existem quatro grupos de medidas numéricas que resumem um conjunto de dados observados. As medidas de
tendência central, medidas de localização ou separatrizes, as medidas de dispersão e as características de forma de
distribuição.

Os índices de centro de distribuição ou medidas de tendência central, assim designados em vertude da tendência que
todos os dados observados têm em torno desses valores centrais. Este grupo inclui as grandezas médias, a moda e a
mediana.

A média Aritmética: é uma grandeza ou valor representativo de um conjunto de dados como eles tendem a se localizar
em torno do ponto central. A média aritmética é a mais usada nas investigações, e esta pode ser simples ou ponderada
quando temos frequências.

x x  f
1 1
Amostra: x = simples; x= ponderada, usado para dados agrupados.

i i i
n n

x  xf
1 1
População  = simples  = ponderada, usado para dados agrupados.

1
i
N

CARACTERÍSTICAS DA MÉDIA ARITMÉTICA


✓ valor da média é determinado em função de todos os valores da distribuição;
✓ O valor da média é influenciado pelos valores extremos da distribuição;
✓ A média independe da ordem das classes (todas as classes) igualmente importantes no seu
cálculo), não dizendo nada sobre a distribuição das classes;
✓ A média tem um valor determinado.

VANTAGENS DA MÉDIA ARITMÉTICA


✓ É a mais comum das médias, mais compreensível e a mais reconhecida como média propriamente
dita, pois se presta a tratamento algébrico por ter seus termos matematicamente bem definidos;
✓ Seu cálculo é simples, para realiza-los são necessários somente valores totais e número de classes
ou valores.

DESVANTAGENS
✓ Seu valor pode ficar alienado devido à influência de valores extremos por não representar bem o
conjunto de valores de uma Série Simples ou da Distribuição de Frequência.

Mediana: é uma separactriz que devide a distribuição de frequência ou conjunto de dados em duas partes iguais. A
mediana é o valor que está na posição do meio para “n impar” e é igual a média aritmética dos dois valores centrais para
“n par”.,

isto é:

Quando n é impar: mediana = X =X  n+1 


p

 
 2 

X n + X n 
   +1
2 2 
Quando n é par: mediana =
2

Para dados agrupados em classe, a mediana é determinada por aproximação, bastando conhecer a classe mediana,
que é localizada calculando as frequências acumuladas.
n
− Fa
Me = Li + 2 c Onde
f me

Li – Limite inferior da classe mediana

f me - irequência da classe mediana

Fa – Frequência acumulada da classe anterior a classe mediana

2
c – Amplitude da classe mediana

Moda

O termo Moda ou Norma (valor dominante de um conjunto) foi introduzido por Karl Pearson em 1895 e
originou-se talvez na maneira de se falar “tal coisa está na moda”, “tal coisa é mais freqüente”.

Portanto, define-se Moda ao valor da variável que ocorre com mais frequência. Para casos em que o número das
observações não é muito elevado esta medida pode ser lida no rol.

A moda pode não existir, e mesmo que exista, pode não ser única. Assim, um conjunto de valores ou uma
Distribuição de Freqüência pode ter várias modas e é dito ser “multimodal”. Se tem duas modas, bimodal e
assim por diante.

De acordo com as frequências de cada valor observado, é possível

➢ não ter a moda (amodal),


➢ ter uma moda (unimodal),
➢ duas modas (bimodal)
➢ três modas (trimodal),
➢ muitas modas (plurimodal ou simplesmente, multimodal).

Unimodal: Existe somente um modo, 8, que ocorre com mais frequência.

Bimodal: Existem dois modos, 4 e 16. Os dados parecem representar duas populações diferentes.

3
Exemplos 1:

a) X={2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18} → Mo=9;

b) X={3, 5, 8, 10, 12, 15, 16} → não tem moda;


c) X={ 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9} → é bimodal: Mo1=4 e Mo2=7.

Nas Distribuições de Freqüência em classe, não temos o valor que mais se repete e sim a classe que possui
a maior frequência. Nestas condições, é dita CLASSE MODAL (classe de maior freqüência).

Quando temos dados agrupados em classe, a moda é calculada por aproximação, começando por localizar a classe
modal (aquela classe que tiver maoir frequencia absoluta), se necessário deve –se conhecer a moda bruta que é o ponto
médio da classe que contém a moda. As formulas de King e de Czuber são alternativas para calcular o valor da moda
com aproximação.

Formula de King

fp c
Mo = Li + 
fa + fp

A formula de Czuber é uma das alternativas para calcular o valor da moda com aproximação.

Neste processo considera-se a influência, sobre a classe modal, das freqüências das classes adjacentes,
anterior e posterior, assim como da freqüência da classe modal. O ponto correspondente à moda divide o
intervalo em partes proporcionais às diferenças respectivas da freqüência da classe modal, com as freqüências
adjacentes.

fmo − fa
Mo = Li + c Onde
2  fmo − ( fa + fp)

Li - Limite inferior da classe modal

fmo - Frequência da classe modal

fa – Frequência anterior a classe modal

fp – Frequência posterior a classe modal e

c – Amplitude da classe modal

Nota: São vantagens e desvantagens de cada uma das medidas de tendência central:

✓ A moda é uma medida que requer apenas o conhecimento da frequência absoluta e pode ser
utilizada para qualquer tipo de variáveis, tanto qualitativas, quanto quantitativas.

✓ A mediana é uma medida que exige uma ordenação de categorias, da mais baixa a mais alta (ou
vice-versa), assim ela só pode ser obtida para variáveis qualitativas ordinais ou para as
4
quantitativas, jamais para variáveis qualitativas nominais. Além disso, a mediana não é influenciada
por valores extremos.

✓ A média aritmética trabalha com todos os elementos do conjunto de dados, enquanto a mediana utiliza
apenas um ou dois valores. No entanto a média sofre influência de valores extremos (muito alto ou
baixo).

✓ A média é uma medida que pode ser calculada apenas para variáveis quantitativas. E embora a média
seja um valor mais fácil de entender, tem o defeito de nos induzir ao erro se a nossa amostra tiver
valores muito extremos.

Assim, no caso das variáveis quantitativas, quando o valor da Mediana é muito diferente da Média, é aconselhável
considerar sempre a Mediana como valor de referência mais importante.

O centro dos dados é a área onde a maioria dos valores em um conjunto de dados se agrupam. A tendência
central pode ser descrita por diversas estatística, como média, média aparada, mediana ou modo. Conhecer
a tendência central dos dados é um primeiro passo importante para entender os dados.

Gráficos como histogramas, boxplots e dotplots são úteis para visualizar a tendência central dos dados e pode
ajudar a decidir qual estatística de tendência central é mais apropriada para um determinado conjunto de
dados.

Exemplo 2: Os dados que se seguem representam as percentagens do valor total que 17 credores do Millennium Bim
retornaram ao banco durante um ano.

32.2 , 29.5 , 29.9 , 32.4 , 30.5 , 30.1 , 32.1 , 35.2 , 10.0 , 20.6 , 28.6 , 30.5 , 38.0 , 33.0 , 29.4 , 37.1 , 28.6

Determine a média, moda e mediana dos 17 credores.

Resolução

Média. x =
x i
=
507.7
= 29.86
n 17

Moda: Para localizar o valor que está na moda vamos escolher o valor que ocorre mais vezes

10.0 20.6 28.6 28.6 29.4 29.5 29.9 30.1 30.5 30.5 32.1 32.2 32.4 33 35.2 37.1 38

Do rol temos dois volores que ocorrem mais vezes (duas vezes cada), portanto, temos duas modas :
5
Mo1 = 28.6, Mo2 = 30.5, assim, diremos que temos uma distribuição bimodal.

6
Mediana: Para localizar o valor mediano, primeiro, vamos ordenar os dados em uma ordem crescente. Como o n é
n +1 17 +1
impar (n=17), a posição (P) em que se encontra o valor mediano será: P(me) = = = 9 , portanto, o
2 2
elemento mediano está na posição 9, vejamos:

1a 2a 3a 4a 5a 6a 7a 8a 9a 10 a 11 a 12 a 13 a 14 a 15 a 16 a 17 a

10.0 20.6 28.6 28.6 29.4 29.5 29.9 30.1 30.5 30.5 32.1 32.2 32.4 33 35.2 37.1 38

Assim, a mediana é 30,5. Isto significa que 50% das pessoas pagaram menos de 30,5% do valor que receberam
quando pediram o emprestimo e outras 50% das pessoas devolveram igual ou maior que 30,5% do total.

Exemplo 3: Para os dados da tabela abaixo, dertemine a media , mediana e a moda.

xi fi xi f i
5 1 5x1=5
6 5 6 x 5 = 30
7 6 7 x 6 = 42
8 5 8 x 5 = 40
9 3 9 x 3 = 27
 20 104

➢ x = x f i
= 104i  x = 5,2 Mediana = 7 Moda = 7

n 20

Exemplo 4: A partir da tabela abaixo, determine a média, moda e mediana da distribuição.

Classes xi fi xi*fi Fi
10 - 20 15 10 150 10
20 - 30 25 20 500 30
30 - 40 35 35 1225 65
40 - 50 45 40 1800 105
50 - 60 55 25 1375 130
60 - 70 65 15 975 145
70 - 80 75 5 375 150
Total - 150 6400 -

Resolução

Média: x =
 xf i i =
6400
= 42,67
n 150

fp 25
Moda: Mo = Li +  a = 40 + 10 = 44,17
fa + fp (25 + 35)

7
n
− Fa
2 75 − 65
Mediana: Me = Li +  a = 40 + 10 = 42,5
fme 40

Resumo da definição de principais medidas de tendência central

Medida Notação Definição, propriedades

_ É a soma dos produtos dos valores da variável e respectiva


Média X frequência, dividida pelo número de observações
É o valor que ocupa a posição central da série de observações de
Mediana Me uma variável, dividindo o conjunto em duas partes iguais. 50%
dos dados tomam valores menores ou iguais ao valor da
mediana e os 50% restantes acima.
Moda Mo È definida como valor que ocorre com mais frequência, dos
valores observados

8
MEDIDAS DE POSIÇÃO

Assim como as medidas de tendência central têm objectivo de fornecer indicadores do local
onde a maioria dos dados se concentram, as medidas de posição tem de objectivo de indicar
onde é o ponto de corte para uma certa posição. As medidas mais usadas são os quartis e
suas versões mais gerais, decís e percentis.

1.1 Quartís (Quantís)

Quartil: Como atrás tratado nas medidas de tendência central, a mediana divide um
conjunto de dados em duas partes iguais, os quartis dividem-no em quatro partes iguais.

Para se determinar a posição quartil sem agrupar os dados é necessário coloca-los em rol
(ordem crescente ou decrescente), só após essa ordenação é que se pode determinar os
quartís.

Estatística Notação Definição, propriedades

1º quartil Q1 É o valor que ocupa a posição tal que um quarto dos dados (25%) tomam
valores menores ou iguais ao valor do primeiro quartil.
2º quartil Q2 Coincide com o valor da mediana, ou seja 50% dos dados tomam valores
(Mediana) Me menores ou iguais aos da mediana. Entre o primeiro quartil (Q1) e a
mediana (Me) ficam 25% dos dados.
3º quartil Q3 É o valor que ocupa a posição tal que um quarto dos dados (25%) tomam
valores maiores ou iguais ao valor do terceiro quartil. Entre a mediana
(Me) e o terceiro quartil (Q3) ficam 25%

9
4.2 Percentís
De todos os percentis os mais importantes são:

Tabela 2.22 – Principais percentís

Definição, propriedades
Percentil Notação
1º P1 1% dos dados tomam valores menores ou iguais
5º P5 5% dos dados tomam valores menores ou iguais
10º P10 10% dos dados tomam valores menores ou iguais
25º P25 25% dos dados tomam valores menores ou iguais (Q1)
50º P50 50% dos dados tomam valores menores ou iguais (Q2 = Me)
75º P75 25% dos dados tomam valores maiores ou iguais (Q3)
90º P90 10% dos dados tomam valores maiores ou iguais
95º P95 5% dos dados tomam valores maiores ou iguais
99º P99 1% dos dados tomam valores maiores ou iguais

Em geral somos solicitados para calcular percentil: 1, 5, 10, 25, 50, 75, 90, 95 e 99.

Exemplo:

Percentil i 1 5 10 25 50 75 90 95 99
in
Posição ( ) 1 3 6 15 30 45 54 57 59
100
Valores de pi 1,55 1.58 1.63 1.67 1.73 1.78 1.82 1.85 1.88

Os valores dos percentís aqui apresentados, representam o enquadramento das alturas da


turma que começam de 1,55 e terminam em 1,89.

4.3 Decís

De todos os decís os mais importantes são:

Tabela 2.23 – Principais Decís

Decíl Notação Definição, propriedades

1º D1 10% dos dados tomam valores menores ou iguais


2º D2 20% dos dados tomam valores menores ou iguais
5º D5 50% dos dados tomam valores menores ou iguais
9º D9 90% dos dados tomam valores menores ou iguais

10
Resumo das medidas de Posição (separatrizes)

Quartis: dividem a série em 4 partes iguais

Q1 = 1º quartil, deixa 25% dos elementos

n
1º) Calcular a posição: posição = (seja n ímpar ou par)
4

2º) Pela Fi identifica-se a classe que contém o Q1


n
−F
i
3º) Aplica-se a fórmula: Qi = L Q1 +4 c
f Q1
sendo

* LQ1 = limite inferior da classe do Q1


* n = tamanho da amostra ou nº de elementos
* Fi = frequência acum. anterior à classe do Q1
* c = intervalo da classe do Q1
* f Q1 = frequência simples da classe do Q1

Q2 = 2º quartil, é igual a mediana, deixa 50% dos elementos

Q3 = 3º quartil, deixa 75% dos elementos

3n
1º) Calcular a posição: posição = (seja n ímpar ou par)
4

2º) Pela Fi identifica-se a classe que contém do Q3


3n
− Fi
Q = L + 4 c
3º) Aplica-se a fórmula: 3 Q
3
f Q3
sendo

* LQ3 = limite inferior da classe do Q3


* n = tamanho da amostra ou nº de elementos
* Fi = frequência acum. anterior à classe do Q3

* c = intervalo da classe do Q3
* f Q3 = frequência simples da classe do Q3

11
Decis: dividem a série em 10 partes iguais
in
1º) Calcular a posição: posição = (seja n ímpar ou par), onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9
10

2º) Pela Fi identifica-se a classe que contém o Di


in
− Fi
3º) Aplica-se a fórmula: Di = L D1 + 10 c
f D1
sendo

* LDi = limite inferior da classe Di , i = 1, 2, 3, ..., 9


* n = tamanho da amostra ou nº de elementos
* Fi = frequência acum. anterior à classe do Di
* c = intervalo da classe do Di
* f Di = frequência simples da classe do Di

Percentis: dividem a série em 100 partes iguais

in
1º) Calcular a posição: posição = (seja n ímpar ou par), em que i = 1, 2, 3, ..., 98, 99
100

2º) Pela Fi identifica-se a classe que contém o Pi


in
− Fi
3º) Aplica-se a fórmula: Pi = LP1 + 100 c
f P1
sendo

* LPi = limite inferior da classe Pi , i = 1, 2, 3, ..., 99


* n = tamanho da amostra ou nº de elementos
* Fi = frequência acum. anterior à classe do Pi
* c = intervalo da classe do Pi
* f Pi = frequência simples da classe do Pi

Vimos que o resumo de dados por meio de tabelas de frequências, diagramas (de
Barras, ramo e folhas, histogramas e circular) fornecem muito mais informações
sobre o comportamento de uma variável do que a própria tabela ou a organização
original de dados. Muitas vezes é ainda mais cómodo resumir ainda mais esses
dados, apresentando resultados que resumem toda a conjuntura de dados. É
evidente, que um único número (de princípio real) que possa resumir todos os
dados, pode nalguns casos fornecer informação relevante, casos das medidas de
12
posição (localização/ tendência central) ou mesmo as de dispersão.
Resumo: Medidas de posição - quartis, percentis e decís. Os quartis dividem o
conjunto de dados em quatro partes iguais, os percentis em cem partes iguais e
os decís em dez partes iguais.

13

Você também pode gostar