Você está na página 1de 4

UFPI – CCN – DIE – Disciplina: Estatística – Curso: C.

da Computação – Profª: Lya Raquel

Medidas Descritivas

A partir de agora suponha que os dados observados na amostra são x1, x2, ..., xn. Note que n é o
tamanho da amostra. A partir dos x's observados vamos encontrar números que resumem as características da
amostra. Estamos interessados em dois tipos principais de medidas numéricas: as que caracterizam a
localização do centro da amostra e as que caracterizam a dispersão dos dados.

MEDIDAS DE POSIÇÃO: São as estatísticas que representam uma série de dados orientando-nos quanto à
posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência.

As medidas de posições mais importantes são as medidas de tendência central (verifica-se uma
tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência
central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as
médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as
separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.
.
a) Média Aritmética: é uma medida que indica onde está o "centro" da sua amostra ou da população. As
fórmulas de cálculo são apresentadas a seguir:

Para a amostra: . Para a população: .

Propriedades da Média:
1 - A soma algébrica dos desvios (diferença entre cada elemento de um conjunto de valores e a média) é

nula: ;

2 - A soma dos quadrados dos desvios em relação a sua média é um valor mínimo;
3 - A média de um conjunto de dados acrescido (ou subtraído) em cada elemento por uma constante é igual a
média original mais (ou menos) essa constante: ;
4 - Multiplicando todos os dados por uma constante a nova média será igual ao produto da média anterior
pela constante: ;
5 - A média é influenciada por valores extremos.

b) Mediana (Md): é o valor que divide o conjunto de dados ordenados ao meio (para a amostra e para a
população).

sendo n ímpar ou, sendo n par.

Obs.:
1 - De modo geral, o uso da mediana é indicado quando:
· Quando desejamos obter o ponto que divide a distribuição em duas partes iguais;
· Os valores para a variável em estudo têm distribuição de frequências assimétrica (verificada através
das ferramentas gráficas);
· O conjunto de dados possui algumas poucas observações extremas (valores muito mais altos ou muito
mais baixos que os outros);
· Não conhecemos exatamente o valor de algum elemento, mas temos alguma informação sobre a ordem
que ele ocupa no conjunto de dados. Por exemplo, no caso de salários, se alguém não quisesse informar
o quanto recebe, mas apenas dissesse que ganha mais (ou menos) do que um certo valor, de modo que
conseguíssemos determinar uma ordem para essa pessoa, poderíamos calcular a mediana, mas não a
média.

2 - A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da
diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos).
Vejamos:
Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10

c) Moda (Mo): A moda amostral é simplesmente a observação mais frequente na amostra. Se os dados são:
1, 4, 8, 12, 5, 4, 4, 7, a moda é 4, o valor que ocorreu mais vezes. Também é possível definir a moda de uma
população.

Obs: A moda, ao contrário das outras medidas de tendência central, pode ser obtida mesmo que a variável
seja qualitativa. A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média
aritmética é a medida de posição que possui a maior estabilidade.

MEDIDAS SEPARATRIZES: São números reais que dividem a sequencia ordenada de dados em partes
que contêm a mesma quantidade de elementos da série. Desta forma, a mediana que divide a sequencia
ordenada em dois grupos, cada um deles contendo 50% dos valores da sequencia, é também uma medida
separatriz. Além da mediana, as outras medidas separatrizes que destacamos são os quartis.

Quartil: Frequentemente é desejável dividir os dados em quatro partes, cada parte contendo um quarto ou
25% das observações, aproximadamente. Os pontos da divisão são referidos como quartis e estão definidos
como:

Q1 = Primeiro quartil, é o valor que com que pelo menos 25% das observações sejam menores ou iguais e
pelo menos 75% são maiores ou iguais: P
Q2 = Segundo quartil, (também a mediana), é o valor que com que pelo menos 50% das observações sejam
menores ou iguais e pelo menos 50% são maiores ou iguais.

Q3 = Terceiro quartil, é o valor que com que pelo menos 75% das observações sejam menores ou iguais e
pelo menos 25% são maiores ou iguais: P

As regras a seguir são utilizadas para obter os valores de quartil:


1- Se o ponto de posicionamento resultante for um número inteiro, a observação numérica em questão,
correspondente àquele ponto de posicionamento, é escolhida para ser o quartil.
2- Se o ponto de posicionamento resultante estiver entre os dois números inteiros, a média de seus
respectivos valores é selecionada para ser o quartil.
3- Se o ponto de posicionamento resultante não se tratar de um número inteiro, nem corresponder ao
valor equivalente à metade do caminho entre dois números inteiros, uma regra simples consiste em
fazer o arredondamento até o número inteiro mais próximo e, em seguida, selecionar o valor
numérico relativo à observação correspondente.

MEDIDAS DE DISPERSÃO: É a diversificação dos valores de uma variável em torno de um valor de


tendência central ( média ou mediana ) tomado como ponto de comparação.

As medidas de tendência central não são as únicas medidas necessárias para caracterizar
uma amostra (ou população). Métodos estatísticos também são usados para nos ajudar a entender a
variabilidade. Por variabilidade, entende-se que sucessivas observações de um sistema ou
fenômeno não produzem o mesmo resultado, então precisamos também saber o quanto as
observações na amostra estão "espalhadas". As medidas de dispersão ou de variabilidade são
medidas que informam sobre a dispersão dos dados e são necessárias para, junto com a média,
representar bem um conjunto de observações. A seguir estudaremos algumas medidas de
variabilidade que são importantes.

a) Amplitude Total: É a diferença entre o maior e o menor valor observado. É a única medida de dispersão
que não tem na média o ponto de referência.

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar
a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem
muita exatidão.

b) Desvio Médio Absoluto (Dm): Para dados brutos: É a média aritmética dos valores absolutos dos desvios
tomados em relação a uma das seguintes medidas de tendência central: média ou mediana.

c) Variância: É a medida mais comum de dispersão, ela é dada pela ponderação da soma do
quadrado dos desvios.

A variância amostral, denotada por s2, é definida como: .

A variância populacional, denotada por 2, é definida como: .

Obs.:
1 - A variância (da amostra ou da população) é sempre maior ou igual a zero.
2 - A unidade de medida da variância é o quadrado da unidade de medida das observações. Assim,
se os dados estão em metros, à variância é expressa em metros quadrados. Isso dificulta a
interpretação da variância amostral. Para evitar isso trabalhamos com o desvio padrão, definido a
seguir.

d) Desvio Padrão: É definido como a raiz quadrada positiva da variância. Pelos comentários acima
concluímos que ele é sempre expresso nas mesmas unidades de medida que as observações do
conjunto de dados.
No caso de uma amostra: . No caso de uma população: .

Na interpretação do desvio padrão, lembre-se de que ele é a medida de quanto uma entrada
típica se desvia da média. Quanto mais espalhadas estiverem as entradas, maior será o desvio
padrão.

Propriedades do desvio padrão:


1 - Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não
se altera.
2 - Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de
zero), o desvio padrão fica multiplicado (ou dividido) pelo módulo dessa constante.
 
e) Coeficiente de Variação de Pearson - CVP (medida de dispersão relativa): é a razão entre o desvio
padrão e a média referentes a dados de uma mesma série multiplicado por 100%.
 Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão
de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no
entanto, se a média for igual a 20, o mesmo não pode ser dito.

 Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão
ou variabilidade, quando expressas em unidades diferentes.

Você também pode gostar