Escolar Documentos
Profissional Documentos
Cultura Documentos
Medidas Descritivas
A partir de agora suponha que os dados observados na amostra são x1, x2, ..., xn. Note que n é o
tamanho da amostra. A partir dos x's observados vamos encontrar números que resumem as características da
amostra. Estamos interessados em dois tipos principais de medidas numéricas: as que caracterizam a
localização do centro da amostra e as que caracterizam a dispersão dos dados.
MEDIDAS DE POSIÇÃO: São as estatísticas que representam uma série de dados orientando-nos quanto à
posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência.
As medidas de posições mais importantes são as medidas de tendência central (verifica-se uma
tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência
central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as
médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as
separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.
.
a) Média Aritmética: é uma medida que indica onde está o "centro" da sua amostra ou da população. As
fórmulas de cálculo são apresentadas a seguir:
Propriedades da Média:
1 - A soma algébrica dos desvios (diferença entre cada elemento de um conjunto de valores e a média) é
nula: ;
2 - A soma dos quadrados dos desvios em relação a sua média é um valor mínimo;
3 - A média de um conjunto de dados acrescido (ou subtraído) em cada elemento por uma constante é igual a
média original mais (ou menos) essa constante: ;
4 - Multiplicando todos os dados por uma constante a nova média será igual ao produto da média anterior
pela constante: ;
5 - A média é influenciada por valores extremos.
b) Mediana (Md): é o valor que divide o conjunto de dados ordenados ao meio (para a amostra e para a
população).
Obs.:
1 - De modo geral, o uso da mediana é indicado quando:
· Quando desejamos obter o ponto que divide a distribuição em duas partes iguais;
· Os valores para a variável em estudo têm distribuição de frequências assimétrica (verificada através
das ferramentas gráficas);
· O conjunto de dados possui algumas poucas observações extremas (valores muito mais altos ou muito
mais baixos que os outros);
· Não conhecemos exatamente o valor de algum elemento, mas temos alguma informação sobre a ordem
que ele ocupa no conjunto de dados. Por exemplo, no caso de salários, se alguém não quisesse informar
o quanto recebe, mas apenas dissesse que ganha mais (ou menos) do que um certo valor, de modo que
conseguíssemos determinar uma ordem para essa pessoa, poderíamos calcular a mediana, mas não a
média.
2 - A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da
diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos).
Vejamos:
Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10
c) Moda (Mo): A moda amostral é simplesmente a observação mais frequente na amostra. Se os dados são:
1, 4, 8, 12, 5, 4, 4, 7, a moda é 4, o valor que ocorreu mais vezes. Também é possível definir a moda de uma
população.
Obs: A moda, ao contrário das outras medidas de tendência central, pode ser obtida mesmo que a variável
seja qualitativa. A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média
aritmética é a medida de posição que possui a maior estabilidade.
MEDIDAS SEPARATRIZES: São números reais que dividem a sequencia ordenada de dados em partes
que contêm a mesma quantidade de elementos da série. Desta forma, a mediana que divide a sequencia
ordenada em dois grupos, cada um deles contendo 50% dos valores da sequencia, é também uma medida
separatriz. Além da mediana, as outras medidas separatrizes que destacamos são os quartis.
Quartil: Frequentemente é desejável dividir os dados em quatro partes, cada parte contendo um quarto ou
25% das observações, aproximadamente. Os pontos da divisão são referidos como quartis e estão definidos
como:
Q1 = Primeiro quartil, é o valor que com que pelo menos 25% das observações sejam menores ou iguais e
pelo menos 75% são maiores ou iguais: P
Q2 = Segundo quartil, (também a mediana), é o valor que com que pelo menos 50% das observações sejam
menores ou iguais e pelo menos 50% são maiores ou iguais.
Q3 = Terceiro quartil, é o valor que com que pelo menos 75% das observações sejam menores ou iguais e
pelo menos 25% são maiores ou iguais: P
As medidas de tendência central não são as únicas medidas necessárias para caracterizar
uma amostra (ou população). Métodos estatísticos também são usados para nos ajudar a entender a
variabilidade. Por variabilidade, entende-se que sucessivas observações de um sistema ou
fenômeno não produzem o mesmo resultado, então precisamos também saber o quanto as
observações na amostra estão "espalhadas". As medidas de dispersão ou de variabilidade são
medidas que informam sobre a dispersão dos dados e são necessárias para, junto com a média,
representar bem um conjunto de observações. A seguir estudaremos algumas medidas de
variabilidade que são importantes.
a) Amplitude Total: É a diferença entre o maior e o menor valor observado. É a única medida de dispersão
que não tem na média o ponto de referência.
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar
a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem
muita exatidão.
b) Desvio Médio Absoluto (Dm): Para dados brutos: É a média aritmética dos valores absolutos dos desvios
tomados em relação a uma das seguintes medidas de tendência central: média ou mediana.
c) Variância: É a medida mais comum de dispersão, ela é dada pela ponderação da soma do
quadrado dos desvios.
Obs.:
1 - A variância (da amostra ou da população) é sempre maior ou igual a zero.
2 - A unidade de medida da variância é o quadrado da unidade de medida das observações. Assim,
se os dados estão em metros, à variância é expressa em metros quadrados. Isso dificulta a
interpretação da variância amostral. Para evitar isso trabalhamos com o desvio padrão, definido a
seguir.
d) Desvio Padrão: É definido como a raiz quadrada positiva da variância. Pelos comentários acima
concluímos que ele é sempre expresso nas mesmas unidades de medida que as observações do
conjunto de dados.
No caso de uma amostra: . No caso de uma população: .
Na interpretação do desvio padrão, lembre-se de que ele é a medida de quanto uma entrada
típica se desvia da média. Quanto mais espalhadas estiverem as entradas, maior será o desvio
padrão.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão
ou variabilidade, quando expressas em unidades diferentes.