Você está na página 1de 11

alfaconcursos.com.

br

SUMÁRIO
ESTATÍSTICA DESCRITIVA: FORMA..................................................................................................................... 2
MEDIDAS DE FORMA ..................................................................................................................................... 2
ASSIMETRIA (As) ............................................................................................................................................ 2
DISTRIBUIÇÃO SIMÉTRICA ......................................................................................................................... 3
DISTRIBUIÇÃO ASSIMÉTRICA À DIREITA (OU POSITIVA):........................................................................... 4
DISTRIBUIÇÃO ASSIMÉTRICA À ESQUERDA (OU NEGATIVA): .................................................................... 4
COEFICIENTE DE ASSIMETRIA DE PEARSON .............................................................................................. 6
COEFICIENTE QUARTÍLICO DE ASSIMETRIA ............................................................................................... 7
CURTOSE (C) .................................................................................................................................................. 8
DISTRIBUIÇÃO MESOCÚRTICA ................................................................................................................... 8
DISTRIBUIÇÃO LEPTOCÚRTICA .................................................................................................................. 9
DISTRIBUIÇÃO PLATICÚRTICA .................................................................................................................... 9

MUDE SUA VIDA!


1
alfaconcursos.com.br

ESTATÍSTICA DESCRITIVA: FORMA


MEDIDAS DE FORMA
As medidas de forma, ou de formato, caracterizam como os dados estão distribuídos em
relação a si mesmos. Com essas medidas, é possível determinar uma tendência da curva de
frequência. As principais informações são quanto à assimetria e ao grau de achatamento da
distribuição. Entenda por distribuição todos os valores que a variável pode assumir e onde
estão mais concentrados (com maior frequência). A melhor forma de representar uma
distribuição é a partir da curva de frequência.

ASSIMETRIA (As)
A medida de assimetria caracteriza como e quanto a distribuição (ou frequência) dos
dados se afasta de uma condição simétrica, isto é, indica o grau de distorção em relação à
simetria. Os dados são distribuídos simetricamente quando, ao separar em duas partes iguais,
possuem formatos iguais de distribuição para os dois lados. Portanto, ao cortar uma
distribuição na sua mediana, que separa o conjunto de dados em dois grupos de 50%, o
formato das distribuições particionadas deve ser igual para que a distribuição seja simétrica.
Assim:

MUDE SUA VIDA!


2
alfaconcursos.com.br

Na distribuição dos dados representada acima, o ponto da mediana separa em dois


componentes igualmente distribuídos (com a mesma forma). Nessa condição, os dados são
considerados simétricos. Qualquer posicionamento diferente da mediana, modificando as
duas partes da distribuição, de modo que não tenham mais formatos iguais, faz com que o
conjunto de dados não tenha mais distribuição simétrica. Desse modo, as distribuições podem
ser da seguinte forma:
 Simétrica;
 Assimétrica à Esquerda (ou Negativa);
 Assimétrica à Direito (ou Positiva).

Os diferentes tipos de distribuições estão associados a outras informações relevantes na


Estatística Descritiva. Basicamente, a assimetria possui uma relação com as medidas de
tendência central, bem como as separatrizes. Por isso, pode-se detectar a assimetria do
conjunto de dados pelos valores da média, mediana e moda; pelas distâncias dos quartis; pela
presença de valores atípicos; e pelas frequências dos dados. Nesse exposto, os gráficos mais
comuns aplicados em provas, para detectar a assimetria, são a curva de frequência e o box-
plot.

DISTRIBUIÇÃO SIMÉTRICA

Os dados com distribuição simétrica têm os valores de média, mediana e moda iguais
para uma distribuição unimodal. Desse modo, em uma curva de frequência com distribuição
simétrica, o pico da curva (ponto com maior frequência) será o valor de todas as três medidas
de tendência central. Além disso, é possível observar que as distâncias entre os quartis
extremos (Q1 e Q3) com o quartil central (Q2) são iguais, isto é, são equidistantes. Isso ocorre
porque os dados são distribuídos igualmente para ambos os lados, e os quartis Q1 e Q3 estão
distanciados da posição do centro na proporção de 25% cada um.

MUDE SUA VIDA!


3
alfaconcursos.com.br

DISTRIBUIÇÃO ASSIMÉTRICA À DIREITA (OU POSITIVA):

Em distribuições assimétricas à direita (ou positiva), existem observações extremas


para o lado direito do plano cartesiano – direção para o sentido positivo da variável. A cauda
da distribuição de frequência prolonga-se para o lado direito. Nessa situação, temos que a
média é maior que a mediana, e ambas são maiores que a moda, em uma distribuição
unimodal. Isso ocorre, praticamente, porque a média é uma medida mais sensível a valores
extremos, já que considera todas as observações em seu cálculo. Assim, é possível afirmar que,
para onde a distribuição se deslocar, a média irá se deslocar junto. A mediana terá um
deslocamento bem menor para a direita, e a moda permanece sendo o valor mais frequente.
Em adição, a diferença entre o Q3 e o Q2 é maior do que a diferença entre o Q2 e o Q1. Essa
variação de distância ocorre porque os dados estão mais deslocados para a direita e, portanto,
o valor da posição do Q3 é mais distante. Na assimetria à direita, é provável que existam
outliers para os valores positivos. A existência de outliers, por si só, já determina uma
distribuição assimétrica, mesmo que seja observada uma equidistância entre os quartis.

DISTRIBUIÇÃO ASSIMÉTRICA À ESQUERDA (OU NEGATIVA):

MUDE SUA VIDA!


4
alfaconcursos.com.br

O raciocínio inverso se aplica a uma distribuição assimétrica à esquerda (em direção ao


sentido negativo da variável). A cauda da distribuição de frequência prolonga-se para o lado
esquerdo. Além disso, a média é mais influenciada para o lado esquerdo e se torna o menor
valor das medidas de centralidade, em uma distribuição unimodal. Logo, a moda é maior que a
mediana que é maior que a média. Junto a isso, podem ser observados outliers para o sentido
negativo da variável e a distância entre o Q2 e o Q1 será maior que a distância entre o Q3 e o Q2.

Todas as informações apresentadas, quanto a assimetria, são válidas para dados que
possuem apenas uma moda (unimodal). Quando o conjunto de dados não for unimodal,
algumas informações podem não ser exatamente iguais ao exposto anteriormente. Nessa
circunstância, é recomendado ilustrar a distribuição dos dados em gráficos, particionar o
conjunto de dados no valor da mediana e, por fim, observar se as duas partes têm formato
simétrico. Exemplo:

Freq. Acumulada
𝑿𝑿𝒊𝒊 Freq. Relativa
Relativa
2 30% 30%
4 10% 40%
6 20% 60%
8 10% 70%
10 30% 100%

A tabela acima evidencia a distribuição de frequência de uma variável X qualquer. É


possível observar que existem duas modas nesse conjunto de dados (Mo = 2 e 10). A
observação de valor 6 é a mediana, isto é, acumula 50% do conjunto de dados. Desse modo, ao
representar a distribuição de frequências dessa variável e separá-la no valor da mediana,
teremos a seguinte ilustração:

Observe que os dois formatos da distribuição particionada são espelhados (simétricos).


Desse modo, temos uma distribuição simétrica em que a moda é diferente da mediana e da
média. No entanto, os valores da média e da mediana são iguais. Assim, ao identificar que se

MUDE SUA VIDA!


5
alfaconcursos.com.br

trata de um conjunto de dados com distribuição não unimodal, a representação gráfica pode
ser uma alternativa interessante para identificar a assimetria dos dados.
Além de identificar a assimetria de uma variável pela sua distribuição de frequência, é
possível calcular o coeficiente de assimetria que permite classificar quanto ao tipo de
assimetria, além de quantificar o grau de distorção do conjunto de dados em relação a uma
forma simétrica. As fórmulas mais cobradas em prova para quantificar o coeficiente de
assimetria são:

COEFICIENTE DE ASSIMETRIA DE PEARSON


Existem dois coeficientes de Pearson que calculam o grau de assimetria de uma
distribuição de dados, o primeiro coeficiente de Pearson pode ser obtido da seguinte forma:

� − 𝑴𝑴𝑴𝑴)
(𝑿𝑿
𝑨𝑨𝑨𝑨 =
𝒔𝒔
O 1º coeficiente de Pearson é calculado a partir da diferença da média pela moda,
dividido pelo desvio-padrão. Essa fórmula pode ser inconsistente quando a distribuição dos
dados não foram unimodais, como exemplificado na situação anterior, assim surge a
necessidade de um segundo coeficiente que seja mais eficiente para quantificar a assimetria
dos dados em qualquer situação. Dessa forma, o segundo coeficiente de Pearson pode ser
calculado por:

� − 𝑴𝑴𝑴𝑴)
𝟑𝟑(𝑿𝑿
𝑨𝑨𝑨𝑨 =
𝒔𝒔
O 2º coeficiente de Pearson é obtido por três vezes a diferença entre a média e a
mediana, dividido pelo desvio-padrão. Esse coeficiente consegue quantificar com mais
eficiência a assimetria uma vez que o valor da mediana assume apenas um resultado.

Para ambos os coeficientes, os resultados são interpretados da seguinte forma:


 As = 0, dados com distribuição simétrica;
 As > 0, dados com distribuição assimétrica à direita, ou positiva;
 As < 0, dados com distribuição assimétrica à esquerda, ou negativa.

É fácil interpretar os possíveis resultados do coeficiente de assimetria de Pearson já que


os valores positivos indicam uma assimetria positiva, assim como, valores negativos indicam
assimetria negativa. Observe que o sinal do coeficiente de assimetria é determinado pela
diferença da média com a moda ou com a mediana, e o resultado coincide com as relações de
assimetria estudadas. Junto a isso, quanto mais distante o coeficiente de assimetria for em
relação a zero, maior será o grau de distorção da distribuição de frequência em relação a uma
forma simétrica.

MUDE SUA VIDA!


6
alfaconcursos.com.br

COEFICIENTE QUARTÍLICO DE ASSIMETRIA


O coeficiente quartílico de assimetria trabalha com a ideia das distâncias entre os
quartis e sua relação com a assimetria da distribuição de dados. Assim, o cálculo pode ser
efetuado da seguinte maneira:
𝑸𝑸𝟑𝟑 + 𝑸𝑸𝟏𝟏 − 𝟐𝟐𝟐𝟐𝟐𝟐
𝑨𝑨𝑨𝑨 =
𝑸𝑸𝟑𝟑 − 𝑸𝑸𝟏𝟏

Os valores desse coeficiente oscilam entre -1 até +1. A interpretação dos resultados são
as mesmas que o coeficiente de Pearson.
 As = 0, dados com distribuição simétrica;
 As > 0, dados com distribuição assimétrica à direita, ou positiva;
 As < 0, dados com distribuição assimétrica à esquerda, ou negativa.

Os coeficientes de assimetria são todos adimensionais (sem unidade de medida), por


isso, o coeficiente de assimetria de uma variável pode ser comparado com o coeficiente de
outra variável, mesmo sendo dados de natureza completamente diferente. Basicamente, a
comparação fornece a ideia de qual conjunto de dados distancia-se mais de uma forma
simétrica. Para exemplificar o cálculo do coeficiente de assimetria, vamos utilizar o exemplo
abordado no cálculo das medidas de posição.

Conforme os valores do exemplo, o cálculo dos coeficientes de assimetria são:

 1º Coeficiente de Pearson:
(𝟏𝟏𝟏𝟏, 𝟒𝟒𝟒𝟒 − 𝟏𝟏𝟏𝟏) −𝟎𝟎, 𝟔𝟔𝟔𝟔
𝑨𝑨𝑨𝑨 = = = −𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎
𝟖𝟖, 𝟖𝟖𝟖𝟖 𝟖𝟖, 𝟖𝟖𝟖𝟖

MUDE SUA VIDA!


7
alfaconcursos.com.br

 2º Coeficiente de Pearson:
𝟑𝟑(𝟏𝟏𝟏𝟏, 𝟒𝟒𝟒𝟒 − 𝟏𝟏𝟏𝟏) −𝟏𝟏, 𝟗𝟗𝟗𝟗
𝑨𝑨𝑨𝑨 = = = −𝟎𝟎, 𝟐𝟐𝟐𝟐𝟐𝟐
𝟖𝟖, 𝟖𝟖𝟖𝟖 𝟖𝟖, 𝟖𝟖𝟖𝟖
 Coeficiente Quartílico:

𝟐𝟐𝟐𝟐 + 𝟕𝟕, 𝟓𝟓 − 𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐 𝟐𝟐𝟐𝟐, 𝟓𝟓 − 𝟑𝟑𝟑𝟑 −𝟐𝟐, 𝟓𝟓


𝑨𝑨𝑨𝑨 = = = = −𝟎𝟎, 𝟐𝟐
𝟐𝟐𝟐𝟐 − 𝟕𝟕, 𝟓𝟓 𝟏𝟏𝟏𝟏, 𝟓𝟓 𝟏𝟏𝟏𝟏, 𝟓𝟓
Todos os resultados obtidos indicam que os dados são distribuídos assimetricamente
para o lado negativo (à esquerda). Como os valores são próximos de zero, é possível inferir
que os dados são levemente assimétricos, sendo sua distribuição de frequência muito próxima
a uma forma assimétrica.

CURTOSE (C)
A medida de curtose indica o grau de concentração dos dados em relação a sua
centralidade, também pode ser abordada como grau de achatamento da curva de frequência.
Basicamente, a forma da curva de frequência em relação à curtose pode ser:

DISTRIBUIÇÃO MESOCÚRTICA
A distribuição dos dados com curtose mesocúrtica é o ponto de referência para
discriminar os demais tipos de curtose. Isso porque ela possui uma distribuição normal,
comportamento que os fenômenos de modo geral tendem a apresentar. Nesse tipo de curtose,
observa-se um aumento gradativo de frequência quando os dados se aproximam da sua
centralidade (média, mediana e moda), isto é, o grau de achatamento da curva é mediano.

MUDE SUA VIDA!


8
alfaconcursos.com.br

DISTRIBUIÇÃO LEPTOCÚRTICA
A curtose leptocúrtica apresenta observações mais concentradas em valores com
maiores frequências (maior concentração na centralidade), comparativamente à curtose
mesocúrtica. Observa-se um aumento mais abrupto na frequência quando se aproxima da
centralidade. A distribuição apresenta uma curva de frequência mais fechada que a normal
(ou mais aguda em sua parte superior).

DISTRIBUIÇÃO PLATICÚRTICA
A curtose platicúrtica apresenta observações mais distribuídas ao longo de todo
conjunto de dados com valores de frequência mais homogêneos entre as observações (menor
concentração na centralidade), comparativamente à curtose mesocúrtica. A curva de
frequência apresenta-se mais aberta que a normal (ou mais achatada na parte superior, como
um platô).

MUDE SUA VIDA!


9
alfaconcursos.com.br

Além de identificar a curtose pela forma da distribuição de frequências, é possível


quantificá-la por meio do coeficiente percentílico de curtose (C). Calculado da seguinte forma:

𝑸𝑸𝟑𝟑 − 𝑸𝑸𝟏𝟏 𝑸𝑸𝟑𝟑 − 𝑸𝑸𝟏𝟏


𝑪𝑪 = 𝒐𝒐𝒐𝒐
𝟐𝟐(𝑷𝑷𝟗𝟗𝟗𝟗 − 𝑷𝑷𝟏𝟏𝟏𝟏 ) 𝟐𝟐(𝑫𝑫𝟗𝟗 − 𝑫𝑫𝟏𝟏 )

Outra forma de representar a fórmula é:


𝑫𝑫𝑸𝑸
𝑪𝑪 =
(𝑫𝑫𝟗𝟗 − 𝑫𝑫𝟏𝟏 )

Os resultados do coeficiente percentílico de curtose podem ser os seguintes:


 C = 0,263 corresponde à curva mesocúrtica, valor observado na curva normal;
 C < 0,263 corresponde à curva leptocúrtica;
 C > 0,263 corresponde à curva platicúrtica.

É possível interpretar que quanto mais distante o coeficiente de curtose estiver do valor
0,263, maior é distorção em relação à curva normal, sendo mais achatada para valores
maiores que 0,263, ou mais aguda para valores menores que 0,263. Além disso, é interessante
observar que o coeficiente é adimensional, sendo passível a comparação com outras
distribuições de dados.

Para exemplificar, será abordado o mesmo exemplo anterior:

MUDE SUA VIDA!


10
alfaconcursos.com.br

O cálculo fica da seguinte forma:


𝟐𝟐𝟐𝟐 − 𝟕𝟕, 𝟓𝟓 𝟏𝟏𝟏𝟏, 𝟓𝟓
𝑪𝑪 = = = 𝟎𝟎, 𝟐𝟐𝟐𝟐𝟐𝟐
𝟐𝟐(𝟑𝟑𝟑𝟑 − 𝟎𝟎) 𝟔𝟔𝟔𝟔

Com o seguinte resultado é possível afirmar que a distribuição dos dados é levemente
platicúrtica, ou seja, as observações estão mais distribuídas por todo intervalo do conjunto de
dados.

MUDE SUA VIDA!


11

Você também pode gostar