Você está na página 1de 6

ActivALEA

active e actualize a sua literacia

N. 20 - DIIAAG
GRRA
AMMA
AD E EX
DE XTTR
REEM
MOOS
SEE QU
UAAR
RTTIIS
S

Por: Maria Eugnia Graa Martins


Departamento de Estatstica e Investigao Operacional da FCUL
memartins@fc.ul.pt

O diagrama de extremos e quartis a representao grfica que melhor se posiciona na


relao custo/benefcio! Efectivamente, custa unicamente de cinco nmeros, trs dos quais
calculados a partir dos dados e os outros dois resultantes de uma simples observao dos
dados, obtm-se uma representao muito esclarecedora sobre a forma como os dados se
distribuem, nomeadamente quanto :
maior ou menor concentrao;
simetria;
existncia de valores aberrantes.
tambm muito til ainda para comparar vrios conjuntos de dados.

Quais so ento esses cinco nmeros, a partir dos quais se constri o


diagrama de extremos e quartis? Quatro desses nmeros so, como o
nome indica, os extremos mnimo e mximo, e os quartis 1 quartil
(Q1 ou Q0,25) e 3 quartil (Q3 ou Q0,75). O outro nmero a mediana (m).

De seguida sero apresentados alguns exemplos de representaes de conjuntos de dados em


diagramas de extremos e quartis, realando-se as principais caractersticas desta
representao grfica.
Esta ActivALEA acompanhada de uma aplicao interactiva que possibilita a representao
de um conjunto de dados num diagrama de extremos e quartis.

www.alea.pt
O diagrama de extremos e quartis pode-se construir horizontal ou verticalmente. Vamos
comear por fazer uma representao horizontal e depois apresentamos uma representao
vertical, que a forma apresentada pelo Excel.

Exemplo 1 Os dados seguintes representam as pontuaes obtidas por 48 estudantes, num


determinado teste. Apresente-os num diagrama de extremos e quartis.

75 98 42 75 84 87 65 59 63 86 78 37
99 66 90 79 80 89 68 57 95 55 79 88
76 60 77 49 92 83 71 78 53 81 77 58
93 85 70 62 80 74 69 90 62 84 64 73

Para obter os cinco nmeros a partir dos quais se constri o diagrama de extremos e quartis,
deve-se comear por ordenar a amostra. Uma representao em caule-e-folhas pode ser til
para ordenar a amostra e calcular a mediana e os quartis.1

3 7
4 2 9
5 3 5 7 8 9
6 0 2 2 3 4 5 6 8 9
7 0 1 2 4 5 5 6 7 7 8 8 9 9
8 0 0 1 3 4 4 5 6 7 8 9
9 0 0 2 3 5 8 9 3|7 significa 37 pontos

Como temos 48 dados, a mediana a semi-soma dos elementos que se encontram nas
48 1
posies 24 e 25 (inteiros que rodeiam o valor =24,5), que assinalmos a azul, ou seja
2
76 77
Mediana = =76,5 pontos.
2

Os quartis so as medianas de cada uma das partes em que ficou dividido o conjunto dos
dados pela mediana, cada uma com 24 elementos.
O 1 quartil a semi-soma dos elementos que se encontram nas posies 12 e 13 (inteiros que
24 1
rodeiam =12,5) a contar do incio do caule-e-folhas, assinalados a verde, ou seja
2
63 64
1 quartil = =63,5 pontos.
2
O 3 quartil a semi-soma dos elementos que se encontram nas posies 12 e 13 a contar do
84 85
fim do caule-e-folhas, assinalados a laranja, ou seja 3 quartil = = 84,5 pontos.
2

1
ver ActivAlea n. 19 Diagrama de Caule-e-folhas http://www.alea.pt/html/statofic/html/dossier/html/activalea19.html

www.alea.pt
Quanto ao mnimo e ao mximo, so, respectivamente, 37 e 99 pontos.
Para construir o diagrama de extremos e quartis, desenha-se um rectngulo com comprimento
igual amplitude entre os quartis e com altura qualquer (a altura do rectngulo no tem
qualquer significado).
Dentro do rectngulo desenha-se um segmento de recta que assinala a posio da mediana.
Dos lados do rectngulo determinados pelo 1 quartil e pelo 3 quartil saem dois segmentos de
recta, at ao mnimo e at ao mximo, respectivamente:

Da representao anterior ressalta imediatamente que:


25% das notas so menores ou iguais a 63 pontos (as notas esto dadas em nmeros
inteiros);
25% das notas so superiores ou iguais a 85 pontos;
50% das notas esto compreendidas entre 64 e 84 pontos;
Existe algum enviesamento do lado esquerdo, isto , os dados esto mais dispersos, ou
seja, menos concentrados na parte inferior do que na parte superior; tambm na parte
central dos dados existe algum enviesamento para a esquerda.

Existem fundamentalmente duas caractersticas do diagrama de extremos e quartis que nos


do ideia da simetria ou enviesamento dos dados e que so:
Distncia entre a linha indicadora da mediana e os lados do rectngulo;
Comprimento das linhas que saem dos lados do rectngulo.

Apresentamos de seguida 3 exemplos de diagramas de extremos e quartis correspondentes a


tipos diferentes de distribuio dos dados.

Por vezes, existem alguns conjuntos de dados cuja representao num diagrama de extremos e
quartis inesperada! Ora vejamos o seguinte exemplo.

www.alea.pt
Exemplo 2 Recolheu-se a idade de 19 alunos que frequentam a disciplina de Estatstica de
um curso da Faculdade de Cincias, tendo-se obtido os seguintes resultados:

19, 20, 20, 21, 21, 20, 19, 20, 22, 23, 21, 21, 20, 25, 20, 19, 21, 44, 20
Represente os dados num diagrama de extremos e quartis e tire concluses sobre a estrutura
dos dados.
Ordenando o conjunto de dados anteriores, tem-se

Mnimo = 19 Mximo = 44
20 20
1 quartil = =20
2
Mediana = 20
21 21
3 quartil = =21
2

A representao anterior mostra que estamos perante uma situao de extremo enviesamento,
em que o diagrama de extremos e quartis pouco claro! Efectivamente, no aparece a linha
que indica a mediana, o que significa que esta se confunde com o 1 ou o 3 quartil. Esta uma
situao em que o diagrama de extremos e quartis apresenta alguma ambiguidade. Se nos
tivessem apresentado esta representao sem estar acompanhada dos dados, devido ao
grande enviesamento dos 25% de dados superiores, seria natural presumir que tambm
existiria enviesamento para a direita nos 50% dos dados centrais e que, portanto, a mediana se
confundia com o 1 quartil. Como temos os dados, podemos confirmar que, na verdade, o 1
quartil se confunde com a mediana.
Por outro lado, o valor 44 que aparece nos dados anteriores um pouco aberrante, quando
comparado com os restantes, pois muito maior que todos os outros dados.

Existe uma verso do diagrama de extremos e quartis que permite visualizar os valores que se
consideram aberrantes, por sarem do contexto dos restantes, e a que usual dar o nome de
outliers. Essa verso designada em ingls por box-and-whiskers, tem a traduo portuguesa de
caixa-com-bigodes.

www.alea.pt
Caixa-com-bigodes
Considera-se uma caixa que um rectngulo tal como foi desenhado para o diagrama de
extremos e quartis.
Consideram-se seguidamente duas linhas que unem os meios dos lados dos rectngulos com o
menor e maior elementos da amostra que esto dentro das barreiras de outliers, definidas a
seguir. Os outros elementos que no esto no intervalo constitudo pelas barreiras de outliers
so assinalados com o smbolo *.

O QUE SO AS BARREIRAS DE OUTLIERS?

Define-se barreira inferior como sendo o valor

Q.25 1,5 (Q.75 - Q.25)


Define-se barreira superior como sendo o valor
Q.75 + 1,5 (Q.75 - Q.25)

Quando que consideramos um valor como outlier?


Dizemos que um valor outlier quando no est compreendido no intervalo [barreira inferior,
barreira superior]. Numa representao em caixa-com-bigodes, os outliers assinalam-se com o
smbolo *.

No caso do exemplo anterior, obter-se-ia a seguinte representao em caixa-com-bigodes:


Barreira inferior = 20 1,5 (21-20)
= 18,5
Barreira superior = 21 + 1,5 (21-20)
= 22,5

Da representao anterior, conclumos que existem 3 outliers, concretamente o 23, 25 e 44.

www.alea.pt
Construo do diagrama de extremos e quartis com o Excel

Como j temos afirmado vrias vezes, embora o Excel no seja um software de Estatstica,
permite a construo de algumas representaes grficas, uma das quais o diagrama de
extremos e quartis. Esta construo pode ser consultada no dossi XIII Estatstica Descritiva
com Excel Complementos, pginas 63-66, na rea Dossis e recursos do ALEA2.
Para obter a representao em diagrama de extremos e quartis dos dados do Exemplo 1,
comemos por inserir os dados num ficheiro Excel e de seguida calculmos os 5 nmeros
necessrios para construir o diagrama, como se apresenta a seguir:

com os seguintes resultados:

Repare-se que os valores obtidos para os quartis, utilizando o Excel, no so iguais aos obtidos
anteriormente, seguindo as indicaes do Exemplo 1. Efectivamente, a regra utilizada pelo
Excel nem sempre coincide com a regra que se
utiliza para calcular os quartis, em que estes so
obtidos como a mediana de cada uma das partes
em que fica dividida a amostra pela mediana (se
a dimenso da amostra for mpar, ou seja, se a
mediana for um dos elementos da amostra,
considera-se como pertencente s duas partes).
Esta situao no grave, pois os valores
obtidos pelas duas regras so aproximados.

2
http://www.alea.pt/html/statofic/html/dossier/html/meio_dossier13.html

www.alea.pt