Você está na página 1de 6

ActivALEA

active e actualize a sua literacia

N. 20 - DIIA AG GR RA AM MA AD DE E EX XT TR RE EM MO OS SE E QU UA AR RT TIIS S

Por: Maria Eugnia Graa Martins Departamento de Estatstica e Investigao Operacional da FCUL memartins@fc.ul.pt

O diagrama de extremos e quartis a representao grfica que melhor se posiciona na relao custo/benefcio! Efectivamente, custa unicamente de cinco nmeros, trs dos quais calculados a partir dos dados e os outros dois resultantes de uma simples observao dos dados, obtm-se uma representao muito esclarecedora sobre a forma como os dados se distribuem, nomeadamente quanto :
maior ou menor concentrao; simetria; existncia de valores aberrantes.

tambm muito til ainda para comparar vrios conjuntos de dados.

Quais so ento esses cinco nmeros, a partir dos quais se constri o diagrama de extremos e quartis? Quatro desses nmeros so, como o nome indica, os extremos mnimo e mximo, e os quartis 1 quartil (Q1 ou Q0,25) e 3 quartil (Q3 ou Q0,75). O outro nmero a mediana (m). De seguida sero apresentados alguns exemplos de representaes de conjuntos de dados em diagramas de extremos e quartis, realando-se as principais caractersticas desta

representao grfica. Esta ActivALEA acompanhada de uma aplicao interactiva que possibilita a representao de um conjunto de dados num diagrama de extremos e quartis.

www.alea.pt

O diagrama de extremos e quartis pode-se construir horizontal ou verticalmente. Vamos comear por fazer uma representao horizontal e depois apresentamos uma representao vertical, que a forma apresentada pelo Excel. Exemplo 1 Os dados seguintes representam as pontuaes obtidas por 48 estudantes, num determinado teste. Apresente-os num diagrama de extremos e quartis.
75 99 76 93 98 66 60 85 42 90 77 70 75 79 49 62 84 80 92 80 87 89 83 74 65 68 71 69 59 57 78 90 63 95 53 62 86 55 81 84 78 79 77 64 37 88 58 73

Para obter os cinco nmeros a partir dos quais se constri o diagrama de extremos e quartis, deve-se comear por ordenar a amostra. Uma representao em caule-e-folhas pode ser til para ordenar a amostra e calcular a mediana e os quartis.1 3 4 5 6 7 8 9 7 2 9 3 5 7 8 9 0 2 2 3 4 5 6 8 9 0 1 2 4 5 5 6 7 7 8 8 9 9 0 0 1 3 4 4 5 6 7 8 9 0 0 2 3 5 8 9 3|7 significa 37 pontos

Como temos 48 dados, a mediana a semi-soma dos elementos que se encontram nas posies 24 e 25 (inteiros que rodeiam o valor Mediana =
76 77 =76,5 pontos. 2 48 1 =24,5), que assinalmos a azul, ou seja 2

Os quartis so as medianas de cada uma das partes em que ficou dividido o conjunto dos dados pela mediana, cada uma com 24 elementos. O 1 quartil a semi-soma dos elementos que se encontram nas posies 12 e 13 (inteiros que rodeiam
24 1 =12,5) a contar do incio do caule-e-folhas, assinalados a verde, ou seja 2 63 64 =63,5 pontos. 2 84 85 = 84,5 pontos. 2

1 quartil =

O 3 quartil a semi-soma dos elementos que se encontram nas posies 12 e 13 a contar do fim do caule-e-folhas, assinalados a laranja, ou seja 3 quartil =

ver ActivAlea n. 19 Diagrama de Caule-e-folhas http://www.alea.pt/html/statofic/html/dossier/html/activalea19.html

www.alea.pt

Quanto ao mnimo e ao mximo, so, respectivamente, 37 e 99 pontos. Para construir o diagrama de extremos e quartis, desenha-se um rectngulo com comprimento igual amplitude entre os quartis e com altura qualquer (a altura do rectngulo no tem qualquer significado). Dentro do rectngulo desenha-se um segmento de recta que assinala a posio da mediana. Dos lados do rectngulo determinados pelo 1 quartil e pelo 3 quartil saem dois segmentos de recta, at ao mnimo e at ao mximo, respectivamente:

Da representao anterior ressalta imediatamente que:


25% das notas so menores ou iguais a 63 pontos (as notas esto dadas em nmeros

inteiros);
25% das notas so superiores ou iguais a 85 pontos; 50% das notas esto compreendidas entre 64 e 84 pontos; Existe algum enviesamento do lado esquerdo, isto , os dados esto mais dispersos, ou

seja, menos concentrados na parte inferior do que na parte superior; tambm na parte central dos dados existe algum enviesamento para a esquerda. Existem fundamentalmente duas caractersticas do diagrama de extremos e quartis que nos do ideia da simetria ou enviesamento dos dados e que so:
Distncia entre a linha indicadora da mediana e os lados do rectngulo; Comprimento das linhas que saem dos lados do rectngulo.

Apresentamos de seguida 3 exemplos de diagramas de extremos e quartis correspondentes a tipos diferentes de distribuio dos dados.

Por vezes, existem alguns conjuntos de dados cuja representao num diagrama de extremos e quartis inesperada! Ora vejamos o seguinte exemplo.

www.alea.pt

Exemplo 2 Recolheu-se a idade de 19 alunos que frequentam a disciplina de Estatstica de um curso da Faculdade de Cincias, tendo-se obtido os seguintes resultados: 19, 20, 20, 21, 21, 20, 19, 20, 22, 23, 21, 21, 20, 25, 20, 19, 21, 44, 20 Represente os dados num diagrama de extremos e quartis e tire concluses sobre a estrutura dos dados. Ordenando o conjunto de dados anteriores, tem-se

Mnimo = 19 1 quartil =

Mximo = 44

20 20 =20 2

Mediana = 20 3 quartil =
21 21 =21 2

A representao anterior mostra que estamos perante uma situao de extremo enviesamento, em que o diagrama de extremos e quartis pouco claro! Efectivamente, no aparece a linha que indica a mediana, o que significa que esta se confunde com o 1 ou o 3 quartil. Esta uma situao em que o diagrama de extremos e quartis apresenta alguma ambiguidade. Se nos tivessem apresentado esta representao sem estar acompanhada dos dados, devido ao grande enviesamento dos 25% de dados superiores, seria natural presumir que tambm existiria enviesamento para a direita nos 50% dos dados centrais e que, portanto, a mediana se confundia com o 1 quartil. Como temos os dados, podemos confirmar que, na verdade, o 1 quartil se confunde com a mediana. Por outro lado, o valor 44 que aparece nos dados anteriores um pouco aberrante, quando comparado com os restantes, pois muito maior que todos os outros dados.

Existe uma verso do diagrama de extremos e quartis que permite visualizar os valores que se consideram aberrantes, por sarem do contexto dos restantes, e a que usual dar o nome de outliers. Essa verso designada em ingls por box-and-whiskers, tem a traduo portuguesa de caixa-com-bigodes.

www.alea.pt

Caixa-com-bigodes
Considera-se uma caixa que um rectngulo tal como foi desenhado para o diagrama de extremos e quartis. Consideram-se seguidamente duas linhas que unem os meios dos lados dos rectngulos com o menor e maior elementos da amostra que esto dentro das barreiras de outliers, definidas a seguir. Os outros elementos que no esto no intervalo constitudo pelas barreiras de outliers so assinalados com o smbolo *.

O QUE SO AS BARREIRAS DE OUTLIERS?

Define-se barreira inferior como sendo o valor Q.25 1,5 (Q.75 - Q.25) Define-se barreira superior como sendo o valor Q.75 + 1,5 (Q.75 - Q.25) Quando que consideramos um valor como outlier? Dizemos que um valor outlier quando no est compreendido no intervalo [barreira inferior, barreira superior]. Numa representao em caixa-com-bigodes, os outliers assinalam-se com o smbolo *. No caso do exemplo anterior, obter-se-ia a seguinte representao em caixa-com-bigodes: Barreira inferior Barreira superior = 20 1,5 (21-20) = 18,5 = 21 + 1,5 (21-20) = 22,5

Da representao anterior, conclumos que existem 3 outliers, concretamente o 23, 25 e 44.

www.alea.pt

Construo do diagrama de extremos e quartis com o Excel Como j temos afirmado vrias vezes, embora o Excel no seja um software de Estatstica, permite a construo de algumas representaes grficas, uma das quais o diagrama de extremos e quartis. Esta construo pode ser consultada no dossi XIII Estatstica Descritiva com Excel Complementos, pginas 63-66, na rea Dossis e recursos do ALEA2. Para obter a representao em diagrama de extremos e quartis dos dados do Exemplo 1, comemos por inserir os dados num ficheiro Excel e de seguida calculmos os 5 nmeros necessrios para construir o diagrama, como se apresenta a seguir:

com os seguintes resultados:

Repare-se que os valores obtidos para os quartis, utilizando o Excel, no so iguais aos obtidos anteriormente, seguindo as indicaes do Exemplo 1. Efectivamente, a regra utilizada pelo Excel nem sempre coincide com a regra que se utiliza para calcular os quartis, em que estes so obtidos como a mediana de cada uma das partes em que fica dividida a amostra pela mediana (se a dimenso da amostra for mpar, ou seja, se a mediana for um dos elementos da amostra, considera-se como pertencente s duas partes). Esta situao no grave, pois os valores obtidos pelas duas regras so aproximados.

http://www.alea.pt/html/statofic/html/dossier/html/meio_dossier13.html www.alea.pt

Você também pode gostar