Você está na página 1de 7

Laboratrio de Estatstica I anlise inicial de dados

Algumas regras a observar na construo de diagramas de caule-e-folhas:


Perante uma coleco de dados, devemos observar o que comum a vrios dos elementos e o que os distingue e, assim, decidir que parte constituir o caule e que parte constituir a folha. O caule pode conter um qualquer nmero de algarismos mas, por norma, cada folha constituda por apenas 1 algarismo. Pode acontecer que, decidida a composio do caule, sobrem dois ou mais algarismos para a folha. Exemplo: 9.45 11.34 13.53 10.10 11.97 9.67 14.29 13.81 10.68 11.50 9.23 9.48 11.92 13.77 14.31 Uma regra importante na construo do caule-e-folhas no fazer arredondamentos. Nestes casos procede-se truncatura dos dados. O arredondamento dificulta o retorno aos dados originais no caso de no ser possvel colocar todos os algarismos na representao.

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

Quando determinados caules tm demasiadas folhas, deve-se proceder a um desdobramento dos mesmos. O caule poder ser duplicado passamos a ter duas linhas por caule; Ou quintuplicado passamos a ter cinco linhas por caule Duas linhas por caule: as folhas 0, 1, 2, 3 e 4 ficam na primeira linha; as folhas 5, 6, 7, 8 e 9 ficam na segunda linha A primeira linha do caule tem o valor do caule seguido de * A segunda linha do caule tem o valor do caule seguido de . Cinco linhas por caule: as folhas ficam em pares, 0 e 1, 2 e 3, 4 e 5, 6 e 7, 8 e 9. A primeira linha do caule tem o valor do caule seguido de * As linhas seguintes so indicadas pelas letras t (two, three), f (four, five) e s (six, seven) A quinta linha do caule tem o valor do caule seguido de .

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados Nveis (medidos em mg/100ml) de glicose no sangue dos diabticos sujeitos a anlise num hospital : 102.5 91.4 106.7 95.9 111.0 103.3 111.7 106.1 109.8 122.2 108.6 119.7 106.6 107.1 102.4 110.0 93.9 97.8 115.3 103.2 116.2 94.5 122.6 109.8 108.5

9 10 11 12

1 2 1 2

5 3 7 4 6 3 6 9 8 6 7 2 3 9 8 1 9 0 5 6 2

ordenao

9 10 11 12

1 2 0 2

3 4 5 7 2 3 3 6 6 6 7 8 8 9 9 1 1 5 6 9 2

O grfico est demasiado denso. Vamos duplicar os caules.

9* 9. 10* 10. 11* 11. 12*

1 5 2 6 0 5 2

3 7 2 6 1 6 2

4 3 3 7 8 8 9 9 1 9

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

Para que o grfico de caule-e-folhas possa ser correctamente lido, necessrio indicar a unidade em que os dados esto representados. Esta informao fica localizada direita, na parte superior do grfico e o valor pelo qual se deve multiplicar o valor lido no grfico (sempre um inteiro), de forma a recuperarmos o valor original. expresso em potncias de 10.

No exemplo do peso dos leites:

6 7 8 9 10

1 0 2 0 0

7 5 3 0 0

Unidade= 10-1

5 5 1 0

5 7 1 2

5 7 8 1 2 2 2 2 4 4 4 5 5 7 8 2 2 3 6 6 8 9

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

No exemplo dos nveis de glicose no sangue:

9* 9. 10* 10. 11* 11. 12*

1 5 2 6 0 5 2

3 7 2 6 1 6 2

4 3 3 7 8 8 9 9 1 9

Unidade= 100

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

O comprimento de linha:
Nos diagramas de caule-e-folhas, chamamos comprimento de linha amplitude do intervalo que cada linha representa. O comprimento de linha depende do nmero de linhas por caule e da unidade de leitura do diagrama.

Um diagrama com 1 linha por caule tem comprimento de linha igual a 10x potncia de 10 Um diagrama com 2 linhas por caule tem comprimento de linha igual a 5x potncia de 10 Um diagrama com 5 linhas por caule tem comprimento de linha igual a 2x potncia de 10 A potncia de 10 acima referida a potncia de 10 correspondente unidade de leitura do diagrama.

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

Ao grfico de caule-e-folhas junta-se ainda a informao relativa profundidade das observaes. Dada uma determinada observao podemos atribuir-lhe duas ordens: a ascendente (quando ordenamos os dados por ordem crescente) e a descendente (quando ordenamos os dados por ordem decrescente). Esta ordens tomam tambm se designam por rank ascendente e rank descendente respectivamente, verificando-se a relao

rank ascendente + rank descendente = n+1

Define-se profundidade de uma observao como o menor dos dois seus dois ranks.

profundidade= min (rank ascendente , rank descendente)

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

estatsticas ordinais rank ascendente rank descendente profundidade

x(1) x(2) 1 n 1 2

...

x(i) i n-i+1 min (i,n-i+1)

...

x(n-1) x(n) n 1 1

...

... n-1 ... ... 2 2

n-1 ... 2 ...

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados Altura (cm) rapazes de adolescentes com 14 anos de idade
168 169 143 139 140 178 149 167 155 149 154 145 151 181 142 166 182 143 183 157 152 182

recupera-se a amostra ordenada


139 140

13 14 15 16 17 18

9 3 5 8 8 1

142

0 9 9 5 2 3 4 1 7 2 9 7 6 2 3 2

143 143 145 149 149 151 152 154 155 157 166 167 168 169 178 181 182 182 183

ordenam-se as folhas em cada caule

13 14 15 16 17 18

9 0 1 6 8 1

2 3 3 5 9 9 2 4 5 7 7 8 9 2 2 3

Unidade =

100

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

No grfico de caule-e-folhas, numa coluna esquerda do caule, inscrevem-se os valores correspondentes profundidade mxima atingida na linha. Na linha onde se encontra a mediana coloca-se, entre parnteses, o nmero de elementos existentes na linha. Voltando ao exemplo os dados relativos altura de rapazes adolescentes:

Unidade = 100 1 8 (5) 9 5 4

8+5+9 = 22

13 14 15 16 17 18

9 0 1 6 8 1

2 3 3 5 9 9 2 4 5 7 7 8 9 2 2 3

A soma do nmero de elementos existentes na linha da mediana com as profundidades das linhas adjacentes igual a n, a dimenso da amostra.

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

Construo do diagrama de caule-e-folhas no Excel:


No existe no Excel uma forma imediata de construir um diagrama de caule-efolhas., pelo que seguiremos o mtodo desenvolvido por Neville Hunt (2001) para o Excel: 1.Coloque a srie de dados na coluna C, comeando na clula C2 2.Insira na clula E1 o comprimento de linha (que dever ser igual a 10x, 2x ou 5x uma potncia de 10 (a potncia de 10 correspondente unidade de leitura do diagrama)) 3.Faa A2=INT(C2/E$1)*E$1 e replique-a tantas vezes para todos os dados inseridos na coluna C 4.Na clula B2 coloque o valor 1. Faa B3=IF(A3=A2,B2+1,1). Replique esta frmula para as restantes linhas da coluna B. 5.Seleccione as colunas A, B e C e escolha a representao Bubble / Bolha. 6.Modifique o grfico da seguinte forma: Com o cursor sobre o grfico, prima o BLD . Seleccione Format Data Series /Formatar srie de dados . Elimine o preenchimento e o contorno escolhendo cor branca e transparncia mxima Em Data labels escolha show bubble sizes Em Lable position escolha Centre Elimine as linhas horizontais do fundo do grfico Formate convenientemente os eixos
1 ano Lic. Estatstica Aplicada DEIO Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

O grfico inicial

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes

Laboratrio de Estatstica I anlise inicial de dados

O grfico final.

1 ano Lic. Estatstica Aplicada DEIO

Marlia Antunes