Você está na página 1de 8

Aula 2

FACULDADE DE CIÊNCIAS NATURAIS E MATEMÁTICA

DEPARTAMENTO DE MATEMÁTICA
Campus de Lhanguene, Av. de Moçambique, km 1, Tel: +258 21401078, Fax: +258 21401082, Maputo

Curso de Licenciatura em Estatística e Gestão de Informação


ESTATÍSTICA DESCRITIVA

AULA II: Tabela de frequência com dados agrupados em classes da mesma


amplitude. Diagrama de caule e folha. Medidas de tendência central. Quartis e
percentis. Diagrama de extremos e quartis

RESUMO TEÓRICO

Tabela de frequência com dados agrupados


Quanto dispomos de dados de uma variável quantitativa contínua, observamos
que sua variação é geralmente maior em um pequeno intervalo e raramente
aparecem valores repetidos. Para estes casos é prático agrupar os dados em
intervalos, seguindo o seguinte procedimento.
1. Determine a amplitude total (A) (diferença entre os valores máximo
e mínimo)
2. Determine o número de classes (k). Se n for menor que 25, faça
k = 5, caso contrário determine k como inteiro próximo a n;
Também pode usar a regra de Sturges: k ≈ 1 + 3, 22 log(n ) ;
3. Divida a amplitude total pelo número de classes, obtendo a
amplitude de classe (a).
4. Partindo do valor mínimo, construa as classes, adicionando
sucessivamente a amplitude de classe, até incluir o valor máximo
observado.

Exemplo 1: (Retirado de Martins et al, Um curso elementar de estatística


descritiva, Universidade Nova de Lisboa, Ano lectivo 2003-2004, capítulo 2, pg.
15).
Os seguintes dados referem-se ao tempo gasto (em minutos) por 42
trabalhadores entre a sua residência e o local de trabalho no centro de Lisboa:

Celso Albino e Teresa Miguel 1


Aula 2

5 21 26 13 24 29 37 12 31 5
50 18 33 14 23 22 17 32 7 17
42 15 38 20 11 26 25 29 27 8
24 12 39 25 28 14 47 19 22 28
9 18

Facilmente nos damos conta de que a melhor forma de resumir os dados


via tabela, é usando uma tabela de frequência com dados agrupados.
A amplitude total é A = x máx − x min = 50 − 5 = 45 ;
O número de classes é k ≈ 1 + 3, 22 × log(42) ≈ 6
A 45
A amplitude de classes é a = = = 7, 5 ≈ 8
k 6

Assim, as classes serão: 5-13; 13-21; 21-29; 29-37; 37-45; 45-53.


As frequências absolutas são obtidas contando a quantidade de valores
compreendida em cada intervalo, note que exceptuando a última classe que é
[45,53], as outras classes são fechadas no limite inferior e abertas no limite
superior, assim, teremos a seguinte tabela de frequência, onde a última coluna
li + ls
representa o ponto central da classe ( c i = , l i - limite inferior da classe
2
e l s - limite superior da classe):

Classes fi f r (%) Fi Fr (%) ci


5 – 13 8 19,0 8 19,0 9
13 – 21 10 23,8 18 42,9 17
21 – 29 13 31,0 31 73,8 25
29 – 37 5 11,9 36 85,7 33
37 – 45 4 9,5 40 95,2 41
45 - 53 2 4,8 42 100,0 49

Gráfico de caule e folha (Stem and leaf)


O diagrama de dispersão permite ordenar os dados e detetar sem perda
de informação algumas de suas características como existência de lacunas,
valores excessivamente altos ou baixos em relação a todo conjunto de dados,
concentrações de etc. Para a sua construção deve:

Celso Albino e Teresa Miguel 2


Aula 2

1. Separar cada valor observado em duas partes, em geral, separa-


se o último dígito do valor dos restantes. Este forma a parte da
folha, enquanto a parte inicial a parte do caule.
2. Colocamos em evidência todos os caules na parte esquerda, (cada
caule numa linha) seguidos pelas respectivas folhas na parte direita,
em ordem crescente.

Exemplo 2: Vamos construir um diagrama de caule e folha com os dados


do exemplo 1:
Note que neste caso temos valores com apenas um dígito e valores com
dois dígitos. Para os valore de um dígito vamos acrescentar o zero à esquerda
e usando este para caule. Para os de dois dígitos vamos separar o dígito das
dezenas do dígito das unidades, sendo o primeiro o caule e o último a folha.

0 5 5 7 8 9
1 1 2 2 3 4 4 5 7 7 8 8 9
2 0 1 2 2 3 4 4 5 5 6 6 7 8 8 9 9
3 1 2 3 7 8 9
4 2 7
5 0

Medidas de tendência central


Outra forma de resumir dados além de gráficos e tabelas é a pela determinação
de medidas estatísticas. As medidas de tendência central são a média a moda
e a mediana. São assim chamadas porque geralmente, estas medidas ao serem
determinadas, nos oferecem valores que se localizam no centro do conjunto de
dados. A tabela seguinte mostra procedimentos para sua determinação:

Dados simples Dados agrupados


n n n
Média
∑ xi ∑ x i fi ∑ c i fi
x = i
=1
ou x = i
x =
=1 i=1
n n n
Mediana Valor central, depois de ordenar os n
− FMe − 1
dados (para n par, é a média dos Me = l iMe + aMe 2
fMe
dois valores centrais)

Celso Albino e Teresa Miguel 3


Aula 2

Moda Valor(es) mais frequente(s) f Mo + 1


Mo = l iMo + aMo
f Mo − 1 + f Mo + 1

Exemplo 3: Segundo o Instituto Nacional de Meteorologia de Moçambique, a


humidade relativa média mensal registada na cidade de Maputo no ano de 2008,
de Janeiro a Dezembro, é a seguinte: 81, 77, 80, 77, 81, 82, 71, 71, 68, 76,
77, 83. Forneça resumos deste conjunto de dados usando as medidas de
tendência central.

12

∑ xi
924
x = i=1
= = 77
n 12
77 + 77
Me = = 77
2
Mo = 77

Exemplo 4: determine as medidas de tendência central para a tabela de


frequência do exemplo 1.
Classes fi Fi ci c i fi
5 – 13 8 8 9 72
13 – 21 10 18 17 170
21 – 29 13 31 25 325
29 – 37 5 36 33 165
37 – 45 4 40 41 164
45 - 53 2 42 49 98
Total 42 - - 994

12

∑ ci x i
994
x = i=1
≈ 23, 7
=
n 42
Classe mediana: 21-29
n
− F Me − 1
21 − 18
Me = l iMe + aMe 2 = 25 + 8 × ≈ 26, 8
fMe 13
Classe modal: 21-29
fMo + 1 5
Mo = l iMo + aMo = 25 + 8 × ≈ 27, 7
f Mo − 1 + f Mo + 1 10 + 5

Celso Albino e Teresa Miguel 4


Aula 2

Que medida de tendência central para caracterizar um conjunto de dados, média,


moda ou mediana?
A média só pode ser usada para dados quantitativos e é mais representativa
quando o conjunto de dados não apresenta valores extremos; pode ser sempre
calculada e é única; e para o seu cálculo, toda informaçào é usada; ela
representa representa o ponto de equilíbrio/centro de gravidade do connunto de
dados.
A mediana pode ser calculada para variáveis quantitativas e qualitativas ordinal;
e é única; é insensível aos valores extremos do conjunto, sendo nestes casos
uma medida mais representativa (do que a média).
A moda é a única medida que pode ser determinada para variáveis qualitativas
nominais e nem sempre é única, havendo casos que não existe.

Quartis e percentis
Quartis e percentis são medidas que ajudam-nos a localizar valores
determinados num conjunto de dados. Os quartis são medidas que dividem o
conjunto de dados em 4 partes aproximadamente iguais, com aproximadamente
um quarto de dados cada. Os percentis dividem o conjunto de dados em 100
partes, cada uma com aproximadamente 1% dos dados. Também existem os
decis e quintis que dividem o conjunto de dados em 10 e 5 partes
respectivamente. Veja os procedimentos de cálculo na tabela abaixo:

Dados simples Dados agrupados


Quartil ni ni
Média dos valores na posição e − FQ −1
4 Qi = l iQi + aQi 4
i

ni fQi
seguinte no caso de ser inteiro,
4
i = 1, 2, 3
i=1,2,3 respectivamente para primeiro,
segundo e terceiro quartil. No caso
ni
de ser decimal, o quartil é o
4
valor na posição seguinte.
Percentil ni ni
Média dos valores na posição − FPi − 1
100 Pi = l iPi + aPi 100
ni f Pi
e seguinte no caso de ser
4
Celso Albino e Teresa Miguel 5
Aula 2

inteiro, i=1,2,..,99 respectivamente i = 1, 2, ..., 99


para primeiro, segundo, … e
nonagésimo nono percentil . No caso
ni
de ser decimal, o percentil é
100
o valor na posição seguinte.

Exemplo 5. Use os dados do exemplo 3 e 4 para determinar o terceiro quartil


e o percentil 85. Interprete os resultados obtidos.
Para os dados do exemplo 3
ni 12 × 3
= = 9 , sendo natural, o quartil é a soma dos valores que se
4 4
81 + 81
encontram na 9ª e 10ª posições: Q 3 = = 81 . Interpretação: Três quartos
2
dos meses do ano 2008, registaram uma humidade relativa de pelo menos 81.
ni 12 × 85
= = 10, 2 ; sendo decimal, o percentil é o valor na posição
100 100
seguinte, posição 11: P85 = 82 .

Para os dados do exemplo 4:


ni 42 × 3
Classe em que se encontra o quartil 3: como = = 31, 5 , corresponde
4 4
à classe 29 – 37. Sendo assim, l iQ = 29 , aQ = 8 , FQ − 1 = 31 e fQ = 5 .
3 3 3 3

31, 5 − 31
Q 3 = 29 + 8 × = 29, 8
5
ni 42 × 85
Classe em que se encontra o percentil 85: = = 35, 7 . Classe
100 100
correspondente:29-37. l iP = 29 , aP = 8 , FP − 1 = 31 e f P = 5 .
85 85 85 85

35, 7 − 31
P85 = 29 + 8 × = 36, 52
5

Diagrama de extremos e quartis (box-plot)


Este gráfico permite observar como se repartem os valores de um conjunto
de dados, mostrando claramente os casos em que existem valores extremos.
Para a sua construção cinco valores são usados: os quartis, o mínimo e o
máximo. No caso em que o objectivo é identificar valores extremos o mínimo e
máximo são substituídos por valores determinados em função da amplitude
interquartil. Neste caso, valores superiores a Q 3 + 1, 5(Q 3 − Q1 ) e valores
Celso Albino e Teresa Miguel 6
Aula 2

inferiores a Q1 − 1, 5(Q 3 − Q1 ) são considerados extremos. Observe como este


gráfico pode ser construído a partir do exemplo seguinte:

Exemplo 6: Os valores da taxa de cambio (compra) semanal do rand sul


africano no período de Setembro a Dezembro de 2012 estão reportados abaixo
(valores ordenados).

3,26 3,29 3,33 3,34 3,35 3,35 3,36 3,37 3,37


3,38 3,40 3,41 3,42 3,44 3,45 3,45 3,46

Vamos usar o box-plot para mostrar o comportamento de compra da moeda


sul africana neste período.

x min = 3, 26 , x máx = 3, 46 , Me = 3, 37 ,
n 17
= = 4, 25 → Q1 = 3, 35
4 4
3n 3 × 17
= = 12, 75 → Q 3 = 3, 42
4 4

Q1 Me Q3

Exercícios
_______________________________________________________________________
1. Um relatório avalia modelos de carros com base no número de
reclamações de seguro preenchidas após os acidentes. Os índices avaliados
próximos de 100 são considerados médios. Avaliações menores são
melhores, indicando um modelo de carro mais seguro. A seguir são
mostradas avaliações para 20 carros de tamanho médio e 20 carros
pequenos:

Carros médios:81 91 93 127 68 81 60 51 58


75 100 103 119 82 128 76 68 81 91 82

Celso Albino e Teresa Miguel 7


Aula 2

Carros pequenos:73 100 127 100 124 103 119 108 109
113 108 118 103 120 102 122 96 133 80 140

a) Apresente o diagrama de extremos para os carros de tamanho


médio e pequeno.
b) Faça um relatório sobre o que os números indicam acerca da
segurança dos carros médios em comparação com os pequenos.

2. Num teste de automobilismo de distância e de consumo de gasolina, 13


automóveis foram testados por 300 quilómetros em estrada, nas mesmas
condições de direcção na cidade e no campo. Foram registados os
seguintes dados para o desempenho em milhas por galão.

Cidade: 16,2 16,7 15,9 14,4 13,2 15,3 16,8 16,0 16,1
15,3 15,2 15,3 16,2
Campo: 19,4 20,6 18,3 18,6 19,2 17,4 17,2 18,6 19,0
21,1 19,4 18,5 18,7
Use a média, mediana e a moda para comparar o desempenho na
condução na cidade e no campo.

3. Realizou-se uma experiência com cabos fabricados para determinar a carga


máxima por eles suportada, e obtiveram-se os seguintes resultados:
4,3 6,8 9,2 7,2 8,7 8,6 6,6 5,2 8,1 8,7
7,4 4,6 4,2 7,6 6,8 7,7 8,4 7,5 8,6 6,0
7,7 8,1 7,0 8,2 8,3 8,8 6,7 8,1 9,4 7,7
6,3 7,7 9,1 7,8 7,9 7,9 9,4 8,2 6,7 8,2

a) Construa um gráfico de caule e folha.


b) Determine as medidas de tendência central agrupando os dados
em classes da mesma amplitude.

FIM

Celso Albino e Teresa Miguel 8

Você também pode gostar