Você está na página 1de 16

Faculdade de Ciências de Ciências Naturais e Matemática

Estatística

Resumo II

Sumarização tabular e gráfica de dados estatísticos

A sumarização de dados estatísticos, geralmente realizado com recursos à


quadros designados tabelas de frequência e gráficos de diversos tipos, depende do
facto de ser qualitativa ou quantitativa.

Feita a coleta, os dados originais ainda não se encontram prontos para análise, pelo
facto de não estarem numericamente organizados. Por essa razão, costuma-se
designar de dados brutos. Chamam-se dados brutos aos dados que são obtidos
diretamente da pesquisa, isto é, ainda não sofreram nenhum processo de síntese ou
análise.

De modo a se obter uma contagem mais precisa e menos confusa dos dados,
aconselha-se a ordená-los de forma crescente ou decrescente, caso os mesmos
sejam de carácter quantitativo. Esta forma de organizar os dados se o nome de Rol.

Por exemplo: Considere que 84 funcionários de uma indústria têxtil, forneceram a


informação seguinte sobre o número de filhos:
2 5 4 2 2 4 5 6 4 5 5 3 6 3
4 4 2 5 6 5 2 5 4 3 5 2 3 5
3 6 3 5 5 3 2 1 4 2 4 2 4 3
3 2 3 4 5 5 5 5 1 2 4 5 5 3
3 5 1 6 5 3 1 5 1 4 5 5 4 1
2 2 3 2 1 4 6 3 5 4 3 1 5 5

Um rol, para estes dados brutos seria (em ordem crescente, e lido verticalmente) o
seguinte:

1 1 2 2 3 3 3 4 4 5 5 5 5 6
1 2 2 2 3 3 4 4 4 5 5 5 5 6
1 2 2 2 3 3 4 4 4 5 5 5 5 6
1 2 2 3 3 3 4 4 4 5 5 5 5 6

1 de 16 2015
1 2 2 3 3 3 4 4 5 5 5 5 5 6

I. Sumarização de dados de carácter qualitativo


Considere-se o exemplo seguinte:
O Leverock´s Waterfront Steakhouse, em Maderia Beach, Flórida, usa
um questionário para solicitar aos clientes uma avaliação do garçom, da
qualidade da comida, dos coquetéis, dos preços e do ambiente no
restaurante. Cada característica é avaliada em uma escala de excelente
(E), óptimo (O), bom (B), médio (M) e fraco (F). Use a estatística descritiva
para sintetizar os seguintes dados colectados sobre a qualidade da
comida. Qual é a sua impressão sobre a qualidade da comida apresentada
no restaurante?

B E O B M E O E O B E O M
O E F M E B M E E E B E O
O M B E O F O E E B E E
E B M E O E E B O M B    

Como se pode observar, fazer qualquer declaração sobre a qualidade


da comida apresentada no restaurante tendo em conta os dados brutos
apresentados, além de difícil, conduziria à declarações muito
provavelmente erradas.
A avaliação da qualidade está associada à uma variável qualitativa ordinal,
neste caso, as categorias apresentadas são, (E), óptimo (O), bom (B),
médio (M) e fraco (F).

Dois tipos de sumarização são mais comuns para este tipo de variáveis: A
apresentação dos dados em tabelas de frequências e gráfico de barras.

Com efeito, após a contagem dos casos registados para cada uma das
categorias da variável em estudo, tem-se o seguinte sumário tabular
(tabela de frequências):

2 de 16 2015
opinião freq abs freq rel freq percentual
F 2 0,0408 4,08
M 7 0,1429 14,29
B 10 0,2041 20,41
O 11 0,2245 22,45
E 19 0,3878 38,78
Total 49 1,00 100

Tendo em conta os resultados dos indivíduos inquiridos, há uma


impressão positiva sobre a qualidade da comida apresentada no restaurante,
visto que só cerca de 4 % dos mesmos referiram ter uma impressão de ser
fraca a qualidade e todos os restantes tiveram a impressão dividida entre
Bom, Excelente, Médio ou Óptimo com maior enfoque para Excelente (cerca
de 39%).

O mesmo resultado podia ser obtido através da sumarização gráfica


seguinte (gráfico de barras):

45
40
35
30
25
[%]

20
15
10
5
0
F M B O E
Opinião

Observações:
1) Em relação à tabela de frequências, o mais importante a ter em conta é
a organização e contagem dos dados brutos. É a partir da contagem,

3 de 16 2015
que tem-se o total de indivíduos participantes e consequentemente a
frequência absoluta de cada classe/rótulo.
Habitualmente, o número total de indivíduos participantes é
representado por n, a frequência absoluta por f (ou fa) e a frequência
relativa por fr.
Para encontrar a frequência relativa de determinada classe, é suficiente
a expressão seguinte:
f
f r=
n
E, no caso em que se pretenda (para determinada classe/rótulo) a
frequência (relativa) percentual, basta, multiplicar a frequência relativa
dessa classe por 100, ou seja,
f
f r (% )= ⋅100
n
Alguns autores usam a letra f em maiúscula (F), para representar as
frequências acumuladas. Que para cada classe/rótulo, consiste da
soma das frequências de todas as classes até sí. Têm obviamente
interpretação diferente das frequências não acumuladas.

2) Quanto ao gráfico de barras, há quatro orientações importantes a


seguir na sua construção:
a. As barras só diferem em comprimento, e não em largura, a qual
é arbitrária.
b. As barras devem estar separadas umas das outras pelo mesmo
espaço, o qual deve ser suficiente para que as inscrições que
identificam as diferentes barras não tragam confusão ao leitor.
Como regra prática pode-se tomar o espaço entre as barras
como aproximadamente a metade ou dois terços de suas
larguras.
c. As barras devem ser desenhadas observando sua ordem de
grandeza, para facilitar a leitura e análise comparativa dos
valores. Normalmente, a ordem é decrescente, a barra superior
representa o maior valor.
d. Um gráfico, construído para mostrar grandezas absolutas,
deverá ter uma linha zero claramente definida e uma escala de

4 de 16 2015
quantidade ininterrupta, caso contrário a leitura e a interpretação
do gráfico poderão ficar distorcidas.

Um terceiro gráfico utilizado na sinteização de dados qualitativos é o


diagrama circular (pie chart). Considere-se o exemplo seguinte:
Uma agência do estado da Califórnia classifica a ocupação dos trabalhadores
como profissional liberal (PL), funcionário (F) e operário (Op). Em relação à
uma amostra de 124 indivíduos inqueridos num mesmo bairro, dispõe-se dos
dados seguintes:
Ocupaçã freq
o abs [%]
PL 30 24.19
F 22 17.74
Op 72 58.06
Total 124 100.00

A representação gráfica referente à estes dados, por meio de um diagrama


circular, é:

Ocupação [%]

24.19

58.06
17.74

PL F Op

Observação: Para a construção deste tipo de diagrama, basta, ter em conta


que 360º correspondem à 100% (dos dados), daí que para determinada classe i,
com frequência relativa fri, onde i=1,…,k onde k é o número de classes, a amplitude

do correspondente ângulo
α i em graus, é dado por

α i=fri⋅360º

5 de 16 2015
II. Sumarização de dados quantitativos
1) Quando os dados são de natureza quantitativa discreta.
Neste caso o procedimento é similar ao tratamento de uma variável
qualitativa. Por exemplo: Quanto ao exemplo acima, referente ao a
informação fornecida pelos 84 funcionários inquiridos sobre o número
de filhos, um resumo tabular e gráfico, são apresentados a seguir:

nº de filhos freq abs freq rel freq percentual


1 8 0,0952 9,52
2 14 0,1667 16,67
3 16 0,1905 19,05
4 15 0,1786 17,86
5 25 0,2976 29,76
6 6 0,0714 7,14
Total 84 1,00 100

[%] 35

30

25

20

15

10

0
1 2 3 4 5 6
número de filhos

Use a informação do gráfico para comentar acerca da distribuição dos dados


recolhidos.

2) Quando os dados são de natureza quantitativa contínua.

6 de 16 2015
Para variáveis de natureza contínua, convém uma outra abordagem de
resumo de dados em tabelas. Há que organizá-los em uma tabela na
qual os dados aparecem organizados em intervalos de classes.

Dentre os diferentes métodos de organização de dados em classes,


consideremos os passos de uma das regras:

 ln n 
k 1
(1). Determinar o número k de classes:  ln 2  (regra de
Sturges). Repare que o resultado que aparece entre parentes rectos,
deve ser tomado sempre a parte inteira do resultado (por exemplo:
[5,1] = 5, [5,9] = 5).

(2). Determinar a amplitude do conjunto de dados At  máximo  mínimo .

At
a
(3). Determinar a amplitude de cada classe k .

(4). Construir as classes ci da seguinte forma:

c1  [min; min  a[
c2  [min  a; min  2  a[
c3  [min  2  a; min  3  a[
...
ck  [min  (k  1)  a; min  k  a[

Exemplo:
Considere o peso de uma amostra de 36 elementos de uma dada comunidade.
Tabela 3: Peso de uma amostra de elementos de uma comunidade
45 47 49 50 51 50 52 53 59
54 58 65 55 73 63 67 56 64
60 62 71 56 61 65 61 71 56
57 59 60 57 62 68 67 59 61

 ln n   ln 36 
k
 ln 2   1   ln 2   1   5,17   1  6
Passo 1:

Passo 2: At  máximo  mínimo  73  45  28


28
a  4, 6  5
Passo 3: Decidir a amplitude de cada classe: 6

7 de 16 2015
c1  [45; 45  5[ [45;50[
c2  [50; 45  2  5[ [50;55[
c3  [55; 45  3  5[  [55;60[
...
Passo 4: c6  [45  (6  1)  5; 45  6  5[ [70;75[

Assim, a tabela de frequências referente à este caso é a seguinte:

Marca de
Classes f fr F Fr
Classe
[45 ; 50[ 3 0,08 3 0,08 47,5
[50 ; 55[ 6 0,17 9 0,25 52,5
[55 ; 60[ 10 0,28 19 0,53 57,5
[60 ; 65[ 9 0,25 28 0,78 62,5
[65 ; 70[ 5 0,14 33 0,92 67,5
[70 ; 75[ 3 0,08 36 1,00 72,5
Total 36 1,00  -  -  -

Observação: A marca da classe (ponto médio da classe), é a semi-soma dos


extremos do intervalo da classe.

Representação gráfica: Neste caso, há uma variedade de representações a ser


considerada, todavia, a mais comum, é o histograma. O aspecto deste diagrama é
um conjunto de rectângulos justapostos em que cada um tem base igual à amplitude
da respectiva classe e a altura igual à razão entre a frequência e a amplitude da
classe; sendo deste modo, a soma das àreas desses rectângulos, igual ao número
de indivíduos ou objectos no caso de frequências absolutas, e igual a unidade no
caso de frequências relativas.
Para facilitar a comparação, das frequências das várias classes usa-se
frequentemente, classes de igual amplitude. E, nesse caso não é importante a
divisão das frequências pela amplitude (constante) das classes, visto que tal
operação consiste apenas numa alteração da escala.

Um histograma referente ao exemplo acima apresentado, sobre o peso dos 36


elementos de uma comunidade, é o seguinte:

8 de 16 2015
fr 0.3

0.25

0.2

0.15

0.1

0.05

0
47.5 52.5 57.5 62.5 67.5 72.5
Peso

Observação: Unindo por segmentos de recta os meios dos lados superiores dos
rectângulos que constituem um histograma, obtém-se uma linha poligonal – o
polígono de frequências. Fazendo tender a amplitude das classes para zero, esta
linha poligonalvai tender para uma linha suave designada por curva de frequências
teórica representativa da distribuição (teórica) na população.

Exercício: O serviço de Recursos humanos da Roth Young relatou que os salários


anuais para os regentes assistenstes de lojas de departamento variam de US$28
000 a US$57 000 (National Business Employment Weekly, 16 – 22 de Outubro de
1994). Assuma que os seguintes dados são uma amostra dos salários anuais de 40
gerentes assistentes de lojas de departamento (os dados estão em mil dólares):
48 35 57 48 52 56 51 44
40 40 50 31 52 37 51 41
47 45 46 42 53 43 44 39
50 50 44 49 45 45 50 42
52 55 46 54 45 41 45 47

a) Quais foram os salários mais alto e mais baixo relatados?


b) Use uma amplitude de classe de US$ 5000 e prepare os sumários tabulares
dos dados de salários anuais.
c) Que proporção de salários anuais é de menos do que US$36000?
d) Que percentagem dos salários anuais é de US$51000 ou mais?
e) Prepare um histograma de dados.

O diagrama de caule e folha (stem and leaf)

9 de 16 2015
É também um diagrama apropriado para a sumarização de dados de carácter
quantitativo. Exemplo: Os seguintes dados referem-se ao tempo gasto (em minutos)
por 42 trabalhadores entre a sua residência e o local de trabalho no centro de
Lisboa:

5 21 26 13 24 29 37 12 31 5
50 18 33 14 23 22 17 32 7 17
42 15 38 20 11 26 25 29 27 8
24 12 39 25 28 14 47 19 22 28
9 18

Uma sumarização com recurso ao caule e folha é a seguinte:

0 5 5 7 8 9
1 1 2 2 3 4 4 5 7 7 8 8 9
2 0 1 2 2 3 4 4 5 5 6 6 7 8 8 9 9
3 1 2 3 7 8 9
4 2 7
5 0

Referências bibliográficas:
• ANDERSON, David R. et al. Estatística Aplicada à Administração e Economia. 2ª ed, THOMSON, São
Paulo, 2003.
• KAZMIER, Leonard J. Estatística Aplicada à Economia e Administração. s/ed, Pearson Makron Books,
São Paulo, 2004.
• LEVIN, Jack et al. Estatística para Ciências Humanas. 11ª ed, Pearson Education, São Paulo, 2012.
• SAMPAIO, Eleutério et al. Exercícios de Estatística Descritiva para as Ciências Sociais. 1ª ed, Edições
Sílabo, Lda, Lisboa, 2003.

10 de 16 2015
Exercícios

1. Em 2007, estudantes do segundo ano do curso de Gestão e Finanças de uma


universidade, decidiram realizar uma pesquisa sobre o estado civil de uma
amostra de 400 homens de uma determinada cidade.

De acordo com o gráfico acima, em que os valores para cada categoria são
apresentados em percentagens, responda às seguintes questões:
a) Defina e classifique a variável em estudo.
b) Construa a tabela de frequências.
c) Qual é a frequência absoluta dos homens solteiros?
d) O que pode concluir deste estudo?

11 de 16 2015
2. Os estudantes de uma certa universidade foram solicitados a preencher um
questionário, onde se obtiveram as seguintes respostas: 10 - Fraco; 15 -
Regular; 8- Bom, 5 - Óptimo, 10 - Excelente
De acordo com esta escala, responda às seguintes questões:

a. Estes dados são qualitativos ou quantitativos?


b. Qual é o tamanho da amostra?
c. Qual é a percentagem dos indivíduos que obtiveram a classificação
Excelente?
d. Qual é a percentagem dos indivíduos que não obtiveram a
classificação Fraco?

3. Realizou-se um estudo sobre a opinião dos estudantes de uma determinada


universidade acerca da qualidade das refeições que lhes foram servidas no
bar. Os dados obtidos foram:

Qualidade das refeições Número de alunos


Deficiente 1
Normal 9
Boa 27
Muito boa 13
50

a. Defina e classifique a variável em estudo.


b. Diga o que representa o valor de 50.
c. Qual é a percentagem de alunos que considera a qualidade de
refeições “Boa”?
d. Represente graficamente a informação.
e. Numa frase simples, procure explicar qual é a opinião destes alunos
sobre a qualidade das refeições servidas no bar.

4. Admita que um grupo de 50 analistas financeiros efectuou uma previsão do


ganho por acção, em euros, de uma empresa no próximo ano, sendo os
resultados apresentados em 7 classes de igual amplitude na tabela seguinte:

Classes Ponto fi Fi Fr

12 de 16 2015
médio
5 4 0.08
8
[08 ; 10[
[10 ; 12[ 8 27
13 37 0.74

17 5 1

a) Qual é o valor da amplitude de classe?

b) Qual é o ponto médio da 7ª classe?

c) Qual é o valor do limite superior da 7ª classe?

d) Quantos analistas tiveram um ganho por acção entre 14 a 15 euros


(inclusive)?

e) Qual é a proporção de analistas que teve ganhos por acção compreendidas


entre 6 a 8 euros?

f) Quantos analistas tiveram ganhos por acção até 9 euros?

g) Qual é a proporção de analistas que teve ganhos por acção inferiores a


12,4 euros?

5. Considere os resultados finais de Estatística de 20 estudantes de uma


Universidade.
9 14 12 8 14 12 16 1 8 14
6
11 12 12 11 11 18 14 1 15 15
8
a. Classifique a variável em estudo.
b. Represente os dados numa tabela de frequência.
c. Represente os dados graficamente.

6. Foi feito um inquérito a um grupo de 40 residentes de uma determinada vila


na província de Inhambane sobre o número de vezes em que foram
diagnosticados malária em suas vidas e obtiveram-se os resultados:

1 4 1 2 2 3 3 2 1 2
3 2 3 1 0 1 2 7 4 3

13 de 16 2015
5 1 2 4 2 1 3 1 0 1
2 1 1 3 1 0 4 2 3 5

a. Construi a tabela de frequências.


b. Construir um gráfico para as frequências absolutas.
c. Numa frase simples, qual a conclusão que podes chegar sobre a taxa
de malária na vila.

7. Considere a seguinte distribuição de frequências correspondente aos


diferentes preços de um determinado produto em 100 lojas pesquisadas.

Preços ($) Número de lojas


50 10
55 20
60 25
65 15
70 30
Total 100

a) Quantas lojas apresentaram um preço de $60?


b) Quantas lojas apresentaram um preço de até $55 (inclusive)?
c) Qual é a percentagem de lojas com preço maior que $60?
d) Qual é a percentagem de lojas com preço maior do que $55 e menor
do que $70?

8. A tabela abaixo apresenta a distribuição de frequência dos salários mensais


em meticais, de 74 empregados da companhia P & R.
Salários (Mt) Nº de Empregados
[500 ; 600[ 10
[600 ;700[ 5
[700 ; 800[ 8
[800 ; 900[ 7
[900 ; 1000[ 15
[1000 ; 1100[ 20
[1100 ; 1200[ 9
Total 74

Encontre:

a) O limite inferior da 6ª classe;

14 de 16 2015
b) O limite superior da 4ª classe;

c) O ponto médio da 3ª classe;

d) A amplitude de classe;

e) A frequência da 3ª classe;

f) A frequência relativa e percentual da 3ª classe;

g) A percentagem de empregados que ganham menos de 1000 Mt por


mês;

9. Os empregados da Electronics Associates estão num sistema de horário


flexível: eles podem começar seu dia de trabalho às 7h, 7h30, 8h ou 9h. Os
seguintes dados representam uma amostra do horário de início escolhido
pelos empregados.
7h 8h30 9h 8h 7h30 7h30 8h30 8h30 7h30 7h
8h3
0 8h30 8h 8h 7h30 8h30 7h 9h 8h30 8h

Sintetize os dados construindo:


a) Uma distribuição de frequência (frequência absoluta).
b) Uma distribuição de frequência percentual.
c) Um gráfico de barras.
d) Um gráfico de pizza.
e) O que os sumários revelam sobre as preferências dos empregados quanto ao
sistema de horário flexível.

10. A National Airlines aceita reservas de vôo por telefone. Os seguintes dados
mostram a duração das chamadas (em minutos) para uma amostra de 20
reservas feitas por telefone. Construa as distribuições de frequências absoluta
e relativa para os dados. Forneça também um histograma:

2,1 4,8 5,5 10,4


3,3 3,5 4,8 5,8
5,3 5,5 2,8 3,6
5,9 6,6 7,8 10,5
7,5 6,0 4,5 4,8

15 de 16 2015
FIM

16 de 16 2015

Você também pode gostar