Você está na página 1de 18

Curso de Gestão da Informação e do Conhecimento

Módulo 17: Análise e Tratamento de Dados

Texto 2

Estatística Descritiva

Nino Matos da Fonseca

Junho de 2005
ESTATÍSTICA DESCRITIVA

• Área da estatística vocacionada para a descrição de


dados;

• Recurso a distribuições de frequências, indicadores


descritivos (medidas de localização [média, mediana,
moda…] e de dispersão [variância, desvio-padrão…]);

• Objectivos: avaliar a qualidade da informação, identifi-


car fenómenos estranhos e resumir a informação.

2
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (I)

Variáveis Tipo Escala Casos


Intervalar
Quantitativas Discretas Razão 1
Intervalar
Contínuas Razão 2

Qualitativas Discretas Nominal 3

Ordinal 4

3
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (II)

• Caso 1 – Exemplo:
Numa experiência relacionada com a interpretação dos
desenhos feitos por 130 crianças com idades com-
preendidas entre 6 e 10 anos, contou-se o número de
personagens reais representadas (adaptado de Maroco
e Bispo, 2003:27):

i N.º de perso- ni Ni fi Fi
nagens reais
1 0 15 15 0,115 0,115
2 1 28 43 0,215 0,330
3 2 41 84 0,315 0,645
4 3 23 107 0,177 0,822
5 4 14 121 0,108 0,930
6 5 9 130 0,069 1,000
TOTAIS ___ 130 ___ 1,000 ___

Distribuição de frequências relativas

0,35
0,3

0,25

0,2

0,15
0,1

0,05

0
0 personagens 1 personagem 2 personagens 3 personagens 4 personagens 5 personagens

4
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (III)

• Caso 1 – Observações:
Ø É desejável a ordenação por ordem crescente dos
da variável em estudo;
Ø As frequências absolutas (e as acumuladas) tam-
bém podem ser representadas graficamente atra-
vés de gráficos de barras. O polígono de frequên-
cias é um outro expediente gráfico usualmente utili-
zado;
Ø Quando o número de observações é grande, é con-
veniente construir classes;
Ø Regras básicas de construção de classes (Maroco
e Bispo, 2003:28):
Número de classes
Regra 1: N < 25 ? 5 classes; N = 25 ? N clas-
ses (N = dimensão da amostra);
Regra 2: Fórmula de Sturges ? k=1+3,32log10(N)
classes;
Amplitude de cada uma das i classes
ai=(max-min)/k, sendo max e min, respectivame n-
te, os maior e menor valores observados.
Ø Estas observações aplicam-se, igualmente, ao caso
2.

5
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (IV)

• Caso 2 – Exemplo:
Num estudo sobre psicologia infantil, foram selecciona-
das aleatoriamente 30 crianças com 4 anos de idade. A
cada criança foi pedido que identificasse uma determi-
nada figura. Os tempos de identificação registados para
cada uma das crianças foram agrupados da seguinte
forma (Maroco e Bispo, 2003:29):

i Classes ni Ni fi Fi
1 [6,3; 7,8[ 7 7 0,23 0,23
2 [7,8; 9,3[ 6 13 0,20 0,43
3 [9,3; 10,8[ 7 20 0,23 0,66
4 [10,8; 12,3[ 4 24 0,13 0,79
5 [12,3; 13,8[ 3 27 0,10 0,89
6 [13,8; 15,3[ 3 30 0,10 1,00
TOTAIS ___ 30 ___ 1,00 ___

Distribuição de frequências relativas

0,25

0,2

0,15

0,1

0,05

0
6,3 a 7,8 7,8 a 9,3 9,3 a 10,8 10,8 a 12,3 12,3 a 13,8 13,8 a 15,3

6
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (V)

• Caso 3:
Numa amostra constituída por 120 peças, constatou-se
que 100 não tinham qualquer defeito, 15 tinham defei-
tos mas eram recuperáveis e 5 eram irrecuperáveis (i.e.
sucata) (Guimarães e Cabral, 1997: 17):

i Categorias das ni Ni fi Fi
peças
1 Sem defeito 100 100 0,833 0,833
2 Recuperáveis 15 115 0,125 0,958
3 Sucata 5 120 0,042 1,000
TOTAIS ___ 120 ___ 1,000 ___

Distribuição de frequências relativas

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
Sem defeito Recuperáveis Sucata

7
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (VI)

• Caso 3 – Observações:
Ø A ordenação da variável é irrelevante (se bem que
o bom-senso possa sugerir uma ordenação lógica);
Ø As frequências absolutas (e as acumuladas) tam-
bém podem ser representadas graficamente, quer
através de gráficos de barras quer de gráficos circu-
lares:

Distribuição de frequências relativas

Sem defeito
Recuperáveis
Sucata

8
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (VII)

• Caso 4:
Os alunos de uma turma do 12º ano obtiveram as
seguintes classificações num exame de Estatística.

i Classificações ni Ni fi Fi
1 Muito mau 1 1 0,025 0,025
2 Mau 2 3 0,050 0,075
3 Suficiente 13 16 0,325 0,400
4 Bom 19 35 0,475 0,875
5 Muito bom 5 40 0,125 1,000
TOTAIS ___ 40 ___ 1,000 ___

Distribuição de frequências relativas

0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
Muito mau Mau Suficiente Bom Muito bom

9
DISTRIBUIÇÕES DE FREQUÊNCIAS E GRÁFICOS (VIII)

• Caso 4 – Observações:
Ø A ordenação da variável é relevante;
Ø As frequências absolutas (e as acumuladas) tam-
bém podem ser representadas graficamente, quer
através de gráficos de barras quer de gráficos circu-
lares;
Ø A construção das categorias pode resultar da con-
versão de uma variável quantitativa medida numa
escala de razão (como aconteceu no exemplo). Tal
acarreta perda de informação.

10
M EDIDAS DE ESTATÍSTICA DESCRITIVA

• Medidas de localização (permitem caracterizar a ordem


de grandeza das observações):
Ø Medidas de tendência central (média, mediana e
moda);
Ø Medidas de tendência não central (quantis).
• Medidas de dispersão (quantificam a variabilidade dos
valores observados):
Ø Amplitude, variância, desvio-padrão e coeficiente de
variação.
• Medidas de assimetria e achatamento (permitem carac-
terizar a assimetria e o grau de achatamento de uma
distribuição):
Ø Coeficientes de Pearson, coeficiente de assimetria
e coeficiente de curtose.

11
EXERCÍCIO N.º 1

Considere a seguintes notas (escala de zero a dez) obtidas pelos alunos de 3


turmas num ditado (dados retirados de D’Hainaut, 1997:3):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Turma A 3 7 9 7 10 6 2 8 7 5 6 7 8 __ __
Turma B 6 5 8 7 5 6 2 3 7 9 6 8 __ __ __
Turma C 8 7 10 8 9 5 8 7 9 8 9 7 6 10 9

a) Classifique a variável em estudo quanto ao tipo e à escala de medida.


b) Construa o quadro de distribuição de frequências de cada uma das tur-
mas.
c) Represente graficamente a distribuição de frequências relativas de cada
turma.
d) Para cada turma, calcule e interprete as seguintes estatísticas:
- Média, mediana e moda;
- Amplitude e desvio-padrão;
- Coeficientes de assimetria e de curtose.

12
EXERCÍCIO N.º 2
(adaptado de D’Hainaut, 1997:15)

1. Qual o critério que distingue os dados ordinais dos nominais?


a) A proporcionalidade dos intervalos;
b) A existência de um zero “verdadeiro” na escala;
c) A existência de uma relação de ordem.
2. Classifique cada uma das variáveis a seguir indicadas de acordo com a
escala de medida:
a) A estatura de um aluno (baixa, média ou alta);
b) A nacionalidade dos turistas que visitaram Portugal em 2004;
c) A opinião dos residentes acerca do estado da economia portuguesa,
numa escala de cinco níveis (muito má, má, razoável, boa ou muito
boa);
d) O resultado de um teste de inteligência (mínimo: zero; máximo: 160).
3. Para avaliar o conhecimento do alfabeto, pediu-se aos alunos do 1º ano
do 1º ciclo do ensino básico que identificassem cada uma das 26 letras do
alfabeto apresentadas por ordem aleatória. O teste é classificado numa
escala de zero (nenhuma letra identificada correctamente) a 26 (26 letras
identificadas correctamente). Qual o tipo e escala de medida da variável
em estudo?
a) Quantitativa discreta em escala de intervalo;
b) Quantitativa discreta em escala de razão;
c) Quantitativa contínua em escala de intervalo;
d) Quantitativa contínua em escala de razão;
e) Qualitativa ordinal;
f) Qualitativa nominal.
4. Indique, para cada um dos casos, se se trata de uma variável discreta ou
contínua:
a) A altura dos alunos;
b) O número de erros num ditado;
c) O número médio de filhos por mulher nos vários países da União
Europeia;
d) O número de anos de uma pena por homicídio;
e) O número de filhos dos casais que vivem em união de facto.

13
NOTAS FINAIS E DICAS (I)

• No processo de construção de gráficos, é necessário


ter em atenção vários pormenores. Em concreto, é
necessário garantir que o gráfico (Silva, s.d.):
Ø É fácil de ler;
Ø Não pode ser mal interpretado;
Ø Tem o tamanho e a forma certa;
Ø Está localizado no sítio certo;
Ø Beneficia (ou não) se for colorido;
Ø Foi testado junto de alguém.
• Os gráficos devem ser simples e de leitu-
ra/compreensão rápida (“Um mau gráfico é pior do que
nenhum gráfico”, Wallgreen, 1996:89, cit in Silva, s.d.).
• O tratamento informático pode melhorar o gráfico de
forma substancial:

Fonte: Silva, (s.d.).

14
NOTAS FINAIS E DICAS (II)

• Para séries temporais, são de recomendar os gráficos


de barras e de linhas:

Fonte: idem.

Fonte: ibidem.

15
NOTAS FINAIS E DICAS (III)

• Nunca se deve usar um gráfico de linhas se os dados


não forem temporais (ou se não representarem algum
tipo de evolução):

Fonte: ibidem.

• Os gráficos circulares não devem ser utilizados quando


existem mais de cinco categorias. Dois primeiros –
maus exemplos; terceiro – bom exemplo:

16
NOTAS FINAIS E DICAS (IV)

• Por vezes, é útil ordenar as colunas por tamanho:

• A maior ou menor simetria da distribuição de frequên-


cias dá-nos indicações intuitivas acerca do método de
análise estatística indutiva a utilizar mais tarde;
• A análise da distribuição de frequências permite, muitas
vezes, detectar “outliers” (observações anormais –
comportamentos estranhos/idiossincráticos ou erros de
medição/registo);
• O valor (classe) mais frequente recebe a designação de
moda (classe modal). Várias modas são indiciadoras da
presença de possíveis grupos distintos nos dados.
• Na apresentação de tabelas, os arredondamentos drás-
ticos, às unidades ou as dezenas, acompanhados de
algum tipo de ordenação, de valores médios e de
sumários verbais, facilita a compreensão.

17
REFERÊNCIAS

D’HAINAUT, L. (1997) Conceitos e Métodos de Estatística, Volume I:


Uma Variável a Uma Dimensão, 1ª Edição, Fundação Calouste
Gulbenkian, Portugal.
GUIMARÃES, R. e Cabral, J. (1997) Estatística, 1ª Edição, McGraw-
Hill, Portugal.
MAROCO, J. e Bispo, R. (2003) Estatística Aplicada às Ciências
Sociais e Humanas, 1 ª Edição, Climepsi, Portugal.
SILVA, A. (s.d.) Representações Gráficas, Colecção Dossiês Didác-
ticos, INE. Em linha, disponível em http://alea-estp.ine.pt. (ace-
dido em Maio de 2005).

18