Você está na página 1de 40

Estatística descritiva

Distribuição de Frequências &


Gráficos
Licenciatura em Psicologia
Edição 2022-2023
Métodos Estatísticos: Fundamentos
Tópicos
• Distribuição de frequências
• Dados qualitativos não ordenados (dados nominais)
• Dados qualitativos ordenados (dados ordinais)
• Dados quantitativos (dados de nível intervalar/razão)
• Gráficos clássicos
• Barras e circular
• Histograma
• Polígono de frequências simples e ogiva de Galton (Polígono de frequências
acumuladas)

J. M. Tomás Silva - FPCEUC 2022 2


• A estatística descritiva preocupa-se com os processos que
nos informam sobre “como tirar informação relevante de um
mar de dados” (Grima, 2018, p .17)
• O “mar de dados” é, muitas vezes, imenso! (e.g., General
Social Survey: https://gss.norc.org/)
• As ferramentas (técnicas) descritivas ajudam a extrair e a
desvendar (“pôr a nu”) a informação essencial que há nos
dados.

J. M. Tomás Silva - FPCEUC 2022 3


Estatísticas descritivas
• São procedimentos estatísticos usados para sumarizar, organizar e simplificar
os dados.
• Frequentemente começamos por organizar os scores/contagens numa tabela
ou gráfico de modo a que possamos ver o conjunto de scores na totalidade
(por ex., construímos tabelas de distribuições de frequências e gráficos de
para essas distribuições)
• Outra técnica comum consiste em sumariar um conjunto de dados através de
um pequeno conjunto de resumos numéricos (p. ex., o sumário com cinco
números). Habitualmente usamos números de três categorias
complementares (tendência central, dispersão e forma)
J. M. Tomás Silva - FPCEUC 2022 4
Distribuição de frequências

• Há dois procedimentos principais para sumariar um conjunto de dados:

✓Tabelas e/ou Gráficos (Tópico desta apresentação)

✓Números (Tópico de uma próxima apresentação)


• Habitualmente quererá usar ambos os procedimentos

J. M. Tomás Silva - FPCEUC 2022 5


Distribuição de frequências & Gráficos

• Distribuições de frequências são um modo de organizar os dados procedendo


à listagem de cada resultado possível (incluindo aqueles que não foram
observados na amostra) numa coluna de números (ou categorias) e a
frequência da ocorrência de cada um deles noutra coluna.
• Gráficos são diagramas ilustrando ligações ou relações entre duas ou mais
variáveis. Os gráficos são frequentemente compostos por linhas ou pontos
ligados.

J. M. Tomás Silva - FPCEUC 2022 6


Distribuição de frequências: Primeiro passo na
análise de dados
• Ao apresentar publicamente a sua investigação vai querer dizer algo sobre
os participantes da sua amostra, p. ex.:
•quantos fizeram parte do estudo?
•quantos eram do sexo masculino? Quantos do sexo feminino?
• A distribuição de frequências é a ferramenta apropriada para esse
objetivo, embora, na prática nem sempre se use uma tabela para
apresentar os dados, optando-se antes por uma narrativa simples (ver
próximos slides).

J. M. Tomás Silva - FPCEUC 2022 7


Descrição do/as
participantes no
estudo ( forma
narrativa)

J. M. Tomás Silva - FPCEUC 2022 8


Descrição do/as
participantes no
estudo (forma de
tabela)

J. M. Tomás Silva - FPCEUC 2022 9


Efeito do tipo de dados/variáveis nas distribuições
de frequências e gráficos
•Há regras distintas para a construção de tabelas/gráficos; em geral, dependem
do tipo de medida das variáveis observadas (e.g., qualitativas vs. quantitativas)

•Ou seja, tenha em atenção se os dados de que dispõe são:

•Nominais Dados
qualitativos
•Ordinais
Dados
quantitativos
•Métricos/Escalares (intervalares e razão)

J. M. Tomás Silva - FPCEUC 2022 10


Variáveis qualitativas
Tabelas e Gráficos

J. M. Tomás Silva - FPCEUC 2022 11


Variáveis qualitativas (nível nominal)
Exemplo: Filiação política de estudantes universitários
Preferências políticas de estudantes
universitários
92 85

fre quê ncia


100
• Tabela de frequências • Gráfico de
33
barras/bar graph 50 11
f % 0
Partido A 92 42
Partido A Partido B Partido C Partido D
Partido B 33 15
Partido
Partido C 85 38
Partido D 11 5
n = 221 100 Preferências políticas de
Estudantes universitários

• Gráfico circular/ Partido A


pie graph Partido B
Partido C
Partido D

J. M. Tomás Silva - FPCEUC 2022 12


Output do IBM SPSS (p/ o ex. preferência política

J. M. Tomás Silva - FPCEUC 2022 13


SPSS (Gráficos)

J. M. Tomás Silva - FPCEUC 2022 14


Variáveis qualitativas (nível ordinal)
[Não difere, essencialmente, do formato adoptado para variáveis de tipo nominal]

Exemplo: Legalização do consumo de marijuana? (de Vaus, 2002)

• Tabela de frequências Devemos legalizar o consumo Percentagem Percentagem


da marijuana? Frequência Válida acumulada
1 Definitivamente legalizar 220 12 12
2 Provavelmente legalizar 422 23 35
3 Indeciso 371 20 55
4 Provavelmente não legalizar 469 26 81
5 Definitivamente não legalizar 351 19 100
Total 1833 100

J. M. Tomás Silva - FPCEUC 2022 15


Output SPSS

J. M. Tomás Silva - FPCEUC 2022 16


Variáveis qualitativas (nível ordinal)
Gráfico de barras (%)
Deve-se legalizar o consumo de marijuana? (de Vaus, 2002)

% válida

30
25
20
15
10
5
0

3 Indeciso
Provavelmente

Provavelmente
Definitivamente

Definitivamente
ilegalizar
legalizar

ilegalizar
legalizar

4
1

5
J. M. Tomás Silva - FPCEUC 2022 17
Variáveis qualitativas (nível ordinal)
Gráfico de barras (frequências acumuladas)
% acumulada
Deve-se legalizar o consumo de marijuana? (de Vaus, 2003)
120
100
80
60
40
20
0

3 Indeciso
Provavelmente

Provavelmente
Definitivamente

Definitivamente
ilegalizar
legalizar

ilegalizar
legalizar

4
1

5
J. M. Tomás Silva - FPCEUC 2022 18
SPSS (Gráficos)

Gráfico de barras Gráfico de barras (acumulado)

J. M. Tomás Silva - FPCEUC 2022 19


Variáveis quantitativas
Tabelas e Gráficos

J. M. Tomás Silva - FPCEUC 2022 20


Autoavaliação da capacidade de liderança
(variável “quase” intervalar)

J. M. Tomás Silva - FPCEUC 2022 21


Distribuição de frequências (não agrupada) -
variáveis quantitativas
Exemplo: Resultados de capacidade de liderança medidas através de um
questionário (Kirk, 1978)

Sujeito Pontos Sujeito Pontos Sujeito Pontos

01 55 11 39 21 45

02 46 12 47 22 33

03 50 13 42 23 50

04 51 14 54 24 51

05 48 15 48 25 54

06 50 16 46 26 59

07 30 17 68 27 49

08 53 18 44 28 42

09 57 19 49 29 56

10 62 20 52 30 53

J. M. Tomás Silva - FPCEUC 2022 22


Resultados de capacidade de liderança (ordem numérica
ascendente sequencial)
Pontos Freq Pontos freq Pontos freq Pontos freq

30 1 40 0 50 3 60 0

31 0 41 0 51 2 61 0

32 0 42 1 52 2 62 1

33 1 43 0 53 2 63 0

34 0 44 1 54 2 64 0

35 0 45 1 55 1 65 0

36 0 46 2 56 1 66 0

37 0 47 1 57 1 67 0

38 0 48 2 58 0 68 1

39 1 49 2 59 1

J. M. Tomás Silva - FPCEUC 2022 23


Output
SPSS

J. M. Tomás Silva - FPCEUC 2022 24


Variáveis de Intervalo/Razão

• As variáveis de quantitativas tendem a manifestar-se através de um


grande número de valores e, muitas vezes, cada um deles ocorrendo
infrequentemente (como vimos no exemplo anterior pouco são os
que se repetem!)
• Construir uma distribuição de frequências simples, nestes casos, não
é muito eficaz e, no passado, a opção era fazer uma divisão em
classes (pode falar-se neste caso numa distribuição agrupada, ou
classificada, para a distinguir das distribuições simples ou não
agrupadas) - ver slide seguinte.

J. M. Tomás Silva - FPCEUC 2022 25


Distribuição em Classes
Classes f p % fac farel fac%
30-32 1 0,03 3,33 1,00 0,03 3,33
33-35 1 0,03 3,33 2,00 0,07 6,67
36-38 0 0,00 0,00 2,00 0,07 6,67
39-41 1 0,03 3,33 3,00 0,10 10,00
42-44 2 0,07 6,67 5,00 0,17 16,67
45-47 4 0,13 13,33 9,00 0,30 30,00
48-50 7 0,23 23,33 16,00 0,53 53,33
51-53 6 0,20 20,00 22,00 0,73 73,33
54-56 4 0,13 13,33 26,00 0,87 86,67
57-59 2 0,07 6,67 28,00 0,93 93,33
60-62 1 0,03 3,33 29,00 0,97 96,67
63-65 0 0,00 0,00 29,00 0,97 96,67
66-68 1 0,03 3,33 30,00 1,00 100,00
30 1 100

Notas:
• Numa apresentação formal, habitualmente apenas incluiríamos as frequências absolutas e as percentagens. Neste exemplo,
seguiram-se as escolhas de Kirk (1978), quanto ao número de classes (outras construções seriam possíveis).
• f = frequência absoluta; p = proporção, ou frequência relativa; % = percentagem; fac = frequência acumulada (absoluta); facrel
= frequência acumulada relativa; facr% = frequência acumulada em percentagem.

J. M. Tomás Silva - FPCEUC 2022 26


Representação gráfica: Histograma

Exemplo: Resultados de capacidade de liderança

freq. absoluta 8
6
4
2
0
2

8
-3

-3

-3

-4

-4

-4

-5

-5

-5

-5

-6

-6

-6
30

33

36

39

42

45

48

51

54

57

60

63

66
capacidade de liderança

Nota: gráfico obtido com o programa Microsoft Excel

J. M. Tomás Silva - FPCEUC 2022 27


Representação gráfica: Polígono de frequências
Exemplo: Resultados de capacidade de liderança

freq. absoluta
6
4

2
0
28 31 34 37 40 43 46 49 52 55 58 61 64 67 70
Capacidade de liderança
Nota: gráfico obtido com o programa Microsoft Excel

J. M. Tomás Silva - FPCEUC 2022 28


Polígono de frequências acumuladas (ogiva de Galton)
Exemplo: Resultados de capacidade de liderança

120
100

% acumuladas 80
60
40
20
0
.5

.5

.5

.5

.5

.5

.5
29

35

41

47

53

59

65
capacidade de liderança

J. M. Tomás Silva - FPCEUC 2022 29


Output SPSS - Histograma

J. M. Tomás Silva - FPCEUC 2022 30


Gráficos simples vs. complexos

• Os gráficos anteriores retratam situações simples (v.g., uma única


variável categorial ou contínua)
• A adição de uma (ou mais) variáveis, embora complexifique a
representação gráfica, pode ser também muito elucidativa de
qualquer tendência que exista nos dados
• De seguida apresentamos* dois tipos de gráficos de barras que
podem usar-se para planos de investigação entre-grupos (between
groups designs) e intra-grupos (within groups designs)
*Os exemplos foram propostos por Andy Field.

J. M. Tomás Silva - FPCEUC 2022 31


Plano de investigação Entre-grupos
• Um diretor de cinema está interessado em saber se
realmente existe um efeito “ckick flick” (um filme que agrada
mais às mulheres que aos homens).
• Obtém uma amostra de 20 participantes de cada sexo e
mostrou a metade de cada amostra um filme que
supostamente seria um “chick flick” (Bridget Jones’ Diary), e
à outra metade de cada amostra um filme que não se
enquadra na categoria de “chick flick” (Memento).
• Todos os casos (participantes) são avaliados relativamente
ao nível de ativação fisiológica como indicador de quanto
gostaram do filme.
• Uma maneira de apresentar os seus resultados é através de
um gráfico (vide slide seguinte – ilustraremos como se
obtém este gráfico nas aulas práticas)

J. M. Tomás Silva - FPCEUC 2022 32


Gráficos de barras agrupados para amostras
independentes

J. M. Tomás Silva - FPCEUC 2022 33


Plano de investigação Intra-grupos
• Imaginem a seguinte investigação hipotética com pessoas que sofrem de
soluços (hiccups/hipo); os soluços podem ser um problema sério!
• Os tratamentos médicos oficiais incluem: manobras de puxar a língua
(tongue-pulling), massagem da artéria carótida/manobras vagais
(massage of the carotid artery) e massagem rectal digital/rectal digital
massage (acreditem ou não!)
• Um investigador obteve 15 sofredores de soluços e durante um episódio de
soluços administrou cada um dos três procedimentos (em ordem aleatória)
e com intervalos de 5 minutos após ter obtido uma linha de base (baseline)
de quantos soluços emitiram num minuto.
• Contaram-se o número de soluços no minuto subsequente a cada
procedimento e os dados foram apresentados num gráfico de barras.
J. M. Tomás Silva - FPCEUC 2022 34
Gráficos de barras simples para dados de
medidas repetidas (intra-grupo)

Tratamento mais eficaz!

J. M. Tomás Silva - FPCEUC 2022 35


APÊNDICE
Linhas de orientação para a construção de distribuição em classes

J. M. Tomás Silva - FPCEUC 2022 36


Como construir uma distribuição com classes?
(Martins, 1980, p. 39):
• Localize os valores máximo e mínimo das observações recolhidas (ou
observadas). A diferença destes extremos é o intervalo de variação
(amplitude) da variável;
• Estabeleça, pela fórmula de Sturges (vide slide mais adiante), ou com base
na sua experiência, o número de classes mais apropriado para obter uma
variação regular das frequências – a maioria dos autores sugere um n.º entre
5 e 15 classes;
• Analise novamente as observações (dados) e verifique se estas têm
tendência para concentrar-se em torno de determinados valores. Oriente-se
por eles para definir a sucessão das marcas (ou do ponto médio) de acordo
com o número de classes que pretende estabelecer;
J. M. Tomás Silva - FPCEUC 2022 37
(Martins, 1980, p. 39)

• Defina depois a sucessão dos extremos das classes, correspondentes às


marcas estabelecidas;
• Proceda à contagem das observações segundo as classes estabelecidas.
Verifique se a soma das frequências apuradas é igual ao efetivo (ou tamanho)
da amostra;
• Represente graficamente a distribuição obtida (optativo, mas bastante
recomendado em análise de dados.)

J. M. Tomás Silva - FPCEUC 2022 38


Nota sobre a fórmula de Sturges
✓O número k de intervalos (i.e., classes) para cada conjunto de observações com n valores pode ser calculado como:

k = 1 + 3,322(log10 n) (fórmula de Sturges) [log, também, denominado logaritmo comum]

✓Exemplo: para um conjunto com n = 169 observações obtemos log10(169) = 2.2279;

Assim, temos: k = 1 + 3.322 × 2.2279  7.68


(i.e., aproximadamente) 8 intervalos/classes.

✓Para pequenas amostras alguns autores sugerem que se use antes a fórmula:
k = √n

Onde k = n.º de classes e n = efetivo (tamanho) da amostra

Nota: Os dois métodos podem propor soluções muito diferentes (e.g., k = 13, versus 8 = k de Sturges).

J. M. Tomás Silva - FPCEUC 2022 39


Referências

• Cohen, B. H. & Lea, R. B. (2004). Essentials of statistics for the social and
behavioral sciences. Hoboken, NJ: Wiley.
• Field, A. (2009). Discovering statistics using SPSS (3rd ed.). London: SAGE
Publications.
• Grima, P. (2018). Os segredos da estatística: A certeza absoluta e outras
ficções. Lisboa: National Geographic.
• Marôco, J. (2007). Análise estatística – Com utilização do SPSS (3ª ed.).
Lisboa: Edições Sílabo.
• Martins, A. P. (1980). Iniciação à estatística. Porto: Porto Editora.
J. M. Tomás Silva - FPCEUC 2022 40

Você também pode gostar