Você está na página 1de 30

Estatística descritiva

Frequências e percentagens
Medidas de tendência central e de dispersão
Estatísticas descritivas em função na natureza da
variáveis
Metodologia de Investigação Quantitativa
Methodology of Quantitative Research

Ricardo Pinto e Joana Cabral


ricardo.pinto@ulp.pt
Estatística exploratória e descritiva

A estatística descritiva diz respeito a um


conjunto de medidas e indicadores que
permitem descrever os dados recolhidos de
forma sucinta, clara e de fácil compreensão
3 principais “ modalidades ” de estatística
descritiva:
•Frequências e percentagens
•Medidas de tendência central e de dispersão
•e sua representação gráfica
Estatística exploratória e descritiva
Medidas de tendência central e de dispersão
• Conjunto de medidas que servem para descrever onde se
concentra a distribuição de valores de uma variável na
amostra
• A seleção do tipo de medidas a utilizar depende do tipo de
variável que queremos descrever:
• As variáveis de tipo nominal, ordinal, ou intervalar são
descritas de forma distinta - medidas descritivas
adequadas à sua natureza

• A descrição da centralidade de uma variável deve ser feita


com recurso a um par de medidas:
• Uma medida de tendência central e
• uma de dispersão
Estatística exploratória e descritiva

Alguns conceitos:
• Frequências – contagens de incidências/casos por cada
opção de resposta ou valor que a variável pode assumir
• Mínimo e máximo – o valor mínimo e máximo presentes
na distribuição dos dados para uma variável.
• Quartis – os quartis dividem o conjunto de dados
(ordenados por ordem crescente) da distribuição em 4
partes iguais.
• Percentis – os quartis também são percentis, contudo
podem criar-se tantos mais percentis quantos forem
adequados para dividir a distribuição dos dados em
função dos propósitos de análise da distribuição.
• geralmente usam-se os percentis 25, 50 e 75.
Estatística descritiva

Medidas de centralidade – procuram descrever as características


mais salientes da amostra e/ou as tendências de resposta
• Moda - é o valor mais frequente
• Mediana – é o valor que divide a distribuição/amostra em 2
partes “iguais”, ou o valor central da variável quando os valores
de todos os sujeitos estão ordenados por ordem crescente.
• corresponde ao percentil 50.
• Média – consiste no resultado da soma de todos os valores dos
sujeitos/participantes numa determinada variável, dividido pelo
número total de participantes.
• Representa o ponto com maior concentração de dados da
distribuição; é um valor hipotético que pode ou não ser um
valor observado entre os dados, um vez que é calculado com
base em todos os valores da amostra.
Estatística descritiva

Medidas de dispersão

• Intervalo interquartílico – acompanha a mediana (que


corresponde ao percentil 50) e consiste na diferença entre o
percentil 75 e o percentil 25.

• Desvio-padrão – acompanha SEMPRE a média; é um


indicador da distância à média e informa acerca da
variabilidade e dispersão dos dados. Diz-nos sobre qual o
valor descritivo da média (deve por isso sempre acompanhá-
la)
Estatística descritiva

• Tabelas descritivas e representação gráfica dos dados


• Tabelas de frequências (incluem sempre as percentagens)
• Diagrama circular Masculino
Feminino

• Diagrama de barras 598


344

• Histograma
25,00%
Medicina
20,00% Arquitect.
Direito
15,00%
Psicologia
10,00% Ciências
Farmácia
5,00% Engenharia
Economia
0,00%
Estatística descritiva

Que dados relatar e como?


• Depende da variável e do seu significado para o
estudo (não só do tipo de variável…).
• A descrição da centralidade de uma variável deve ser
feita com recurso a um par de medidas:
• Uma medida de tendência central e
• Uma de dispersão
• Regras da APA – a média é sempre acompanhada do
DP e as frequências (sempre relatadas em 1º) da
respectiva %.
Medidas de tendência central e dispersão
para variáveis nominais

• Frequências: representa o número de vezes que


cada valor da variável aparece na amostra.
• Moda: valor da variável que aparece com maior
frequência na amostra

• Exemplo com base na nossa base de dados:

• Variável nominal: Sexo


MODA E FREQUÊNCIAS PARA A VARIÁVEL
NOMINAL SEXO
MODA E FREQUÊNCIAS PARA A VARIÁVEL
NOMINAL SEXO | comandos
MODA E FREQUÊNCIAS PARA A
VARIÁVEL NOMINAL SEXO | Syntax
MODA E FREQUÊNCIAS PARA A VARIÁVEL
NOMINAL SEXO | Execução da Syntax
MODA E FREQUÊNCIAS PARA A
VARIÁVEL NOMINAL SEXO | Output
MODA E FREQUÊNCIAS PARA A VARIÁVEL
NOMINAL SEXO | Análise output

Statistics
Interpretação dos resultados
Sexo
Tabela Statistics:
Valid 318
n = 318 casos válidos N
e nenhum missing ou valor omisso Missing 0

Sexo

Frequency Percent Valid Percent Cumulative


Tabela Sexo: apresenta Percent

frequências e percentagens
masculino 107 33,6 33,6 33,6

Moda: Feminino Valid feminino 211 66,4 66,4 100,0

(valor numérico: 2 – Total 318 100,0 100,0

isoladamente não tem


significado)
MODA E FREQUÊNCIAS PARA A VARIÁVEL
NOMINAL SEXO | Redação resultados

A amostra é constituída por 318 participantes,


107 (33.6%) do sexo masculino e 211 (66.4%)
do sexo feminino. A maioria dos participantes
são do sexo feminino (Mo = 2).

Nota: colocar o valor numérico da moda é


facultativo, porque pouco informativo. O
gráfico a apresentar seria o diagrama circular.
MEDIDAS DE TENDÊNCIA CENTRAL E DE DISPERSÃO PARA
VARIÁVEIS ORDINAIS:
MEDIANA E INTERVALO INTERQUARTÍLICO

• Mediana: é o valor que divide a


distribuição/amostra em 2 partes iguais, ou o
valor central da variável quando os valores de
todos os sujeitos estão ordenados por ordem
crescente.
• Representa o percentil 50
• O intervalo interquartílico consiste na
diferença entre o percentil 75 e o percentil
25.
MEDIANA E INTERVALO INTERQUARTÍLICO: VARIÁVEL
ORDINAL: ESCOLARIDADE DO PAI | Comandos
MEDIANA E INTERVALO INTERQUARTÍLICO: VARIÁVEL
ORDINAL: ESCOLARIDADE DO PAI | Syntax
MEDIANA E INTERVALO INTERQUARTÍLICO: VARIÁVEL
ORDINAL: ESCOLARIDADE DO PAI | Output
MEDIANA E INTERVALO INTERQUARTÍLICO: VARIÁVEL
ORDINAL: ESCOLARIDADE DO PAI | Análise output

Nem todos os participantes


forneceram informação relativa
a esta variável – valores
omissos

Mediana: 12º ano


Intervalo interquartílico: 7
25%: 7º ano
75%: licenciatura (nos valores ordenados a
licenciatura corresponde ao valor 14)
Cálculo IQQ: 14-7= 7
MEDIANA E INTERVALO INTERQUARTÍLICO:
VARIÁVEL ORDINAL: ESCOLARIDADE DO PAI

Redação dos resultados:

A amostra é constituída por 318 participantes, a


escolaridade mínima é a 2ª classe e a máxima a
formação pós-graduada; 49 (16%) dos pais tem a 4ª
classe, 25 (8.2%) o 9º ano, 46 (15%) o 12º ano de
escolaridade, e 98 (32%) a licenciatura. A mediana
corresponde ao 12º ano (Mdn = 12, IQQ = 7).

Nota: os gráficos a apresentar seriam o diagrama


circular ou o de barras.
MEDIDAS DE TENDÊNCIA CENTRAL E DE DISPERSÃO
PARA VARIÁVEIS INTERVALARES:
MÉDIA E DESVIO-PADRÃO

•Média: consiste no resultado da soma de


todos os valores dos indivíduos numa
determinada variável, dividido pelo número
total de valores

•Desvio-Padrão: traduz a dispersão média


dos valores individuais em relação ao valor
da média da amostra na variável em
questão
MÉDIA E DESVIO-PADRÃO
VARIÁVEL INTERVALAR: IDADE | Comandos
MÉDIA E DESVIO-PADRÃO
VARIÁVEL INTERVALAR: IDADE | Comandos
MÉDIA E DESVIO-PADRÃO
VARIÁVEL INTERVALAR: IDADE | Syntax
MÉDIA E DESVIO-PADRÃO
VARIÁVEL INTERVALAR: IDADE | Output
MÉDIA E DESVIO-PADRÃO
VARIÁVEL INTERVALAR: IDADE | Análise Output

Descriptive Statistics

Tabela Descriptive N Minimum Maximum Mean Std. Deviation


Statistics: contém os
casos válidos e omissos Idade 317 17 20 17,88 ,491
se existirem, valores
Valid N (listwise) 317
mínimo e máximo, e
média e desvio-padrão

Redação dos Resultados relativos à Média e Desvio-Padrão:


A idade dos participantes varia entre 17 e os 20 anos, sendo a
média de 17.88 e o desvio-padrão de .49 (M = 17.88, DP = .49).

Nota: Sempre que informativo acerca da distribuição dos dados e útil para a
descrição da amostra, pode incluir-se ainda a Moda e a Mediana.
ESTATÍSTICA DESCRITIVA EM FUNÇÃO DA
TIPOLOGIA DA VARIÁVEL

Representaçã
Medidas descritivas
o gráfica
Escala de Medida
Tendência Central Dispersão Gráficos
das Variáveis
Diagrama circular
Nominais Moda Frequências
ou de barras
Intervalo Diagrama de
Ordinais Moda e Mediana
Interquartílico barras
Moda, Mediana e
Intervalares Desvio-Padrão Histograma
Média
Descrição da amostra (exemplo)
A amostra inclui 942 caloiros de diversos cursos da
Universidade do Porto - 344 homens (36.5%) e 25,00%
Medicina
598 mulheres (63.5%), com idades entre os 17 os 20,00% .Arquitect
Direito
15,00%
20 anos (M = 17.19, DP = .54) . Psicologia
Ciências
10,00%
Farmácia
5,00% Engenharia
Economia
0,00%

As notas de admissão variam entre 11,1 a 19,9


(numa uma escala de 1/20), sendo as notas entre
os 15 e 19 valores as mais frequentes (M = 17, DP
= 1.76).

Uma percentagem considerável dos alunos estão Masculino


Feminino
deslocados (n = 389, 41.3%), vivem num quarto 344
alugado ou apartamento (sozinhos, com 598
parentes, com amigos ou colegas), ou em
residências, e a maioria (n = 324; 34.4%) regressa
a casa semanalmente.

Você também pode gostar