Você está na página 1de 69

Métodos Estatísticos

Mestrado em Gestão

Introdução à análise de dados


com aplicações em SPSS

João Paulo Oliveira Martins


DMAT, ESTG – Instituto Politécnico de Leiria
2016
Sumário
1. Terminologia básica
2. Iniciação ao SPSS
3. Estatística Descritiva

2
1. Terminologia básica
Antes de iniciarmos o estudo das metodologias de Estatística descritiva,
importa referir alguma da terminologia comummente utilizada em qualquer
estudo estatístico:
• População – conjunto de indivíduos que se pretende estudar
• Amostra – subconjunto da população a partir do qual é recolhida
informação sobre as características de interesse
• Unidade estatística – cada um dos elementos da população
• Variáveis – características de interesse que se pretendem estudar. Uma
variável é quantitativa (ex.: peso, altura, quantidade de calorias
o su idasàdia ia e te,… à ua doàseàexp essaà u e i a e te.àCasoà
contrário é qualitativa. Uma variável qualitativa que apresente uma ordem
lógica entre as categorias é designada por variável qualitativa ordinal
ívelàdeàsatisfação,à o àat i uídaà aàt iage àdeàMa heste ,… .àCasoà
contrário, é uma variável qualitativa nominal (género, marca do
medicamento anti-hista í i o,… .

Instituto Politécnico de Leiria 3


2. Iniciação ao SPSS
• O SPSS é um poderoso programa informático para a análise
estatística de dados no domínio das Ciências Sociais e não só.
• Outros softwares disponíveis são, por exemplo, o R (gratuito), SAS e
Statistica.
• Tal como as aplicações que utilizam o sistema operativo Windows, o
SPSS funciona através de menus e quadros de diálogo o que
permite executar a maior parte do trabalho utilizando
simplesmente o rato. Porém, é necessário saber como interpretar
os resultados (outputs)!

Instituto Politécnico de Leiria 4


2.1. Extensão dos ficheiros associados

• .sav – ficheiro de dados (onde se inserem os dados)

• .spo – extensão dos ficheiros de output (apresentam os


resultados dos comandos executados)

• .sps/.spv – ficheiros com códigos de programação (utilização


avançada)

Instituto Politécnico de Leiria 5


2.2. Extensão .sav
• File – Open – Data

Permite
abrir vários
tipos de
ficheiros
incluindo
Excel

Instituto Politécnico de Leiria 6


2.2. Extensão .sav
Variáveis

I
n
d
i
v
í
d
u
o
s

Instituto Politécnico de Leiria 7


2.2. Extensão .sav

Instituto Politécnico de Leiria 8


2.2. Extensão .sav
Colunas da Variable view

• Name – o eàdaàva i velà se àa e tos,àespaços,…

• Type – tipo de variável: numérica, texto (string ,àdata,….à


Ha itual e te,àasà espostas àe àtextoàsãoà odifi adasà éàat i uídoà
um número que representa a resposta) pelo que a maioria das
variáveis será do tipo numérica (o que não significa que seja
qualitativa)

• Width – ú e oà xi oàdeà a a te esàpe itidosà asà espostas

• Decimals – número de casas decimais


Instituto Politécnico de Leiria 9
2.2. Extensão .sav
• Label - legenda

• Values – atribuir valores a uma categoria

• Missing – atribuir valores a não respostas

• Colums – largura das colunas

• Align – alinhamento do texto

• Measure – No caso de uma variável qualitativa seleciona-se


o i al àouà o di al à o soa teàelaàsejaà ualitativaà o i alàouà
ordinal. Seleciona-seà scale à oà asoàdeàva i veisà ua titativas

Instituto Politécnico de Leiria 10


2.3. Output (.spo)
Quando se executa um comando qualquer sobrepõe-se no écran
uma nova janela correspondendo ao ficheiro de output. Neste
aparecem:

• As linhas de programação correspondentes ao comando em


causa.

• Os valores ou representações solicitadas por esse comando,


se aplicável.

Instituto Politécnico de Leiria 11


2.3. Output (.spo)

Instituto Politécnico de Leiria 12


3. Estatística descritiva
Estatística descritiva é o termo habitualmente utilizado para
designar o ramo da Estatística associado à análise dos dados
provenientes de uma amostra. As conclusões obtidas aplicam-se
unicamente à amostra e não à população (exceto quando estas
são coincidentes – censo)

As ferramentas de Estatística Descritiva mais relevantes são


• Tabelas de frequência
• Representações gráficas
• Medidas de estatística descritiva

Instituto Politécnico de Leiria 13


3.1. Tabelas de frequências
Dados qualitativos ou quantitativos com poucas categorias
distintas
• Analyze →ààDescriptive Statistics →àFrequencies →àStatistics
(manual)

Este comando permite construir tabelas de frequências para


uma ou mais variáveis (sem cruzamento de informação).

Instituto Politécnico de Leiria 14


3.1. Tabelas de frequências
Clicar 2x na
variável
pretendida e ela
passará do
campo da
esquerda para a
direita. Em
alternativa, clicar
uma vez e depois Clicar no
na seta. botão
Statistics à
abre esta
janela onde
podem ser
selecionadas
diversas
medidas
estatísticas

Instituto Politécnico de Leiria 15


3.1. Tabelas de frequências

O SPSS fornece, da esquerda para a direita, as frequências absolutas, as


frequências relativas incluindo e excluindo os missings e as frequências
relativas acumuladas.
As frequências acumuladas para variáveis qualitativas nominais não têm
sentido.
Neste caso, amostra tem dimensão 414 sendo que cerca de 216 indivíduos
(52%) são do sexo masculino.

Instituto Politécnico de Leiria 16


3.1. Tabelas de frequências
Dados quantitativos com muitas categorias distintas
• Transform →ààVisualàBinning

Este comando permite construir tabelas de frequências para dados


agrupados em classes. Uma regra prática consiste em utilizar um número de
classes � que seja o menor inteiro que iguale ou ultrapasse a dimensão da

amostra �, isto é, tal que ≥ � (Regra de Sturges). No software é necessário
especificar o limite superior de cada intervalo (classe). Esse valor é designado
por cutpoint. O último cutpoint não é especificado e surge a designação
automática HIGH.

Instituto Politécnico de Leiria 17


3.1. Tabelas de frequências
Nome da nova variável que irá guardar a classe de cada indivíduo

Note que não há


classes nos
ext e osà vazias .à
O primeiro
cutpoint está a
vermelho.
Cutpoints
incluídos?
Cutpoints
Inserir
intervalos

Em Make Cutpoints podem-se criar automaticamente os cupoints defenindo o


primeiro cutpoint e o número de cutpoints ou a amplitude dos intervalos (width).
Instituto Politécnico de Leiria 18
3.1. Tabelas de frequências

Neste caso, por exemplo, o peso é inferior a 3583 em 71% dos indivíduos.
Também se verifica ausência de informação para 3 (0.7%) dos indivíduos o que
explica as ligeiras diferenças observadas nas últimas 2 colunas.

Instituto Politécnico de Leiria 19


3.1. Tabelas de frequências
• Analyze →ààDescriptive Statistics →àCrosstabs

Este comando permite construir tabelas de frequências para duas ou mas variáveis
cruzando informação.

Instituto Politécnico de Leiria 20


3.1. Tabelas de frequências

As percentagens podem ser calculadas


Inserir pelo menos uma sobre o total ou sobre o total de cada linha
variável em cada campo (row) ou sobre o total de cada coluna
(column)
Instituto Politécnico de Leiria 21
3.1. Tabelas de frequências

A amostra é composta por 200 indivíduos sendo que para todos foi
recolhida informação sobre ambas as variáveis em causa (zero missings).

Instituto Politécnico de Leiria 22


3.1. Tabelas de frequências

São apresentadas as percentagens por linha. A soma das percentagens em cada


linha é 100%.
Por exemplo, 3% dos trabalhadores do departamento de Aprovisionamento têm o
nível de escolaridade básico.
Instituto Politécnico de Leiria 23
3.1. Tabelas de frequências
Nota sobre variáveis qualitativas ordinais

No caso de variáveis qualitativas ordinais é necessário ordenar as categorias pela sua


ordem lógica (por exemplo, para que as frequências acumuladas tenham sentido).

Tal pode ser concretizado através da aplicação do comando

Transform →ààRecode into Different Variables

Este procedimento é igualmente necessário nas representações gráficas.

Instituto Politécnico de Leiria 24


3.1. Tabelas de frequências
Indicar
nome da
nova
variável
Selecionar reordenada
variável e clicar em
Change

Para definir a nova ordenação clicar em Old and New Values

Instituto Politécnico de Leiria 25


3.1. Tabelas de frequências
Neste caso, estamos a transformar o valor 4 da variável inicial em 1

Para guardar cada uma das alterações clica-seàe à Add .


Instituto Politécnico de Leiria 26
3.2. Representações gráficas
• Graphs →ààChart Builder →à….

Das representações gráficas de frequências disponíveis destacamos:

• Para variáveis com um reduzido número de valores/categorias distintas


– Diagrama de barras (bar)

– Diagrama de linhas (lines), não aplicável a variáveis qualitativas nominais

– Diagrama circular (pie), recomendável sobretudo para variáveis qualitativas nominais dada a
ausência de ordem lógica entre as categorias

• Para variáveis quantitativas com um elevado número de valores distintos


– Histograma (histogram)

– Diagrama de extremos e quartis, comummente designado por caixa de bigodes (boxplot)

Instituto Politécnico de Leiria 27


3.2. Representações gráficas
• Para relacionar 2 variáveis qualitativas e/ou variáveis quantitativas com um
reduzido número de modalidades
– Diagrama de barras/diagrama circular em painel de linhas/colunas ( avariável que determina as
linhas/colunas do painel deve ser a que contém menor número de modalidades)

• Para relacionar 1 variáveis qualitativa ou variável quantitativa com um reduzido


número de modalidades e uma variável quantitativa
– Histograma em painel

– Diagrama de extremos e quartis em painel

• Para relacionar duas variáveis quantitativas


– Diagrama de dispersão (scatter)

Vejamos exemplos de cada uma das representações anteriores

Instituto Politécnico de Leiria 28


3.2. Representações gráficas

Arrastar
Clicar neste variável de
separador no caso interesse
de se pretender a para este
representação de campo
vários gráficos em
painel

Seleção do
tipo de
gráfico

Instituto Politécnico de Leiria 29


3.2. Representações gráficas
Diagrama de barras

Instituto Politécnico de Leiria 30


3.2. Representações gráficas
Diagrama de linhas

O número de trabalhadores tende a diminuir com o nível de


escolaridade embora o número de licenciados supere o número de
trabalhadoras com habilitações ao nível do Secundário.
Instituto Politécnico de Leiria 31
3.2. Representações gráficas
Diagrama circular

Perde-se a noção de evolução das frequências relativamente ao nível


de escolaridade mas permite comparar mais facilmente as frequências
entre si.
Por exemplo, quase metade dos trabalhadores têm o ensino básico
como habilitação.
Instituto Politécnico de Leiria 32
3.2. Representações gráficas
Histograma

Grande concentração das observações entre 400 e 800


aproximadamente.
Os rendimentos mais elevados ultrapassam 2000 mas são poucos os
indivíduos a usufruir dos rendimentos mais elevados.

Instituto Politécnico de Leiria 33


3.2. Representações gráficas
Diagramas de barras em painel de colunas

Instituto Politécnico de Leiria 34


3.2. Representações gráficas
Histograma (por grupos)

Está representação gráfica permite evidenciar que as remunerações


mais altas são exclusivas do sexo masculino o que pode indiciar um
tratamento diferenciado consoante o género.

Instituto Politécnico de Leiria 35


3.2. Representações gráficas
Diagrama de extremos e
quartis Máximo (excluindo
Outliers
outliers)
mode-
De baixo para cima: 1.º quartil, rados
2.º quartil ou mediana e terceiro
quartil
Mínimo (excluindo
outliers)
Outlier
severo

O 1.º quartil ou percentil 25 ou � 5 , aproximadamente igual a


2800 para o sexo feminino e 3200 para o sexo masculino, identifica o
valor abaixo do qual estão pelo menos 25% dos indivíduos e acima do
qual estão pelo menos 75% dos indivíduos.

Instituto Politécnico de Leiria 36


3.2. Representações gráficas
O 2.º quartil, mediana ou percentil 50 , �� ou �5 identifica o valor
abaixo do qual estão pelo menos 50% dos indivíduos e acima do qual
estão pelo menos 50% dos indivíduos.
O 3.º quartil ou percentil 75 ou �75 identifica o valor abaixo do qual
estão pelo menos 75% dos indivíduos e acima do qual estão pelo menos
25% dos indivíduos.
Os outliers são observações distantes das restantes (se distam de ou
mais de .5 − e menos de − são outliers moderados. Se a
distância for superior a 3 − são designadas por outliers severos.

Neste caso, temos pesos a i a do o al apenas no sexo masculino.


Apenas no sexo masculino surgem indivíduos com pesos uito abaixo do
o al (outliers severos) embora acima do mínimo do sexo feminino.

Instituto Politécnico de Leiria 37


3.2. Representações gráficas
Exemplo (quartis):

Identifique os quartis e se existem outliers nos seguintes conjuntos de dadps:

A: -13 2 3 5 9 10 11 12
13 13 13

B: 9 8 8 7 7

Instituto Politécnico de Leiria 38


3.2. Representações gráficas
Diagrama de dispersão

Há uma correlação forte (padrão linear evidente) e positiva (variação no mesmo


sentido, isto é, quando uma variável aumenta a outra tende a aumentar) entre
as variáveis (a estudar mais detalhadamente adiante).
Instituto Politécnico de Leiria 39
3.3. Medidas estatísticas
Além do comando para a criação das tabelas de frequências o SPSS disponibiliza um
comando que permite aceder às principais medidas sem ser necessário selecioná-las
uma a uma .

• Analyze →ààDescriptive Statistics →àFrequencies →àExplore

Instituto Politécnico de Leiria 40


3.3. Medidas estatísticas

Permite
identificar
outliers e
Variável ou percentis
variáveis a
analisar Permite
selecionar
Comparação por histogramas e
grupos, se gráficos de
aplicável probabilidades
(P-P plots), a
estudar
posteriormente

Instituto Politécnico de Leiria 41


3.3.1. Medidas de localização
Iremos analisar 3 grupos de medidas estatísticas:
• Medidas de localização
• Medidas de dispersão
• Medidas de assimetria
As medidas de localização mais utilizadas são:
• Média aritmética (mean) – �
• Mediana (median) ou 2.º quartil – �
• Moda (mode) – � , valor(es) mais frequente(s) na amostra. É a única medida de
localização aplicável a variáveis qualitativas.
• O software também fornece a média aparada a 5% (5% trimmed mean) que exclui do
cálculo da média os 5% de valores mais baixos e os 5% mais altos.

Instituto Politécnico de Leiria 42


3.3.1. Medidas de localização
• Mínimo (minimum) e máximo (maximum)

• Quartis (quartiles) – , e

• Percentis (percentiles) – �� , para qualquer valor � entre 0 e 100 o


percentil �� corresponde ao valor em que pelo menos �% dos indivíduos
são menores ou iguais a �� e pelo menos − � % dos indivíduos são
maiores ou iguais a �� . O percentil 0 e 100 correspondem,
respetivamente, ao mínimo e máximo.

Instituto Politécnico de Leiria 43


3.3.1. Medidas de localização

A análise será feita separadamente para cada um dos géneros


sendo que temos 216 indivíduos do sexo masculino e 198 do
sexo feminino.

Instituto Politécnico de Leiria 44


3.3.1. Medidas de localização

Instituto Politécnico de Leiria 45


3.3.1. Medidas de localização
Os pesos no sexo masculino variam entre
…..
Os pesos no sexo feminino variam entre
….

A média dos pesos do sexo masculino é


...
relativamente ao sexo feminino.

A mediana dos pesos do sexo masculino é


...
relativamente ao sexo feminino.

Instituto Politécnico de Leiria 46


3.3.1. Medidas de localização

Instituto Politécnico de Leiria 47


3.3.1. Medidas de localização
Metadeàdosài divíduosàdeàsexoà as uli oàpesa àatéà…à
e metade dos indivíduos de sexo feminino pesa àatéà…

Os 5% dos indivíduos menos pesados do sexo masculino têm peso menor


ouàigualàaà…

Os 10% dos indivíduos mais pesados do sexo feminino pesam, pelo menos,
...

Os ¾ dos indivíduos menos pesados do sexo masculino pesam, no máximo,


...

Instituto Politécnico de Leiria 48


3.3.1. Medidas de localização

Instituto Politécnico de Leiria 49


3.3.1. Medidas de localização
Os 2 recém- as idosà aisàpesadosàdoàsexoà as uli oàfo a àosài divíduosà…àeà…à o à
pesosà…àeà…à espetiva e te.

A recém- as idaà e osàpesadaàéàaà…à ujoàpesoà à as e çaàfoiàigualàaà…

Instituto Politécnico de Leiria 50


3.3.2. Medidas de dispersão
As medidas de dispersão mais utilizadas são:
• Amplitude (range) – diferença entre o mínimo e o máximo
• Amplitude interquartis (interquartile range) – diferença entre o 3.º quartil e o 1.º quartil
• Variância (variance) e desvio padrão (standard deviation) – e , o desvio padrão é a
raiz quadrada (positiva) da variância. São um indicador do grau de afastamento dos
dados relativamente à sua média aritmética. Quanto maior é o seu valor maior é a
dispersão dos dados.

• Coeficiente de variação – �� = , é o quociente entre o desvio padrão e a média.

Interpreta-se de forma semelhante às 2 medidas anteriores mas permite comparar
amostras, quanto à dispersão, ainda que utilizem escalas distintas (por exemplo,
toneladas e quilos). Esta medida não é calculada diretamente pelo SPSS.

Instituto Politécnico de Leiria 51


3.3.2. Medidas de dispersão

Instituto Politécnico de Leiria 52


3.3.2. Medidas de dispersão
Oàpesosàdoàsexoà…àap ese ta à aio àa plitude.

Relativamente à parte central dos dados verifica-se que a amplitude entre o 1.º e 3.º
ua tisàéàsupe io à oàsexoà…

Oà oefi ie teàdeàva iaçãoà elativa e teàaà adaàu àdosàsexosàéà…..àeà…..àoà ueài di aà


u aà aio àdispe sãoàdosàpesosàdoàsexoà….

Instituto Politécnico de Leiria 53


3.3.3. Medidas de assimetria
O coeficiente de assimetria, � , toma valores em ℝ e consoante o seu sinal (admitindo que
existe uma única moda) conclui-se:
• � = , dados simétricos
• � > , dados com assimetria positiva, isto é, mais concentrados nos valores mais
baixos da variável
• � < , dados assimetria negativa, isto é, mais concentrados nos valores mais elevados
da variável
Quanto maior o valor, em módulo, maior é a assimetria.

Noàexe ploàa te io ,àa osàosàsexosàap ese ta àu aàassi et iaà……àoà ueàsig ifi aà ueàosà
dadosàseà o e t a à osàpesosà aisà…..

Vejamos o efeito que cada tipo de assimetria provoca nas representações gráficas

Instituto Politécnico de Leiria 54


3.3.3. Medidas de assimetria

Oàg fi oà aisàp óxi oàdaàsi et iaàéàoàg fi oàdoàsexoà……………….àoà ueàest à


de acordo com o facto de, em módulo, ter um coeficiente de assimetria
…………………

Instituto Politécnico de Leiria 55


3.3.3. Medidas de assimetria

Claramente, neste gráfico, a grande maioria dos indivíduos usufrui


rendimentos que correspondem aos valores mais baixos pelo que os dados
ap ese ta àu aàassi et iaà…….

Instituto Politécnico de Leiria 56


3.3.4. Medidas de associação
As medidas de associação são utilizadas para avaliar o grau de associação entre variáveis, isto é, em que medida é que o
conhecimento de uma delas relativamente a um indivíduo nos dá informação sobre a outra variável.

No caso de variáveis qualitativas nominais é comum utilizar medidas que dependem de uma estatística conhecida por estatística
�� −�� 2
do Qui-quadrado que é dada por χ = . Este valor varia de 0 a +∞ pelo que não é a mais adequada. Assim, são
��

utilizadas as seguintes medidas:

�2 �−
• Coeficiente de contingência � = �2 +�
, note que <C< �

�2
• V de Cramer � = , varia entre 0 e 1.
�∗ �−

�2
• Phi � = é adequado para tabelas × onde varia entre 0 e 1. Em tabelas maiores � pode exceder 1.

onde � é a dimensão da amostra e = min , � onde é o número de linhas da tabela e � é o número de colunas.

Valores até 0.10 indicam uma associação nula ou fraca, de 0.10 a 0.30 indicam uma associação moderada e de 0.30 a 1 uma
associação forte.
Instituto Politécnico de Leiria 57
3.3.4. Medidas de associação
No caso de variáveis qualitativas ordinais é comum utilizar os coeficientes de associação:
• Coeficiente tau-b e tau-c de Kendall (toma valores entre -1 e 1)
• Gama (toma valores entre -1 e 1)
• Coeficiente de correlação de Spearman (toma valores entre -1 e 1 e é aplicável também a variáveis quantitativas)

Em módulo, os coeficientes de associação variam entre 0 e um valor que pode ser no máximo 1. Quanto maior o valor
em módulo, maior é o grau de associação entre as variáveis.
Em geral, o valor zero para o coeficiente de associação é muito improvável pelo que o SPSS fornece o p-value do teste
ás hipóteses

� : não há associação entre as variáveis


� : há associação entre as variáveis

para que seja possível perceber se o valor é significativamente distinto de zero. Tal acontece quando o p-value
Sig. / Aprox. Sig. à oà“P““ àéà aixoà diga osài fe io àaà0.05 .à“eàoàp-value é superior a 0.05 a associação não é
significativa.

Instituto Politécnico de Leiria 58


3.3.4. Medidas de associação
No caso de variáveis quantitativas é comum utilizar os coeficientes de:

• Correlação de Pearson (toma valores entre -1 e 1)

• Correlação de Spearman (toma valores entre -1 e 1)

O primeiro é mais indicado para populações Normais.

Como anteriormente, em módulo, os coeficientes de associação variam entre 0 e um valor que pode ser no máximo 1.
Quanto maior o valor em módulo, maior é o grau de associação entre as variáveis.

Valores, em módulo, até 0.10 indicam uma associação nula ou muito fraca, 0.30 indica uma associação fraca, 0.50 uma
associação moderada e 0,70 uma associação forte. O valor 1 corresponde a uma associação perfeita.

Em geral, o valor zero para o coeficiente de associação é muitíssimo improvável pelo que o SPSS fornece o p-value do
teste às hipóteses

� : não há associação entre as variáveis versus � : há associação entre as variáveis

para que seja possível perceber se o valor é significativamente distinto de zero. Tal acontece quando o p-value
Sig. / Aprox. Sig. à oà“P““ àéà aixoà diga osài fe io àaà0.05 .à“eàoàp-value é superior a 0.05 a associação não é
significativa. Instituto Politécnico de Leiria 59
3.3.4. Medidas de associação
• Analyze →àDescriptive Statistics →à Crosstabs (indicado quando pelo menos uma das
variáveis é qualitativa. Se existe uma a variável quantitativa esta deve ser agrupada em
classes. A variável que representa as classes é uma variável qualitativa ordinal)

Clicar aqui
Colocar pelo
para
menos uma
selecionar a
variável em cada
medida de
espaço
associação
pretendida

Instituto Politécnico de Leiria 60


3.3.4. Medidas de associação
Botão Statistics (as medidas de associação encontram-se agrupadas consoante o tipo de
variáveis envolvidas)
Coeficientes de
correlação
Medidas de
associação Medidas de
(var. nominais) associação (var.
ordinais)

Instituto Politécnico de Leiria 61


3.3.4. Medidas de associação
Botão Cells (permite associar a cada valor da tabela o valor esperado caso não existisse
associação entre as variáveis, isto é, os valores esperados no caso das variáveis serem
independentes,àistoàé,à…
Opção selecionada
por predefinição Diferença
esta da dizada à
Valor esperado entre os valores
para cada observed àeà
entrada da expected .à
tabela no caso Permite ver para
de variáveis que par de
independentes, categorias a
isto é, o total da diferença é maior.
linha * total da
coluna / n
Instituto Politécnico de Leiria 62
3.3.4. Medidas de associação

Instituto Politécnico de Leiria 63


3.3.4. Medidas de associação

O coeficiente V de Cramer e o coeficiente de contingência C permitem perceber


que existe associação entre as variáveis e que esta é significativa, isto é, não é
fruto do acaso.
Aliás, atendendo à tabela de contingência, observa-se que na Direção temos
apenas indivíduos do sexo masculino o que indicia associação entre as variáveis.

Instituto Politécnico de Leiria 64


3.3.4. Medidas de associação

Observa-se uma grande associação entre as variáveis que se reflete, por


exemplo, no facto de apenas os trabalhadores, no mínimo, licenciados
usufruírem de rendimentos mais elevados.

Instituto Politécnico de Leiria 65


3.3.4. Medidas de associação
• Analyze →àCo elateà→à Bivariate (variáveis quantitativas)

Colocar variáveis

Selecionar coeficientes
(coeficiente de
correlação de Pearson,
tau-b de Kendall e
coeficiente de
associação e
Spearman). Todos
tomam valores entre -1
e 1.
Instituto Politécnico de Leiria 66
3.3.4. Medidas de associação

O coeficiente de correlação de Pearson ultrapassa 0.75 o que indicia uma


forte associação (como expectável tendo em conta as variáveis envolvidas).

O valor é positivo o que indica que as variáveis TENDEM (o coeficiente não é


1) a variam no mesmo sentido, isto é, o aumento do comprimento do fémur
tende a traduzir-se num aumento do comprimento fetal

Instituto Politécnico de Leiria 67


3.3.4. Medidas de associação

O coeficiente tau-b de Kendall (0.443) e o coeficiente de associação de


Spearman (0.582) são positivos e significativos pelo que as conclusões são
semelhantes às anteriores.

Instituto Politécnico de Leiria 68


Bibliografia
• Maroco, J. (2014). Análise Estatística com o SPSS Statistics, ReportNumber.

• Reis, E. (2008). Estatística Descritiva, 7.ª ed., Edições Sílabo.

Instituto Politécnico de Leiria 69

Você também pode gostar