Escolar Documentos
Profissional Documentos
Cultura Documentos
Mestrado em Gestão
2
1. Terminologia básica
Antes de iniciarmos o estudo das metodologias de Estatística descritiva,
importa referir alguma da terminologia comummente utilizada em qualquer
estudo estatístico:
• População – conjunto de indivíduos que se pretende estudar
• Amostra – subconjunto da população a partir do qual é recolhida
informação sobre as características de interesse
• Unidade estatística – cada um dos elementos da população
• Variáveis – características de interesse que se pretendem estudar. Uma
variável é quantitativa (ex.: peso, altura, quantidade de calorias
o su idasàdia ia e te,… à ua doàseàexp essaà u e i a e te.àCasoà
contrário é qualitativa. Uma variável qualitativa que apresente uma ordem
lógica entre as categorias é designada por variável qualitativa ordinal
ívelàdeàsatisfação,à o àat i uídaà aàt iage àdeàMa heste ,… .àCasoà
contrário, é uma variável qualitativa nominal (género, marca do
medicamento anti-hista í i o,… .
Permite
abrir vários
tipos de
ficheiros
incluindo
Excel
I
n
d
i
v
í
d
u
o
s
Neste caso, por exemplo, o peso é inferior a 3583 em 71% dos indivíduos.
Também se verifica ausência de informação para 3 (0.7%) dos indivíduos o que
explica as ligeiras diferenças observadas nas últimas 2 colunas.
Este comando permite construir tabelas de frequências para duas ou mas variáveis
cruzando informação.
A amostra é composta por 200 indivíduos sendo que para todos foi
recolhida informação sobre ambas as variáveis em causa (zero missings).
– Diagrama circular (pie), recomendável sobretudo para variáveis qualitativas nominais dada a
ausência de ordem lógica entre as categorias
Arrastar
Clicar neste variável de
separador no caso interesse
de se pretender a para este
representação de campo
vários gráficos em
painel
Seleção do
tipo de
gráfico
A: -13 2 3 5 9 10 11 12
13 13 13
B: 9 8 8 7 7
Permite
identificar
outliers e
Variável ou percentis
variáveis a
analisar Permite
selecionar
Comparação por histogramas e
grupos, se gráficos de
aplicável probabilidades
(P-P plots), a
estudar
posteriormente
• Quartis (quartiles) – , e
Os 10% dos indivíduos mais pesados do sexo feminino pesam, pelo menos,
...
Relativamente à parte central dos dados verifica-se que a amplitude entre o 1.º e 3.º
ua tisàéàsupe io à oàsexoà…
Noàexe ploàa te io ,àa osàosàsexosàap ese ta àu aàassi et iaà……àoà ueàsig ifi aà ueàosà
dadosàseà o e t a à osàpesosà aisà…..
Vejamos o efeito que cada tipo de assimetria provoca nas representações gráficas
No caso de variáveis qualitativas nominais é comum utilizar medidas que dependem de uma estatística conhecida por estatística
�� −�� 2
do Qui-quadrado que é dada por χ = . Este valor varia de 0 a +∞ pelo que não é a mais adequada. Assim, são
��
�2 �−
• Coeficiente de contingência � = �2 +�
, note que <C< �
�2
• V de Cramer � = , varia entre 0 e 1.
�∗ �−
�2
• Phi � = é adequado para tabelas × onde varia entre 0 e 1. Em tabelas maiores � pode exceder 1.
�
onde � é a dimensão da amostra e = min , � onde é o número de linhas da tabela e � é o número de colunas.
Valores até 0.10 indicam uma associação nula ou fraca, de 0.10 a 0.30 indicam uma associação moderada e de 0.30 a 1 uma
associação forte.
Instituto Politécnico de Leiria 57
3.3.4. Medidas de associação
No caso de variáveis qualitativas ordinais é comum utilizar os coeficientes de associação:
• Coeficiente tau-b e tau-c de Kendall (toma valores entre -1 e 1)
• Gama (toma valores entre -1 e 1)
• Coeficiente de correlação de Spearman (toma valores entre -1 e 1 e é aplicável também a variáveis quantitativas)
Em módulo, os coeficientes de associação variam entre 0 e um valor que pode ser no máximo 1. Quanto maior o valor
em módulo, maior é o grau de associação entre as variáveis.
Em geral, o valor zero para o coeficiente de associação é muito improvável pelo que o SPSS fornece o p-value do teste
ás hipóteses
para que seja possível perceber se o valor é significativamente distinto de zero. Tal acontece quando o p-value
Sig. / Aprox. Sig. à oà“P““ àéà aixoà diga osài fe io àaà0.05 .à“eàoàp-value é superior a 0.05 a associação não é
significativa.
Como anteriormente, em módulo, os coeficientes de associação variam entre 0 e um valor que pode ser no máximo 1.
Quanto maior o valor em módulo, maior é o grau de associação entre as variáveis.
Valores, em módulo, até 0.10 indicam uma associação nula ou muito fraca, 0.30 indica uma associação fraca, 0.50 uma
associação moderada e 0,70 uma associação forte. O valor 1 corresponde a uma associação perfeita.
Em geral, o valor zero para o coeficiente de associação é muitíssimo improvável pelo que o SPSS fornece o p-value do
teste às hipóteses
para que seja possível perceber se o valor é significativamente distinto de zero. Tal acontece quando o p-value
Sig. / Aprox. Sig. à oà“P““ àéà aixoà diga osài fe io àaà0.05 .à“eàoàp-value é superior a 0.05 a associação não é
significativa. Instituto Politécnico de Leiria 59
3.3.4. Medidas de associação
• Analyze →àDescriptive Statistics →à Crosstabs (indicado quando pelo menos uma das
variáveis é qualitativa. Se existe uma a variável quantitativa esta deve ser agrupada em
classes. A variável que representa as classes é uma variável qualitativa ordinal)
Clicar aqui
Colocar pelo
para
menos uma
selecionar a
variável em cada
medida de
espaço
associação
pretendida
Colocar variáveis
Selecionar coeficientes
(coeficiente de
correlação de Pearson,
tau-b de Kendall e
coeficiente de
associação e
Spearman). Todos
tomam valores entre -1
e 1.
Instituto Politécnico de Leiria 66
3.3.4. Medidas de associação