Você está na página 1de 42

Guia Prtico do

SPSS

Outubro/2010

Utilizao do SPSS
(Statistical Package for the Social Sciences)

Guia Prtico I

Programa Utilizao do SPSS


1. Introduo
2. Origem
3. Abordagem conceptual
4. reas de interesse
5. Ambiente de trabalho
6. Criao de ficheiro de dados
7. Importao de ficheiros
8. Anlise estatstica de dados
9. Anlise de grficos
10. Ajuda - Utilizao do tutorial
Bibliografia

PESTANA, M. H., GAGEIRO, J. N., Anlise de Dados para Cincias Sociais


a complementaridade do SPSS, Ed. Slabo, 1998

PEREIRA, Alexandre, SPSS Guia prtico de utilizao Anlise de


Dados para Cincias Sociais e Psicologia, Ed. Slabo, Lisboa, 1999

HILL

MAGALHES,

Manuela,

Hill,

ANDREW,

Investigao

por

Questionrio, Ed. Slabo, Lisboa, 2000.

Site: www.spss.com

1. Introduo
O SPSS um package estatstico que integra diversas funcionalidades que
envolvem a recolha, validao e a anlise de dados. A sua utilizao deve ser
sempre supervisionada por uma boa orientao em termos de
conhecimento e domnio das tcnicas estatsticas envolvidas.

1.1 Objectivo:
Dotar os formandos de conhecimentos bsicos
para a utilizao de determinadas tcnicas para a
obteno e anlise de resultados estatsticos.

1.2 Requisitos bsicos:


Estatstica (ou que utilizem como apoio um livro
de estatstica).
Informtica (windows,..).

1.3 Resultados esperados:


Introduzir dados num novo ficheiro; gravar
ficheiros e abrir ficheiro criado anteriormente;
definir e transformar variveis;
Importar dados do Excel e de outras aplicaes;
Analisar dados (estatstica univariada e bivariada,
tabelas e grficos);
Executar alguns procedimentos de estatstica
inferencial.
4

2. Origem
Universidade de Londres nos anos 60. Tornou-se
muito popular no meio acadmico a partir da
dcada de 70;
Alm do SPSS, foram desenvolvidos na dcada de 60
vrios softwares estatsticos. De entre esses, podem ser
citados:
SAS (Statistic Analysis System): foi desenvolvido na
Universidade da Carolina do Norte; semelhante ao
SPSS; contm vrios mdulos; muito popular nos
institutos de pesquisa;
"BMD"
(Biomedical
Computer
Programs):
desenvolvido na Universidade da Califrnia.
EPINFO: foi desenvolvido sob os auspcios da ONU,
para ser utilizado e popularizado na rea mdica;
possui diversos mdulos estatsticos; todavia,
tecnicamente constitui um software limitado,
principalmente quanto aos seus recursos grficos;

SPHINX: originrio da Frana; possui


particularidades como a capacidade de realizar
anlises lexicais, factoriais e de correspondncias
mltiplas; ao contrrio dos softwares tradicionais,
possui uma viso dos dados que vai do particular ao
geral;

Alguns endereos estatsticos:


www.spss.com o site do SPSS com alguns
links interessantes.

www.statsoft.com o site de um pacote


menos conhecido, chamado Statistica.

www.statsoft.com/textbook/stathome.html
trochim.human.cornell.edu/selstat/ssstart.htm
um site para seleccionar procedimentos
estatsticos.
www.ats.ucla.edu/stat/ o site sobre
recursos acadmicos da Univiversidade Califrnia
Los Angeles (UCLA).

3. Abordagem conceptual
Segundo alguns especialistas, o SPSS :
uma poderosa ferramenta informtica que
permite realizar clculos estatsticos complexos,
e visualizar os seus resultados, em poucos
segundos, (Pereira, 1999).
Uma das muitas aplicaes para o tratamento
estatstico de dados disponveis e das mais
divulgadas no mundo inteiro (Fonseca & Silva,
2003).
Um software til para gerir e analisar
estatisticamente uma matriz de dados. Processa
em ambientes DOS e Windows e possui uma
viso que vai do geral para o particular.

Um poderoso software estatstico especialmente


desenvolvido para a utilizao por profissionais
de cincias humanas. Diferentemente de outros
pacotes estatsticos existentes no mercado, o
SPSS apresenta uma interface bastante amigvel
ao usurio, facilitando em muito suas anlises
estatsticas
(Valentim,
Fernando,
2001:
fvalentin@ig.com.br)

4. reas de interesse
O SPSS pode ser utilizado nas mais diversas
reas do conhecimento e aplicaes:

Marketing
Psicologia
Administrao
Educao
Cincias Sociais
Servio Social
Economia
Governamental
Finanas
Sade Pblica
Pesquisa de Mercado
Pesquisa Social
Pesquisa Eleitoral
Pesquisa de Opinio
Pesquisa de Mdia

Investigao cientifica.

5. Ambiente de trabalho
5.1 Janelas

H oito tipos de janelas/windows no SPSS:

Figura 1 Lista de janelas do SPSS.

Data Editor

A janela que apresenta o contedo do ficheiro de

dados. Os dados podem ser criados ou modificados


atravs desta janela. S possvel ter uma destas
abertas num dado momento. a primeira janela
que abre quando inicia o SPSS.
Barra de menus

Barra de ferramentas

Barra
de
estado
Figura 2 Janela de edio de dados

Folha de edio de dados


Modo de visualizao de dados

Modo de visualizao e definio das variveis.

10

Viewer (Output)

Janela onde so apresentados todos os

resultados estatsticos, tabelas, grficos, etc. Abre


automaticamente, sempre que um determinado
procedimento gera resultados. composto por duas subjanelas: esquerda est um organigrama do output:
direita esto os resultados propriamente ditos.

Figura 3 Janela de visualizao de resultados.

Draft Viewer

Os resultados podem ser apresentados em forma de

texto (instead of interactive pivot table) no Draft


Viewer.

Pivot Table Editor permite editar e modificar tabelas (editor da


tabela dinmica). Pode editar-se o texto,
trocar os dados de linhas com colunas,
adicionar
cor,
criar
tabelas
multidimensionais, etc.

11

Chart Editor permite editar e modificar grficos. Podem alterarse as cores, seleccionar tipos e tamanhos de letras, trocar os eixos
vertical com horizontal, fazer rotaes, etc.

Figura 4 - Janela de edio de grficos.

Text Output Editor permite alterar texto que no seja visvel no


Pivot Table Editor. Pode alterar-se com o
tipo, tamanho, cor e estilo das letras.

Syntax Editor

Todos os comandos emitidos a partir dos menus

do SPSS podem ser apresentados numa janela de


sintaxe. Para isso, utiliza-se o comando Paste das
caixas de dilogo.

Script Editor Janela de programao que permite personalizar e


automatizar
programas).

tarefas

do

SPSS

(pequenos

12

5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help
Tabela 1 Menu da Janela de dados

M en u

File
Edit
View
Data

Funcionalidades
Criar, abrir, ler, gravar ou imprimir ficheiros.
Modificar, copiar ou colar textos das janelas de
output ou de sintaxe; pesquisa de dados e
parametrizao de opes diversas.
Activar diversas barras de ferramentas/botes,
fontes, grelhas, barra de status e mostrar os
rtulos (labels) definidos.
Alterar globalmente os dados tais como: transpor
variveis e casos, criar subconjuntos de casos para
anlise, insero de dados.
Obs: Estas alteraes so temporrias e no

afectam o ficheiro, excepto se for efectuada uma


gravao com estas alteraes.

Transform

Produzir alteraes nas variveis seleccionadas e,


calcular novas variveis a partir de valores de
outras j existentes.
Obs: Estas alteraes s sero efectivas se forem

gravadas.

Analyze

Graph
Utilities
Add-ons
Windows
Help

Seleccionar vrios procedimentos estatsticos como


a anlise descritiva, cruzamento de variveis,
anlise da varincia, correlaes, regresses,
clusters, sries, amostras, anlise multivariada,
estatsticas no paramtricas, etc.
Criar grficos de colunas, de sectores,
histogramas, diagramas de disperso, etc.
Obter informao acerca das variveis, controlar
lista de variveis que aparece nas caixas de
dilogos, correr scripts e alterar menus.
Comutar entre as vrias janelas do SPSS ou
minimiz-las.
Ajudar o funcionamento do SPSS.
Ligar Pgina do SPSS na Internet.

13

6. Criao de Ficheiro de dados


6.1 Introduo de dados
Aspectos a considerar:

Muitas das caractersticas da Janela do Data Editor do


SPSS so similares s de qualquer folha de calculo em
ambiente Windows, tal como o Excel.
As colunas correspondem s variveis (ou campos). E as
linhas aos casos (ou registos).
As clulas podem apenas conter valor (numricos e no
numricos); no possvel, tal como se faz nas folhas de
clculos, definir frmulas nas clulas.
Definio das variveis (Data Define Variable):

O primeiro caracter deve ser uma letra; os restantes


podem ser numricos ou no numricos; ou mesmo
incluir certos smbolos (@, #, _, ou $). No deve incluir
espaos em branco ou conter os smbolos: &, !,? ou *.
As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT,
AND, NOT, GE, WITH no podem constituir nomes para
as variveis. Esto reservadas para a Syntax.
Deve indicar o tipo da varivel: numrico, textos/no
numricos (string), data (date), etc; descrever a varivel e
dos seus valores (rtulos/labels); e codificar os valores em
falta/sem informao (missing values).
Obs: recomendvel definir uma varivel qualitativa como numrica e
depois atribuir os rtulos ou labels. Por exemplo, a varivel sexo: digitar 1 para
sexo feminino e 2 para sexo masculino e nos labels colocar a equivalncia.

14

Exemplo 1 - Considere um exemplo prtico.


Nmero de linha

Nome da varivel

Editor de Clula

Clula activa

Figura 5 Introduo de dados

1. Guarde o ficheiro: File Save nomeficheiro (osvaldo.sav)


2. Produza: Tabela de frequncias para a varivel ano.
Analyze Descriptive Statistics Frequencies varivel
3. Repita a alnea 2) para as outras variveis.
4. Feche todas as janelas do SPSS. Abra de novo o SPSS.
5. Abra o ficheiro de dados introduzido anteriormente:
File Open nomeficheiro
6. Utilize no menu Edit as opes (copiar, apagar, paste, find, ...)
7. Introduza/Insira 5 novos casos: Data Insert Case
8. Insira 2 novas variveis: Data Insert variable
15

Depois de efectuar o exemplo anterior, faa o seguinte:


9. Seleccione as variveis sexo, idade, ano e turma e
construa as frequncias e os respectivos grficos de
barras.

Figura 6 Seleco de variveis

10. Cruze as variveis ano e sexo.


Analyze Descriptive Statistics Crosstabs
ANO * SEXO Crosstabulation
Count
SEXO
f
7
ANO

8
9

2
2

10
Total

Total

4
2
3
1
10

1
1
6

Obs: Este resultado foi obtido para 10 casos/indivduos.


16

11. Repita o procedimento utilizado em 10), separando


os resultados por turma.
Split
File:
permite
dividir
qualitativa/categrica por grupos.

uma

varivel

Data Split File Organize output by groups

Figura 7 Diviso de ficheiro

A seguir, cruze as variveis ano e sexo.


Para anular o Split File, deve fazer:
Data Split File Analyze all cases, do not create groups

12. Seleccione apenas os alunos do sexo feminino.


Select Cases: Selecciona determinados casos.
Data Select Cases if condition, is satisfied

17

Figura 8

18

6.2 Transformao de varivel (TRANSFORM)


Transform

Funo

Compute

Calcula uma nova


varivel a partir de
outras j existentes,
podendo usar todas
as funes
matemticas e
estatsticas

Como accionar e os subcomandos

Colocar o nome da nova varivel


em target variable. Em numerical
expression colocar as variveis
existentes e as operaes entre
elas. Por exemplo:
soma=a1+a2+a3+a4.
Ainda, pode seleccionar casos
utilizando a condio if .
Random Number Serve para gerar um nmero aleatrio
Seed
Recode
Recodifica variveis Into the same variable: altera
os valores da varivel e guarda
as alteraes na mesma
varivel. Seleccionar a varivel
e entrar em Old and new
values, e a cada valor antigo
colocar o valor novo e
adicionar clicando add, no fim
dar continue.
Into the diferent variable: cria
uma nova varivel em funo
de uma j existente, seguir o
mesmo esquema do item
anterior.
Rank cases
Atribui postos na varivel segundo uma outra.
Automatic recode Cria uma nova varivel com o mesmo contedo da
varivel desejada
Run Pending Roda as transformaes pendentes
transforms
Create Time Cria sries temporais.
Series

19

7. Importao de ficheiros
O SPSS dispe de procedimentos de importao de ficheiros criados
noutras aplicaes designadamente folhas de clculo (Lotus 123, Excel),
bases de dados (dBase, Access), ficheiros ASCII (separados por
tabulaes, vrgula, espaos), etc.
IMPORTAO DE FICHEIROS DE EXCEL
File Open

Figura 9 Tipos de ficheiros

Nesta janela deve:


Procurar a pasta onde se encontra o ficheiro;
Especificar Excel e seleccionar a opo (*.xls).

Aparece de seguida uma caixa de dilogo, onde se especifica se as


primeiras clulas contm os nomes das variveis (se sim activar Read
variable names) e o intervalo (rectangular) de clulas (no exemplo,
A1:B11).
Por ltimo, o SPSS cria um ficheiro com tantas variveis quantas as
colunas e tantos casos quantas as linhas do bloco especificado. No se
esquea de guard-lo na sua pasta (extenso .sav).
20

8. Anlise de estatstica de dados (STATISTICS)


O SPSS apresenta um conjunto de funes e
procedimentos avanados para a anlise estatstica de
dados, os quais se encontram sob o comando Analyze
(Anlise de dados).
8.1 Tabelas de Frequncia
Antes de dar incio apresentao das diferentes funes
estatsticas, aconselha-se a interpretao das tabelas de
frequncia (frequency).
Considere o seguinte exemplo:
Ano de Escolaridade

7
8
Valid

9
10
Total

Frequency

Percent

Valid
Percent

Cumulative
Percent

18
14
11
7
50

36,0
28,0
22,0
14,0
100,0

36,0
28,0
22,0
14,0
100,0

36,0
64,0
86,0
100,0

Interpretao:

Dezoito (18) alunos frequentam o 7 ano de escolaridade. Ou


seja, 36% dos alunos esto a frequentar o 7 ano. ... 28% o 8
ano de estudo. ...
H 64% de inquiridos estudam o 1 ciclo do ensino
secundrio (7 e 8 anos de escolaridade). Por outro lado,
36% frequentam o 2 ciclo (9 e 10 anos de escolaridade).
...

21

8.2 Anlise de Relatrios (Reports)


O SPSS produz pequenos relatrios, contendo medidas
estatsticas. Por exemplo, para seleccionar uma ou mais
variveis (ou categorias de variveis), utiliza-se o seguinte
procedimento:
Analyze Reports OLAP Cubes...
OLAP: Online Analytical Processing.

Figura 10

Ainda, pode-se seleccionar diferentes medidas estatsticas,


clicando no Statistics.

Figura 11
22

8.3 Medidas Estatsticas (Statistics)


8.3.1 Descritivas (Descriptives statistics)
O SPSS apresenta as medidas:
Localizao
(Tendncia no Central)

Figura 12 Estatsticas Descritiva


Disperso
(ou variabilidade)

Localizao/Posio
(Tendncia Central)

Assimetria e
Achatamento/Curtose

Podem ser obtidas de 2 formas:

Analyze Descriptive Statistics Frequencies Statistics


Ou

Analyze Descriptive Statistics Descriptive Options

23

Medidas de Tendncia Central

Mean (Media) medida de tendncia central mais utilizada,


sendo definida como o resultado da diviso da
soma de todos os valores observados pelo nmero
total de observaes.
Median (Mediana) valor central (meio) de uma
distribuio; divide a distribuio em 2 partes
iguais, tendo assim, 50% dos dados sua direita
como sua esquerda.
Mode (Moda) - valor que ocorre com maior frequncia
numa distribuio. Ela pode no existir e, quando
existe, pode no ser nica.
Medidas de Tendncia no Central (ou de ordem)

Quartiles (Quartis) so 3 pontos (Q1, Q2 e Q3) que dividem


um conjunto de dados em 4 partes iguais: o Q1 (1
Quartil) precedido de 25% dos valores e sucedido
por 75%; o Q2 tem abaixo de si 50% dos valores e
acima de si tambm 50% e, por esta razo, coincide
com a Mediana; o Q3 antecedido de 75% dos valores
e seguido por 25% dos mesmos.
n
Cut points for
equal groups definem outros
separadores: Decis (dividem em 10 partes iguais: D1,
D2,...., D9), Percentis/centis (dividem em 100 partes
iguais: P1, P2 ,....,P99), ....
Percentile(s): permitem especificar o percentil pretendido,
(por exemplo, 67, 15, ....)
Medidas de Disperso (ou variabilidade)

24

Std deviation (Desvio Padro) mais importante medida de


disperso, sendo definida como a raiz quadrada da
varincia.
Variance (Varincia) mdia dos quadrados dos desvios de
cada valor em relao sua mdia. Contudo, a sua
utilizao como medida descritiva ocasiona alguma
dificuldade (sobretudo de interpretao) visto que se
trata, por definio, de uma mdia quadrtica, no
possuindo a mesma unidade de medida dos dados
originais.
Range (amplitude do intervalo de variao) diferena entre
os valores mximo e mnimo do conjunto de dados.
Mnino (Minimum) valor mnimo de uma distribuio.
Mximo (Maximum) Valor mximo de uma distribuio.
S.E. Mean (Estimativa do Erro amostral) quociente entre o
desvio padro e a raiz quadrada da dimenso da
amostra. Indica a variabilidade da mdia aritmtica
entre amostras tiradas da mesma populao. Esta
medida permite a construo dos intervalos de confiana
sobre o valor da mdia da populao.
Intervalo Interquartil (Interquartile Range): Q3 - Q1.
Medidas de Assimetria

A medida de assimetria utilizada pelo SPSS dada pelo


quociente entre o Skewness e o seu Std Error. O resultado
desse quociente deve ser analisado da seguinte forma:
Assimtrica
negativa

< -2

No rejeitar a
simetria

-2

Assimetria
positiva

+2

> +2

Medidas de Achatamento (ou curtose)

A diviso do Kurtosis pelo seu Std Error d o coeficiente de


achatamento (k). Quanto forma de achatamento, uma
25

distribuio pode ser Mesocrtica (k igual a 0), Platicurtica


(k menor que -2) e Leptocrtica (k maior que +2).
Exemplo 4. Considere o seguinte output.
Statistics
IDADE
Valid

50
0
12,78
,25
13,00
14
1,80
3,24
-,554
,337
-1,093
,662
5
10
15
639
10,75
13,00
14,00

Missing

Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
25
Percentiles

50
75

IDADE

10
11
12
Valid

13
14
15
Total

Frequency

Percent

Valid
Percent

12
1
3
12
14
8
50

24,0
2,0
6,0
24,0
28,0
16,0
100,0

24,0
2,0
6,0
24,0
28,0
16,0
100,0

Cumulative
Percent

24,0
26,0
32,0
56,0
84,0
100,0

26

Interpretao:

A idade mdia dos inquiridos de 12,78 anos (Mean).


A mediana ou precentil 50 indica que metade dos alunos tem at 13
anos. Na tabela de frequncia, a mediana a idade que acumula at si
metade (50%) das observaes, isto , a idade que corresponde ao
Cumulative Percent imediatamente superior a 50 (13 Cumulative
Percent=56,0), (Median).
O quociente entre o desvio padro (1,80) e a raiz quadrada da
dimenso da amostra (n=50) 0,25. Significa que a variao entre a
mdia calculada (12,78) e a mdia de outras amostra aleatrias de
igual dimenso de 0,25 anos (Std Error Mean).
A maioria dos alunos tem 14 anos (Mode).
A varincia de 3,24. O desvio padro igual a 1,80 denota uma baixa
disperso (coef.variao, 1,80/12,78=14%). Quanto menos dispersos
estiverem os valores da varivel idade relativamente mdia, menor
ser o desvio padro, e vice versa (Variance e Std Deviation).
O coeficiente de skewness de 0.554 e o seu Std Error (estimativa do
erro) de 0.337. O quociente entre estes dois valores igual a 1.64.
Como o resultado negativo e menor que 2, pode-se concluir que a
distribuio assimtrica negativa. Na prtica, faz-se a diferena da
mdia e da moda e divide-se pelo desvio padro. Neste caso, esta
diferena negativa, - 0.68, e a concluso a mesma.
Kurtosis/Std Error Kurtosis=-1,65. Como menor que 2, diz-se que
a distribuio Platicrtica (mais achatada do que a normal).
As idades variam entre os 10 (Mnimo) e os 15 (Mximo), sendo a
amplitude do intervalo de variao de 5 anos (Range).
A soma de todas idades de 639 (Sum).
Percentil 75: Significa que 75% dos inquiridos tm at 14 anos.

27

Distribuio normal

O SPSS apresenta o histograma com a distribuio normal


sobreposta.
Recorda-se que a distribuio normal :
Terica, contnua, simtrica e mesocrtica;
Tem a forma de um sino e definida com base em dois
parmetros: mdia e desvio padro.
O ponto mximo da distribuio a mdia.
Analyze Descriptive Statistics Frequencies Chart

Figura 13 Histograma com normal sobreposta

Veja o Output:
IDADE
16
14
12
10
8

Frequency

6
4
Std. Dev = 1,80
2

Mean = 12,8
N = 50,00

0
10,0

11,0

12,0

13,0

14,0

15,0

IDADE

Figura 14 Histograma com normal sobreposta

O histograma acima com ajustamento distribuio normal tem o


aspecto onde sobressai o enviesamento da amostra para a direita em
28

relao distribuio terica, bem como um achatamento um


maior que o que seria de esperar.
Opo Explore - calcula as estatsticas, e elabora o grfico

caule-e-folhas e o grfico de extremos-e-quartis, muito til


para analisar a amostra em termos de concentrao ou
disperso dos valores por intervalos quartlicos, bem como a
sua simetria; alm disso, uma boa ferramenta de verificar
se h observaes outliers, isto , observaes extremas
que se afastam muito da mdia dos valores da amostra.
Analyze Descriptive Statistics Explore
Selecciona-se a varivel a analisar (idade), tal como descrito
atrs. De seguida, seleccionar o boto, Statistics.

Figura 15

Faa Continue para voltar ao Explore. Escolha, de seguida a


opo Plots. Seleccione histograma.
Faa Ok e analise o Output.

Figura 16

29

Faa Explore, utilizando o Factor List para a varivel Sexo.


Teste de Normalidade
Testa a hiptese de que os dados da amostra esto
normalmente distribudos.
Analyze Descriptives statistics Explore Plots

Figura 17

A tabela Teste de Normalidade (Tests of Normality) mostra os


resultados do Teste de Kolmogorov Smirnov (K-S). Se a
amostra tiver menos de 50 casos o SPSS tambm calcula o teste
de Shapiro-Wilk.

Tests of Normality
a

Kolmogorov-Smirnov
Statistic
df
Sig.
IDADE

,229

50

,000

Shapiro-Wilk
Statistic
df

,824

50

Sig.

,010**

**. This is an upper bound of the true significance.


a. Lilliefors Significance Correction

Um baixo valor de significncia ( geralmente considerado


baixo se Sig. < 0.05) indica que a distribuio dos dados difere
significativamente de uma distribuio normal.
30

Intervalos de Confiana sobre a mdia (IC )


Mdia: 12,78 com o Std Error = 0,25

Nveis: Confiana de 95% Significncia (risco) de 5%

Figura 18

Resultado: IC95% = ] 12,27 ; 13; 29[


Significado: Existe uma probabilidade de 95% para que o valor
desconhecido da mdia da populao pertena ao intervalo
]12,27 ; 13; 29[. Ou seja, com 95% de confiana, a verdadeira
mdia da populao dever pertencer ao intervalo de 12,27 a
13,29.
Este intervalo de confiana s tem interesse se os valores em
causa so de uma amostra seleccionada aleatoriamente de uma
populao mais vasta.

Nveis: Confiana de 99% Significncia (risco) de 1%

Figura 19

31

Resultado: IC99% = ] 12,10 ; 13; 46[


Concluso: Diminuindo o nvel de significncia (risco)
implica um aumento do intervalo de confiana.

8.3.2 Anlise Inferencial


8.3.2.1 Anlise Bivariada: Cruzamentos e Medidas de
Associao (Crosstabs)
"p" (nvel de) significncia estatstica (Asymp. Sig.). Prob.
Geralmente, em cincias sociais, quando estas probabilidades
(Asymp. Sig.) so inferiores a 5%, ou seja, h menos de 5
possibilidades em 100 de suceder um determinado resultado,
considera-se que so estatisticamente significativas.
Varivel Qualitativa Nominal
Independncia Estatstica utiliza-se normalmente o Teste de
Qui-Quadrado de Pearson, 2.
As hipteses do Teste de Qui-Quadrado so:
H0 (Hip. Nula): As variveis turma e sexo so independentes.
Ha (Hip. Alternativa): As variveis turma e sexo so dependentes
(existe uma relao entre as 2 variveis).
Analyze Descriptive Statistics Crosstabs Statistics

32

Figura 20

Resultado:
Chi-Square Tests
Value

df

Asymp. Sig.
(2-sided)

Pearson Chi-Square

36,883a

,000

Continuity Correction
Likelihood Ratio

40,291

,000

Linear-by-Linear
Association
N of Valid Cases

50

a. 2 cells (33,3%) have expected count less than 5. The


minimum expected count is 3,90.

Concluso:

Como o nvel de significncia do teste de Qui-Quadrado de 0,000,


valor inferior a 0,05 (5% de signficncia fixada), rejeita-se a
hiptese de serem independentes (H0), ou seja, h
evidncia/significncia estatstica para aceitar a hiptese alternativa
de que so dependentes (existe relao entre 2 variveis).
Portanto, pode-se inferir a relao de dependncia observada na
amostra para o universo/populao em estudo.

33

Medidas de Associao baseadas no Teste de Qui-Quadrado


Symmetric Measures
Value
Phi
Nominal by Nominal

Cramer's V
Contingency Coefficient
Kendall's tau-b

Ordinal by Ordinal

Kendall's tau-c
Gamma

Measure of Agreement

Kappa

N of Valid Cases

Asymp.
a
Std. Error

,859
,859
,652
-,117
-,122
-,162
,c
50

,132
,136
,179

Approx. T

Approx. Sig.

-,893
-,893
-,893

,000
,000
,000
,372
,372
,372

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null hypothesis.
c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values
of the first variable match the values of the second variable.
d. Correlation statistics are available for numeric data only.

Significado: Todos esses testes indicam que existe uma


associao forte entre as duas variveis devido aos seus altos
valores. O teste Phi s se aplica para tabelas 2 x 2.
Variveis Quantitativas
Coeficiente de Correlao de Pearson aplica-se s variveis
quantitativas. Varia entre 1 (negativa) e 1 (positiva).
Quanto mais prximo estiver dos valores extremos maior e a
associao linear.
Associao ou Correlao Negativa: variao entre as variveis
for em sentido contrrio (aumento de uma
varivel est associada diminuio de outra).
Associao ou Correlao Positiva : variao entre as variveis
for no mesmo sentido.
Analyze Correlate Bivariate variveis

34

Figura 21

Variveis Ordinais
Coeficiente de Spearman utiliza-se para as variveis ordinais.

8.3.2.2 Regresso (Regression)


Modelo estatstico usado para prever o comportamento de uma
varivel contnua (varivel dependente ou Y) a partir de uma
ou mais variveis (var. independentes ou X).
Modelo de Regresso Linear Simples (MRLS): Quando existe
apenas uma varivel independente.
Modelo de Regresso Linear Mltipla (MRLS): Quando existe
mais do que uma varivel independente.
Modelo de Regresso Linear Simples (MRLS): permite encontrar a
recta que melhor representa a relao entre 2 variveis (X e Y).

35

Y = aX + b,
em que, Y: var. dependente/explicada
X: var. independente/explicativa
a: declive ou inclinao
b: ordenada na origem (CONSTANT)

Para proceder ao clculo da equao da recta de regresso


linear, deve executar o seguinte procedimento:
Analyze Regression Linear

Figura 22

Resultado da regresso linear


Coefficientsa

Unstandardized
Coefficients
B
Std. Error

Model
1

(Constant)
ALTURAP

,238
,858

,276
,154

Standardi
zed
Coefficient
s
Beta

Sig.

,892

,864
5,574

,413
,001

a. Dependent Variable: ALTURAF

Declive

Ordenada na origem
Figura 23

0.01<0.05 ....
H0 rejeitada para o nvel
de significncia de 5%
36

Equao da recta ALTURAF = 0.858ALTURAP + 0,238


Interpretao:
a = 0,858 - Por cada aumento de uma unidade na
altura dos Pas (X) implica um aumento de 0.858 na
altura dos Filhos (Y). O valor positivo indica de que a
recta cresce da esquerda para a direita. Se o declive
fosse negativo, a recta decresceria da esquerda para a
direita.
b = 0,238 Para ALTURAP=0 ALTURAF=0,238.
Mtodo utilizado: Mnimos Quadrados (MMQ).
Exerccio:
Se um Pai tiver 1,95 m de altura, a altura do Filho
ser 1,91, aproximadamente.
Coeficiente de determinao (R2 e R2 Ajustado) indica a
qualidade do ajustamento da recta estimada aos dados.
Model Summaryb

Model
1

R Square

Adjusted
R Square

,892a

,795

,770

Std. Error
of the
Estimate

4,638E-02

a. Predictors: (Constant), ALTURAP


b. Dependent Variable: ALTURAF

Coeficiente de correlao
Coeficiente de determinao
Cerca de 80% (79,5%) da variao da varivel dependente
(ALTURAF) em torno da sua mdia explicada pela
regresso, ou seja, o modelo explica 80%. Portanto, considerase um bom ajustamento.
37

Teste T testa a hiptese dos parmetros, individualmente,


serem nulos.
Como o Sig.do Teste T de 0,01, valor inferior a 0.05 (5%), pode-se
concluir que a varivel ALTURAP diferente de zero, isto , esta
varivel estatisticamente significativa. Entretanto, a concluso no
a mesma para a CONSTANT.

Teste F valida, em termos globais o modelo, e no cada um


dos parmetros isoladamente.
ANOVAb
Sum of
Squares

Model
1

Regression 6,683E-02
Residual
1,721E-02
Total

8,404E-02

df

1
8
9

Mean
Square

6,683E-02
2,151E-03

Sig.

31,072

,001a

a. Predictors: (Constant), ALTURAP


b. Dependent Variable: ALTURAF

Como o Sig.do Teste F de 0,01, valor inferior a 5%, pode-se


concluir que o modelo adequado para descreve esta relao, ou
seja, o modelo estatisticamente significativo.

Diagrama de Disperso (ou de pontos)


I.

Graphs Scatter Simple Define

II. Escolha as variveis dependente e independentes


III. Label Cases by colocar o nome da varivel que
identifique os pontos nos grficos. Seleccione Options e
active Display chart with case labels.

38

Figura 24

Resultado: Utilizando o ajustamento da recta.


2,0
Elmano, Pedro

1,9
Antonio, Joao
El ton, Elio
Mapa, Melo

1,8

Leao, Santos
Pedr o, Jorge
Tavares, Silva

ALT URAF

1,7

Li to, Silva
Montei ro, Pina
Borges, Elzo

1,6
1,6

1,7

1,8

1,9

2,0

ALTURAP

Figura 25

39

Tabela 2 - Procedimentos de estatstica: descritiva, inferencial e


multivariada disponveis pelo SPSS.
Analyze
Summarize
Descriptives
statistics

Compare
means

ANOVA
models

Correlate

Sub-comandos

Funo

Calcula a tabela de distribuio de


frequncias.
Calcula as principais estatsticas
Descriptives
descritivas.
Faz uma anlise completa das
Explore
variveis, podendo ainda repetir
essas anlises por outra varivel.
Calcula a tabela de distribuio de
Crosstabs
frequncias cruzadas, calcula o
teste Qui-quadrado e o Coeficiente
de Pearson para associao de
variveis e outros testes.
Lista
casos
escolhendo
as
List cases
variveis desejadas
Report Summaries Organiza relatrios em linhas,
segundo uma varivel
in Rows
Calcula a mdia, o desvio padro,
Means
soma, etc. das variveis desejadas.
Calcula o teste de diferena de
Independent
duas mdias de populaes
sampled T-test
independentes
Paired-sampled T- Calcula o teste de diferena de
duas mdias de populaes
test
emparelhadas.
One-Way ANOVA Testa a diferena de mdias de
mais de duas amostras
Testa a diferena de mdias do
Simple factorial
modelo fatorial
General factorial
Testa a diferena de mdias do
modelo geral
Calcula o teste de anlise de
Multivariate
varincia multivariada
Calcula a matriz de correlao,
Bivariate
tomando as variveis de duas em
duas.
Partial
Calcula o coeficiente de correlao
Distances
Frequencies

40

Regression

Linear
Logistic
Probit
Nonlinear

Loglinear

General
Hierarchical
Logit
K-means cluster
Hierarchical
clusters
Discriminant
Factor

Classify

Data
Reduction
Scale

Non
Parametric
Test

Survival
Multiple
response

parcial.
Calcula a distncia euclidiana entre
os casos.
Ajusta o modelo de regresso
linear
Ajusta o modelo de regresso
logstica
Ajusta o modelo Probit
Ajusta um modelo no linear

Anlise de clusters
Anlise de clusters hierrquicos
Anlise discriminante
Anlise factorial

Reliabity analysis Anlise de confiabilidade


Multidimensional
Scaling
Testes no paramtricos ou de
Chi-square
distribuio livre
Binomial
Runs
1-Sample K-S
2-Independent
Samples
k-Independent
Samples
2-Related Samples
K-Related Samples
Anlise de sobrevivncia
Anlise de respostas mltiplas

Obs: As verses mais recentes do SPSS (11.0) apresentam mais


procedimentos estatsticos.

41

9. Anlise de grficos (GRAPHS)


A representao grfica uma das possibilidades de anlise de dados
sob uma forma ilustrada, produzindo uma viso mais clara e imediata
dos resultados.
SPSS oferece vrios tipos de grficos:
Graphs

Funo

Tipo de variveis

Bar

Grfico de barra

Line
Area
Pie
Boxplot
Scatter

De linha
De rea
Circular
Da caixa
De disperso

Histogram

Histograma

Qualitativas, discretas de poucos


valores
Sries de tempo
Srie de tempo
Qualitativas
Quantitativas
Relao entre duas variveis
quantitativas, podendo colorir
segundo outra varivel
Quantitativa (de preferncia
contnua). Tem a opo de
desenhar a curva normal
superposta ao histograma

42

Você também pode gostar