Você está na página 1de 41

Curso: Utilizao do SPSS

Nvel Bsico
Guia Prtico I
(Statistical Package for Social Sciences)

Osvaldo M. Borges,
Mestre em Gesto de Informao nas Organizaes Fac.Economia/Univ. Coimbra (Esp.Estatstica e Sistemas de Informao) Setembro/04

Programa Utilizao do SPSS


1. Introduo 2. Origem 3. Abordagem conceptual 4. reas de interesse 5. Ambiente de trabalho 6. Criao de ficheiro de dados 7. Importao de ficheiros 8. Anlise estatstica de dados 9. Anlise de grficos 10. Ajuda - Utilizao do tutorial
Bibliografia
PESTANA, M. H., GAGEIRO, J. N., Anlise de Dados para Cincias Sociais a complementaridade do SPSS, Ed. Slabo, 1998 PEREIRA, Alexandre, SPSS Guia prtico de utilizao Anlise de Dados para Cincias Sociais e Psicologia, Ed. Slabo, Lisboa, 1999 HILL MAGALHES, Manuela, Hill, ANDREW, Investigao por Questionrio, Ed. Slabo, Lisboa, 2000. Site: www.spss.com

Prof. Osvaldo Borges

1. Introduo
O SPSS um package estatstico que integra diversas funcionalidades que envolvem a recolha, validao e a anlise de dados. A sua utilizao deve ser sempre supervisionada por uma boa orientao em termos de conhecimento e domnio das tcnicas estatsticas envolvidas.

1.1 Objectivo:
Dotar os formandos de conhecimentos bsicos para a utilizao de determinadas tcnicas para a obteno e anlise de resultados estatsticos.

1.2 Requisitos bsicos:


estatstica (ou que utilizem como apoio um livro de estatstica). informtica (windows,..).

1.3 Resultados esperados:


Introduzir dados num novo ficheiro; gravar ficheiros e abrir ficheiro criado anteriormente; definir e transformar variveis; Importar dados do Excel e de outras aplicaes; Analisar dados (estatstica univariada e bivariada, tabelas e grficos); Executar alguns procedimentos de estatstica inferencial.
Prof. Osvaldo Borges

2. Origem
Universidade de Londres nos anos 60. Tornou-se muito popular no meio acadmico a partir da dcada de 70;

Alm do SPSS, foram desenvolvidos na dcada de 60 vrios softwares estatsticos. Dentre esses, podem ser citados: SAS (Statistic Analysis System): foi desenvolvido na Universidade da Carolina do Norte; semelhante ao SPSS; contm vrios mdulos; muito popular nos institutos de pesquisa; "BMD" (Biomedical Computer Programs): desenvolvido na Universidade da Califrnia. EPINFO: foi desenvolvido sob os auspcios da ONU, para ser utilizado e popularizado na rea mdica; possui diversos mdulos estatsticos; todavia, tecnicamente constitui um software limitado, principalmente quanto aos seus recursos grficos;

Prof. Osvaldo Borges

SPHINX: originrio da Frana; possui particularidades como a capacidade de realizar anlises lexicais, factoriais e de correspondncias mltiplas; ao contrrio dos softwares tradicionais, possui uma viso dos dados que vai do particular ao geral;

Alguns endereos estatsticos:


www.spss.com o site do SPSS com alguns links interessantes.

www.statsoft.com o site de um pacote


menos conhecido, chamado Statistica.

www.statsoft.com/textbook/stathome.html
trochim.human.cornell.edu/selstat/ssstart.htm um site para seleccionar procedimentos estatsticos. www.ats.ucla.edu/stat/ o site sobre recursos acadmicos da Univiversidade Califrnia Los Angeles (UCLA).

Prof. Osvaldo Borges

3. Abordagem conceptual
Segundo alguns especialistas, o SPSS :
uma poderosa ferramenta informtica que permite realizar clculos estatsticos complexos, e visualizar os seus resultados, em poucos segundos, (Pereira, 1999). uma das muitas aplicaes para o tratamento estatstico de dados disponveis e das mais divulgadas no mundo inteiro (Fonseca & Silva, 2003). um software til para gerir e analisar estatisticamente uma matriz de dados. Processa em ambientes DOS e Windows e possui uma viso que vai do geral para o particular.

um poderoso software estatstico especialmente desenvolvido para a utilizao por profissionais de cincias humanas. Diferentemente de outros pacotes estatsticos existentes no mercado, o SPSS apresenta uma interface bastante amigvel ao usurio, facilitando em muito suas anlises estatsticas (Valentin, Fernando, 2001:
fvalentin@ig.com.br)

Prof. Osvaldo Borges

4. reas de interesse
O SPSS pode ser utilizado nas mais diversas reas do conhecimento e aplicaes: Marketing Psicologia Administrao Educao Cincias Sociais Servio Social Economia Governamental Finanas Sade Pblica Pesquisa de Mercado Pesquisa Social Pesquisa Eleitoral Pesquisa de Opinio Pesquisa de Mdia

(Valentin, Fernando, 2001)

Investigao cientifica.

Prof. Osvaldo Borges

5. Ambiente de trabalho
5.1 Janelas

H oito tipos de janelas/windows no SPSS:

Figura 1 Lista de janelas do SPSS.

Prof. Osvaldo Borges

Data Editor

A janela que apresenta o contedo do ficheiro de

dados. Os dados podem ser criados ou modificados atravs desta janela. S possvel ter uma destas aberta num dado momento. a primeira janela que abre quando inicia o SPSS.
Barra de menus Barra de ferramentas

Barra de estado Figura 2 Janela de edio de dados

Folha de edio de dados Modo de visualizao de dados

Modo de visualizao e definio das variveis.

Prof. Osvaldo Borges

Viewer (Output)

Janela onde so apresentados todos os

resultados estatsticos, tabelas, grficos, ... Abre automaticamente, sempre que um determinado procedimento gera resultados. composto por duas subjanelas: esquerda est um organigrama do output: direita esto os resultados propriamente ditos.

Figura 3 Janela de visualizao de resultados.

Draft Viewer os resultados podem ser apresentados em forma de


texto (instead of interactive pivot table) no Draft Viewer.

Pivot Table Editor

permite editar e modificar tabelas (editor

da tabela dinmica). Pode editar-se o texto, trocar os dados de linhas com colunas, adicionar cor, criar tabelas multidimensionais, etc.
Prof. Osvaldo Borges

10

Chart Editor permite editar e modificar grficos. Podem alterarse as cores, seleccionar tipos e tamanhos de letras, trocar os eixos vertical com horizontal, fazer rotaes, etc.

Figura 4 - Janela de edio de grficos.

Text Output Editor permite alterar texto que no seja visvel


no Pivot Table Editor. Pode alterar-se com o tipo, tamanho, cor e estilo das letras.

Syntax Editor

Todos os comandos emitidos a partir dos menus

do SPSS podem ser apresentados numa janela de sintaxe. Para isso, utiliza-se o comando Paste das caixas de dilogo.

Script Editor Janela de programao que permite personalizar e


automatizar programas).
Prof. Osvaldo Borges

tarefas

do

SPSS

(pequenos

11

5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help

Tabela 1 Menu da Janela de dados

Menu

Funcionalidades
Criar, abrir, ler, gravar ou imprimir ficheiros. Modificar, copiar ou colar textos das janelas de output ou de sintaxe; pesquisa de dados e parametrizao de opes diversas. Activar diversas barras de ferramentas/botes, fontes, grelhas, barra de status e mostrar os rtulos (labels) definidos. Alterar globalmente os dados tais como: transpor variveis e casos, criar subconjuntos de casos para anlise, insero de dados. Obs: Estas alteraes so temporrias e no

File Edit View Data Transform

afectam o ficheiro, excepto se for efectuada uma gravao com estas alteraes.

gravadas.

Produzir alteraes nas variveis seleccionadas e, calcular novas variveis a partir de valores de outras j existentes. Obs: Estas alteraes s sero efectivas se forem

Analyze

Graph Utilities Windows Help

Seleccionar vrios procedimentos estatsticos como a anlise descritiva, cruzamento de variveis, anlise da varincia, correlaes, regresses, clusters, sries, amostras, anlise multivariada, estatsticas no paramtricas, etc. Criar grficos de colunas, de sectores, histogramas, diagramas de disperso, etc. Obter informao acerca das variveis, controlar lista de variveis que aparece nas caixas de dilogos, correr scripts e alterar menus. Comutar entre as vrias janelas do SPSS ou minimiz-las. Ajudar o funcionamento do SPSS. Ligar Pgina do SPSS na Internet.

Prof. Osvaldo Borges

12

6. Criao de Ficheiro de dados 6.1 Introduo de dados


Aspectos a considerar:

Muitas das caractersticas da Janela do Data Editor do SPSS so similares s de qualquer folha de calculo em ambiente Windows, tal como o Excel. As colunas correspondem s variveis (ou campos). E as linhas aos casos (ou registos). As clulas podem apenas conter valor (numricos e no numricos); no possvel, tal como se faz nas folhas de clculos, definir frmulas nas clulas.
Definio das variveis (Data Define Variable):

O nome das variveis no devem ter mais de 8 caracteres. O primeiro caracter deve ser uma letra; os restantes podem ser numricos ou no numricos; ou mesmo incluir certos smbolos (@, #, _, ou $). No deve incluir espaos em branco ou conter os smbolos: &, !,? ou *. As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT, AND, NOT, GE, WITH no podem constituir nomes para as variveis. Esto reservadas para a Syntax. Deve indicar o tipo da varivel: numrico, textos/no numricos (string), data (date), etc; descrever a varivel e dos seus valores (rtulos/labels); e codificar os valores em falta/sem informao (missing values). Obs: recomendvel definir uma varivel qualitativa como numrica e
depois atribuir os rtulos ou labels. Por exemplo, a varivel sexo: digitar 1 para
sexo feminino e 2 para sexo masculino e nos labels colocar a equivalncia.
Prof. Osvaldo Borges

13

Exemplo 1 - Considere um exemplo prtico.


Nmero de linha Nome da varivel Editor de Clula Clula activa

Figura 5 Introduo de dados

1. Guarde o ficheiro: File Save nomeficheiro (osvaldo.sav) 2. Produza: Tabela de frequncias para a varivel ano. Analyze Descriptive Statistics Frequencies varivel 3. Repita a alnea 2) para as outras variveis. 4. Feche todas as janelas do SPSS. Abra de novo o SPSS. 5. Abra o ficheiro de dados introduzido anteriormente: File Open nomeficheiro 6. Utilize no menu Edit as opes (copiar, apagar, paste, find, ...) 7. Introduza/Insira 5 novos casos: Data Insert Case 8. Insira 2 novas variveis: Data Insert variable
Prof. Osvaldo Borges

14

Depois de efectuar o exemplo anterior, faa o seguinte: 9. Seleccione as variveis sexo, idade, ano e turma e construa as frequncias e os respectivos grficos de barras.

Figura 6 Seleco de variveis

10. Cruze as variveis ano e sexo.


Analyze Descriptive Statistics Crosstabs
ANO * SEXO Crosstabulation
Count SEXO f 7 ANO 8 9 10 Total m Total

4 2 2 4 1 1 6

4 2 3 1 10

Obs: Este resultado foi obtido para 10 casos/indivduos.


Prof. Osvaldo Borges

15

11. Repita o procedimento utilizado em 10), separando os resultados por turma.


Split File: permite dividir qualitativa/categrica por grupos. uma varivel

Data Split File Organize output by groups

Figura 7 Diviso de ficheiro

A seguir, cruze as variveis ano e sexo. Para anular o Split File, deve fazer: Data Split File Analyze all cases, do not create groups

12. Seleccione apenas os alunos do sexo feminino.


Select Cases: Selecciona determinados casos. Data Select Cases if condition, is satisfied

Prof. Osvaldo Borges

16

Prof. Osvaldo Borges

17

6.2 Transformao de varivel (TRANSFORM)


Transform Compute Funo Calcula uma nova varivel a partir de outras j existentes, podendo usar todas as funes matemticas e estatsticas Como acionar e os subcomandos

Random Number Seed Recode

Colocar o nome da nova varivel em target variable. Em numerical expression colocar as variveis existentes e as operaes entre elas. Por exemplo: soma=a1+a2+a3+a4. Ainda, pode seleccionar casos utilizando a condio if . Serve para gerar um nmero aleatrio Recodifica variveis Into the same variable: altera os valores da varivel e guarda as alteraes na mesma varivel. Seleccionar a varivel e entrar em Old and new values, e a cada valor antigo colocar o valor novo e adicionar clicando add, no fim dar continue. Into the diferent variable: cria uma nova varivel em funo de uma j existente, seguir o mesmo esquema do item anterior. Atribui postos na varivel segundo uma outra. Cria uma nova varivel com o mesmo contedo da varivel desejada Roda as transformaes pendentes Cria sries temporais.

Rank cases Automatic recode Run Pending transforms Create Time Series

Prof. Osvaldo Borges

18

7. Importao de ficheiros
O SPSS dispe de procedimentos de importao de ficheiros criados noutras aplicaes designadamente folhas de clculo (Lotus 123, Excel), bases de dados (dBase, Access), ficheiros ASCII (separados por tabulaes, vrgula, espaos), etc. IMPORTAO DE FICHEIROS DE EXCEL File Open

Figura XX Tipos de ficheiros

Nesta janela deve: procurar a pasta onde se encontra o ficheiro; especificar Excel e seleccionar a opo (*.xls). Aparece de seguida uma caixa de dilogo, onde se especifica se as primeiras clulas contm os nomes das variveis (se sim activar Read variable names ) e o intervalo (rectangular) de clulas (no exemplo, A1:B11). Por ltimo, o SPSS cria um ficheiro com tantas variveis quantas as colunas e tantos casos quantas as linhas do bloco especificado. No se esquea de guard-lo na sua pasta (extenso .sav).
Prof. Osvaldo Borges

19

8. Anlise de estatstica de dados (STATISTICS) O SPSS apresenta um conjunto de funes e procedimentos avanados para a anlise estatstica de dados, os quais se encontram sob o comando Analyze (Anlise de dados). 8.1 Tabelas de Frequncia
Antes de dar incio apresentao das diferentes funes estatsticas, aconselha-se a interpretao das tabelas de frequncia (frequency). Considere o seguinte exemplo:
Ano de Escolaridade
Frequency 7 8 Valid 9 10 Total Percent Valid Percent Cumulative Percent

18 14 11 7 50

36,0 28,0 22,0 14,0 100,0

36,0 28,0 22,0 14,0 100,0

36,0 64,0 86,0 100,0

Interpretao:

Dezoito (18) alunos frequentam o 7 ano de escolaridade. Ou seja, 36% dos alunos esto a frequentar o 7 ano. ... 28% o 8 ano de estudo. ... H 64% de inquiridos estudam o 1 ciclo do ensino secundrio (7 e 8 anos de escolaridade). Por outro lado, 36% frequentam o 2 ciclo (9 e 10 anos de escolaridade). ...

Prof. Osvaldo Borges

20

8.2 Anlise de Relatrios (Reports)


O SPSS produz pequenos relatrios, contendo medidas estatsticas. Por exemplo, para seleccionar uma ou mais variveis (ou categorias de variveis), utiliza-se o seguinte procedimento: Analyze Reports OLAP Cubes...
OLAP: Online Analytical Processing.

Ainda, pode-se seleccionar diferentes medidas estatsticas, clicando no Statistics.

Prof. Osvaldo Borges

21

8.3 Medidas Estatsticas (Statistics) 8.3.1 Descritivas (Descriptives statistics)


O SPSS apresenta as medidas:
Localizao (Tendncia no Central) Localizao/Posio (Tendncia Central)

Figura 12 Estatsticas Descritiva Disperso (ou variabilidade)

Assimetria e Achatamento/Curtose

Podem ser obtidas de 2 formas:

Analyze Descriptive Statistics Frequencies Statistics


Ou

Analyze Descriptive Statistics Descriptive Options

Prof. Osvaldo Borges

22

Medidas de Tendncia Central

Mean (Media) medida de tendncia central mais utilizada, sendo definida como o resultado da diviso da soma de todos os valores observados pelo nmero total de observaes. Median (Mediana) valor central (meio) de uma distribuio; divide a distribuio em 2 partes iguais, tendo assim, 50% dos dados sua direita como sua esquerda. Mode (Moda) - valor que ocorre com maior frequncia numa distribuio. Ela pode no existir e, quando existe, pode no ser nica.
Medidas de Tendncia no Central (ou de ordem)

Quartiles (Quartis) so 3 pontos (Q1, Q2 e Q3) que dividem um conjunto de dados em 4 partes iguais: o Q1 (1 Quartil) precedido de 25% dos valores e sucedido por 75%; o Q2 tem abaixo de si 50% dos valores e acima de si tambm 50% e, por esta razo, coincide com a Mediana; o Q3 antecedido de 75% dos valores e seguido por 25% dos mesmos. n Cut points for equal groups definem outros separadores: Decis (dividem em 10 partes iguais: D1, D2,...., D9), Percentis/centis (dividem em 100 partes iguais: P1, P2 ,....,P99), .... Percentile(s): permitem especificar o percentil pretendido, (por exemplo, 67, 15, ....)
Medidas de Disperso (ou variabilidade)

Std deviation (Desvio Padro) mais importante medida de disperso, sendo definida como a raiz quadrada da varincia.
Prof. Osvaldo Borges

23

Variance (Varincia) mdia dos quadrados dos desvios de cada valor em relao sua mdia. Contudo, a sua utilizao como medida descritiva ocasiona alguma dificuldade (sobretudo de interpretao) visto que se trata, por definio, de uma mdia quadrtica, no possuindo a mesma unidade de medida dos dados originais. Range (amplitude do intervalo de variao) diferena entre os valores mximo e mnimo do conjunto de dados. Mnino (Minimum) valor mnimo de uma distribuio. Mximo (Maximum) Valor mximo de uma distribuio. S.E. Mean (Estimativa do Erro amostral) quociente entre o desvio padro e a raiz quadrada da dimenso da amostra. Indica a variabilidade da mdia aritmtica entre amostras tiradas da mesma populao. Esta medida permite a construo dos intervalos de confiana sobre o valor da mdia da populao. Intervalo Interquartil (Interquartile Range): Q3 - Q1.
Medidas de Assimetria

A medida de assimetria utilizada pelo SPSS dada pelo quociente entre o Skewness e o seu Std Error. O resultado desse quociente deve ser analisado da seguinte forma:
Assimtrica negativa No rejeitar a simetria Assimetria positiva

< -2

-2

+2

> +2

Medidas de Achatamento (ou curtose)

A diviso do Kurtosis pelo seu Std Error d o coeficiente de achatamento (k). Quanto forma de achatamento, uma distribuio pode ser Mesocrtica (k igual a 0), Platicurtica (k menor que -2) e Leptocrtica (k maior que +2).

Prof. Osvaldo Borges

24

Exemplo 4. Considere o seguinte output.


Statistics
IDADE N Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum 25 Percentiles 50 75 Valid Missing

50 0 12,78 ,25 13,00 14 1,80 3,24 -,554 ,337 -1,093 ,662 5 10 15 639 10,75 13,00 14,00

IDADE
Frequency 10 11 12 Valid 13 14 15 Total Percent Valid Percent Cumulative Percent

12 1 3 12 14 8 50

24,0 2,0 6,0 24,0 28,0 16,0 100,0

24,0 2,0 6,0 24,0 28,0 16,0 100,0

24,0 26,0 32,0 56,0 84,0 100,0

Prof. Osvaldo Borges

25

Interpretao:

A idade mdia dos inquiridos de 12,78 anos (Mean). A mediana ou precentil 50 indica que metade dos alunos tem at 13 anos. Na tabela de frequncia, a mediana a idade que acumula at si metade (50%) das observaes, isto , a idade que corresponde ao Cumulative Percent imediatamente superior a 50 (13 Cumulative Percent=56,0), (Median). O quociente entre o desvio padro (1,80) e a raiz quadrada da dimenso da amostra (n=50) 0,25. Significa que a variao entre a mdia calculada (12,78) e a mdia de outras amostra aleatrias de igual dimenso de 0,25 anos (Std Error Mean). A maioria dos alunos tem 14 anos (Mode). A varincia de 3,24. O desvio padro igual a 1,80 denota uma baixa disperso (coef.variao, 1,80/12,78=14%). Quanto menos dispersos estiverem os valores da varivel idade relativamente mdia, menor ser o desvio padro, e vice versa (Variance e Std Deviation). O coeficiente de skewness de 0.554 e o seu Std Error (estimativa do erro) de 0.337. O quociente entre estes dois valores igual a 1.64. Como o resultado negativo e menor que 2, pode-se concluir que a distribuio assimtrica negativa. Na prtica, faz-se a diferena da mdia e da moda e divide-se pelo desvio padro. Neste caso, esta diferena negativa, - 0.68, e a concluso a mesma. Kurtosis/Std Error Kurtosis=-1,65. Como menor que 2, diz-se que a distribuio Platicrtica (mais achatada do que a normal). As idades variam entre os 10 (Mnimo) e os 15 (Mximo), sendo a amplitude do intervalo de variao de 5 anos (Range). A soma de todas idades de 639 (Sum). Percentil 75: Significa que 75% dos inquiridos tm at 14 anos.

Prof. Osvaldo Borges

26

Distribuio normal

O SPSS apresenta o histograma com a distribuio normal sobreposta. Recorda-se que a distribuio normal : Terica, contnua, simtrica e mesocrtica; Tem a forma de um sino e definida com base em dois parmetros: mdia e desvio padro. O ponto mximo da distribuio a mdia. Analyze Descriptive Statistics Frequencies Chart

Figura 13 Histograma com normal sobreposta

Veja o Output:
IDADE
16 14 12 10 8 6 4 Std. Dev = 1,80 2 0 10,0 11,0 12,0 13,0 14,0 15,0 Mean = 12,8 N = 50,00

Frequency

IDADE

O histograma acima com ajustamento distribuio normal tem o aspecto onde sobressai o enviesamento da amostra para a direita em relao distribuio terica, bem como um achatamento um maior que o que seria de esperar.
Prof. Osvaldo Borges

27

Opo Explore - calcula as estatsticas, e elabora o grfico

caule-e-folhas e o grfico de extremos-e-quartis, muito til para analisar a amostra em termos de concentrao ou disperso dos valores por intervalos quartlicos, bem como a sua simetria; alm disso, uma boa ferramenta de verificar se h observaes outliers, isto , observaes extremas que se afastam muito da mdia dos valores da amostra. Analyze Descriptive Statistics Explore Selecciona-se a varivel a analisar (idade), tal como descrito atrs. De seguida, seleccionar o boto, Statistics.

Faa Continue para voltar ao Explore. Escolha, de seguida a opo Plots. Seleccione histograma.

Faa Ok e analise o Output. Faa Explore, utilizando o Factor List para a varivel Sexo.
Prof. Osvaldo Borges

28

Teste de Normalidade Testa a hiptese de que os dados da amostra esto normalmente distribudos. Analyze Descriptives statistics Explore Plots

A tabela Teste de Normalidade (Tests of Normality) mostra os resultados do Teste de Kolmogorov Smirnov (K-S). Se a amostra tiver menos de 50 casos o SPSS tambm calcula o teste de Shapiro-Wilk.

Tests of Normality
Kolmogorov-Smirnov Statistic df Sig. IDADE
a

Shapiro-Wilk Statistic df

Sig.

,229

50

,000

,824

50

,010**

**. This is an upper bound of the true significance. a. Lilliefors Significance Correction

Um baixo valor de significncia ( geralmente considerado baixo se Sig. < 0.05) indica que a distribuio dos dados difere significativamente de uma distribuio normal.

Prof. Osvaldo Borges

29

Intervalos de Confiana sobre a mdia (IC )


Mdia: 12,78 com o Std Error = 0,25

Nveis: Confiana de 95% Significncia (risco) de 5%

Resultado: IC95% = ] 12,27 ; 13; 29[ Significado: Existe uma probabilidade de 95% para que o valor
desconhecido da mdia da populao pertena ao intervalo ]12,27 ; 13; 29[. Ou seja, com 95% de confiana, a verdadeira mdia da populao dever pertencer ao intervalo de 12,27 a 13,29. Este intervalo de confiana s tem interesse se os valores em causa so de uma amostra seleccionada aleatoriamente de uma populao mais vasta.

Nveis: Confiana de 99% Significncia (risco) de 1%

Resultado: IC99% = ] 12,10 ; 13; 46[

Prof. Osvaldo Borges

30

Concluso: Diminuindo o nvel de significncia (risco) implica um aumento do intervalo de confiana.

8.3.2 Anlise Inferencial 8.3.2.1 Anlise Bivariada: Cruzamentos e Medidas de Associao (Crosstabs)
"p" (nvel de) significncia estatstica (Asymp. Sig.). Prob. Geralmente, em cincias sociais, quando estas probabilidades (Asymp. Sig.) so inferiores a 5%, ou seja, h menos de 5 possibilidades em 100 de suceder um determinado resultado, considera-se que so estatisticamente significativas. Varivel Qualitativa Nominal Independncia Estatstica utiliza-se normalmente o Teste de Qui-Quadrado de Pearson, 2. As hipteses do Teste de Qui-Quadrado so: H0 (Hip. Nula): As variveis turma e sexo so independentes. Ha (Hip. Alternativa): As variveis turma e sexo so dependentes (existe uma relao entre as 2 variveis). Analyze Descriptive Statistics Crosstabs Statistics

Prof. Osvaldo Borges

31

Resultado:
Chi-Square Tests
Value Pearson Chi-Square Continuity Correction Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided)

36,883a 40,291

2 2

,000 ,000

50

a. 2 cells (33,3%) have expected count less than 5. The minimum expected count is 3,90.

Concluso:

Como o nvel de significncia do teste de Qui-Quadrado de 0,000, valor inferior a 0,05 (5% de signficncia fixada), rejeita-se a hiptese de serem independentes (H0), ou seja, h evidncia/significncia estatstica para aceitar a hiptese alternativa de que so dependentes (existe relao entre 2 variveis). Portanto, pode-se inferir a relao de dependncia observada na amostra para o universo/populao em estudo.

Medidas de Associao baseadas no Teste de Qui-Quadrado

Prof. Osvaldo Borges

32

Symmetric Measures
Value Phi Nominal by Nominal Cramer's V Contingency Coefficient Kendall's tau-b Ordinal by Ordinal Measure of Agreement N of Valid Cases
a. Not assuming the null hypothesis.

Asymp. a Std. Error

Approx. T

Approx. Sig.

Kendall's tau-c Gamma Kappa

,859 ,859 ,652 -,117 -,122 -,162 ,c 50

,132 ,136 ,179

-,893 -,893 -,893

,000 ,000 ,000 ,372 ,372 ,372

b. Using the asymptotic standard error assuming the null hypothesis. c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values of the first variable match the values of the second variable. d. Correlation statistics are available for numeric data only.

Significado: Todos esses testes indicam que existe uma associao forte entre as duas variveis devido aos seus altos valores. O teste Phi s se aplica para tabelas 2 x 2. Variveis Quantitativas Coeficiente de Correlao de Pearson aplica-se s variveis quantitativas. Varia entre 1 (negativa) e 1 (positiva). Quanto mais prximo estiver dos valores extremos maior e a associao linear. Associao ou Correlao Negativa: variao entre as variveis for em sentido contrrio (aumento de uma varivel est associada diminuio de outra). Associao ou Correlao Positiva : variao entre as variveis for no mesmo sentido. Analyze Correlate Bivariate variveis

Prof. Osvaldo Borges

33

Variveis Ordinais Coeficiente de Spearman utiliza-se para as variveis ordinais.

8.3.2.2 Regresso (Regression)


Modelo estatstico usado para prever o comportamento de uma varivel contnua (varivel dependente ou Y) a partir de uma ou mais variveis (var. independentes ou X). Modelo de Regresso Linear Simples (MRLS): Quando existe apenas uma varivel independente. Modelo de Regresso Linear Mltipla (MRLS): Quando existe mais do que uma varivel independente. Modelo de Regresso Linear Simples (MRLS): permite encontrar a recta que melhor representa a relao entre 2 variveis (X e Y).

Prof. Osvaldo Borges

34

Y = aX + b,
em que, Y: var. dependente/explicada X: var. independente/explicativa a: declive ou inclinao b: ordenada na origem (CONSTANT)

Para proceder ao clculo da equao da recta de regresso linear, deve executar o seguinte procedimento: Analyze Regression Linear

Resultado da regresso linear


Coefficientsa
Standardi zed Coefficient s Beta

Model 1 (Constant) ALTURAP

Unstandardized Coefficients B Std. Error

Sig.

,238 ,858

,276 ,154

,892

,864 5,574

,413 ,001

a. Dependent Variable: ALTURAF

Declive

Ordenada na origem
0.01<0.05 .... H0 rejeitada para o nvel de significncia de 5% 35

Prof. Osvaldo Borges

Equao da recta ALTURAP = 0.858ALTURAF + 0,238 Interpretao: a = 0,858 - Por cada aumento de uma unidade na altura dos Pas (X) implica um aumento de 0.858 na altura dos Filhos (Y). O valor positivo indica de que a recta cresce da esquerda para a direita. Se o declive fosse negativo, a recta decresceria da esquerda para a direita. b = 0,238 Para ALTURAP=0 ALTURAF=0,238. Mtodo utilizado: Mnimos Quadrados (MMQ). Exerccio: Se um Pai tiver 1,95 m de altura, a altura do Filho ser 1,91, aproximadamente. Coeficiente de determinao (R2 e R2 Ajustado) indica a qualidade do ajustamento da recta estimada aos dados.
Model Summaryb
Adjusted R Square Std. Error of the Estimate

Model 1

R Square

,892a

,795

,770

4,638E-02

a. Predictors: (Constant), ALTURAP b. Dependent Variable: ALTURAF

Coeficiente de correlao Coeficiente de determinao

Prof. Osvaldo Borges

36

Cerca de 80% (79,5%) da variao da varivel dependente (ALTURAF) em torno da sua mdia explicada pela regresso, ou seja, o modelo explica 80%. Portanto, considerase um bom ajustamento. Teste T testa a hiptese dos parmetros, individualmente, serem nulos.
Como o Sig.do Teste T de 0,01, valor inferior a 0.05 (5%), pode-se concluir que a varivel ALTURAP diferente de zero, isto , esta varivel estatisticamente significativa. Entretanto, a concluso no a mesma para a CONSTANT.

Teste F valida, em termos globais o modelo, e no cada um dos parmetros isoladamente.


ANOVAb
Model 1 Sum of Squares Regression 6,683E-02 Residual 1,721E-02 Total df Mean Square F Sig.

8,404E-02

1 8 9

6,683E-02 2,151E-03

31,072

,001a

a. Predictors: (Constant), ALTURAP b. Dependent Variable: ALTURAF

Como o Sig.do Teste F de 0,01, valor inferior a 5%, pode-se concluir que o modelo adequado para descreve esta relao, ou seja, o modelo estatisticamente significativo.

Diagrama de Disperso (ou de pontos) I. Graphs Scatter Simple Define

II. Escolha as variveis dependente e independentes III. Label Cases by colocar o nome da varivel que identifique os pontos nos grficos. Seleccione Options e active Display chart with case labels.

Prof. Osvaldo Borges

37

Resultado: Utilizando o ajustamento da recta.


2,0 Elmano, Pedro

1,9 Antonio, Joao El ton, Elio Mapa, Melo Leao, Santos Pedr o, Jorge Tavares, Silva

1,8

1,7

ALT URAF

Li to, Silva Montei ro, Pina Borges, Elzo

1,6 1,6 1,7 1,8 1,9 2,0

ALTURAP

Tabela 2 - Procedimentos de estatstica: descritiva, inferencial e multivariada disponveis pelo SPSS.


Analyze Summarize Descriptives statistics Sub-comandos Funo

Frequencies

Calcula a tabela de distribuio de frequncias.

Prof. Osvaldo Borges

38

Compare means

ANOVA models

Correlate

Regression

Calcula as principais estatsticas descritivas. Explore Faz uma anlise completa das variveis, podendo ainda repetir essas anlises por outra varivel. Crosstabs Calcula a tabela de distribuio de frequncias cruzadas, calcula o teste Qui-quadrado e o Coeficiente de Pearson para associao de variveis e outros testes. List cases Lista casos escolhendo as variveis desejadas Report Summaries Organiza relatrios em linhas, in Rows segundo uma varivel Means Calcula a mdia, o desvio padro, soma, etc. das variveis desejadas. Independent Calcula o teste de diferena de sampled T-test duas mdias de populaes independentes Paired-sampled T- Calcula o teste de diferena de test duas mdias de populaes emparelhadas. One-Way ANOVA Testa a diferena de mdias de mais de duas amostras Simple factorial Testa a diferena de mdias do modelo fatorial General factorial Testa a diferena de mdias do modelo geral Multivariate Calcula o teste de anlise de varincia multivariada Bivariate Calcula a matriz de correlao, tomando as variveis de duas em Partial duas. Distances Calcula o coeficiente de correlao parcial. Calcula a distncia euclidiana entre os casos. Linear Ajusta o modelo de regresso Logistic linear Ajusta o modelo de regresso Probit logstica Nonlinear Ajusta o modelo Probit

Descriptives

Prof. Osvaldo Borges

39

Ajusta um modelo no linear Loglinear General Hierarchical Logit K-means cluster Hierarchical clusters Discriminant Factor

Classify

Anlise de clusters Anlise de clusters hierrquicos Anlise discriminante Anlise factorial

Data Reduction Scale

Non Parametric Test

Survival Multiple response

Reliabity analysis Anlise de confiabilidade Multidimensional Scaling Chi-square Testes no paramtricos ou de Binomial distribuio livre Runs 1-Sample K-S 2-Independent Samples k-Independent Samples 2-Related Samples K-Related Samples Anlise de sobrevivncia Anlise de respostas mltiplas

Obs: As verses mais recentes do SPSS (11.0) apresentam mais procedimentos estatsticos.

Prof. Osvaldo Borges

40

9. Anlise de grficos (GRAPHS)


A representao grfica uma das possibilidades de anlise de dados sob uma forma ilustrada, produzindo uma viso mais clara e imediata dos resultados. SPSS oferece vrios tipos de grficos: Graphs Bar Line Area Pie Boxplot Scatter Funo Grfico de barra De linha De rea Circular Da caixa De disperso Tipo de variveis Qualitativas, discretas de poucos valores Sries de tempo Srie de tempo Qualitativas Quantitativas Relao entre duas variveis quantitativas, podendo colorir segundo outra varivel Quantitativa (de preferncia contnua). Tem a opo de desenhar a curva normal superposta ao histograma

Histogram

Histograma

Prof. Osvaldo Borges

41

Você também pode gostar