Análise de dados com SPSS

IADE-U Instituto de Arte, Design e Empresa - Universitrio
LICENCIATURA EM MARKETING E PUBLICIDADE
Manual de SPSS
TRATAMENTO E ANLISE DE DADOS
Prof. Doutor Joaquim Casaca Setembro de 2012
Este manual integra as funcionalidades do SPSS (verso 20) necessrias para complementar o contedo das aulas da unidade curricular Tratamento e Anlise de Dados.
NDICE DE CONTEDOS
NDICE
NDICE ............................................................................................................................. III NDICE DE QUADROS ..................................................................................................... VIII NDICE DE TABELAS ........................................................................................................ VIII 1 CONCEITOS BSICOS DA ANLISE DE DADOS .............................................................. 1
1.1 1.2 1.3 1.4 MTODOS DE INVESTIGAO ......................................................................................................... 2 TIPOS DE VARIVEL E DE ESCALA..................................................................................................... 2 DISTRIBUIES DE PROBABILIDADE ................................................................................................. 3 ESTIMAR PARMETROS POPULACIONAIS .......................................................................................... 4
VISO GERAL DO SPSS................................................................................................ 7

2.1 2.2 2.3 2.4 2.5 JANELAS DO SPSS ........................................................................................................................ 8 MENU DA JANELA DE DADOS ....................................................................................................... 11 BARRA DE ESTADO ..................................................................................................................... 12 CAIXAS DE DILOGO ................................................................................................................... 13 OBTER AJUDA (MENU DE AJUDA) ................................................................................................. 14 Navegao na Tabela de Contedos ............................................................................. 14
2.5.1 2.6 2.7 2.8 2.9
FICHEIROS DE DADOS.................................................................................................................. 16 DEFINIR VARIVEIS ..................................................................................................................... 18 INTRODUO E EDIO DE DADOS................................................................................................ 22 FALTA DE DADOS ....................................................................................................................... 24 Como Saber se h Falta de Dados ................................................................................. 24 Como Tratar o Problema de Falta de Dados ................................................................. 25
2.9.1 2.9.2 2.10 2.11
SELECO DE CASOS ................................................................................................................... 28 DIVISO DO FICHEIRO (SPLIT FILE) ................................................................................................ 31
TRANSFORMAO DE DADOS .................................................................................. 33

3.1 3.2 3.3 TRANSFORMAO DE DADOS ....................................................................................................... 34 CLCULO DE UMA VARIVEL ........................................................................................................ 34 RECODIFICAO DE VARIVEIS ..................................................................................................... 36 Recodificao na Mesma Varivel ................................................................................. 36 Recodificao numa Varivel Diferente ........................................................................ 37 Recodificao Automtica ............................................................................................. 38
P g i n a | iii
3.3.1 3.3.2 3.3.3
EXPLORAO E CRUZAMENTO DE VARIVEIS ........................................................... 39

4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 RESUMO DE UMA DISTRIBUIO................................................................................................... 40 VALORES EXTREMOS................................................................................................................... 42 PERCENTIS ................................................................................................................................ 43 HISTOGRAMA ............................................................................................................................ 44 GRFICO DE CAULE E FOLHAS ...................................................................................................... 45 CAIXA DE BIGODES ..................................................................................................................... 46 CRUZAMENTO DE VARIVEIS ........................................................................................................ 47 PERCENTAGENS DE LINHA E COLUNA ............................................................................................. 50 VISUALIZAO GRFICA .............................................................................................................. 51
VARIVEIS DE RESPOSTA MLTIPLA ......................................................................... 55

5.1 5.2 5.3 INTRODUO ............................................................................................................................ 56 QUESTES DE DICOTOMIA MLTIPLA ............................................................................................ 56 QUESTES DE CATEGORIA MLTIPLA ............................................................................................ 58
TESTES DE HIPTESES (TEORIA DA DECISO) ............................................................ 61

6.1 6.2 REGRA DE DECISO .................................................................................................................... 62 PROCEDIMENTOS DOS TESTES ...................................................................................................... 63 Testes de Hipteses no SPSS ......................................................................................... 63
6.2.1 6.3
TESTES BILATERAIS E UNILATERAIS ................................................................................................ 63 Testes Bilaterais (two-tailed) ......................................................................................... 63 Testes Unilaterais (one-tailed) ...................................................................................... 64
6.3.1 6.3.2
REGRESSO LINEAR ................................................................................................. 65

7.1 7.2 7.3 7.4 7.5 7.6 7.7 INTRODUO ............................................................................................................................ 66 COEFICIENTE DE CORRELAO DE PEARSON.................................................................................... 66 REGRESSO LINEAR NO SPSS ....................................................................................................... 67 ANLISE GRFICA ...................................................................................................................... 68 RECTA DE REGRESSO ................................................................................................................. 70 VALORES PREVISTOS E VALORES RESIDUAIS .................................................................................... 71 COEFICIENTE DE CORRELAO ...................................................................................................... 73
TESTE DE INDEPENDNCIA DO QUI-QUADRADO ....................................................... 75

8.1 INTRODUO ............................................................................................................................ 76 Requisitos para a Validade do Teste ............................................................................. 76 Caso do Teste do Qui-Quadrado de Independncia ..................................................... 76 8.1.1 8.1.2
P g i n a | iv
ANEXO A EDIO DE TABELAS ...................................................................................... 81 ANEXO B ASSIMETRIA E ACHATAMENTO ...................................................................... 85
P g i n a |v
NDICE DE FIGURAS
Figura 2.1: Janela de edio de dados..................................................................................................... 8 Figura 2.2: Janela de visualizao de resultados (Output Viewer). ......................................................... 9 Figura 2.3: Editor de grficos................................................................................................................. 10 Figura 2.4: Barra de estado. .................................................................................................................. 12 Figura 2.5: Caixa de dilogo para o clculo de frequncias. ................................................................. 13 Figura 2.6: Help. .................................................................................................................................... 14 Figura 2.7: ndice de assuntos. .............................................................................................................. 14 Figura 2.8: ndice de assuntos (2). ......................................................................................................... 15 Figura 2.9: Pesquisa de palavras/termos. ............................................................................................. 15 Figura 2.10: Abrir ficheiro de dados. ..................................................................................................... 16 Figura 2.11: Abrir ficheiro Excel. ........................................................................................................... 16 Figura 2.12: Condies de abertura de ficheiro Excel. .......................................................................... 17 Figura 2.13: Seleco da Variable View................................................................................................. 18 Figura 2.14: Janela da Variable View..................................................................................................... 18 Figura 2.15: Definio do tipo de varivel. ............................................................................................ 19 Figura 2.16: Seleco do tipo de varivel. ............................................................................................. 19 Figura 2.17: Rtulo da varivel. ............................................................................................................. 20 Figura 2.18: Rtulos dos valores da varivel. ........................................................................................ 20 Figura 2.19: Indicao dos valores em falta. ......................................................................................... 21 Figura 2.20: Tipificao dos valores em falta. ....................................................................................... 21 Figura 2.21: Escala de medida da varivel. ........................................................................................... 21 Figura 2.22: Janela de Data View. ......................................................................................................... 22 Figura 2.23: Insero de novos casos. ................................................................................................... 23 Figura 2.24: Insero de novas variveis. .............................................................................................. 23 Figura 2.25: Tratar a falta de dados. ..................................................................................................... 25 Figura 2.26: Substituio de valores em falta pela mdia. ................................................................... 27 Figura 2.27: Opo Transform (substituio de valores em falta). ....................................................... 27 Figura 2.28: Seleccionar casos. .............................................................................................................. 28 Figura 2.29: Seleco de casos. ............................................................................................................. 29 Figura 2.30: Criao da condio para a seleco de casos. ................................................................. 29 Figura 2.31: Visualizao dos casos excludos. ...................................................................................... 30 Figura 2.32: Diviso do ficheiro. ............................................................................................................ 31 Figura 2.33: Seleco de variveis de agrupamento para a diviso de ficheiro. .................................. 31 Figura 3.1: Calcular uma varivel. ......................................................................................................... 34 Figura 3.2: Condio para clculo da varivel. ...................................................................................... 35 Figura 3.3: Operadores lgicos e aritmticos........................................................................................ 35 Figura 3.4: Recodificao na mesma varivel. ...................................................................................... 36 Figura 3.5: Seleco da varivel a recodificar. ...................................................................................... 36 Figura 3.6: Recodificao de uma varivel. ........................................................................................... 36 Figura 3.7: Recodificao numa varivel diferente. .............................................................................. 37 Figura 3.8: Seleco da varivel a recodificar noutra varivel diferente. ............................................. 37 Figura 3.9: Velhos e novos valores da nova varivel. ............................................................................ 37 Figura 3.10: Recodificao automtica. ................................................................................................ 38 Figura 3.11: Recodificao automtica. ................................................................................................ 38
P g i n a | vi
Figura 4.1: Explore. ................................................................................................................................ 40 Figura 4.2: Seleco de variveis. .......................................................................................................... 40 Figura 4.3: Obter valores extremos. ...................................................................................................... 42 Figura 4.4: Obter percentis.................................................................................................................... 43 Figura 4.5: Obter histograma. ............................................................................................................... 44 Figura 4.6: Histograma. ......................................................................................................................... 44 Figura 4.7: Obter grfico de caule e folhas. .......................................................................................... 45 Figura 4.8: Grfico de caule e folhas. .................................................................................................... 45 Figura 4.9: Obter caixa de bigodes. ....................................................................................................... 46 Figura 4.10: Caixa de bigodes. ............................................................................................................... 46 Figura 4.11: Cruzamento de variveis. .................................................................................................. 47 Figura 4.12: Seleco de variveis para cruzamento. ........................................................................... 47 Figura 4.13: Seleco de variveis para cruzamento por camada (layer). ............................................ 48 Figura 4.14: Obter percentagens........................................................................................................... 50 Figura 4.15: Seleco de grficos. ......................................................................................................... 51 Figura 4.16: Seleco de variveis para visualizao grfica. ............................................................... 51 Figura 4.17: Grfico de barras empilhadas. .......................................................................................... 52 Figura 4.18: Grfico em percentagem................................................................................................... 52 Figura 4.19: Grfico de barras empilhadas em percentagens. ............................................................. 53 Figura 5.1: Definir VRM dicotmica. ..................................................................................................... 56 Figura 5.2: Criao de VRM dicotmica. ............................................................................................... 57 Figura 5.3: Calcular tabela de frequncias de VRM. ............................................................................. 57 Figura 5.4: VRM a seleccionar para clculo de frequncias. ................................................................. 57 Figura 5.5: Missing values na VRM. ....................................................................................................... 58 Figura 5.6: Frequncias de uma VRM.................................................................................................... 58 Figura 5.7: Definio de VRM - Categoria ............................................................................................. 59 Figura 5.8: Criao de VRM categrica. ................................................................................................ 59 Figura 5.9: Cruzamento de variveis com VRM. ................................................................................... 60 Figura 7.1: Dados para clculo da regresso. ........................................................................................ 67 Figura 7.2: Regresso linear. ................................................................................................................. 67 Figura 7.3: Seleco de variveis para clculo da regresso. ................................................................ 67 Figura 7.4: Seleco do tipo de grfico. ................................................................................................ 68 Figura 7.5: Seleco das variveis para o grfico. ................................................................................. 69 Figura 7.6: Edio do grfico. ................................................................................................................ 69 Figura 7.7: Definir a recta de regresso. ............................................................................................... 70 Figura 7.8: Recta de regresso. ............................................................................................................. 70 Figura 7.9: Valores previstos e residuais. .............................................................................................. 71 Figura 7.10: Visualizar os valores previstos e residuais. ....................................................................... 72 Figura 7.11: Seleco de variveis para anlise. ................................................................................... 72 Figura 8.1: Ponderao de casos. .......................................................................................................... 77 Figura 8.2: Seleco de variveis. .......................................................................................................... 78 Figura 8.3: Seleco da estatstica qui-quadrado.................................................................................. 78
P g i n a | vii
NDICE DE QUADROS
Quadro 1-1: Anlise de valores em falta (1).......................................................................................... 24 Quadro 1-2: Anlise de valores em falta (2).......................................................................................... 24 Quadro 1-3: Coeficientes de correlao (com exclude cases listwise) .................................................. 26 Quadro 1-4: Coeficientes de correlao (com exclude cases parwise) ................................................. 26 Quadro 1-5: Clculo da mdia de uma varivel aps diviso de ficheiro. ............................................ 32 Quadro 3-1: Resultado do comando explore. ....................................................................................... 41 Quadro 3-2: Estatsticas (comando explore). ........................................................................................ 41 Quadro 3-3: Anlise de valores extremos. ............................................................................................ 42 Quadro 3-4: Anlise de percentis. ......................................................................................................... 43 Quadro 3-5: Resultado do cruzamento de duas variveis. ................................................................... 48 Quadro 3-6: Resultado do cruzamento de trs variveis. ..................................................................... 49 Quadro 3-7: Anlise de percentagens. .................................................................................................. 50 Quadro 4-1: Regra da deciso. .............................................................................................................. 62 Quadro 5-1: Resultado do clculo da regresso. .................................................................................. 68 Quadro 5-2: Anlise dos valores previstos e residuais. ......................................................................... 73 Quadro 5-3: Coeficiente de correlao. ................................................................................................ 73 Quadro 6-1: Resultado do cruzamento das variveis. .......................................................................... 79 Quadro 6-2: Resultados do teste do qui-quadrado. ............................................................................. 79
NDICE DE TABELAS
Tabela 1-1: Folha de Excel. .................................................................................................................... 16 Tabela 1-2: Folha de dados importada do Excel. .................................................................................. 17 Tabela 1-3: Tabela de dados (com valores em falta). ........................................................................... 25 Tabela 6-1: Dados para anlise. ............................................................................................................ 77 Tabela 6-2: Dados para anlise agrupados......................................................................................... 77
P g i n a | viii
Conceitos Bsicos da Anlise de Dados
1
Conceitos Bsicos da Anlise de Dados
MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS
1.1
MTODOS DE INVESTIGAO
Para efeitos de enquadramento, apresenta-se de seguida - de uma forma muito sinttica -as etapas do mtodo de investigao cientfica, o qual inclui a anlise dos dados. Esta etapa engloba a supresso de erros e valores anormais, a organizao dos dados de maneira prtica e funcional, a escolha de indicadores que sintetizem a informao, a utilizao de tcnicas estatsticas adequadas para testar as hipteses estipuladas e, ainda, a interpretao da informao. 1. 2. 3. 4. 5. 6. 7. 8. Identificao do problema; Reviso da literatura; Construo das hipteses; Definio das variveis; Definio da populao e da amostra; Escolha e/ou construo de instrumentos de recolha de dados; Tratamento e anlise dos dados; Relatrio de investigao.
Em investigao, existem estudos correlacionais e estudos experimentais. Enquanto, nos primeiros, se procura indicar em que graus determinados fenmenos esto relacionados, nos segundos procura-se verificar se existem diferenas significativas entre situaes. Neste ultimo caso, muito utilizada a comparao relativamente a um atributo - de um grupo experimental com o grupo de controlo (exemplo: verificar se a frequncia de aulas adicionais de apoio melhoram o desempenho escolar - aqui, o grupo de controlo poderia ser uma turma de alunos sem aulas adicionais de apoio e o grupo experimental poderia ser outra turma de alunos com aulas adicionais de apoio). Relativamente ao design experimental, existem as amostras independentes (design entre-sujeitos: betweensubject design), ou seja, aquelas compostas por indivduos diferentes a testar numa situao (exemplo: avaliar o comportamento na sala de aula, segundo o sexo) e as amostras emparelhadas (design intra-sujeitos: withinsubject design), isto , as que so compostas pelos mesmos indivduos em vrias fases da realizao de uma experincia (exemplo: verificar, para um grupo de alunos, se h diferenas de performance entre um teste intermdio e o exame final a uma disciplina).
1.2
TIPOS DE VARIVEL E DE ESCALA
As variveis so smbolos que representam determinadas caractersticas de uma populao ou amostra susceptveis de serem estudadas. Distinguem-se essencialmente entre: qualitativas, i.e., que esto relacionadas com categorias no susceptveis de medida mas apenas de classificao, assumindo diferentes modalidades (exemplo: cor dos olhos) e quantitativas, ou seja, relacionadas com caractersticas que tomam valores numricos e so susceptveis de medida (exemplo: peso em kg). As variveis quantitativas podem ainda ser discretas, quando assumem uma realidade numervel de valores em que os decimais no fazem sentido P g i n a |2
CONCEITOS BSICOS DA ANLISE DE DADOS

(exemplo: nmero de filhos por agregado familiar) ou contnuas, quando podem assumir qualquer valor num intervalo de nmeros reais (exemplo: rendimento por agregado familiar). Associadas s variveis, existem vrios tipos de escala, correspondendo os dois primeiros a variveis qualitativas e os dois ltimos a variveis quantitativas Entre parntesis, encontram-se as designaes dadas pelo SPSS a cada um dos tipos de escala (Measure). i) Nominal (Nominal) - dados classificados por categorias no ordenadas (exemplos: sexo, clube de futebol, turma a que pertence); ii) iii) Ordinal (Ordinal) - dados classificados por categorias ordenadas (exemplos: nvel de escolaridade); Intervalar (Scale) - dados expressos numa escala numrica com origem arbitrria (exemplo: temperatura em graus centgrados); iv) Razo (Scale) - dados expressos numa escala numrica com origem fixa (exemplos: idade (anos), classificao num teste (0 a 20 valores), rendimento mensaI do agregado familiar (euros), tempo de realizao de uma determinada prova (minutos)). Note-se que a distino entre as escalas intervalar e de razo muitas vezes terica e no tem particular interesse para a aplicao de tcnicas estatsticas. Para as variveis quantitativas, o SPSS assume sempre a medida Scale. De igual forma, note-se que uma determinada designao de varivel, per se, no implica necessariamente que esta se enquadre num nico tipo de escala. Tudo depende dos objectivos do estudo e da forma como so recolhidas as variveis. Por exemplo, a varivel idade pode ser quantitativa quando absolutamente expressa em anos, ou qualitativa ordinal quando expressa em escales etrios (menor que 18 anos, entre 19 e 34 anos, e assim sucessivamente).
1.3
DISTRIBUIES DE PROBABILIDADE
A Estatstica incide nos chamados fenmenos aleatrios ou casuais, ou seja, naqueles em que no possvel prever exactamente o resultado final antes da realizao da experincia (quando repetida nas mesmas circunstncias). A noo de incerteza est claramente implcita e, neste contexto, o conceito de probabilidade torna-se incontornvel. A base da inferncia estatstica consiste na possibilidade de se tomarem decises sobre os parmetros de uma populao, sem que seja necessrio proceder a um censo (recenseamento de toda a populao). Os mtodos envolvem o clculo de estatsticas amostrais a partir das quais se infere sobre os parmetros populacionais, ou seja, procura-se elaborar uma generalizao, com determinado grau de probabilidade. importante reter que as concluses em estatstica inferencial no so 100% seguras, embora a probabilidade de errar deva ser relativamente baixa, caso contrrio a informao deixa de ter utilidade. Uma noo chave em Estatstica so as distribuies amostrais - variveis aleatrias que "transformam" as estatsticas amostrais (calculadas com base na amostra) em parmetros (valores populacionais). Existem vrias distribuies amostrais (mdia, desvio-padro, coeficiente de correlao, entre muitas outras), distribuies essas que seguem uma determinada distribuio terica de probabilidade. P g i n a |3

Outro conceito fundamental o de grau de liberdade (df: degree of freedom), que basicamente se refere ao nmero de elementos que podem variar livremente numa amostra ou situao. Encontra-se associado a determinados tipos de distribuio terica e pode depender directamente do nmero de elementos da amostra, ou do nmero de situaes a comparar, entre outros factores. Para compreender a lgica subjacente a este conceito, imagine que existem dez cadeiras livres volta de uma mesa. Neste exemplo, existe "liberdade" para sentar nove pessoas, dado que a dcima ter que ficar com o nico lugar de sobra, residualmente determinado.
1.4
ESTIMAR PARMETROS POPULACIONAIS
Um dos objectivos da estatstica inferencial estimar as caractersticas desconhecidas de uma populao, atravs dos dados contidos na amostra. Torna-se necessrio introduzir o conceito de estimador - estatstica que produz valores (estimativas) no domnio do parmetro. Existem dois grandes tipos de estimao: a pontual, que consiste em encontrar uma boa aproximao do parmetro atravs de um nico valor, e a intervalar, que consiste em estabelecer um intervalo no qual o parmetro se ir situar, com um determinado grau de probabilidade. Um estimador pontual respeita as seguintes propriedades: i) no enviesado, ou seja, espera-se que o valor esperado do estimador seja o verdadeiro valor do parmetro da populao; ii) iii) eficaz, i.e., vrias estimaes devem ser o mais prximas possvel do valor do parmetro; e convergente, o que quer dizer que quando se aumenta a dimenso da amostra, deve obter-se valores mais prximos do parmetro. No entanto, sendo um valor nico, uma estimativa pontual acaba por "falhar" sempre o "alvo", nem que seja por margens muito pequenas. Por isso, recorre-se muitas vezes chamada estimao intervalar. Esta ltima baseada na pontual, qual se "junta" um factor de incerteza baseado na distribuio de probabilidade (amostral) do estimador pontual, dando origem a um intervalo que, no fundo, representa as fronteiras dentro das quais "acreditamos" que se encontra o parmetro populacional. A estimao intervalar consiste, ento, em calcular - a partir de um determinado estimador - um intervalo de confiana no qual plausvel encontrar o verdadeiro valor do parmetro. Os limites do intervalo de confiana so variveis aleatrias cuja probabilidade de conter o verdadeiro valor do parmetro definida pelo investigador. Essa probabilidade (1-) designa-se por nvel de confiana. probabilidade complementar , chama-se nvel de significncia e representa o risco de o parmetro no estar no intervalo de confiana calculado. Os nveis de significncia mais utilizados so 1% (0,01), 5% (0,05) e 10% (0,10), que correspondem a nveis de confiana de 99%, 95% e 90%, respectivamente. Note-se que na generalidade possvel afirmar que, para um determinado nvel de confiana, (1-)% das amostras contm o verdadeiro valor do parmetro. No entanto, quando se concretiza para uma amostra em particular, deixa de haver aleatoriedade, i.e., um intervalo de confiana especfico contem ou no contem o verdadeiro valor do parmetro. P g i n a |4
CONCEITOS BSICOS DA ANLISE DE DADOS

importante referir que um maior nvel de confiana implica uma maior amplitude do intervalo de confiana, ou seja, reduzindo o risco de errar torna-se menos preciso. Por exemplo, um intervalo de confiana a 99% menos preciso do que um de 90%, porque se est a arriscar menos. Em contra partida, a probabilidade de errar menor no primeiro caso.
P g i n a |5
Viso Geral do SPSS
2
Viso Geral do SPSS
2.1
JANELAS DO SPSS
Existem sete tipos de janelas no SPSS: Data Editor .......................... : Janela que apresenta o contedo do ficheiro de dados. Os ficheiros de dados podem ser modificados atravs desta. S possvel ter uma janela destas aberta num dado momento. Output Viewer .................... : Janela onde so apresentados os resultados estatsticos, tabelas e grficos, os quais podem ser editados e gravados para uso posterior. Uma janela Viewer abre automaticamente a primeira vez que se executa um procedimento que gera uma sada.
Figura 2.1: Janela de edio de dados.
P g i n a |8
VISO GERAL DO SPSS
Figura 2.2: Janela de visualizao de resultados (Output Viewer).
Pivot Table Editor ............... : Permite editar e modificar tabelas. Pode editar-se o texto, trocar dados em linhas e colunas, adicionar cor, criar tabelas multidimensionais e ocultar ou mostrar resultados. Chart Editor......................... : Permite modificar grficos de alta resoluo e grficos em janelas grfico. Pode alterar-se as cores, seleccionar fontes de diferentes tipos e tamanhos, trocar os eixos horizontal e vertical, rotao 3-D grficos de disperso e at mesmo alterar o tipo de grfico.
P g i n a |9
Figura 2.3: Editor de grficos.
Text Output Editor .............. : Permite alterar texto que no seja visvel no Pivot Table Editor. Pode alterar-se o tipo, tamanho, cor e estilo das letras. Syntax Editor ...................... : Todos os comandos do SPSS podem ser emitidos a partir da janela de sintaxe. Todos os comandos emitidos a partir dos menus podem ser apresentados numa janela de sintaxe: para isso usa-se o comando Paste das caixas de dilogo. O contedo do editor pode ser guardado e reutilizado mais tarde. Script Editor ........................ : Usado para criar e modificar scripts que permitem automatizar muitas tarefas no SPSS.
P g i n a | 10
VISO GERAL DO SPSS
2.2
MENU DA JANELA DE DADOS
File ........................... : Funes de criar, abrir, ler ou imprimir ficheiros provenientes de outras sesses de anlise ou de outros programas (bases de dados, folhas de clculo, etc.). Edit .......................... : Funes de modificar ou copiar texto das janelas de output ou de sintaxe; pesquisa de dados e parametrizao de opes diversas. View ........................ : Funes de activao de diversas barras de botes, fontes, grelha, barra de status e mostrar os rtulos (labels) definidos. Data......................... : Funes de alterao global dos dados, tais como: transpor variveis e casos, criar subconjuntos de casos para anlise, insero de dados. Estas mudanas so temporrias e no afectam o ficheiro, excepto se for efectuada uma gravao com estas alteraes. Transform ............... : Funo de produzir alteraes nas variveis seleccionadas e para calcular novas variveis a partir de valores de outras j existentes. Estas alteraes s sero efectivas se forem gravadas. Analyze ................... : Funes de seleccionar os vrios procedimentos estatsticos, como a anlise descritiva, anlise de varincia, correlaes, regresses lineares, etc. Graphs..................... : Funes para criar grficos de colunas, de sectores, histogramas. Utilities.................... : Funes para obteno de informao acerca das variveis, controlo da lista de variveis que aparece nas caixas de dilogo, correr scripts (pequenos programas) e alterar os menus. Window .................. : Funes de comutar entre as vrias janelas do SPSS ou minimiz-las. Help ......................... : Ligao pgina do SPSS na Internet. Ajuda relativa ao funcionamento do SPSS.
P g i n a | 11
2.3
BARRA DE ESTADO
Para mostrar ou esconder a barra de estado
Figura 2.4: Barra de estado.
A barra de estado no fundo de cada janela, d informao sobre: O estado do comando: para cada comando ou procedimento indica o nmero de casos processados; O estado do filtro: caso se esteja a analisar parte dos casos apresentada a mensagem Filter on; O estado do peso: a mensagem Weight on indica que se est a utilizar uma varivel ponderada; O estado de um ficheiro particionado: a mensagem Split File on indica que se est a utilizar parte de um ficheiro na anlise.
P g i n a | 12
VISO GERAL DO SPSS
2.4
CAIXAS DE DILOGO
A maior parte dos comandos dos menus do SPSS abre caixas de dilogo. As caixas de dilogo so utilizadas para seleccionar variveis e opes para anlise. Cada caixa de dilogo tem vrias componentes bsicas: Lista de variveis fonte: lista de onde se escolhem as variveis a ser analisadas; Lista(s) de variveis destino: uma ou mais listas onde se encontram as variveis escolhidas para anlise; Botes: botes que executam a anlise ou permitem especificar opes da anlise.
Figura 2.5: Caixa de dilogo para o clculo de frequncias.
P g i n a | 13
2.5
OBTER AJUDA (MENU DE AJUDA)
A informao para esclarecimento de dvidas do utilizador podem ser obtidas
Menu de Help: Todas as janelas do SPSS tm um menu de HELP na barra de menus. A opo Topics acede s fichas de Contents, Index e Find. A opo Tutorial tem umas aulas introdutrias. Menu de ajuda relativo ao contexto: Premindo o boto direito do rato em qualquer item de uma caixa de dilogo, obtm-se ajuda sobre esse item. Boto de Help nas caixas de dilogo: Premindo o boto de Help de uma caixa de dilogo, obtm-se ajuda sobre essa caixa de dilogo.
Figura 2.6: Help.
2.5.1 NAVEGAO NA TABELA DE CONTEDOS
Na barra de menu de qualquer janela do SPSS escolher:
1.
ndice de assuntos: Seleccionar uma ficha e fazer duplo clique num item (representado por um livro) para expandir ou fechar o seu contedo.
Figura 2.7: ndice de assuntos.
P g i n a | 14
VISO GERAL DO SPSS

2. ndice de assuntos: Introduzir o termo a procurar dar um duplo clique no tpico pretendido
Figura 2.8: ndice de assuntos (2).
3.
Pesquisa de palavras/termos: Introduzir as palavras a procurar dar um duplo clique no tpico pretendido para visualizar a informao.
Figura 2.9: Pesquisa de palavras/termos.
P g i n a | 15
2.6
FICHEIROS DE DADOS
O SPSS pode abrir ficheiros criados noutras aplicaes, como o Excel.
Figura 2.10: Abrir ficheiro de dados.
Para as folhas de clculo (Excel) e ficheiros com valores delimitados por TAB, podem ler-se os nomes das variveis da primeira linha do ficheiro ou da primeira linha do intervalo de valores ( range) especificado.
Figura 2.11: Abrir ficheiro Excel.
Considere-se a seguinte folha de clculo do Excel:

Tabela 2-1: Folha de Excel.
P g i n a | 16
VISO GERAL DO SPSS

Indicando as seguintes opes de abertura:
Figura 2.12: Condies de abertura de ficheiro Excel.
Obtm-se a seguinte folha de dados no SPSS:
Tabela 2-2: Folha de dados importada do Excel.
P g i n a | 17
2.7
DEFINIR VARIVEIS
O SPSS permite definir as seguintes caractersticas de uma varivel: O nome da varivel; O tipo da varivel (numrico, texto, data, etc.); Descrio da varivel e dos seus valores; Cdigos especiais para os valores em falta.
Para definir uma varivel fazer duplo clique sobre o topo da coluna correspondente varivel na janela de dados ou premir a Variable View no canto inferior esquerdo do Data Editor:
Figura 2.13: Seleco da Variable View.
Premindo o Tab Variable View surge a seguinte janela:
Figura 2.14: Janela da Variable View.
P g i n a | 18
VISO GERAL DO SPSS NOME DA VARIVEL

O nome das variveis tem no mximo 64 caracteres, deve comear por uma letra e pode ser seguido de letras, nmeros ou os caracteres @, #, _ e $.
TIPO DE VARIVEL
No Tab Variable View, seleccionar a clula Type da varivel que se pretende definir e premir o boto .
Figura 2.15: Definio do tipo de varivel.
Depois de premir o boto surge a janela para definio do tipo de varivel:
Figura 2.16: Seleco do tipo de varivel.
RTULOS (LABELS) DAS VARIVEIS E DOS SEUS VALORES

No Tab Variable View, editar o rtulo da varivel na clula Label da varivel em causa. O rtulo pode ter at 256 caracteres:
P g i n a | 19
Figura 2.17: Rtulo da varivel.
RTULOS (LABELS) DOS VALORES DA VARIVEL

No Tab Variable View, seleccionar a clula Values e premir o boto dos rtulos dos valores da varivel: para aceder janela de definio
Figura 2.18: Rtulos dos valores da varivel.
DEFINIO DOS VALORES EM FALTA (MISSING VALUES)

No Tab Variable View, seleccionar a clula Missing e premir o boto para aceder janela de definio dos valores em falta para a varivel. Os valores em falta no so considerados para efeitos de clculos estatsticos:
P g i n a | 20
VISO GERAL DO SPSS
Figura 2.19: Indicao dos valores em falta.
Os valores em falta podem ser discretos e/ou contnuos:
Figura 2.20: Tipificao dos valores em falta.
DEFINIO DA ESCALA DE MEDIDA DA VARIVEL

No Tab Variable View, seleccionar a clula Measure e escolher a escala de medida pretendida para a varivel (mtrica, ordinal ou nominal):
Figura 2.21: Escala de medida da varivel.
P g i n a | 21
2.8
INTRODUO E EDIO DE DADOS
Na introduo de dados h a considerar o seguinte: Os dados so sempre introduzidos na clula activa que apresentada com um rebordo mais forte; O nome da varivel e o nmero de linha da clula activa so apresentados no canto superior esquerdo da janela Data Editor; O valor da clula activa aparece no campo editor de clula, acima do Data Editor; Os valores introduzidos s so registados quando se pressiona ENTER ou quando se selecciona outra clula; Para introduzir dados no numricos deve alterar-se o tipo de varivel previamente.
Figura 2.22: Janela de Data View.
INSERIR NOVOS CASOS

Para inserir um novo caso (linha) clicar, com o boto direito do rato, no topo da linha acima da qual se pretende inserir o novo caso. Surgir uma janela onde se deve seleccionar a opo Insert Case:
P g i n a | 22
VISO GERAL DO SPSS
Figura 2.23: Insero de novos casos.
INSERIR NOVAS VARIVEIS

Fazer clique, com o boto direito do rato, no topo da coluna direita da qual se pretende inserir o novo caso. Surgir uma janela onde se deve seleccionar a opo Insert Variable:
Figura 2.24: Insero de novas variveis.
P g i n a | 23
2.9
FALTA DE DADOS
Antes de se efectuar a anlise de dados preliminares importante verificar se o ficheiro de dados contm falta de valores (valores missing). Existem dois problemas principais associados com a falta de dados: i. ii. Como saber se h falta de dados (valores missing); Como tratar o problema de falta de dados.
2.9.1 COMO SABER SE H FALTA DE DADOS

Quando o ficheiro de dados contm poucos dados e poucas variveis mais ou menos fcil e rpido observar os dados visualmente e verificar se existem dados em falta e em que variveis e casos. No entanto, quando o ficheiro de dados contm centenas ou milhares de casos e dezenas e/ou centenas de variveis, necessrio despender muito tempo para analisar os valores missing e, dada a dificuldade desta tarefa normal que o investigador cometa erros neste processo. Neste caso, prefervel utilizar o SPSS para encontrar o nmero de casos que apresentam valores missing em cada uma das variveis e que casos so esses.
A verso do SPSS utilizada no IADE no inclui a funcionalidade de anlise de valores missing;
Embora, no seja possvel efectuar uma anlise dos valores missing, sempre que se executa uma anlise sobre uma varivel (ou grupo de variveis) o SPSS apresenta o n. de valores missing para essa varivel: a) A varivel ano escolar mais elevado completado no tem valores missing
Quadro 2-1: Anlise de valores em falta (1).
b) A varivel horas trabalhadas pelo marido na semana passada tem 430 valores missing, representando cerca de 58% dos casos totais da amostra:
Quadro 2-2: Anlise de valores em falta (2).
P g i n a | 24
VISO GERAL DO SPSS
2.9.2 COMO TRATAR O PROBLEMA DE FALTA DE DADOS

Muitas tcnicas estatsticas do SPSS contm opes alternativas para tratar a falta de dados (valores missing), como o apresentado na figura para a tcnica Explore:
Figura 2.25: Tratar a falta de dados.
2.9.2.1
Opo Exclude Cases Listwise
Esta opo retira de todas as anlises todos os casos com falta de dados. A vantagem desta opo que todos os dados analisados so genunos, mas tem a desvantagem de que a dimenso da amostra fica reduzida. Quando uma anlise utiliza um conjunto de variveis, cada uma das quais com falta de alguns dados, esta opo pode fazer baixar muito a dimenso da amostra.
Tabela 2-3: Tabela de dados (com valores em falta).
CASO 1 2 3 4 5 6 7 8 9 10
IDADE 36 -1 23 17 45 -1 34 48 57 22
ANTIG. ORDENADO -1 265 5 230 4 -1 -1 201 4 -1 13 212 -1 205 3 277 6 264 2 197
No caso da Tabela 2-3, que contm apenas 10 casos, constata-se que cada uma das variveis tem um valor missing para trs casos, ou seja, em cada uma das variveis, s 70% dos casos da amostra no tm falta de dados. O comando CORRELATE do SPSS aplicado aos dados da Tabela e utilizando a opo exclude cases listwise, produziu as correlaes entre as variveis que se apresentam no Quadro 2-3. O SPSS vai utilizar apenas os casos sem valores missing em simultneo, neste caso os casos 8, 9 e 10. Este significa que apenas 30% dos casos da amostra so utilizados na anlise, na medida em que o efeito da falta de dados cumulativo quando as variveis tm valores missing em casos diferentes. Daqui resulta que se deve ter cautela com esta opo para resolver o problema da falta de dados .
P g i n a | 25
Quadro 2-3: Coeficientes de correlao (com exclude cases listwise)
2.9.2.2
Opo Exclude Cases Parwise
Esta opo retira os casos s das anlises que utilizam a varivel (ou variveis) com falta de dados e no retira estes casos de todas as anlises. As vantagens desta opo que apenas se usam dados genunos e se maximiza a utilizao dos dados. A desvantagem que a dimenso da amostra varia de uma anlise para outra. Executando o comando CORRELATE agora com a opo Exclude Cases Parwise, obtm-se as correlaes do Quadro 2-4.
Quadro 2-4: Coeficientes de correlao (com exclude cases parwise)
de salientar que estas correlaes apresentam valores diferentes dos obtidos no caso anterior. Neste caso a dimenso da amostra varia de cinco casos at oito. Esta variao da dimenso da amostra pode trazer problemas porque a amostra pode ser, por exemplo, representativa para algumas anlises de dados e no ser representativa para outras. Este problema grave.
2.9.2.3
Opo Replace with Mean
Esta opo substitui os valores missing por valores calculados atravs de diversos mtodos, sendo o mais comum a utilizao da mdia da srie dos valores da varivel, isto , calcula o valor mdio dos valores de uma varivel que tem valores missing e utiliza o valor mdio como o valor da varivel para todas as situaes de missing. P g i n a | 26
VISO GERAL DO SPSS
Figura 2.26: Substituio de valores em falta pela mdia.
A execuo desta opo de replace with mean efectuada atravs da opo Transform na barra de menus:
Figura 2.27: Opo Transform (substituio de valores em falta).
2.9.2.4
Que Opo Utilizar?
O mtodo a utilizar depende de quatro factores: i. ii. iii. iv. A dimenso T da amostra completa (incluindo os casos com falta de dados); A natureza da anlise estatstica que o investigador pretende efectuar; A varivel com maior nmero de valores missing nessa anlise; A distribuio dos casos com falta de dados no conjunto de variveis na anlise.
Para cada anlise que se pretende efectuar, deve-se encontrar, para cada uma das variveis na anlise, o nmero de casos com valores missing. A varivel com maior nmero de casos com falta de dados a varivel crtica (M n. de casos da varivel crtica com falta de dados). Para decidir qual das opes do SPSS a mais adequada para lidar com o problema de falta de dados, sugerese a utilizao das seguintes regras do polegar: a) Quando , razovel utilizar a opo Replace with mean;
) representa uma dimenso da amostra suficiente para fazer a b) Quando , mas ( anlise, razovel utilizar a opo Exclude cases listwise; c) ) representa uma dimenso da amostra insuficiente para fazer a anlise, deve-se Quando ( utilizar a opo Exclude cases parwise; P g i n a | 27
2.10 SELECO DE CASOS

Por vezes, h necessidade de proceder a anlises sem a incluso de todos os casos contidos nas variveis em jogo. Uma situao tpica ter-se verificado que h valores outliers, isto , valores extremos muito elevados ou muito baixos, que provavelmente so registos mal efectuados ou, eventualmente, observaes anmalas que, includas nas anlises estatsticas, vo distorcer a validade das concluses. Desta forma, poder ser prefervel exclu-las das anlises, mas sem as eliminar do ficheiro de dados (antes de se efectuar a anlise de dados preliminares importante verificar se o ficheiro de dados contm falta de valores (valores missing)). O procedimento Select Cases fornece vrios mtodos para a seleco de um subgrupo de casos com base em critrios que incluem variveis e expresses complexas. Os critrios utilizados para definir um subgrupo podem incluir: Valores e intervalos de variveis; Intervalos de data e hora; Nmero de casos (linhas); Expresses Aritmticas; Expresses Lgicas; Funes.
Para executar o procedimento, seleccionar na barra de menus:
Figura 2.28: Seleccionar casos.
As opes possveis para a seleco de casos (Figura 2.29) so: All cases. desactiva filtragem de casos e usa todos os casos. If condition is satisfied. Usa uma expresso condicional para seleccionar os casos. Se o resultado da expresso condicional verdadeiro, o caso est seleccionado. Se o resultado for falso ou est em falta, o caso no seleccionado. Random sample of cases. Selecciona uma amostra aleatria com base numa percentagem aproximada ou um nmero exacto de casos Based on time or case range. Selecciona os casos com base num intervalo de nmeros de casos ou num intervalo de datas/tempo. Use filter variable. Usa a varivel numrica seleccionada do ficheiro de dados como a varivel de filtro. Casos com qualquer valor diferente de 0 ou em falta (missing) para a varivel filtro so seleccionados.
P g i n a | 28
VISO GERAL DO SPSS
Figura 2.29: Seleco de casos.
A rea Output da Figura 2.29 controla o tratamento dos casos no seleccionados. Pode-se escolher uma das seguintes alternativas para o tratamento de casos no seleccionados: Filter out unselected cases. Os casos no seleccionados no so includos na anlise, mas permanecem na base de dados. Estes casos podem ser utilizados mais tarde desactivando a filtragem. Se for seleccionada uma amostra aleatria ou se forem seleccionados os casos com base numa expresso condicional, isso gera uma varivel chamada filter_$ com um valor 1 para os casos seleccionados e um valor 0 para os casos no seleccionados. Copy selected cases to a new dataset. Os casos seleccionados so copiados para um novo conjunto de dados, deixando o conjunto de dados original inalterado. Os casos no seleccionados no esto includos no novo conjunto de dados e so deixados no seu estado original no conjunto de dados original. Delete unselected cases. Os casos no seleccionados so excludos do conjunto de dados. Os casos excludos podem ser recuperados apenas se se sair do ficheiro sem guardar as alteraes e, em seguida, reabrir o ficheiro. A excluso de casos permanente se forem guardadas as alteraes ao ficheiro de dados. Nota: Se os casos no seleccionados forem apagados e se o ficheiro for guardado, os casos no podem ser recuperados posteriormente. Se o objectivo for efectuar algumas anlises apenas para os casos correspondentes aos indivduos do sexo masculino, pode-se seleccionar esses casos atravs da opo If condition is satisfied, conforme apresentado na Figura 2.30:
Figura 2.30: Criao da condio para a seleco de casos.
P g i n a | 29

Na janela do Data View (Figura 2.31) pode-se verificar que os casos excludos (que se mantm na base de dados) apresentam uma barra oblqua no correspondente nmero do caso, sinalizando que o caso no foi seleccionado.
Figura 2.31: Visualizao dos casos excludos.
Todas as anlises efectuadas daqui em diante tomaro em considerao apenas os casos relativos aos indivduos do sexo masculino. Para anular esta seleco deve-se seleccionar a opo All cases.
P g i n a | 30
VISO GERAL DO SPSS
2.11 DIVISO DO FICHEIRO (SPLIT FILE)

O procedimento Diviso do Ficheiro (Split File) divide o ficheiro de dados em grupos distintos para anlise com base nos valores de uma ou mais variveis de agrupamento. Se forem seleccionadas vrias variveis de agrupamento, os casos so agrupados por cada varivel dentro das categorias da varivel anterior na lista Groups Based On. Se, por exemplo, for seleccionado o sexo do respondente como primeira varivel de agrupamento e grau mais elevado como segunda varivel, os casos sero agrupados pela classificao do grau mais elevado dentro de cada categoria de sexo. Para efectuar esta diviso, deve-se seleccionar na barra de menus:
Figura 2.32: Diviso do ficheiro.
Posteriormente, seleccionar as variveis de agrupamento:
Figura 2.33: Seleco de variveis de agrupamento para a diviso de ficheiro.
P g i n a | 31
Compare groups. Os grupos resultantes do procedimento Split file so apresentados em conjunto para efeitos de comparao. Organize output by groups. Todos os resultados de cada procedimento so mostrados separadamente para cada grupo de diviso do ficheiro. Por exemplo, no clculo das da mdia da idade dos respondentes (recorrendo o procedimento Frequencies), obtm-se a informao estruturada de acordo com as variveis de agrupamento, conforme apresentado Quadro 2-5:
Quadro 2-5: Clculo da mdia de uma varivel aps diviso de ficheiro.
P g i n a | 32
Transformao de Dados
3
Transformao de Dados
3.1
TRANSFORMAO DE DADOS
O SPSS permite a criao de uma nova varivel a partir de transformaes sobre outras variveis: Podem criar-se novas variveis ou alterar-se os valores de variveis j existentes; Podem calcular-se valores sobre apenas uma parte dos casos, baseando-se em condies lgicas; Podem usar-se mais de 70 funes pr-existentes: funes aritmticas, estatsticas, de distribuio e de manipulao de caracteres.
3.2
CLCULO DE UMA VARIVEL
Na barra de menus escolher:
Introduzir o nome da varivel destino, que pode j existir, ou ser uma varivel nova; Construir a expresso escolhendo as funes na lista de funes e os operadores na lista de operadores. Opcionalmente pode digitar a expresso a partir do teclado.
Figura 3.1: Calcular uma varivel.
P g i n a | 34
TRANSFORMAO DE DADOS SUBCONJUNTO DE CASOS

Premindo o boto If pode introduzir-se uma expresso condicional que limita o nmero de casos calculados a um subconjunto determinado. O exemplo seguinte, selecciona apenas os casos do sexo feminino (1) e que trabalham na seco de produo (2).
Figura 3.2: Condio para clculo da varivel.
OPERADORES LGICOS E ARITMTICOS
Figura 3.3: Operadores lgicos e aritmticos.
P g i n a | 35
3.3
RECODIFICAO DE VARIVEIS
A recodificao de variveis muito til na combinao de categorias. A recodificao pode assumir trs formas diferentes: 1. 2. 3. Recodificao na mesma varivel; Recodificao numa varivel diferente; Recodificao automtica.
3.3.1 RECODIFICAO NA MESMA VARIVEL

Figura 3.4: Recodificao na mesma varivel.
Seleccionar as variveis que se pretendem recodificar; Premir o boto Old and New Values para especificar a recodificao:
Figura 3.5: Seleco da varivel a recodificar.
Figura 3.6: Recodificao de uma varivel.
P g i n a | 36
TRANSFORMAO DE DADOS
3.3.2 RECODIFICAO NUMA VARIVEL DIFERENTE

Figura 3.7: Recodificao numa varivel diferente.
Seleccionar as variveis que se pretendem recodificar; Introduzir o nome da nova varivel e premir o boto Change; Premir o boto Old and New Values para especificar a recodificao:
Figura 3.8: Seleco da varivel a recodificar noutra varivel diferente.
Figura 3.9: Velhos e novos valores da nova varivel.
P g i n a | 37
3.3.3 RECODIFICAO AUTOMTICA

O SPSS recodifica automaticamente variveis do tipo String (texto) ou numricas em nmeros inteiros consecutivos. Na barra de menus escolher:
Figura 3.10: Recodificao automtica.
Escolher varivel; Digitar novo nome; Premir Add New Name:
Figura 3.11: Recodificao automtica.
P g i n a | 38
Explorao e Cruzamento de Variveis
4
Explorao e Cruzamento de Variveis
4.1
RESUMO DE UMA DISTRIBUIO
Figura 4.1: Explore.
Seleccionar a varivel (ou variveis) que se pretende explorar e coloc-la na lista de variveis dependentes; Seleccionar a varivel que define os grupos de casos e mov-la para a lista de factores.
Exemplo: a) Pretende-se analisar a satisfao no emprego por idade.
Figura 4.2: Seleco de variveis.
P g i n a | 40
EXPLORAO E CRUAZAMENTO DE VARIVEIS

b) Depois de indicadas as variveis e premido o boto OK, obtm-se o seguinte resultado:
Quadro 4-1: Resultado do comando explore.
c)
Leitura da tabela (Quadro 4-1): Verifica-se que existem 325 casos na categoria muito satisfeito para os quais a idade est disponvel. O nmero de casos em falta de 2 (dois). Isto significa que 2 casos muito satisfeito no tm um valor vlido para a varivel idade. Este nmero representa apenas 0,6% do total de casos, pelo que o seu efeito de somenos importncia. O nmero de casos varia consideravelmente entre os quatro grupos: mais de 300 indivduos dizem-se moderadamente satisfeito; 74 esto um pouco insatisfeito; e apenas 26 esto muito satisfeito. As concluses extradas sobre os ltimos dois grupos tm que ser cuidadosas, pois so baseadas num pequeno nmero de casos.
O Quadro 4-2 apresenta o resultado das estatsticas sobre os grupos de casos:

Quadro 4-2: Estatsticas (comando explore).
P g i n a | 41
As mdias das idades variam do valor mais elevado de 41,5 no grupo muito satisfeito, at ao valor mais baixo de 38,58 no grupo muito insatisfeito. O valor das medianas sensivelmente mais baixo para todos os grupos porque as distribuies de idade tm caudas nos valores mais elevados de idade. A mdia aparada (trimmed mean) evita este problema pois exclui os valores mais elevados, assim como os mais baixos. Na 5% trimmed mean, apenas so considerados 90% dos casos no centro da distribuio, excluindo-se os 5% do extremo superior e os 5% do extremo inferior. O desvio padro mais elevado pertence ao grupo muito satisfeito, pois este contm o valor de idade mais elevado: 82 anos. A linha Range d-nos a amplitude de idades do grupo. O Interquartile Range d-nos a amplitude de idades do grupo, medida entre os percentis 25 e 75, no sendo por isso afectado pelos valores extremos.
4.2
VALORES EXTREMOS
Para identificar os valores extremos deve-se premir o boto Statistics na caixa de dilogo Explore e seleccionar a opo Outliers:
Figura 4.3: Obter valores extremos.
O Quadro 4-3 apresenta os valores extremos para o grupo muito satisfeito:

Quadro 4-3: Anlise de valores extremos.
P g i n a | 42
4.3
PERCENTIS
Com o Explore podem obter-se os percentis para cada grupo. Procedimento: Premir o boto Statistics na caixa de dilogo Explore e seleccionar a opo Percentiles
Figura 4.4: Obter percentis.
Resultados:
Quadro 4-4: Anlise de percentis.
P g i n a | 43
4.4
HISTOGRAMA
Para obter o Histograma deve-se premir o boto Plots na caixa de dilogo Explore e seleccionar a opo Histogram.
Figura 4.5: Obter histograma.
Figura 4.6: Histograma.
P g i n a | 44
4.5
GRFICO DE CAULE E FOLHAS
Para obter o Histograma deve-se premir o boto Plots na caixa de dilogo Explore e seleccionar a opo Stemand-leaf.
Figura 4.7: Obter grfico de caule e folhas.
Figura 4.8: Grfico de caule e folhas.
Se a largura do caule (stem width) fosse 100, ento os valores do tronco de valor 6 seriam 600, 610 e 630.
P g i n a | 45
4.6
CAIXA DE BIGODES
Para obter a Caixa de Bigodes deve-se seleccionar a opo Plots ou Both na caixa de dilogo Explore.
Figura 4.9: Obter caixa de bigodes.
Figura 4.10: Caixa de bigodes.
P g i n a | 46
4.7
CRUZAMENTO DE VARIVEIS
Uma tabela de frequncias insuficiente para visualizar o grau de satisfao no emprego por cada categoria de salrio. Para isso h necessidade de recorrer ao cruzamento de variveis. Na barra de menus escolher:
Figura 4.11: Cruzamento de variveis.
Seleccionar a varivel (ou variveis) que vai ocupar as linhas da tabela e coloc-la em Row(s); Seleccionar a varivel (ou variveis) que vai ocupar as colunas da tabela e coloc-la em Column(s).
Figura 4.12: Seleco de variveis para cruzamento.
Podem mover-se diversas variveis para as listas de linhas ou colunas para obter mltiplos cruzamentos bivariados. Para visualizar trs ou mais variveis em simultneo, devem-se colocar as variveis adicionais em camadas sucessivas (layers). P g i n a | 47
CRUZAMENTO DE SAT_EMP COM RECEITA4

Quadro 4-5: Resultado do cruzamento de duas variveis.
CRUZAMENTO DE SAT_EMP COM RECEITA4 POR SEXO
Figura 4.13: Seleco de variveis para cruzamento por camada (layer).
P g i n a | 48
Quadro 4-6: Resultado do cruzamento de trs variveis.
P g i n a | 49
4.8
PERCENTAGENS DE LINHA E COLUNA
Para que seja possvel visualizar as percentagens das clulas deve-se premir o boto Cells na caixa de dilogo Crosstabs e seleccionar as opes Row, Column ou Total.
Figura 4.14: Obter percentagens.
Quadro 4-7: Anlise de percentagens.
P g i n a | 50
4.9
VISUALIZAO GRFICA
Os resultados do cruzamento de variveis podem ser apresentados graficamente.
a)
Em valores absolutos Na barra de menus escolher:
Escolher Stacked e premir Define; Escolher a varivel receita4 para o eixo das categorias; Escolher a varivel sat_emp para a definio dos clusters.
Figura 4.15: Seleco de grficos.
Figura 4.16: Seleco de variveis para visualizao grfica.
P g i n a | 51
Figura 4.17: Grfico de barras empilhadas.
b) Em valores relativos
Para apresentar a percentagem de casos, as variveis devem ser escolhidas por ordem inversa. Depois, no editor de grficos deve fazer-se
Figura 4.18: Grfico em percentagem.
P g i n a | 52
Figura 4.19: Grfico de barras empilhadas em percentagens.
Desta forma, consegue-se comparar a distribuio inspeccionando as barras para cada grupo. Observa-se que o grupo das pessoas com menor rendimento o que possui menor percentagem de indivduos muito satisfeito com o seu emprego. Representam tambm a menor percentagem de indivduos muito insatisfeito. Pode ver-se que a soma das percentagens dos indivduos muito satisfeito e moderadamente satisfeito sensivelmente a mesma para os quatro grupos.
P g i n a | 53
Variveis de Resposta Mltipla
5
Variveis de Resposta Mltipla
5.1
INTRODUO
Por vezes nos inquritos surgem questes em que possvel recolher mais que uma resposta, as chamadas Respostas Mltiplas. Para resolver essa questo o SPSS possui uma funo que permite criar variveis para analisar essas respostas, as Variveis de Respostas Mltiplas (VRM). Este tipo de variveis pode ser recolhido de duas formas.
5.2
QUESTES DE DICOTOMIA MLTIPLA
Caso tpico: o inquirido confrontado com um campo com diversos itens devendo seleccionar aqueles que se aplicam sua situao. Por exemplo, numa questo ligada s razes de emigrao o indivduo pode apresentar mais do que uma razo. No caso de um campo de seleco, isso significaria que existiria uma listagem com as vrias opes, das quais os indivduos seleccionariam as suas razes. As variveis assim codificadas so designadas como questes de dicotomia mltipla, uma vez que cada item possui dois estados - seleccionado ou no. O primeiro passo para a anlise deste gnero de variveis a criao de uma varivel para cada uma das opes. Todas as variveis estaro codificadas com 1 = sim, 2 = no.
PROCESSO DE CRIAO DAS VRM.

Figura 5.1: Definir VRM dicotmica.
Surgir ento a caixa de dilogo Define Multiple Response Sets. O primeiro passo a escolha das variveis que devem pertencer ao conjunto. No lado esquerdo est o conjunto total das variveis da base de dados (Set Definition), no qual se seleccionam aquelas que se desejam analisar como VRM e que passaro para a janela da direita (Variables in Set) pressionando o boto Como se est perante questes de dicotomia mltipla, na caixa Variables Are Coded As escolhe-se a opo Dichotomies. Na caixa Counted value digita-se o valor 1, o qual est codificado como sim, pois esta a opo que deseja contabilizar. Em baixo existem duas caixas de texto onde se pode indicar o nome e o label da varivel. A seguir pressiona-se o boto Add para adicionar este conjunto de variveis ao conjunto das respostas mltiplas, sobre o qual se podem realizar tabelas de frequncias
P g i n a | 56
Figura 5.2: Criao de VRM dicotmica.
TABELA DE FREQUNCIAS
Figura 5.3: Calcular tabela de frequncias de VRM.
Seguidamente, na janela Multiple Response Frequencies seleccionar a VRM sobre a qual se pretende calcular a tabela de frequncias, indicando se pretende excluir os missing values.
Figura 5.4: VRM a seleccionar para clculo P g ide n a | 57 frequncias.

Depois de clicar em OK, surge a tabela de frequncias, a qual deve ser interpretada do seguinte modo:
Figura 5.5: Missing values na VRM.
A tabela Case Summary d a indicao dos missing values, que se referem aos indivduos que no apresentaram qualquer razo para desejar emigrar. No caso do exemplo, todos os indivduos apresentaram, pelo menos, uma razo para emigar (no existem missing values).
Figura 5.6: Frequncias de uma VRM.
A coluna Respondes N apresenta o nmero de vez que cada motivo foi seleccionado como razo do desejo de emigrar. A coluna Responses Percent d a percentagem do total de problemas que foi atribuda a cada problema especfico, enquanto a coluna Percent of Cases d a percentagem de inquiridos (que seleccionaram pelo menos uma razo de emigrao) que mencionaram cada uma das razes. Por exemplo, 5 pessoas responderam que ganhar pouco uma das suas motivaes para emigrar. Assim, das pessoas que apresentaram alguma motivao para emigrar, 50% apresentaram estar a ganhar pouco como uma das razes. Se pretendermos analisar em termos de % de cada resposta, pode-se dizer que no total de 17 opes, 29,4% das motivaes esto ligadas ao facto de ganhar pouco. Normalmente, a informao que apresenta maior utilidade em termos de anlise estatstica aquela que se encontra relacionada com a percentagem de casos, j que natural que com a possibilidade de resposta mltipla o nmero de respostas exceda o nmero de casos, pelo que a percentagem no dever ser calculada em funo do nmero de respostas, mas sim do nmero de inquiridos.
5.3
QUESTES DE CATEGORIA MLTIPLA
Nesta opo, trata-se de uma situao em que o inquirido confrontado com um campo com diversos itens, podendo contemplar vrias respostas em simultneo, por exemplo Quando tem problemas econmicos a quem recorre?. Em primeiro lugar, devem-se inserir os casos segundo a figura abaixo, ou seja, definir tantas variveis quanto as hipteses de resposta (neste caso, sete), s preenchendo os casos que efectivamente correspondem a uma resposta.
P g i n a | 58
Figura 5.7: Definio de VRM - Categoria
PROCESSO DE CRIAO DAS VRM.

Repetir os procedimentos indicados anteriormente, mas ao contrrio da primeira opo, na caixa Variables Are Coded As escolhe-se a opo Categories e a preferncia Range 1 through 7 (hipteses de resposta no presente exemplo):
Figura 5.8: Criao de VRM categrica.
P g i n a | 59
MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS TABELA DE FREQUNCIAS / CRUZAMENTO DE VARIVEIS

O processo de clculo de tabelas de frequncias com VRM categricas idntico ao efectuado para as VRM dicotmicas. Tambm possvel calcular tabelas de cruzamento de variveis utilizando VRM, quer dicotmicas quer categricas. O processo semelhante ao processo de criao de uma tabela que usa variveis normais. A nica diferena que a varivel VRM no se encontra na janela junto ao canto superior esquerdo, mas sim na janela designada Multiple Response Sets que se situa imediatamente abaixo dessa janela.
Figura 5.9: Cruzamento de variveis com VRM.
P g i n a | 60
Testes de Hipteses (Teoria da Deciso)
6
Testes de Hipteses
(Teoria da Deciso)
6.1
REGRA DE DECISO
Um teste de hipteses um procedimento cuja finalidade fornecer uma regra de deciso, com determinada probabilidade, permitindo escolher entre duas hipteses estatsticas, com base em resultados obtidos da amostra. Designa-se por hiptese nula (H0) a hiptese da no diferena (status quo), ou seja, aquela que sujeita ao teste, por oposio hiptese alternativa (Ha) que a hiptese da diferena. S depois de se obter resultados na amostra que se toma a deciso de rejeitar ou no rejeitar a hiptese nula. Nos ensaios de hipteses h duas hipteses mutuamente exclusivas e exaustivas, a hiptese nula ( H0) e a hiptese alternativa (Ha) e quatro resultados possveis: Duas decises correctas: - No rejeitar a hiptese nula quando ela verdadeira; - Aceitar a hiptese alternativa quando ela verdadeira Dois tipos de erros: - Erro tipo I - Erro tipo II;
O erro tipo I, tambm designado por alfa () ou o nvel de significncia (sig ou p) a probabilidade de rejeitar erradamente a H0, isto , a probabilidade de rejeitar H0 sabendo que H0 verdadeiro. ( )
O erro tipo II, tambm designado por beta () a probabilidade de rejeitar incorrectamente Ha, isto , a probabilidade de rejeitar Ha sabendo que Ha verdadeiro. ( )
Os dois tipos de erro variam em sentido contrrio, ainda que com intensidades diferentes. Como so probabilidades, variam sempre entre 0 e 1. Ao complemento aritmtico de chama-se funo potncia:
A qual informa sobre a probabilidade de rejeitar correctamente H 0, ou seja, sobre a confiana com que se aceita a hiptese alternativa. Embora a potncia de um teste possa ser muito elevada, tal no obriga verificao da hiptese alternativa. Sabe-se apenas que existe uma grande confiana em que se verifique H a. A hiptese nula considerada verdadeira at prova em contrrio.
Quadro 6-1: Regra da deciso.
Deciso vs Realidade No se rejeita H0 Rejeita-se H0
H0 Verdadeira Deciso acertada Erro tipo I
H0 Falsa Erro tipo II Deciso acertada
P g i n a | 62
TESTES DE HIPTESES (TEORIA DA DECISO)
6.2
PROCEDIMENTOS DOS TESTES
Relativamente ao procedimento genrico dos testes, primeiro h que estabelecer as hipteses estatsticas, de acordo com a hiptese experimental que surge do problema. Seguidamente, necessrio escolher o melhor estimador do parmetro em causa e estudar a sua lei de distribuio, ou seja, seleccionar a estatstica teste, admitindo que a hiptese nula se verifica. Depois, calcula-se a estatstica teste para a amostra concreta. A nvel terico, necessrio estabelecer a regio de rejeio da hiptese nula, com base no nvel de significncia e no tipo de teste e comparar o valor da estatstica teste com a regio de rejeio. Fixando um determinado nvel de significncia () normalmente 1% (0,01), 5% (0,05) ou 10% (0,10) a regio de rejeio encontra-se associada a essa probabilidade de rejeitar uma hiptese nula verdadeira. Ao diminuir o torna-se mais difcil rejeitar a hiptese nula, ou seja, diminui a regio de rejeio. Note-se que aumentando a dimenso da amostra (N), diminui-se igualmente o erro de tipo I associado deciso (pelo que as grandes amostras sejam preferidas s pequenas amostras, quando se pretende detectar efeitos significativos).
6.2.1 TESTES DE HIPTESES NO SPSS

No SPSS o processo dos testes de hipteses est bastante simplificado, no sendo necessrio definir regies de rejeio nem consultar tabelas estatsticas. Neste caso, a estatstica teste encontra-se associada a uma probabilidade de significncia (sig. ou p-value), que se compara directamente com o nvel de significncia ( ) previamente definido. A probabilidade de significncia a probabilidade de obter o valor especfico da estatstica teste caso se verifique a hiptese nula, ou seja, caso no exista efeito no modelo (igualdade). Desta forma, valores muito baixos de probabilidade de significncia implicam que, muito provavelmente, a hiptese nula no deve ser verdadeira. Se sig. for inferior a , rejeita-se a hiptese nula, caso contrrio no existe evidncia estatstica para o fazer. Para terminar o procedimento, retiram-se as concluses de acordo com o enunciado do problema.
6.3
TESTES BILATERAIS E UNILATERAIS
6.3.1 TESTES BILATERAIS (TWO-TAILED)

Se o valor do erro tipo I associado ao teste (sig), for menor ou igual ao escolhido pelo analista (p), rejeita-se a hiptese nula e aceita-se a hiptese alternativa. Se o valor do erro tipo I associado ao teste (sig), for maior que o escolhido pelo analista (p), no se rejeita a hiptese nula.
Sempre que Ha tem o sinal diferente, est-se perante um teste bilateral ou de regio crtica bilateral. Rejeita-se a hiptese nula tanto para valores superiores como inferiores aos estabelecidos em H 0.
P g i n a | 63
6.3.2 TESTES UNILATERAIS (ONE-TAILED)

Se (sig/2) for menor ou igual ao erro tipo I escolhido pelo analista (p), rejeita-se a hiptese nula e aceita-se a hiptese alternativa. Caso contrrio no se rejeita a hiptese nula.
Sempre que Ha inclua o sinal maior (>) ou menor (<), est-se perante um teste unilateral ou de regio crtica unilateral.
O valor que o investigador escolhe para o erro tio I (p), normalmente p = 0,01; p = 0,05; p = 0,10, deve ser determinado por sua prpria estimativa, em funo da importncia prtica dos resultados e da maior potncia do teste, ou seja, do menor erro .
P g i n a | 64
Regresso Linear
7
Regresso Linear
7.1
INTRODUO
Os objectivos da regresso linear so: Mostrar de que forma as variveis independentes explicam as variveis dependentes; Fazer previses sobre as variveis dependentes a partir dos valores das independentes.
A relao linear entre duas variveis contnuas pode ser aferida atravs do coeficiente de correlao ou do modelo de regresso linear. Deve construir-se um quadro (diagrama de disperso) a partir dos pares de valores (X, Y) de variveis independente e dependente. Funes do diagrama de disperso: Ajudar a determinar se existe relao entre as variveis; Permitir identificar a equao matemtica mais apropriada para descrever essa relao (linear, exponencial, logartmica, potncia, etc.).
A relao linear entre duas variveis pode ser descrita atravs da equao:
Em que: ................... : varivel dependente ................... : varivel independente ................... : varivel residual (inclui factores exteriores ao modelo e erros de medio) ................... : parmetro ordenada na origem ................... : parametro declive
7.2
COEFICIENTE DE CORRELAO DE PEARSON
Um coeficiente de correlao superior a 0,5 (em valor absoluto) mostra uma correlao forte entre as variveis, enquanto um coeficiente de correlao inferior a 0,5 (em valor absoluto) mostra uma correlao fraca entre as variveis.
P g i n a | 66
REGRESSO LINEAR
7.3
1.
REGRESSO LINEAR NO SPSS

Introduo dos dados
Figura 7.1: Dados para clculo da regresso.
2.
Na barra de menus seleccionar:
Figura 7.2: Regresso linear.
3.
Seleccionar as variveis dependente e independente:
Figura 7.3: Seleco de variveis para clculo da regresso.
P g i n a | 67

4. Aps premir o boto OK, obtm-se o seguinte quadro de resultados (Quadro 7-1):
Quadro 7-1: Resultado do clculo da regresso.
De onde se extraem os valores 6,163 e 0,093 para
e , respectivamente.
7.4
ANLISE GRFICA
Seleccionar Simple e premir Define;
Figura 7.4: Seleco do tipo de grfico.
Seleccionar a varivel dependente para o eixo Y; Seleccionar a varivel independente para o eixo X; Em Label Cases by colocar o nome da varivel que vai identificar os pontos nos grficos.
P g i n a | 68
REGRESSO LINEAR
Figura 7.5: Seleco das variveis para o grfico.
Para identificar os pontos, editar o grfico e usar a View Data Labels. O resultado o seguinte:
Figura 7.6: Edio do grfico.
P g i n a | 69
7.5
RECTA DE REGRESSO
Para visualizar a recta de regresso, fazer duplo clique no grfico no Output Viewer para obter o Chart Editor:
Figura 7.7: Definir a recta de regresso.
em Fit Line escolher Total em Fit Options escolher Linear regression
Para alterar a gama de valores representados, fazer duplo clique no grfico no Output Viewer para obter o Chart Editor: Para a gama do eixo X, escolher X scale. Modificar os valores mnimo e mximo de Range Para a gama do eixo Y, proceder do mesmo modo.
Figura 7.8: Recta de regresso.
P g i n a | 70
REGRESSO LINEAR
7.6
VALORES PREVISTOS E VALORES RESIDUAIS
Os valores previstos pela recta so diferentes dos valores reais para cada caso. A diferena entre os dois constitui o valor residual. O SPSS calcula os valores previstos pelo modelo linear, assim como os valores residuais. Na caixa de dilogo Linear Regression escolher a opo Save. Em Predicted Values e Residuals seleccionar as opes Unstandardized. Premir o boto Continue.
Figura 7.9: Valores previstos e residuais.
So criadas as variveis pre_1 e res_1, respectivamente, com os valores previstos e residuais para cada caso. possvel visualizar os valores previstos junto dos valores reais. Na barra de menus escolher:
P g i n a | 71
Figura 7.10: Visualizar os valores previstos e residuais.
Seleccionar as variveis a analisar e mov-las para a lista de variveis.
Figura 7.11: Seleco de variveis para anlise.
P g i n a | 72
REGRESSO LINEAR
Quadro 7-2: Anlise dos valores previstos e residuais.
Neste caso, o modelo afirma que:
expresso a partir da qual se podem calcular os valores previstos pelo modelo e respectivos valores residuais.
7.7
COEFICIENTE DE CORRELAO
A tabela seguinte, apresentada como um dos resultados do clculo de regresso linear, d-nos o valor do coeficiente de correlao (R), assim como o seu quadrado (R Square).
Quadro 7-3: Coeficiente de correlao.
P g i n a | 73
Teste de Independncia do Qui-Quadrado
8
Teste de Independncia do Qui-Quadrado
8.1
INTRODUO
O teste do Qui-Quadrado utilizado para variveis nominais ou ordinais. Neste tipo de dados por categorias, no faz sentido calcular alguns indicadores como mdias, da trabalhar-se com as frequncias (nmero de ocorrncias de uma determinada categoria da varivel). O teste verifica se existe ou no relao entre duas variveis. Existem vrios tipos de teste do Qui-Quadrado, mas todos comparam o valor observado na amostra com o chamado valor esperado (valor que ocorre caso no exista ligao entre as variveis). Tanto os testes de independncia do Qui-Quadrado como os resduos ajustados estandardizados permitem analisar a relao de independncia entre variveis qualitativas. As hipteses dos testes de independncia so:
O teste do Qui-Quadrado apenas informa sobre a independncia entre as variveis, mas nada diz sobre o grau de associao existente.
8.1.1 REQUISITOS PARA A VALIDADE DO TESTE

Nenhuma clula da tabela deve ter frequncia esperada inferior a 1; No mais do que 20% das clulas devem ter frequncia esperada inferior a 5 unidades; Em tabelas de 2 2 no deve existir nenhuma clula com frequncia esperada inferior a 5.
Se os pressupostos no forem garantidos, o nvel de significncia observado pode ser correcto ou enganador, dependendo respectivamente da pequena ou elevada contribuio das clulas com Fe < 5 para o valor do teste. Se o pressuposto das frequncias esperadas inferior a 5 for violado, compara-se o valor do teste do 2 nessas clulas (Fe < 5)com o valor do mesmo teste contando com todas as clulas.
8.1.2 CASO DO TESTE DO QUI-QUADRADO DE INDEPENDNCIA

Caso: Pretende-se estudar a relao dos adeptos do Benfica e do Sporting para com o respectivo estdio, especificamente, a assiduidade desses adeptos aos jogos. Foi recolhida uma amostra de 200 respostas, das quais 78 de scios e simpatizantes do Sporting e 122 do Benfica, em que era perguntado a esses adeptos se iam ou no ao estdio com frequncia.
8.1.2.1
Tratamento dos Dados
A base de dados no SPSS pode ser criada de duas formas distintas: a) Mtodo 1 Criao de duas variveis: clube e estdio; Listar as 200 ocorrncias com cada uma das respostas dos adeptos (clube e ir ou no ao estdio)
P g i n a | 76
TESTE DE INDEPENDNCIA DO QUI-QUADRADO

Tabela 8-1: Dados para anlise.
b) Mtodo 2 Criao de trs variveis: clube, estdio e frequncia (varivel que representa o nmero de ocorrncia para cada categoria de clube/estdio (implica um tratamento prvio de contar o nmero de ocorrncias por categoria); No SPSS carregam-se apenas quatro casos, correspondentes s quatro categorias possveis.
Tabela 8-2: Dados para anlise agrupados.
Antes de se executar o procedimento de clculo do teste do Qui-Quadrado necessrio efectuar no SPSS os seguintes comandos:
Figura 8.1: Ponderao de casos.
Nota: Para o caso do mtodo 1, no necessrio executar estes comandos. P g i n a | 77
MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS 8.1.2.2 Clculo do Teste
Executar os seguintes comandos: a) Seleccionar a opo Crosstabs e indicar as variveis para figurar em linha e coluna:
Figura 8.2: Seleco de variveis.
b) Na caixa Statistics seleccionar Chi-square e na caixa Cells seleccionar em Counts: Observed e Expected:
Figura 8.3: Seleco da estatstica qui-quadrado.
P g i n a | 78
TESTE DE INDEPENDNCIA DO QUI-QUADRADO

Os resultados so os apresentados no Quadro 8-1 e no Quadro 8-2:
Quadro 8-1: Resultado do cruzamento das variveis.
Quadro 8-2: Resultados do teste do qui-quadrado.
A hiptese nula ser: existe independncia entre filiao clubstica (Benfica, Sporting) e ida habitual ao estdio para assistir a jogos (no vai, vai); A hiptese alternativa ser: existe relao entre filiao clubstica (Benfica, Sporting) e ida habitual ao estdio para assistir a jogos (no vai, vai); A tabela de contingncia (crosstabulation) - Quadro 8-1 - mostra os valores observados (count) e esperados (expected count) para as duas variveis: clube e estdio. Verifica-se que, a nvel descritivo, a amostra total composta por 200 indivduos as frequncias marginais indicam que 78 so adeptos do Sporting e 122 so adeptos do Benfica e tambm que 96 no vo habitualmente ao estdio e 104 vo habitualmente ao estdio ver jogos. Alm disso, dos Sportinguistas, 32 no frequentam habitualmente o estdio e 46 frequentam, enquanto que, relativamente aos Benfiquistas, 64 no frequentam o estdio e 58 frequentam. Seria ainda possvel pedir os valores percentuais por linha, por coluna e totais na caixa Cells. O teste do Qui-quadrado de independncia apresenta um valor de 2,492 e uma significncia de 0,114, o que mostra que no existe relao entre a filiao clubstica e o hbito de ir ao estdio ver jogos [ ( ) ]. Quando as amostras so grandes (como aqui), no necessrio activar a caixa do teste exacto. Para o caso de tabelas (como este), normalmente apresentado o valor do teste com correco de continuidade, embora esse valor seja manifestamente conservador em termos estatsticos (por isso , em geral, ignorado). Note-se que, caso exista relao entre as variveis, o teste do Qui-quadrado no mostra isoladamente quais as clulas especficas da tabela que esto relacionadas, o que torna desaconselhvel usar o teste em variveis com demasiadas categorias (muitas linhas e/ou colunas). P g i n a | 79
Anexo A Edio de Tabelas
A
Edio de Tabelas

Ao executar o procedimento Explore (idade como varivel dependente e sat_emp como varivel de agrupamento) no Output Viewer surge um mapa com a seguinte estrutura:
Como este mapa no de fcil leitura, aconselhvel mudar a sua estrutura. Neste caso pode-se mudar a varivel sat_emp para a coluna, com as correspondentes estatsticas.
Para isso deve-se: a) Seleccionar o mapa (clicar em cima do mapa pretendido); b) Fazer duplo clique sobre o mapa, obtendo-se uma janela com uma Pivot Table
P g i n a | 82
ANEXO A EDIO DE TABELAS
c)
No menu da Pivot Table seleccionar
Movendo as variveis de linha para coluna e vice-versa, obtm-se um layout do tipo:
P g i n a | 83
A que corresponde um mapa do seguinte tipo:
P g i n a | 84
Anexo B Assimetria e Achatamento
B
Assimetria e Achatamento
Medidas de Assimetria
Na utilizao de questionrios para recolha de dados fundamental ter uma ateno redobrada sobre as caractersticas desses instrumentos. Por norma, desenvolvem-se escalas se onde colocam afirmaes cujas respostas podem assumir vrias modalidades: 1 (discordo totalmente), 2 (discordo), 3 (no concordo nem discordo), 4 (concordo) e 5 (concordo totalmente). Para que as pessoas no respondam, num mesmo item, a mesma coisa, necessrio que a pergunta esteja construda para que se obtenham respostas diversificadas (1, 2, 3, 4, 5). As medidas de assimetria permitem precisamente calcular as inclinaes e as modalidades de resposta e, neste sentido, deve-se estar atento ao comportamento dos resultados. No se pretendem resultados em que a maior parte das pessoas responda 4 (concordo) e 5 (concordo totalmente), existindo nesse caso uma assimetria negativa. Outro caso indesejvel seria todas as pessoas responderem 1 (discordo totalmente) ou 2 (discordo), sucedendo o caso de uma assimetria positiva. Do ponto de vista terico, o desejvel haver um equilbrio, j que a assimetria diz respeito ao grau de enviesamento -desvio lateral -de uma distribuio. O coeficiente de assimetria no tem interpretao directa, pelo que deve ser dividido pelo erro padro associado, originando um valor designado z-score. Este valor estandardizado -com media zero e desvio-padro unitrio pode ser comparado com valores baseados na distribuio normal atravs de um teste de hipteses. Quanto mais esse valor se distanciar de zero, maior ser o grau de assimetria da distribuio. Para simplificar a explicao, os valores que se seguem so baseados em nveis de significncia de 0,05: i. ii. iii. Distribuio simtrica -caso em que o z-score tende para o valor zero; Distribuio enviesada esquerda (assimtrica positiva) -caso em que o z-score esta acima de 1,96; Distribuio enviesada direita (assimtrica negativa) -caso em que o z-score esta abaixo de -1,96.
Medidas de Achatamento (Curtose)

Alm da preocupao com a simetria das distribuies, tambm se deve prestar ateno s dimenses de curtose (achatamento). desejvel que haja uma pequena percentagem de resposta nas modalidades de extremo 1 (discordo totalmente) e 5 (concordo totalmente) que v aumentando para as outras modalidades de resposta 2 (discordo) e 4 (concordo) e assuma um valor mais elevado em 3 (no concordo nem discordo). Essa evoluo sendo gradual e simtrica permite o aparecimento de uma curva de distribuio normalizada que se assemelha a um "sino" (distribuio mesocrtica). Em algumas situaes, sucede que 20% das pessoas responde 1, 20% responde 2, 20% responde 3, 20% responde 4 e 20% responde 5. Isso permite uma distribuio algo achatada a que se d o nome de platicrtica. Poder ainda acontecer que 50% das pessoas responda 3 (no concordo nem discordo), 40% responda 4 (concordo) e 10 % responda 4 (concordo totalmente) e isso permite uma curva com tendncia pontiaguda ou alongada considerando o eixo das ordenadas. Tanto as distribuies leptocrticas como platicrticas no so desejveis. De acordo com este exemplo, pode-se considerar que a curtose diz respeito ao grau de achatamento de uma distribuio. Tal como na assimetria, o coeficiente de curtose no tem interpretao directa, devendo igualmente ser dividido pelo erro padro associado, dando origem um z-score cuja interpretao muito semelhante ao caso da assimetria. Mais uma vez, os valores que se seguem so baseados em nveis de significncia de 0,05: i. ii. iii. Distribuio mesocrtica - caso em que o z-score tende para o valor zero; Distribuio leptocrtica (tendncia pontiaguda) -caso em que o z-score esta acima do valor 1,96; Distribuio platicurtica (tendncia achatada) -caso em que o z-score esta abaixo de -1,96.
P g i n a | 86

Análise de dados com SPSS

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análise de dados com SPSS

Enviado por

Direitos autorais:

Formatos disponíveis

IADE-U Instituto de Arte, Design e Empresa - Universitrio

LICENCIATURA EM MARKETING E PUBLICIDADE

Prof. Doutor Joaquim Casaca Setembro de 2012

VISO GERAL DO SPSS................................................................................................ 7

2.5.1 2.6 2.7 2.8 2.9

2.9.1 2.9.2 2.10 2.11

SELECO DE CASOS ................................................................................................................... 28 DIVISO DO FICHEIRO (SPLIT FILE) ................................................................................................ 31

TRANSFORMAO DE DADOS .................................................................................. 33

3.3.1 3.3.2 3.3.3

EXPLORAO E CRUZAMENTO DE VARIVEIS ........................................................... 39

VARIVEIS DE RESPOSTA MLTIPLA ......................................................................... 55

TESTES DE HIPTESES (TEORIA DA DECISO) ............................................................ 61

REGRESSO LINEAR ................................................................................................. 65

TESTE DE INDEPENDNCIA DO QUI-QUADRADO ....................................................... 75

ANEXO A EDIO DE TABELAS ...................................................................................... 81 ANEXO B ASSIMETRIA E ACHATAMENTO ...................................................................... 85

Conceitos Bsicos da Anlise de Dados

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

TIPOS DE VARIVEL E DE ESCALA

CONCEITOS BSICOS DA ANLISE DE DADOS

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

ESTIMAR PARMETROS POPULACIONAIS

CONCEITOS BSICOS DA ANLISE DE DADOS

Viso Geral do SPSS

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

Figura 2.1: Janela de edio de dados.

VISO GERAL DO SPSS

Figura 2.2: Janela de visualizao de resultados (Output Viewer).

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

Figura 2.3: Editor de grficos.

VISO GERAL DO SPSS

MENU DA JANELA DE DADOS

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

Para mostrar ou esconder a barra de estado

Figura 2.4: Barra de estado.

VISO GERAL DO SPSS

Figura 2.5: Caixa de dilogo para o clculo de frequncias.

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

OBTER AJUDA (MENU DE AJUDA)

A informao para esclarecimento de dvidas do utilizador podem ser obtidas

Figura 2.6: Help.

2.5.1 NAVEGAO NA TABELA DE CONTEDOS

Na barra de menu de qualquer janela do SPSS escolher:

Figura 2.7: ndice de assuntos.

VISO GERAL DO SPSS

Figura 2.8: ndice de assuntos (2).

Figura 2.9: Pesquisa de palavras/termos.

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

O SPSS pode abrir ficheiros criados noutras aplicaes, como o Excel.

Figura 2.10: Abrir ficheiro de dados.

Figura 2.11: Abrir ficheiro Excel.

Considere-se a seguinte folha de clculo do Excel:

VISO GERAL DO SPSS

Figura 2.12: Condies de abertura de ficheiro Excel.

Obtm-se a seguinte folha de dados no SPSS:

Tabela 2-2: Folha de dados importada do Excel.

MANUAL DE SPSS TRATAMENTO E ANLISE DE DADOS

Figura 2.13: Seleco da Variable View.

Premindo o Tab Variable View surge a seguinte janela:

Figura 2.14: Janela da Variable View.

VISO GERAL DO SPSS NOME DA VARIVEL

Figura 2.15: Definio do tipo de varivel.

Depois de premir o boto surge a janela para definio do tipo de varivel: