Escolar Documentos
Profissional Documentos
Cultura Documentos
Manual de SPSS
TRATAMENTO E ANLISE DE DADOS
Este manual integra as funcionalidades do SPSS (verso 20) necessrias para complementar o contedo das aulas da unidade curricular Tratamento e Anlise de Dados.
NDICE DE CONTEDOS
NDICE
NDICE ............................................................................................................................. III NDICE DE QUADROS ..................................................................................................... VIII NDICE DE TABELAS ........................................................................................................ VIII 1 CONCEITOS BSICOS DA ANLISE DE DADOS .............................................................. 1
1.1 1.2 1.3 1.4 MTODOS DE INVESTIGAO ......................................................................................................... 2 TIPOS DE VARIVEL E DE ESCALA..................................................................................................... 2 DISTRIBUIES DE PROBABILIDADE ................................................................................................. 3 ESTIMAR PARMETROS POPULACIONAIS .......................................................................................... 4
FICHEIROS DE DADOS.................................................................................................................. 16 DEFINIR VARIVEIS ..................................................................................................................... 18 INTRODUO E EDIO DE DADOS................................................................................................ 22 FALTA DE DADOS ....................................................................................................................... 24 Como Saber se h Falta de Dados ................................................................................. 24 Como Tratar o Problema de Falta de Dados ................................................................. 25
6.2.1 6.3
TESTES BILATERAIS E UNILATERAIS ................................................................................................ 63 Testes Bilaterais (two-tailed) ......................................................................................... 63 Testes Unilaterais (one-tailed) ...................................................................................... 64
6.3.1 6.3.2
P g i n a | iv
P g i n a |v
NDICE DE FIGURAS
Figura 2.1: Janela de edio de dados..................................................................................................... 8 Figura 2.2: Janela de visualizao de resultados (Output Viewer). ......................................................... 9 Figura 2.3: Editor de grficos................................................................................................................. 10 Figura 2.4: Barra de estado. .................................................................................................................. 12 Figura 2.5: Caixa de dilogo para o clculo de frequncias. ................................................................. 13 Figura 2.6: Help. .................................................................................................................................... 14 Figura 2.7: ndice de assuntos. .............................................................................................................. 14 Figura 2.8: ndice de assuntos (2). ......................................................................................................... 15 Figura 2.9: Pesquisa de palavras/termos. ............................................................................................. 15 Figura 2.10: Abrir ficheiro de dados. ..................................................................................................... 16 Figura 2.11: Abrir ficheiro Excel. ........................................................................................................... 16 Figura 2.12: Condies de abertura de ficheiro Excel. .......................................................................... 17 Figura 2.13: Seleco da Variable View................................................................................................. 18 Figura 2.14: Janela da Variable View..................................................................................................... 18 Figura 2.15: Definio do tipo de varivel. ............................................................................................ 19 Figura 2.16: Seleco do tipo de varivel. ............................................................................................. 19 Figura 2.17: Rtulo da varivel. ............................................................................................................. 20 Figura 2.18: Rtulos dos valores da varivel. ........................................................................................ 20 Figura 2.19: Indicao dos valores em falta. ......................................................................................... 21 Figura 2.20: Tipificao dos valores em falta. ....................................................................................... 21 Figura 2.21: Escala de medida da varivel. ........................................................................................... 21 Figura 2.22: Janela de Data View. ......................................................................................................... 22 Figura 2.23: Insero de novos casos. ................................................................................................... 23 Figura 2.24: Insero de novas variveis. .............................................................................................. 23 Figura 2.25: Tratar a falta de dados. ..................................................................................................... 25 Figura 2.26: Substituio de valores em falta pela mdia. ................................................................... 27 Figura 2.27: Opo Transform (substituio de valores em falta). ....................................................... 27 Figura 2.28: Seleccionar casos. .............................................................................................................. 28 Figura 2.29: Seleco de casos. ............................................................................................................. 29 Figura 2.30: Criao da condio para a seleco de casos. ................................................................. 29 Figura 2.31: Visualizao dos casos excludos. ...................................................................................... 30 Figura 2.32: Diviso do ficheiro. ............................................................................................................ 31 Figura 2.33: Seleco de variveis de agrupamento para a diviso de ficheiro. .................................. 31 Figura 3.1: Calcular uma varivel. ......................................................................................................... 34 Figura 3.2: Condio para clculo da varivel. ...................................................................................... 35 Figura 3.3: Operadores lgicos e aritmticos........................................................................................ 35 Figura 3.4: Recodificao na mesma varivel. ...................................................................................... 36 Figura 3.5: Seleco da varivel a recodificar. ...................................................................................... 36 Figura 3.6: Recodificao de uma varivel. ........................................................................................... 36 Figura 3.7: Recodificao numa varivel diferente. .............................................................................. 37 Figura 3.8: Seleco da varivel a recodificar noutra varivel diferente. ............................................. 37 Figura 3.9: Velhos e novos valores da nova varivel. ............................................................................ 37 Figura 3.10: Recodificao automtica. ................................................................................................ 38 Figura 3.11: Recodificao automtica. ................................................................................................ 38
P g i n a | vi
Figura 4.1: Explore. ................................................................................................................................ 40 Figura 4.2: Seleco de variveis. .......................................................................................................... 40 Figura 4.3: Obter valores extremos. ...................................................................................................... 42 Figura 4.4: Obter percentis.................................................................................................................... 43 Figura 4.5: Obter histograma. ............................................................................................................... 44 Figura 4.6: Histograma. ......................................................................................................................... 44 Figura 4.7: Obter grfico de caule e folhas. .......................................................................................... 45 Figura 4.8: Grfico de caule e folhas. .................................................................................................... 45 Figura 4.9: Obter caixa de bigodes. ....................................................................................................... 46 Figura 4.10: Caixa de bigodes. ............................................................................................................... 46 Figura 4.11: Cruzamento de variveis. .................................................................................................. 47 Figura 4.12: Seleco de variveis para cruzamento. ........................................................................... 47 Figura 4.13: Seleco de variveis para cruzamento por camada (layer). ............................................ 48 Figura 4.14: Obter percentagens........................................................................................................... 50 Figura 4.15: Seleco de grficos. ......................................................................................................... 51 Figura 4.16: Seleco de variveis para visualizao grfica. ............................................................... 51 Figura 4.17: Grfico de barras empilhadas. .......................................................................................... 52 Figura 4.18: Grfico em percentagem................................................................................................... 52 Figura 4.19: Grfico de barras empilhadas em percentagens. ............................................................. 53 Figura 5.1: Definir VRM dicotmica. ..................................................................................................... 56 Figura 5.2: Criao de VRM dicotmica. ............................................................................................... 57 Figura 5.3: Calcular tabela de frequncias de VRM. ............................................................................. 57 Figura 5.4: VRM a seleccionar para clculo de frequncias. ................................................................. 57 Figura 5.5: Missing values na VRM. ....................................................................................................... 58 Figura 5.6: Frequncias de uma VRM.................................................................................................... 58 Figura 5.7: Definio de VRM - Categoria ............................................................................................. 59 Figura 5.8: Criao de VRM categrica. ................................................................................................ 59 Figura 5.9: Cruzamento de variveis com VRM. ................................................................................... 60 Figura 7.1: Dados para clculo da regresso. ........................................................................................ 67 Figura 7.2: Regresso linear. ................................................................................................................. 67 Figura 7.3: Seleco de variveis para clculo da regresso. ................................................................ 67 Figura 7.4: Seleco do tipo de grfico. ................................................................................................ 68 Figura 7.5: Seleco das variveis para o grfico. ................................................................................. 69 Figura 7.6: Edio do grfico. ................................................................................................................ 69 Figura 7.7: Definir a recta de regresso. ............................................................................................... 70 Figura 7.8: Recta de regresso. ............................................................................................................. 70 Figura 7.9: Valores previstos e residuais. .............................................................................................. 71 Figura 7.10: Visualizar os valores previstos e residuais. ....................................................................... 72 Figura 7.11: Seleco de variveis para anlise. ................................................................................... 72 Figura 8.1: Ponderao de casos. .......................................................................................................... 77 Figura 8.2: Seleco de variveis. .......................................................................................................... 78 Figura 8.3: Seleco da estatstica qui-quadrado.................................................................................. 78
P g i n a | vii
NDICE DE QUADROS
Quadro 1-1: Anlise de valores em falta (1).......................................................................................... 24 Quadro 1-2: Anlise de valores em falta (2).......................................................................................... 24 Quadro 1-3: Coeficientes de correlao (com exclude cases listwise) .................................................. 26 Quadro 1-4: Coeficientes de correlao (com exclude cases parwise) ................................................. 26 Quadro 1-5: Clculo da mdia de uma varivel aps diviso de ficheiro. ............................................ 32 Quadro 3-1: Resultado do comando explore. ....................................................................................... 41 Quadro 3-2: Estatsticas (comando explore). ........................................................................................ 41 Quadro 3-3: Anlise de valores extremos. ............................................................................................ 42 Quadro 3-4: Anlise de percentis. ......................................................................................................... 43 Quadro 3-5: Resultado do cruzamento de duas variveis. ................................................................... 48 Quadro 3-6: Resultado do cruzamento de trs variveis. ..................................................................... 49 Quadro 3-7: Anlise de percentagens. .................................................................................................. 50 Quadro 4-1: Regra da deciso. .............................................................................................................. 62 Quadro 5-1: Resultado do clculo da regresso. .................................................................................. 68 Quadro 5-2: Anlise dos valores previstos e residuais. ......................................................................... 73 Quadro 5-3: Coeficiente de correlao. ................................................................................................ 73 Quadro 6-1: Resultado do cruzamento das variveis. .......................................................................... 79 Quadro 6-2: Resultados do teste do qui-quadrado. ............................................................................. 79
NDICE DE TABELAS
Tabela 1-1: Folha de Excel. .................................................................................................................... 16 Tabela 1-2: Folha de dados importada do Excel. .................................................................................. 17 Tabela 1-3: Tabela de dados (com valores em falta). ........................................................................... 25 Tabela 6-1: Dados para anlise. ............................................................................................................ 77 Tabela 6-2: Dados para anlise agrupados......................................................................................... 77
P g i n a | viii
1
Conceitos Bsicos da Anlise de Dados
1.1
MTODOS DE INVESTIGAO
Para efeitos de enquadramento, apresenta-se de seguida - de uma forma muito sinttica -as etapas do mtodo de investigao cientfica, o qual inclui a anlise dos dados. Esta etapa engloba a supresso de erros e valores anormais, a organizao dos dados de maneira prtica e funcional, a escolha de indicadores que sintetizem a informao, a utilizao de tcnicas estatsticas adequadas para testar as hipteses estipuladas e, ainda, a interpretao da informao. 1. 2. 3. 4. 5. 6. 7. 8. Identificao do problema; Reviso da literatura; Construo das hipteses; Definio das variveis; Definio da populao e da amostra; Escolha e/ou construo de instrumentos de recolha de dados; Tratamento e anlise dos dados; Relatrio de investigao.
Em investigao, existem estudos correlacionais e estudos experimentais. Enquanto, nos primeiros, se procura indicar em que graus determinados fenmenos esto relacionados, nos segundos procura-se verificar se existem diferenas significativas entre situaes. Neste ultimo caso, muito utilizada a comparao relativamente a um atributo - de um grupo experimental com o grupo de controlo (exemplo: verificar se a frequncia de aulas adicionais de apoio melhoram o desempenho escolar - aqui, o grupo de controlo poderia ser uma turma de alunos sem aulas adicionais de apoio e o grupo experimental poderia ser outra turma de alunos com aulas adicionais de apoio). Relativamente ao design experimental, existem as amostras independentes (design entre-sujeitos: betweensubject design), ou seja, aquelas compostas por indivduos diferentes a testar numa situao (exemplo: avaliar o comportamento na sala de aula, segundo o sexo) e as amostras emparelhadas (design intra-sujeitos: withinsubject design), isto , as que so compostas pelos mesmos indivduos em vrias fases da realizao de uma experincia (exemplo: verificar, para um grupo de alunos, se h diferenas de performance entre um teste intermdio e o exame final a uma disciplina).
1.2
As variveis so smbolos que representam determinadas caractersticas de uma populao ou amostra susceptveis de serem estudadas. Distinguem-se essencialmente entre: qualitativas, i.e., que esto relacionadas com categorias no susceptveis de medida mas apenas de classificao, assumindo diferentes modalidades (exemplo: cor dos olhos) e quantitativas, ou seja, relacionadas com caractersticas que tomam valores numricos e so susceptveis de medida (exemplo: peso em kg). As variveis quantitativas podem ainda ser discretas, quando assumem uma realidade numervel de valores em que os decimais no fazem sentido P g i n a |2
1.3
DISTRIBUIES DE PROBABILIDADE
A Estatstica incide nos chamados fenmenos aleatrios ou casuais, ou seja, naqueles em que no possvel prever exactamente o resultado final antes da realizao da experincia (quando repetida nas mesmas circunstncias). A noo de incerteza est claramente implcita e, neste contexto, o conceito de probabilidade torna-se incontornvel. A base da inferncia estatstica consiste na possibilidade de se tomarem decises sobre os parmetros de uma populao, sem que seja necessrio proceder a um censo (recenseamento de toda a populao). Os mtodos envolvem o clculo de estatsticas amostrais a partir das quais se infere sobre os parmetros populacionais, ou seja, procura-se elaborar uma generalizao, com determinado grau de probabilidade. importante reter que as concluses em estatstica inferencial no so 100% seguras, embora a probabilidade de errar deva ser relativamente baixa, caso contrrio a informao deixa de ter utilidade. Uma noo chave em Estatstica so as distribuies amostrais - variveis aleatrias que "transformam" as estatsticas amostrais (calculadas com base na amostra) em parmetros (valores populacionais). Existem vrias distribuies amostrais (mdia, desvio-padro, coeficiente de correlao, entre muitas outras), distribuies essas que seguem uma determinada distribuio terica de probabilidade. P g i n a |3
1.4
Um dos objectivos da estatstica inferencial estimar as caractersticas desconhecidas de uma populao, atravs dos dados contidos na amostra. Torna-se necessrio introduzir o conceito de estimador - estatstica que produz valores (estimativas) no domnio do parmetro. Existem dois grandes tipos de estimao: a pontual, que consiste em encontrar uma boa aproximao do parmetro atravs de um nico valor, e a intervalar, que consiste em estabelecer um intervalo no qual o parmetro se ir situar, com um determinado grau de probabilidade. Um estimador pontual respeita as seguintes propriedades: i) no enviesado, ou seja, espera-se que o valor esperado do estimador seja o verdadeiro valor do parmetro da populao; ii) iii) eficaz, i.e., vrias estimaes devem ser o mais prximas possvel do valor do parmetro; e convergente, o que quer dizer que quando se aumenta a dimenso da amostra, deve obter-se valores mais prximos do parmetro. No entanto, sendo um valor nico, uma estimativa pontual acaba por "falhar" sempre o "alvo", nem que seja por margens muito pequenas. Por isso, recorre-se muitas vezes chamada estimao intervalar. Esta ltima baseada na pontual, qual se "junta" um factor de incerteza baseado na distribuio de probabilidade (amostral) do estimador pontual, dando origem a um intervalo que, no fundo, representa as fronteiras dentro das quais "acreditamos" que se encontra o parmetro populacional. A estimao intervalar consiste, ento, em calcular - a partir de um determinado estimador - um intervalo de confiana no qual plausvel encontrar o verdadeiro valor do parmetro. Os limites do intervalo de confiana so variveis aleatrias cuja probabilidade de conter o verdadeiro valor do parmetro definida pelo investigador. Essa probabilidade (1-) designa-se por nvel de confiana. probabilidade complementar , chama-se nvel de significncia e representa o risco de o parmetro no estar no intervalo de confiana calculado. Os nveis de significncia mais utilizados so 1% (0,01), 5% (0,05) e 10% (0,10), que correspondem a nveis de confiana de 99%, 95% e 90%, respectivamente. Note-se que na generalidade possvel afirmar que, para um determinado nvel de confiana, (1-)% das amostras contm o verdadeiro valor do parmetro. No entanto, quando se concretiza para uma amostra em particular, deixa de haver aleatoriedade, i.e., um intervalo de confiana especfico contem ou no contem o verdadeiro valor do parmetro. P g i n a |4
P g i n a |5
2
Viso Geral do SPSS
2.1
JANELAS DO SPSS
Existem sete tipos de janelas no SPSS: Data Editor .......................... : Janela que apresenta o contedo do ficheiro de dados. Os ficheiros de dados podem ser modificados atravs desta. S possvel ter uma janela destas aberta num dado momento. Output Viewer .................... : Janela onde so apresentados os resultados estatsticos, tabelas e grficos, os quais podem ser editados e gravados para uso posterior. Uma janela Viewer abre automaticamente a primeira vez que se executa um procedimento que gera uma sada.
P g i n a |8
Pivot Table Editor ............... : Permite editar e modificar tabelas. Pode editar-se o texto, trocar dados em linhas e colunas, adicionar cor, criar tabelas multidimensionais e ocultar ou mostrar resultados. Chart Editor......................... : Permite modificar grficos de alta resoluo e grficos em janelas grfico. Pode alterar-se as cores, seleccionar fontes de diferentes tipos e tamanhos, trocar os eixos horizontal e vertical, rotao 3-D grficos de disperso e at mesmo alterar o tipo de grfico.
P g i n a |9
Text Output Editor .............. : Permite alterar texto que no seja visvel no Pivot Table Editor. Pode alterar-se o tipo, tamanho, cor e estilo das letras. Syntax Editor ...................... : Todos os comandos do SPSS podem ser emitidos a partir da janela de sintaxe. Todos os comandos emitidos a partir dos menus podem ser apresentados numa janela de sintaxe: para isso usa-se o comando Paste das caixas de dilogo. O contedo do editor pode ser guardado e reutilizado mais tarde. Script Editor ........................ : Usado para criar e modificar scripts que permitem automatizar muitas tarefas no SPSS.
P g i n a | 10
2.2
File ........................... : Funes de criar, abrir, ler ou imprimir ficheiros provenientes de outras sesses de anlise ou de outros programas (bases de dados, folhas de clculo, etc.). Edit .......................... : Funes de modificar ou copiar texto das janelas de output ou de sintaxe; pesquisa de dados e parametrizao de opes diversas. View ........................ : Funes de activao de diversas barras de botes, fontes, grelha, barra de status e mostrar os rtulos (labels) definidos. Data......................... : Funes de alterao global dos dados, tais como: transpor variveis e casos, criar subconjuntos de casos para anlise, insero de dados. Estas mudanas so temporrias e no afectam o ficheiro, excepto se for efectuada uma gravao com estas alteraes. Transform ............... : Funo de produzir alteraes nas variveis seleccionadas e para calcular novas variveis a partir de valores de outras j existentes. Estas alteraes s sero efectivas se forem gravadas. Analyze ................... : Funes de seleccionar os vrios procedimentos estatsticos, como a anlise descritiva, anlise de varincia, correlaes, regresses lineares, etc. Graphs..................... : Funes para criar grficos de colunas, de sectores, histogramas. Utilities.................... : Funes para obteno de informao acerca das variveis, controlo da lista de variveis que aparece nas caixas de dilogo, correr scripts (pequenos programas) e alterar os menus. Window .................. : Funes de comutar entre as vrias janelas do SPSS ou minimiz-las. Help ......................... : Ligao pgina do SPSS na Internet. Ajuda relativa ao funcionamento do SPSS.
P g i n a | 11
2.3
BARRA DE ESTADO
A barra de estado no fundo de cada janela, d informao sobre: O estado do comando: para cada comando ou procedimento indica o nmero de casos processados; O estado do filtro: caso se esteja a analisar parte dos casos apresentada a mensagem Filter on; O estado do peso: a mensagem Weight on indica que se est a utilizar uma varivel ponderada; O estado de um ficheiro particionado: a mensagem Split File on indica que se est a utilizar parte de um ficheiro na anlise.
P g i n a | 12
2.4
CAIXAS DE DILOGO
A maior parte dos comandos dos menus do SPSS abre caixas de dilogo. As caixas de dilogo so utilizadas para seleccionar variveis e opes para anlise. Cada caixa de dilogo tem vrias componentes bsicas: Lista de variveis fonte: lista de onde se escolhem as variveis a ser analisadas; Lista(s) de variveis destino: uma ou mais listas onde se encontram as variveis escolhidas para anlise; Botes: botes que executam a anlise ou permitem especificar opes da anlise.
P g i n a | 13
2.5
Menu de Help: Todas as janelas do SPSS tm um menu de HELP na barra de menus. A opo Topics acede s fichas de Contents, Index e Find. A opo Tutorial tem umas aulas introdutrias. Menu de ajuda relativo ao contexto: Premindo o boto direito do rato em qualquer item de uma caixa de dilogo, obtm-se ajuda sobre esse item. Boto de Help nas caixas de dilogo: Premindo o boto de Help de uma caixa de dilogo, obtm-se ajuda sobre essa caixa de dilogo.
1.
ndice de assuntos: Seleccionar uma ficha e fazer duplo clique num item (representado por um livro) para expandir ou fechar o seu contedo.
P g i n a | 14
3.
Pesquisa de palavras/termos: Introduzir as palavras a procurar dar um duplo clique no tpico pretendido para visualizar a informao.
P g i n a | 15
2.6
FICHEIROS DE DADOS
Para as folhas de clculo (Excel) e ficheiros com valores delimitados por TAB, podem ler-se os nomes das variveis da primeira linha do ficheiro ou da primeira linha do intervalo de valores ( range) especificado.
P g i n a | 16
P g i n a | 17
2.7
DEFINIR VARIVEIS
O SPSS permite definir as seguintes caractersticas de uma varivel: O nome da varivel; O tipo da varivel (numrico, texto, data, etc.); Descrio da varivel e dos seus valores; Cdigos especiais para os valores em falta.
Para definir uma varivel fazer duplo clique sobre o topo da coluna correspondente varivel na janela de dados ou premir a Variable View no canto inferior esquerdo do Data Editor:
P g i n a | 18
TIPO DE VARIVEL
No Tab Variable View, seleccionar a clula Type da varivel que se pretende definir e premir o boto .
P g i n a | 19
P g i n a | 20
P g i n a | 21
2.8
Na introduo de dados h a considerar o seguinte: Os dados so sempre introduzidos na clula activa que apresentada com um rebordo mais forte; O nome da varivel e o nmero de linha da clula activa so apresentados no canto superior esquerdo da janela Data Editor; O valor da clula activa aparece no campo editor de clula, acima do Data Editor; Os valores introduzidos s so registados quando se pressiona ENTER ou quando se selecciona outra clula; Para introduzir dados no numricos deve alterar-se o tipo de varivel previamente.
P g i n a | 22
P g i n a | 23
2.9
FALTA DE DADOS
Antes de se efectuar a anlise de dados preliminares importante verificar se o ficheiro de dados contm falta de valores (valores missing). Existem dois problemas principais associados com a falta de dados: i. ii. Como saber se h falta de dados (valores missing); Como tratar o problema de falta de dados.
Embora, no seja possvel efectuar uma anlise dos valores missing, sempre que se executa uma anlise sobre uma varivel (ou grupo de variveis) o SPSS apresenta o n. de valores missing para essa varivel: a) A varivel ano escolar mais elevado completado no tem valores missing
Quadro 2-1: Anlise de valores em falta (1).
b) A varivel horas trabalhadas pelo marido na semana passada tem 430 valores missing, representando cerca de 58% dos casos totais da amostra:
Quadro 2-2: Anlise de valores em falta (2).
P g i n a | 24
2.9.2.1
Esta opo retira de todas as anlises todos os casos com falta de dados. A vantagem desta opo que todos os dados analisados so genunos, mas tem a desvantagem de que a dimenso da amostra fica reduzida. Quando uma anlise utiliza um conjunto de variveis, cada uma das quais com falta de alguns dados, esta opo pode fazer baixar muito a dimenso da amostra.
CASO 1 2 3 4 5 6 7 8 9 10
IDADE 36 -1 23 17 45 -1 34 48 57 22
ANTIG. ORDENADO -1 265 5 230 4 -1 -1 201 4 -1 13 212 -1 205 3 277 6 264 2 197
No caso da Tabela 2-3, que contm apenas 10 casos, constata-se que cada uma das variveis tem um valor missing para trs casos, ou seja, em cada uma das variveis, s 70% dos casos da amostra no tm falta de dados. O comando CORRELATE do SPSS aplicado aos dados da Tabela e utilizando a opo exclude cases listwise, produziu as correlaes entre as variveis que se apresentam no Quadro 2-3. O SPSS vai utilizar apenas os casos sem valores missing em simultneo, neste caso os casos 8, 9 e 10. Este significa que apenas 30% dos casos da amostra so utilizados na anlise, na medida em que o efeito da falta de dados cumulativo quando as variveis tm valores missing em casos diferentes. Daqui resulta que se deve ter cautela com esta opo para resolver o problema da falta de dados .
P g i n a | 25
2.9.2.2
Esta opo retira os casos s das anlises que utilizam a varivel (ou variveis) com falta de dados e no retira estes casos de todas as anlises. As vantagens desta opo que apenas se usam dados genunos e se maximiza a utilizao dos dados. A desvantagem que a dimenso da amostra varia de uma anlise para outra. Executando o comando CORRELATE agora com a opo Exclude Cases Parwise, obtm-se as correlaes do Quadro 2-4.
Quadro 2-4: Coeficientes de correlao (com exclude cases parwise)
de salientar que estas correlaes apresentam valores diferentes dos obtidos no caso anterior. Neste caso a dimenso da amostra varia de cinco casos at oito. Esta variao da dimenso da amostra pode trazer problemas porque a amostra pode ser, por exemplo, representativa para algumas anlises de dados e no ser representativa para outras. Este problema grave.
2.9.2.3
Esta opo substitui os valores missing por valores calculados atravs de diversos mtodos, sendo o mais comum a utilizao da mdia da srie dos valores da varivel, isto , calcula o valor mdio dos valores de uma varivel que tem valores missing e utiliza o valor mdio como o valor da varivel para todas as situaes de missing. P g i n a | 26
A execuo desta opo de replace with mean efectuada atravs da opo Transform na barra de menus:
2.9.2.4
O mtodo a utilizar depende de quatro factores: i. ii. iii. iv. A dimenso T da amostra completa (incluindo os casos com falta de dados); A natureza da anlise estatstica que o investigador pretende efectuar; A varivel com maior nmero de valores missing nessa anlise; A distribuio dos casos com falta de dados no conjunto de variveis na anlise.
Para cada anlise que se pretende efectuar, deve-se encontrar, para cada uma das variveis na anlise, o nmero de casos com valores missing. A varivel com maior nmero de casos com falta de dados a varivel crtica (M n. de casos da varivel crtica com falta de dados). Para decidir qual das opes do SPSS a mais adequada para lidar com o problema de falta de dados, sugerese a utilizao das seguintes regras do polegar: a) Quando , razovel utilizar a opo Replace with mean;
) representa uma dimenso da amostra suficiente para fazer a b) Quando , mas ( anlise, razovel utilizar a opo Exclude cases listwise; c) ) representa uma dimenso da amostra insuficiente para fazer a anlise, deve-se Quando ( utilizar a opo Exclude cases parwise; P g i n a | 27
As opes possveis para a seleco de casos (Figura 2.29) so: All cases. desactiva filtragem de casos e usa todos os casos. If condition is satisfied. Usa uma expresso condicional para seleccionar os casos. Se o resultado da expresso condicional verdadeiro, o caso est seleccionado. Se o resultado for falso ou est em falta, o caso no seleccionado. Random sample of cases. Selecciona uma amostra aleatria com base numa percentagem aproximada ou um nmero exacto de casos Based on time or case range. Selecciona os casos com base num intervalo de nmeros de casos ou num intervalo de datas/tempo. Use filter variable. Usa a varivel numrica seleccionada do ficheiro de dados como a varivel de filtro. Casos com qualquer valor diferente de 0 ou em falta (missing) para a varivel filtro so seleccionados.
P g i n a | 28
A rea Output da Figura 2.29 controla o tratamento dos casos no seleccionados. Pode-se escolher uma das seguintes alternativas para o tratamento de casos no seleccionados: Filter out unselected cases. Os casos no seleccionados no so includos na anlise, mas permanecem na base de dados. Estes casos podem ser utilizados mais tarde desactivando a filtragem. Se for seleccionada uma amostra aleatria ou se forem seleccionados os casos com base numa expresso condicional, isso gera uma varivel chamada filter_$ com um valor 1 para os casos seleccionados e um valor 0 para os casos no seleccionados. Copy selected cases to a new dataset. Os casos seleccionados so copiados para um novo conjunto de dados, deixando o conjunto de dados original inalterado. Os casos no seleccionados no esto includos no novo conjunto de dados e so deixados no seu estado original no conjunto de dados original. Delete unselected cases. Os casos no seleccionados so excludos do conjunto de dados. Os casos excludos podem ser recuperados apenas se se sair do ficheiro sem guardar as alteraes e, em seguida, reabrir o ficheiro. A excluso de casos permanente se forem guardadas as alteraes ao ficheiro de dados. Nota: Se os casos no seleccionados forem apagados e se o ficheiro for guardado, os casos no podem ser recuperados posteriormente. Se o objectivo for efectuar algumas anlises apenas para os casos correspondentes aos indivduos do sexo masculino, pode-se seleccionar esses casos atravs da opo If condition is satisfied, conforme apresentado na Figura 2.30:
P g i n a | 29
Todas as anlises efectuadas daqui em diante tomaro em considerao apenas os casos relativos aos indivduos do sexo masculino. Para anular esta seleco deve-se seleccionar a opo All cases.
P g i n a | 30
P g i n a | 31
Compare groups. Os grupos resultantes do procedimento Split file so apresentados em conjunto para efeitos de comparao. Organize output by groups. Todos os resultados de cada procedimento so mostrados separadamente para cada grupo de diviso do ficheiro. Por exemplo, no clculo das da mdia da idade dos respondentes (recorrendo o procedimento Frequencies), obtm-se a informao estruturada de acordo com as variveis de agrupamento, conforme apresentado Quadro 2-5:
P g i n a | 32
Transformao de Dados
3
Transformao de Dados
3.1
TRANSFORMAO DE DADOS
O SPSS permite a criao de uma nova varivel a partir de transformaes sobre outras variveis: Podem criar-se novas variveis ou alterar-se os valores de variveis j existentes; Podem calcular-se valores sobre apenas uma parte dos casos, baseando-se em condies lgicas; Podem usar-se mais de 70 funes pr-existentes: funes aritmticas, estatsticas, de distribuio e de manipulao de caracteres.
3.2
Introduzir o nome da varivel destino, que pode j existir, ou ser uma varivel nova; Construir a expresso escolhendo as funes na lista de funes e os operadores na lista de operadores. Opcionalmente pode digitar a expresso a partir do teclado.
P g i n a | 34
P g i n a | 35
3.3
RECODIFICAO DE VARIVEIS
A recodificao de variveis muito til na combinao de categorias. A recodificao pode assumir trs formas diferentes: 1. 2. 3. Recodificao na mesma varivel; Recodificao numa varivel diferente; Recodificao automtica.
Seleccionar as variveis que se pretendem recodificar; Premir o boto Old and New Values para especificar a recodificao:
P g i n a | 36
TRANSFORMAO DE DADOS
Seleccionar as variveis que se pretendem recodificar; Introduzir o nome da nova varivel e premir o boto Change; Premir o boto Old and New Values para especificar a recodificao:
P g i n a | 37
P g i n a | 38
4
Explorao e Cruzamento de Variveis
4.1
Seleccionar a varivel (ou variveis) que se pretende explorar e coloc-la na lista de variveis dependentes; Seleccionar a varivel que define os grupos de casos e mov-la para a lista de factores.
P g i n a | 40
c)
Leitura da tabela (Quadro 4-1): Verifica-se que existem 325 casos na categoria muito satisfeito para os quais a idade est disponvel. O nmero de casos em falta de 2 (dois). Isto significa que 2 casos muito satisfeito no tm um valor vlido para a varivel idade. Este nmero representa apenas 0,6% do total de casos, pelo que o seu efeito de somenos importncia. O nmero de casos varia consideravelmente entre os quatro grupos: mais de 300 indivduos dizem-se moderadamente satisfeito; 74 esto um pouco insatisfeito; e apenas 26 esto muito satisfeito. As concluses extradas sobre os ltimos dois grupos tm que ser cuidadosas, pois so baseadas num pequeno nmero de casos.
P g i n a | 41
As mdias das idades variam do valor mais elevado de 41,5 no grupo muito satisfeito, at ao valor mais baixo de 38,58 no grupo muito insatisfeito. O valor das medianas sensivelmente mais baixo para todos os grupos porque as distribuies de idade tm caudas nos valores mais elevados de idade. A mdia aparada (trimmed mean) evita este problema pois exclui os valores mais elevados, assim como os mais baixos. Na 5% trimmed mean, apenas so considerados 90% dos casos no centro da distribuio, excluindo-se os 5% do extremo superior e os 5% do extremo inferior. O desvio padro mais elevado pertence ao grupo muito satisfeito, pois este contm o valor de idade mais elevado: 82 anos. A linha Range d-nos a amplitude de idades do grupo. O Interquartile Range d-nos a amplitude de idades do grupo, medida entre os percentis 25 e 75, no sendo por isso afectado pelos valores extremos.
4.2
VALORES EXTREMOS
Para identificar os valores extremos deve-se premir o boto Statistics na caixa de dilogo Explore e seleccionar a opo Outliers:
P g i n a | 42
4.3
PERCENTIS
Com o Explore podem obter-se os percentis para cada grupo. Procedimento: Premir o boto Statistics na caixa de dilogo Explore e seleccionar a opo Percentiles
Resultados:
Quadro 4-4: Anlise de percentis.
P g i n a | 43
4.4
HISTOGRAMA
Para obter o Histograma deve-se premir o boto Plots na caixa de dilogo Explore e seleccionar a opo Histogram.
P g i n a | 44
4.5
Para obter o Histograma deve-se premir o boto Plots na caixa de dilogo Explore e seleccionar a opo Stemand-leaf.
Se a largura do caule (stem width) fosse 100, ento os valores do tronco de valor 6 seriam 600, 610 e 630.
P g i n a | 45
4.6
CAIXA DE BIGODES
Para obter a Caixa de Bigodes deve-se seleccionar a opo Plots ou Both na caixa de dilogo Explore.
P g i n a | 46
4.7
CRUZAMENTO DE VARIVEIS
Uma tabela de frequncias insuficiente para visualizar o grau de satisfao no emprego por cada categoria de salrio. Para isso h necessidade de recorrer ao cruzamento de variveis. Na barra de menus escolher:
Seleccionar a varivel (ou variveis) que vai ocupar as linhas da tabela e coloc-la em Row(s); Seleccionar a varivel (ou variveis) que vai ocupar as colunas da tabela e coloc-la em Column(s).
Podem mover-se diversas variveis para as listas de linhas ou colunas para obter mltiplos cruzamentos bivariados. Para visualizar trs ou mais variveis em simultneo, devem-se colocar as variveis adicionais em camadas sucessivas (layers). P g i n a | 47
P g i n a | 48
P g i n a | 49
4.8
Para que seja possvel visualizar as percentagens das clulas deve-se premir o boto Cells na caixa de dilogo Crosstabs e seleccionar as opes Row, Column ou Total.
P g i n a | 50
4.9
VISUALIZAO GRFICA
a)
Escolher Stacked e premir Define; Escolher a varivel receita4 para o eixo das categorias; Escolher a varivel sat_emp para a definio dos clusters.
P g i n a | 51
b) Em valores relativos
Para apresentar a percentagem de casos, as variveis devem ser escolhidas por ordem inversa. Depois, no editor de grficos deve fazer-se
P g i n a | 52
Desta forma, consegue-se comparar a distribuio inspeccionando as barras para cada grupo. Observa-se que o grupo das pessoas com menor rendimento o que possui menor percentagem de indivduos muito satisfeito com o seu emprego. Representam tambm a menor percentagem de indivduos muito insatisfeito. Pode ver-se que a soma das percentagens dos indivduos muito satisfeito e moderadamente satisfeito sensivelmente a mesma para os quatro grupos.
P g i n a | 53
5
Variveis de Resposta Mltipla
5.1
INTRODUO
Por vezes nos inquritos surgem questes em que possvel recolher mais que uma resposta, as chamadas Respostas Mltiplas. Para resolver essa questo o SPSS possui uma funo que permite criar variveis para analisar essas respostas, as Variveis de Respostas Mltiplas (VRM). Este tipo de variveis pode ser recolhido de duas formas.
5.2
Caso tpico: o inquirido confrontado com um campo com diversos itens devendo seleccionar aqueles que se aplicam sua situao. Por exemplo, numa questo ligada s razes de emigrao o indivduo pode apresentar mais do que uma razo. No caso de um campo de seleco, isso significaria que existiria uma listagem com as vrias opes, das quais os indivduos seleccionariam as suas razes. As variveis assim codificadas so designadas como questes de dicotomia mltipla, uma vez que cada item possui dois estados - seleccionado ou no. O primeiro passo para a anlise deste gnero de variveis a criao de uma varivel para cada uma das opes. Todas as variveis estaro codificadas com 1 = sim, 2 = no.
Surgir ento a caixa de dilogo Define Multiple Response Sets. O primeiro passo a escolha das variveis que devem pertencer ao conjunto. No lado esquerdo est o conjunto total das variveis da base de dados (Set Definition), no qual se seleccionam aquelas que se desejam analisar como VRM e que passaro para a janela da direita (Variables in Set) pressionando o boto Como se est perante questes de dicotomia mltipla, na caixa Variables Are Coded As escolhe-se a opo Dichotomies. Na caixa Counted value digita-se o valor 1, o qual est codificado como sim, pois esta a opo que deseja contabilizar. Em baixo existem duas caixas de texto onde se pode indicar o nome e o label da varivel. A seguir pressiona-se o boto Add para adicionar este conjunto de variveis ao conjunto das respostas mltiplas, sobre o qual se podem realizar tabelas de frequncias
P g i n a | 56
TABELA DE FREQUNCIAS
Na barra de menus escolher:
Seguidamente, na janela Multiple Response Frequencies seleccionar a VRM sobre a qual se pretende calcular a tabela de frequncias, indicando se pretende excluir os missing values.
A tabela Case Summary d a indicao dos missing values, que se referem aos indivduos que no apresentaram qualquer razo para desejar emigrar. No caso do exemplo, todos os indivduos apresentaram, pelo menos, uma razo para emigar (no existem missing values).
A coluna Respondes N apresenta o nmero de vez que cada motivo foi seleccionado como razo do desejo de emigrar. A coluna Responses Percent d a percentagem do total de problemas que foi atribuda a cada problema especfico, enquanto a coluna Percent of Cases d a percentagem de inquiridos (que seleccionaram pelo menos uma razo de emigrao) que mencionaram cada uma das razes. Por exemplo, 5 pessoas responderam que ganhar pouco uma das suas motivaes para emigrar. Assim, das pessoas que apresentaram alguma motivao para emigrar, 50% apresentaram estar a ganhar pouco como uma das razes. Se pretendermos analisar em termos de % de cada resposta, pode-se dizer que no total de 17 opes, 29,4% das motivaes esto ligadas ao facto de ganhar pouco. Normalmente, a informao que apresenta maior utilidade em termos de anlise estatstica aquela que se encontra relacionada com a percentagem de casos, j que natural que com a possibilidade de resposta mltipla o nmero de respostas exceda o nmero de casos, pelo que a percentagem no dever ser calculada em funo do nmero de respostas, mas sim do nmero de inquiridos.
5.3
Nesta opo, trata-se de uma situao em que o inquirido confrontado com um campo com diversos itens, podendo contemplar vrias respostas em simultneo, por exemplo Quando tem problemas econmicos a quem recorre?. Em primeiro lugar, devem-se inserir os casos segundo a figura abaixo, ou seja, definir tantas variveis quanto as hipteses de resposta (neste caso, sete), s preenchendo os casos que efectivamente correspondem a uma resposta.
P g i n a | 58
P g i n a | 59
P g i n a | 60
6
Testes de Hipteses
(Teoria da Deciso)
6.1
REGRA DE DECISO
Um teste de hipteses um procedimento cuja finalidade fornecer uma regra de deciso, com determinada probabilidade, permitindo escolher entre duas hipteses estatsticas, com base em resultados obtidos da amostra. Designa-se por hiptese nula (H0) a hiptese da no diferena (status quo), ou seja, aquela que sujeita ao teste, por oposio hiptese alternativa (Ha) que a hiptese da diferena. S depois de se obter resultados na amostra que se toma a deciso de rejeitar ou no rejeitar a hiptese nula. Nos ensaios de hipteses h duas hipteses mutuamente exclusivas e exaustivas, a hiptese nula ( H0) e a hiptese alternativa (Ha) e quatro resultados possveis: Duas decises correctas: - No rejeitar a hiptese nula quando ela verdadeira; - Aceitar a hiptese alternativa quando ela verdadeira Dois tipos de erros: - Erro tipo I - Erro tipo II;
O erro tipo I, tambm designado por alfa () ou o nvel de significncia (sig ou p) a probabilidade de rejeitar erradamente a H0, isto , a probabilidade de rejeitar H0 sabendo que H0 verdadeiro. ( )
O erro tipo II, tambm designado por beta () a probabilidade de rejeitar incorrectamente Ha, isto , a probabilidade de rejeitar Ha sabendo que Ha verdadeiro. ( )
Os dois tipos de erro variam em sentido contrrio, ainda que com intensidades diferentes. Como so probabilidades, variam sempre entre 0 e 1. Ao complemento aritmtico de chama-se funo potncia:
A qual informa sobre a probabilidade de rejeitar correctamente H 0, ou seja, sobre a confiana com que se aceita a hiptese alternativa. Embora a potncia de um teste possa ser muito elevada, tal no obriga verificao da hiptese alternativa. Sabe-se apenas que existe uma grande confiana em que se verifique H a. A hiptese nula considerada verdadeira at prova em contrrio.
P g i n a | 62
6.2
Relativamente ao procedimento genrico dos testes, primeiro h que estabelecer as hipteses estatsticas, de acordo com a hiptese experimental que surge do problema. Seguidamente, necessrio escolher o melhor estimador do parmetro em causa e estudar a sua lei de distribuio, ou seja, seleccionar a estatstica teste, admitindo que a hiptese nula se verifica. Depois, calcula-se a estatstica teste para a amostra concreta. A nvel terico, necessrio estabelecer a regio de rejeio da hiptese nula, com base no nvel de significncia e no tipo de teste e comparar o valor da estatstica teste com a regio de rejeio. Fixando um determinado nvel de significncia () normalmente 1% (0,01), 5% (0,05) ou 10% (0,10) a regio de rejeio encontra-se associada a essa probabilidade de rejeitar uma hiptese nula verdadeira. Ao diminuir o torna-se mais difcil rejeitar a hiptese nula, ou seja, diminui a regio de rejeio. Note-se que aumentando a dimenso da amostra (N), diminui-se igualmente o erro de tipo I associado deciso (pelo que as grandes amostras sejam preferidas s pequenas amostras, quando se pretende detectar efeitos significativos).
6.3
Sempre que Ha tem o sinal diferente, est-se perante um teste bilateral ou de regio crtica bilateral. Rejeita-se a hiptese nula tanto para valores superiores como inferiores aos estabelecidos em H 0.
P g i n a | 63
Sempre que Ha inclua o sinal maior (>) ou menor (<), est-se perante um teste unilateral ou de regio crtica unilateral.
O valor que o investigador escolhe para o erro tio I (p), normalmente p = 0,01; p = 0,05; p = 0,10, deve ser determinado por sua prpria estimativa, em funo da importncia prtica dos resultados e da maior potncia do teste, ou seja, do menor erro .
P g i n a | 64
Regresso Linear
7
Regresso Linear
7.1
INTRODUO
Os objectivos da regresso linear so: Mostrar de que forma as variveis independentes explicam as variveis dependentes; Fazer previses sobre as variveis dependentes a partir dos valores das independentes.
A relao linear entre duas variveis contnuas pode ser aferida atravs do coeficiente de correlao ou do modelo de regresso linear. Deve construir-se um quadro (diagrama de disperso) a partir dos pares de valores (X, Y) de variveis independente e dependente. Funes do diagrama de disperso: Ajudar a determinar se existe relao entre as variveis; Permitir identificar a equao matemtica mais apropriada para descrever essa relao (linear, exponencial, logartmica, potncia, etc.).
A relao linear entre duas variveis pode ser descrita atravs da equao:
Em que: ................... : varivel dependente ................... : varivel independente ................... : varivel residual (inclui factores exteriores ao modelo e erros de medio) ................... : parmetro ordenada na origem ................... : parametro declive
7.2
Um coeficiente de correlao superior a 0,5 (em valor absoluto) mostra uma correlao forte entre as variveis, enquanto um coeficiente de correlao inferior a 0,5 (em valor absoluto) mostra uma correlao fraca entre as variveis.
P g i n a | 66
REGRESSO LINEAR
7.3
1.
2.
3.
P g i n a | 67
e , respectivamente.
7.4
ANLISE GRFICA
Seleccionar Simple e premir Define;
Seleccionar a varivel dependente para o eixo Y; Seleccionar a varivel independente para o eixo X; Em Label Cases by colocar o nome da varivel que vai identificar os pontos nos grficos.
P g i n a | 68
REGRESSO LINEAR
Para identificar os pontos, editar o grfico e usar a View Data Labels. O resultado o seguinte:
P g i n a | 69
7.5
RECTA DE REGRESSO
Para visualizar a recta de regresso, fazer duplo clique no grfico no Output Viewer para obter o Chart Editor:
Para alterar a gama de valores representados, fazer duplo clique no grfico no Output Viewer para obter o Chart Editor: Para a gama do eixo X, escolher X scale. Modificar os valores mnimo e mximo de Range Para a gama do eixo Y, proceder do mesmo modo.
P g i n a | 70
REGRESSO LINEAR
7.6
Os valores previstos pela recta so diferentes dos valores reais para cada caso. A diferena entre os dois constitui o valor residual. O SPSS calcula os valores previstos pelo modelo linear, assim como os valores residuais. Na caixa de dilogo Linear Regression escolher a opo Save. Em Predicted Values e Residuals seleccionar as opes Unstandardized. Premir o boto Continue.
So criadas as variveis pre_1 e res_1, respectivamente, com os valores previstos e residuais para cada caso. possvel visualizar os valores previstos junto dos valores reais. Na barra de menus escolher:
P g i n a | 71
P g i n a | 72
REGRESSO LINEAR
Quadro 7-2: Anlise dos valores previstos e residuais.
expresso a partir da qual se podem calcular os valores previstos pelo modelo e respectivos valores residuais.
7.7
COEFICIENTE DE CORRELAO
A tabela seguinte, apresentada como um dos resultados do clculo de regresso linear, d-nos o valor do coeficiente de correlao (R), assim como o seu quadrado (R Square).
P g i n a | 73
8
Teste de Independncia do Qui-Quadrado
8.1
INTRODUO
O teste do Qui-Quadrado utilizado para variveis nominais ou ordinais. Neste tipo de dados por categorias, no faz sentido calcular alguns indicadores como mdias, da trabalhar-se com as frequncias (nmero de ocorrncias de uma determinada categoria da varivel). O teste verifica se existe ou no relao entre duas variveis. Existem vrios tipos de teste do Qui-Quadrado, mas todos comparam o valor observado na amostra com o chamado valor esperado (valor que ocorre caso no exista ligao entre as variveis). Tanto os testes de independncia do Qui-Quadrado como os resduos ajustados estandardizados permitem analisar a relao de independncia entre variveis qualitativas. As hipteses dos testes de independncia so:
O teste do Qui-Quadrado apenas informa sobre a independncia entre as variveis, mas nada diz sobre o grau de associao existente.
Se os pressupostos no forem garantidos, o nvel de significncia observado pode ser correcto ou enganador, dependendo respectivamente da pequena ou elevada contribuio das clulas com Fe < 5 para o valor do teste. Se o pressuposto das frequncias esperadas inferior a 5 for violado, compara-se o valor do teste do 2 nessas clulas (Fe < 5)com o valor do mesmo teste contando com todas as clulas.
8.1.2.1
A base de dados no SPSS pode ser criada de duas formas distintas: a) Mtodo 1 Criao de duas variveis: clube e estdio; Listar as 200 ocorrncias com cada uma das respostas dos adeptos (clube e ir ou no ao estdio)
P g i n a | 76
b) Mtodo 2 Criao de trs variveis: clube, estdio e frequncia (varivel que representa o nmero de ocorrncia para cada categoria de clube/estdio (implica um tratamento prvio de contar o nmero de ocorrncias por categoria); No SPSS carregam-se apenas quatro casos, correspondentes s quatro categorias possveis.
Antes de se executar o procedimento de clculo do teste do Qui-Quadrado necessrio efectuar no SPSS os seguintes comandos:
Executar os seguintes comandos: a) Seleccionar a opo Crosstabs e indicar as variveis para figurar em linha e coluna:
b) Na caixa Statistics seleccionar Chi-square e na caixa Cells seleccionar em Counts: Observed e Expected:
P g i n a | 78
A hiptese nula ser: existe independncia entre filiao clubstica (Benfica, Sporting) e ida habitual ao estdio para assistir a jogos (no vai, vai); A hiptese alternativa ser: existe relao entre filiao clubstica (Benfica, Sporting) e ida habitual ao estdio para assistir a jogos (no vai, vai); A tabela de contingncia (crosstabulation) - Quadro 8-1 - mostra os valores observados (count) e esperados (expected count) para as duas variveis: clube e estdio. Verifica-se que, a nvel descritivo, a amostra total composta por 200 indivduos as frequncias marginais indicam que 78 so adeptos do Sporting e 122 so adeptos do Benfica e tambm que 96 no vo habitualmente ao estdio e 104 vo habitualmente ao estdio ver jogos. Alm disso, dos Sportinguistas, 32 no frequentam habitualmente o estdio e 46 frequentam, enquanto que, relativamente aos Benfiquistas, 64 no frequentam o estdio e 58 frequentam. Seria ainda possvel pedir os valores percentuais por linha, por coluna e totais na caixa Cells. O teste do Qui-quadrado de independncia apresenta um valor de 2,492 e uma significncia de 0,114, o que mostra que no existe relao entre a filiao clubstica e o hbito de ir ao estdio ver jogos [ ( ) ]. Quando as amostras so grandes (como aqui), no necessrio activar a caixa do teste exacto. Para o caso de tabelas (como este), normalmente apresentado o valor do teste com correco de continuidade, embora esse valor seja manifestamente conservador em termos estatsticos (por isso , em geral, ignorado). Note-se que, caso exista relao entre as variveis, o teste do Qui-quadrado no mostra isoladamente quais as clulas especficas da tabela que esto relacionadas, o que torna desaconselhvel usar o teste em variveis com demasiadas categorias (muitas linhas e/ou colunas). P g i n a | 79
A
Edio de Tabelas
Como este mapa no de fcil leitura, aconselhvel mudar a sua estrutura. Neste caso pode-se mudar a varivel sat_emp para a coluna, com as correspondentes estatsticas.
Para isso deve-se: a) Seleccionar o mapa (clicar em cima do mapa pretendido); b) Fazer duplo clique sobre o mapa, obtendo-se uma janela com uma Pivot Table
P g i n a | 82
c)
P g i n a | 83
P g i n a | 84
B
Assimetria e Achatamento
Medidas de Assimetria
Na utilizao de questionrios para recolha de dados fundamental ter uma ateno redobrada sobre as caractersticas desses instrumentos. Por norma, desenvolvem-se escalas se onde colocam afirmaes cujas respostas podem assumir vrias modalidades: 1 (discordo totalmente), 2 (discordo), 3 (no concordo nem discordo), 4 (concordo) e 5 (concordo totalmente). Para que as pessoas no respondam, num mesmo item, a mesma coisa, necessrio que a pergunta esteja construda para que se obtenham respostas diversificadas (1, 2, 3, 4, 5). As medidas de assimetria permitem precisamente calcular as inclinaes e as modalidades de resposta e, neste sentido, deve-se estar atento ao comportamento dos resultados. No se pretendem resultados em que a maior parte das pessoas responda 4 (concordo) e 5 (concordo totalmente), existindo nesse caso uma assimetria negativa. Outro caso indesejvel seria todas as pessoas responderem 1 (discordo totalmente) ou 2 (discordo), sucedendo o caso de uma assimetria positiva. Do ponto de vista terico, o desejvel haver um equilbrio, j que a assimetria diz respeito ao grau de enviesamento -desvio lateral -de uma distribuio. O coeficiente de assimetria no tem interpretao directa, pelo que deve ser dividido pelo erro padro associado, originando um valor designado z-score. Este valor estandardizado -com media zero e desvio-padro unitrio pode ser comparado com valores baseados na distribuio normal atravs de um teste de hipteses. Quanto mais esse valor se distanciar de zero, maior ser o grau de assimetria da distribuio. Para simplificar a explicao, os valores que se seguem so baseados em nveis de significncia de 0,05: i. ii. iii. Distribuio simtrica -caso em que o z-score tende para o valor zero; Distribuio enviesada esquerda (assimtrica positiva) -caso em que o z-score esta acima de 1,96; Distribuio enviesada direita (assimtrica negativa) -caso em que o z-score esta abaixo de -1,96.
P g i n a | 86