Apostila SPSS

APOSTILA PARA TRATAMENTO DE DADOS VIA SPSS
Ronaldo Pilati Juliana B. Porto
NDICE
APRESENTAO CAPTULO 1 APRESENTAO DO SPSS CAPTULO 2 DESCREVENDO DADOS NO SPSS CAPTULO 3 EXPLORANDO E ADEQUANDO O ARQUIVO DE DADOS CAPTULO 4 REALIZANDO ANLISES INFERENCIAIS: ANOVA
QUADRADO E REGRESSO LINEAR SIMPLES UMA VIA,
1 1 1 14 14 21 21 34 CORRELAO BIVARIADA, QUI34 39 39 51 51
CAPTULO 5 ANLISE FATORIAL EM AVALIAO DO TREINAMENTO CAPTULO 6 GERAO E MANIPULAO DE SYNTAX
Apresentao da Apostila
Apresentao
Nas ltimas dcadas o uso da microinformtica tem facilitado enormemente o trabalho de organizao, tratamento e anlise de dados estatsticos de pesquisas em psicologia e outras reas do conhecimento. Pelo fato do ferramental estatstico servir como uma auxlio para iluminar as informaes advindas da realidade, esta tem sido uma estratgia secular de produo do conhecimento em psicologia e reas afins. Boa parte do conhecimento que temos hoje sobre o comportamento e a psicologia humana se deve, em grande medida, ao uso da estatstica na prtica da pesquisa. A microinformtica trouxe uma enorme capacidade de tratamento dos dados, graas ao incremento do processamento dos hardwares, a miniaturizao dos computadores e ao desenvolvimento de programas cada vez mais fceis de serem utilizados e poderosos em seus recursos e capacidades grficas e de clculo. Atualmente h uma grande quantidade de softwares estatsticos que podem ser eficientemente utilizados para tratamento de dados nas pesquisas de psicologia e cincias humanas, como o Excel, o BMDP, Minitab, NCSS, SYSTAT, Statplus, SAS, SPSS, entre centenas de outros. H tambm softwares estatsticos gratuitos, vrios com cdigo livre, como EPINFO e o R. H muitos programas que so especializados em algumas anlises e outros, como a lista citada, que so gerais. Se voc for curioso poder encontrar dezenas de softwares estatsticos em uma simples busca na internet. Se por um lado o avano da microinformtica gerou muitas possibilidades para a pesquisa em psicologia e reas afins, tambm potencializou o mau uso da estatstica. A mxima lixo entra, lixo sai foi significativamente potencializada nos tempos modernos. Por este motivo, no suficiente que o usurio saiba operar o software, mas sim que seja capaz de compreender e analisar os resultados que o programa oferece, alm, claro, de organizar as informaes a serem inseridas no programa de anlise de dados. Esta apostila tem como objetivo ser um pequeno manual introdutrio ao SPSS, um pacote estatstico que se tornou o principal software em uso entre psiclogos sociais, do trabalho e organizacionais no Brasil. Especificamente no departamento de Psicologia Social e do Trabalho da UnB este programa utilizado h mais de 30 anos, o que significa que vrias geraes de pesquisadores acabaram sendo formados em anlise de 1
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB. Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Apresentao da Apostila dados com o uso deste programa. Isto no quer dizer que ele seja o melhor daqueles tantos oferecidos no mercado, mas um programa que oferece vrias vantagens apreciadas pelos pesquisadores em cincias sociais, como menus fceis de serem utilizados e a no necessidade de uso de linguagem de programao ou de conhecimento sofisticado de matemtica para a realizao das anlises estatsticas. Alm disto, o programa oferece uma ampla variedade de mdulos, que permitem um grande nmero de anlises estatsticas multivariadas, boa parte das quais freqentes na pesquisa cientfica em psicologia. Dentro deste zeitgeist que este manual foi concebido. tambm neste contexto que ele deve ser utilizado, pois pretende ser um pequeno manual introdutrio queles que tm a pretenso de fazer pesquisa em psicologia social e reas afins, de forma a abrir o vasto mundo de utilizao da ferramenta estatstica SPSS. Mas ateno! Este manual no tem a pretenso de substituir a aprendizagem sria e comprometida do pensamento estatstico. Muito pelo contrrio, este manual apenas uma leitura complementar para uso do SPSS. Portanto, foi concebido como uma ferramenta extra para servir de apoio ao ensino de estatstica, feito com, no mnimo, o uso de um livro texto de estatstica voltado para cientistas sociais. Isto significa que o manual no pretende substituir a leitura de um bom livro introdutrio ou de anlise multivariada de dados, muito menos a realizao de exerccios de aplicao de conhecimentos estatsticos, mas sim auxiliar o aluno na realizao de procedimentos estatsticos via SPSS. Considera que o desenvolvimento destas competncias parte essencial da formao de pesquisa em psicologia. Vale lembrar que o manual foi desenvolvido com base na verso 10.0 do SPSS, o que significa que vrias dos aprimoramentos das verses posteriores no foram, necessariamente, implementadas no manual. De qualquer forma considera-se que a lgica geral do programa permanece a mesma para as verses posteriores, o que ainda o deixa atualizado. Uma boa leitura!
2
Captulo 1 Apresentao do programa
CAPTULO 1 Apresentao do SPSS
Contedo: 1. 2. Apresentao das Janelas de Trabalho Descrio dos Menus de Comando
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. 4. Identificar o SPSS Descrever cada uma das janelas de trabalho do programa Montar arquivos de dados Operar comandos bsicos dos menus do SPSS
1
Captulo 1 Apresentao do programa JANELAS DE TRABALHO
O SPSS um pacote estatstico, composto de diferentes mdulos, desenvolvido para o uso em cincias humanas, sociais, biolgicas, entre outras rea do conhecimento. Est baseado no ambiente Windows, sendo de fcil operao e muito abrangente, pois permite realizar uma grande amplitude de anlises estatsticas e grficas (anlises descritivas, anlises inferenciais multivariadas, mdulos grficos, entre outros). A principal janela de trabalho do software apresentada abaixo. A Figura 1.1 mostra a janela de digitao (ou input) de dados SPSS Data Editor, na qual os bancos de dados so gerados e analisados. Na janela SPSS Data Editor as linhas so relativas aos casos, participantes ou respondentes e as colunas relativas as variveis investigadas. Esta janela gera um dos trs tipos de arquivos associados ao SPSS. Esse arquivo tem terminao .sav e armazena todas as informaes relativas ao banco de dados, como definio de variveis e os dados digitados.
Figura 1.1 Janela de input de dados do SPSS (v.10.0).
Colunas: representam as variveis em um banco de dados.
Linhas: representam os casos em um banco de dados
Acesso a janela de definio dos parmetros das variveis.
2
Captulo 1 Apresentao do programa Teoricamente, no SPSS, no existe limitao do nmero de colunas, muito menos do nmero de casos, possibilitando a anlise de bancos de dados de qualquer tamanho. Os bancos de dados so montados no prprio SPSS ou importados de outras planilhas. O SPSS importa praticamente todos os tipos de arquivos utilizados no mercado, alm de trabalhar com arquivos de texto e .dat. Junto com a digitao dos dados necessrio definir cada uma das variveis colocadas nas colunas da janela SPSS Data Editor. Nesta verso do SPSS, a definio das variveis do banco de dados feita em outra janela tambm denominada SPSS Data Editor (Figura 1.2). Para tornar esta janela ativa, deve-se clicar na opo Variable View, disposta no lado inferior esquerdo da barra de rolamento da janela da Figura 1.1.
Figura 1.2 Janela de definio de variveis.
Colunas: representam cada uma das caractersticas das variveis a serem definidas.
Linhas: representam cada uma das variveis que compem um banco de dados.
A janela acima apresentada na Figura 1.2 possui vrias colunas relativas aos principais parmetros de cada uma das variveis da planilha. So oito colunas: 3
Captulo 1 Apresentao do programa Name: refere-se ao nome da varivel, composto de at oito caracteres (a depender da verso do programa), que ser colocado nas colunas da janela de input de dados. Deve-se clicar em qualquer cela dessa coluna para que se possa digitar o nome da varivel; Type: refere-se ao tipo de varivel, ou seja, sua caracterstica de notao (numrica, qualitativa, etc). Clicando-se na cela desta coluna abre-se a caixa de dilogo da Figura 1.3. Observe que a caixa de dilogo Variable Type permite a escolha de vrios tipos de variveis. A definio de cada uma pode ser acessada clicando-se no boto direito do mouse colocado em cima da opo (ver reproduo na Figura 1.3). Esta mesma caixa de dilogo tambm permite a escolha de outras caractersticas da varivel (width e decimal places ver definies abaixo).
Figura 1.3 Caixa de dilogo Variable Type..
Caixa de dilogo de definio de tipo da varivel.
Clicando-se com o boto da direita do mouse abre-se esta janela explicativa.
Width: diz respeito ao nmero de caracteres da varivel. Pode ser definido diretamente na cela ou atravs da caixa de dilogo Variable Type reproduzida na Figura 1.3.
4
Captulo 1 Apresentao do programa Decimals define o nmero de casas decimais, a direita da vrgula, que sero apresentadas. Da mesma forma que o Width, pode ser definido diretamente na cela ou na caixa de dilogo Variable Type. Label define o nome atribudo a uma varivel e no possui restrio de nmero de caracteres (e.g., idade, escolaridade, descrio do item de um questionrio, entre outras); Value refere-se aos valores que os labels podem assumir. Neste parmetro o pesquisador deve definir todos os possveis valores que uma varivel pode assumir. Um tipo comum nas cincias sociais a escala Likert (1 = discordo totalmente; 2 = discordo...); Missing define o tipo de tratamento para os casos ausentes que o pesquisador quer adotar. O Default do programa geralmente usado, mas outros valores podem ser definidos (e.g. 999 ou 99); Columns define o tamanho da coluna da varivel, que ser apresentada na janela de input de dados; Align define o alinhamento dentro de cada clula da planilha de dados; Measure que informa o tipo de varivel (contnua ou discreta) sendo estudada pelo pesquisador. Esta definio fundamental, pois o software habilitar o uso das variveis em certos procedimentos a partir do tipo de medida (measure) selecionada.
Na construo de um arquivo de dados para digitao de dados importante criar como primeira varivel uma coluna de identificao. A funo desta criar um rtulo (varivel nominal) de identificao do questionrio dentro do banco de dados. A Figura 1.2 apresenta, na primeira coluna, uma varivel denominada identif. Este rtulo importante para que o questionrio possa ser identificado a qualquer momento, para correo de erros de digitao ou retorno ao questionrio para coletar qualquer tipo de informao. A contagem automtica do SPSS no confivel, pois a excluso de qualquer caso acarretar na modificao da numerao de todos os subsequentes.
5
Captulo 1 Apresentao do programa O SPSS possui ainda mais janelas de trabalho. A prxima a ser apresentada refere-se ao output do programa. Nesta janela so geradas as tabelas e os grficos processados a pedido do usurio. Quando qualquer tipo de procedimento executado, mesmo na janela de input, os resultados so gerados na janela de output, que se abre automaticamente quando o procedimento de anlise solicitado. Essa janela , tambm, um outro tipo de arquivo, com terminao .spo. importante o usurio ter em mente que deve executar o procedimento de nomeao e salvamento desta janela, para que se torne uma janela de resultados do SPSS. A Figura 1.4 apresenta esta janela do programa.
Figura 1.4 Janela de output (sada de dados)
Sumrio das informaes da janela de output.
Rgua de diviso: pode ser movida.
Resultado do procedimento para obteno de grfico de barras.
A outra janela de trabalho do SPSS a de syntax. Esta janela possibilita a execuo de anlises estatsticas e a gerao de grficos a partir dos cdigos de comando do programa. Este tipo de janela muito til quando o padro de anlise de dados extremamente complexo e/ou exige que as anlises sejam feitas com freqncia (como aquelas para relatrios peridicos) ou quando as mesmas anlises devem ser feitas com diferentes variveis, o que possibilita apenas que o nome das variveis seja modificado, sem precisar repetir os procedimentos nos menus do programa. Tambm importante ressaltar que, a exemplo da janela de output, a janela de syntax tambm um arquivo 6
Captulo 1 Apresentao do programa diferenciado, com terminao .sps A Figura 1.5 apresenta esta janela de trabalho do SPSS.
Figura 1.5 Janela de syntax do SPSS.
Comandos do SPSS para Anlise Fatorial.
Comandos para estatstica descritiva (mdia, desvio padro, etc)
Comandos gerao grfico disperso.
para de de
MENUS DE COMANDO
Na janela SPSS Data Editor o programa possui uma srie de menus de comandos, que possibilitam a manipulao e anlise dos dados, bem como os procedimentos do windows para trabalhar com arquivos. O primeiro desses menus denominado File e tem como principais funes a abertura, salvamento, importao, alm de outras funes comuns aos diferentes programas da mesma plataforma operacional ou especficos do SPSS. O segundo menu o Edit, que possui as seguintes funes: voltar a ltima ao, copiar, colar, cortar, procurar (find) e opes. O menu opes tem como objetivo definir diferentes parmetros do programa, como formato de apresentao dos dados digitados na SPSS Data Editor, o formato de gerao das tabelas na janela de output de dados, entre outras funes. A Figura 1.6 apresenta a janela de dilogo do menu edit/opes. 7
Figura 1.6 Janela de opes do programa.
Formato de apresentao do output nomes e labels.
Formato de apresentao da janela de input.
Este menu de opes importante para adaptar o padro de apresentao do programa s caractersticas ou preferncias de trabalho do usurio. Por exemplo, na pasta output labels importante a definio de apresentao do nome das variveis e tambm de seus labels, para que a tabela de resultados j possa fornecer todas as informaes necessrias para a interpretao dos resultados das anlises O prximo menu da barra de comandos denominada Data. Esse menu possibilita manipular o arquivo de dados de diferentes maneiras. A figura 1.7 apresenta a tela do SPSS com este menu aberto.
8

Figura 1.7 Menu Data do SPSS.
Como pode ser observado na Figura 1.7 o menu Data possui vrios comandos. Estes sero apresentados em tpicos a seguir: O comando insert variable permite a insero de uma nova coluna na planilha de dados, ao lado esquerdo da coluna onde se encontra a cela ativa da planilha; o comando insert case ir inserir uma nova linha em uma planilha de dados, acima da linha em que est a cela ativa da planilha; o sort cases realiza um ordenamento de todos os casos de uma planilha (linhas) a partir da seleo de uma das colunas do arquivo de dados; este ordenamento pode ser em ordem ascendente ou descendente, como a especificao apontada na janela de dilogo deste comando; o comando merge files, que possibilita a insero de novos casos (linhas) ou variveis (colunas) provenientes de um outro arquivo de dados; o split files possibilita a separao do banco de dados a partir de uma das variveis deste banco. Quando este comando est acionado, por exemplo, as anlises resultantes sero apresentadas para cada uma das categorias definidas por uma varivel. Se for acionado o comando split files para a varivel 9
Captulo 1 Apresentao do programa escolaridade na Figura 1.7 sero apresentados os resultados para os sujeitos pertencentes a cada grupo de escolaridade; o comando select cases possibilita a seleo de um grupo de casos em um mesmo arquivo ou a criao de um outro arquivo a partir de um grupo de casos inicial. O prximo menu da barra de menus do SPSS denominado Transform. Este menu possibilita a transformao de variveis do arquivo, assim como a criao de novas variveis no arquivo de dados a partir de variveis j presentes no mesmo. A Figura 1.8 apresenta o referido menu na janela de input do SPSS.
Figura 1.8 Menu Transfom do SPSS
A seguir so apresentados os comandos desse menu. compute um comando de gerao de novas variveis (ou sobreposio de antigas) a partir de variveis j existentes no arquivo de dados. Este comando que possibilitar, por exemplo, a gerao dos escores fatoriais, gerados a partir da mdia aritmtica de cada um dos itens componentes do fator. Ele permite a composio e manipulao de variveis por meio de dezenas de funes matemticas; 10
Captulo 1 Apresentao do programa o comando recode possibilita a recodificao de valores (labels) de uma varivel nela mesma ou na criao de uma nova varivel; automatic recode possibilita a recodificao de variveis em novas variveis, mas de forma automtica, diferentemente do que possibilita o comando recode, onde a estipulao dos valores manual; create time series possibilita a gerao de uma varivel de srie temporal dentro de um arquivo de dados j existentes; o comando replace missing values realiza substituies automticas de casos omissos nas variveis selecionadas. Esta substituio pode ser feita pelo valor mdio ou mediano, alm de outros mtodos. Tambm importante ressaltar que o comando gera um novo conjunto de variveis, onde a substituio apresentada. O prximo menu de comando denominado Analyze. Neste menu todos os procedimentos estatsticos esto concentrados. Aqui so apresentadas todas as tcnicas descritivas e inferenciais, univariadas e multivariadas. Vale uma ressalva: as tcnicas descritivas so aquelas que sintetizam os dados brutos, apresentando os padres de disperso (e.g. varincia, desvio padro) e tendncia central (e.g. mdia, moda e mediana), assim como as medidas de posicionamento (e.g. quartil, decil, percentil). As anlises inferenciais so aquelas que aplicam modelos probabilsticos, estimando a chance do comportamento observado na amostra se repetir na populao. Quanto a tcnicas univariadas, estas levam em considerao apenas uma varivel e as multivariadas levam em considerao mltiplas variveis. So comandos do menu analyze: report cases, descriptive statistics, compare means, correlate, regression, data reduction, scale, entre outros. Durante este curso sero abordadas tcnicas estatsticas bsicas que se encontram nos comandos descriptives statistics, correlate e compare means. Estes comandos sero explorados em detalhe no captulo 3. O prximo menu denominado graph. Este relativo aos mdulos de gerao de grficos do SPSS, que apresenta uma grande quantidade de recursos de gerao e
11
Captulo 1 Apresentao do programa manipulao de dados a partir de grficos. A Figura 1.9 apresenta a tela do SPSS com esse menu aberto.
Figura 1.9 Menu Graph do SPSS.
So tipos de grficos gerados por este menu do SPSS: bar apresenta grficos de barras, ideais para comparao de categorias de uma varivel categrica, como escolaridade, sexo, entre outras. Esse tipo de apresentao tambm importante para aquelas variveis categricas que no tem um somatrio total de 100%; pie um tipo de grfico conhecido por pizza. Ele ideal para variveis discretas (categricas) que possuem somatrio total de categorias de 100%; box-plot um grfico que apresenta o tipo de disperso de uma varivel, apresentando o mnimo, o mximo, o primeiro e o terceiro quartil e a mediana em uma nica representao grfica. direcionado para variveis contnuas e ideal para observar casos extremos univariados. O SPSS trabalha a perspectiva de amplitude interquartlica para a identificao de casos extremos; histogram o grfico de barras direcionado para variveis contnuas, onde todas as observaes so encaixadas em intervalos e sua freqncia contatada 12
Captulo 1 Apresentao do programa (eixo X o conjunto de intervalos e o Y a contagem de casos dentro daquela amplitude). Este grfico ideal para observar a normalidade das distribuies; scatter conhecido em portugus como grfico de disperso e apresenta o relacionamento entre duas variveis, buscando captar o componente linear de correlao entre essas variveis. uma forma grfica de captar um coeficiente de correlao bivariada ou um coeficiente de regresso simples; interactive um mdulo do SPSS para trabalhar com todos os grficos descritos anteriormente e muitos outros, mas com a possibilidade de gerao e manipulao tridimensional. Os grficos dos SPSS podem ser formatados na janela de output do programa. Para isso basta clicar duas vezes sobre o grfico, na janela de output, que uma terceira janela ser aberta e vrios procedimentos de formatao podem ser executados, como nomear o grfico, inserir notas de rodap, modificar a cor de partes do grfico, transpor os eixos, entre muitas outra opes. Esses procedimentos so importantes para que os grficos possam sair do SPSS com a aparncia desejada para serem inseridos no corpo de relatrios ou textos. O menu utilities possui vrios comandos que auxiliam na manipulao dos dados e das variveis de um arquivo. Existem comandos para a visualizao das variveis e seus respectivos critrios de definio, estipulados na janela do SPSS Data Editor (input) chamada variable view. O menu Window possibilita a mudana de janelas do SPSS, como em qualquer programa de ambiente windows. O ltimo menu denominado Help. Nele esto inseridas muitas informaes sobre o programa, desde como executar determinados procedimentos at a explicao da funo de diferentes tcnicas estatsticas. Este menu possui um tutorial de procura de termos, que pode ser muito til para a proficincia na operao do SPSS.
13
Captulo 2 Descrevendo Dados no SPSS
CAPTULO 2 Descrevendo Dados no SPSS
Contedo: 1. 2. 3. 4. 5. Tabelas de freqncia Cruzamento de dados Medidas de tendncia central Medidas de posio Medidas de disperso
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. 4. 5. Gerar tabelas de freqncia no SPSS. Gerar e interpretar tabelas de cruzamento de dados. Realizar procedimentos estatsticos de tendncia central. Gerar medidas de posio. Calcular medidas de disperso de dados.
14
Captulo 2 Descrevendo Dados no SPSS Uma das primeiras aes a serem feitas com dados estatsticos sua descrio, por meio de estatsticas descritivas, como freqncias, mdias, medianas, varincia, entre outras. Muitas vezes tambm objetivo da anlise de dados a realizao de cruzamento de diferentes informaes, para se ter uma noo da relao existente entre variveis da pesquisa. Todos os procedimentos referentes a essa descrio de dados, e conseqentemente todo o contedo desse segundo captulo da apostila, esto concentrados no menu Analyze Descriptives Statistics do SPSS. Na presente apostila ser iniciada a apresentao de tcnicas de descrio de dados categricos via SPSS. Para tanto inicialmente sero apresentadas a gerao de tabelas de freqncia e posteriormente a gerao de tabelas de cruzamento de dados (crosstabs). Em seguida sero apresentadas as tcnicas de descrio de dados contnuos no SPSS, primeiramente com as medidas de tendncia central, em seguida com as de posio e por ltima as medidas de disperso. Para a obteno de tabelas de freqncia deve-se seguir os seguintes passos para a janela de dilogo apresentada na Figura 2.1: Analyze Descriptives Statistics Frequencies.
Figura 2.1 Janela do comando Frequencies.
Caixa para requisio de tabela de freqncia.
15
ESCOLAR escolaridade mai s el evada Cumulat iv e Percent 50. 7 82. 4 95. 8 98. 6 100.0
Tabela 2.1 Resultado do procedimento Frequencies.
Valid
Frequency 3 Segundo grau 144 4 Curso s uperior 90 5 Espec ializa o 38 6 Mest rado 8 7 Dout orado 4 Tot al 284
Percent 50. 7 31. 7 13. 4 2. 8 1. 4 100.0
Valid Percent 50. 7 31. 7 13. 4 2. 8 1. 4 100.0
Colunas com freqncia, percentagem, percentagem vlida e percentagem acumulada.
Como pode ser observado na Figura 2.1 foi solicitada uma tabela de freqncia para cada uma das variveis do exemplo, i.e. sexo e escolaridade. A Tabela 2.1 apresenta a tabela de freqncia para a varivel escolaridade, com o resultado da anlise solicitada na Figura 2.1. J a anlise de cruzamento de dados (crosstabs) obtida por meio do menu Analyze Descriptives Statistics Crosstabs. Esse comando resultar na janela apresentada na Figura 2.2.
Figura 2.2 Janela do comando Crosstabs.
Janelas de definio de variveis que sero apresentadas nas linhas (row) e nas colunas (column).
16
ESCOLAR escolaridade mai s el evada * SEXO sexo Crosstabul ati on Count SEXO s exo 1 Feminino 2 Masc ulino 69 75 45 45 19 19 4 4 1 3 138 146 Tot al 144 90 38 8 4 284
Tabela 2.2 Resultado do procedimento Crosstabs.
ESCOLAR esc olaridade mais elev ada
3 4 5 6 7
Segundo grau Curso s uperior Espec ializa o Mest rado Dout orado
Tot al
Valor que representa o nmero de pessoas do sexo feminino que possuem nvel de escolaridade de segundo grau.
Como pode ser observado na Tabela 2.2, a tabela de cruzamento de dados do SPSS apresenta o cruzamento de informaes entre variveis, como sexo e escolaridade, como exemplificado. Dessa forma, possvel ter uma noo de covariao de variveis categricas, para uma explorao das caractersticas dos dados da pesquisa. As medidas de tendncia central so usualmente utilizadas em variveis contnuas ou quantitativas. A Figura 2.3 apresenta a janela de dilogo para execuo das principais medidas de tendncia central no SPSS, mdia, mediana e moda. Essa janela obtida por meio do caminho Analyze Descriptives Statistics Frequencies.
Desmarque essa opo. Clique no boto statistics para selecionar as anlises.
17
Captulo 2 Descrevendo Dados no SPSS Quando selecionado o boto statistics da janela apresentada na Figura 2.3 tem-se a nova janela de dilogo de estatsticas, apresentada na Figura 2.4.
Figura 2.4 Janela de opes de estatstica do comando Frequencies.
Selecione as medidas de tendncia central desejadas: mdia, mediana e moda.
Nessa mesma caixa de dilogo so apresentadas as medidas de posio e disperso.
Depois de geradas as anlises os resultados so apresentados na Tabela 2.3.

Statistics EXPTRAB tempo de experincia de trabalho (em anos j complet os) 282 2 12. 156 10. 000 2. 0
Tabela 2.3 Resultado das anlises de tendncia central.
N Mean Median Mode
Valid Miss ing
IDADE idade (j complet a) em anos 274 10 31. 50 29. 00 21a
As colunas apresentam as variveis e as linhas as anlise de tendncia central.
a. Mult iple modes ex is t. The smallest v alue is shown
Como salientado anteriormente a gerao de medidas de disperso e posio so selecionadas na mesma janela de dilogo, apresentada na Figura 2.4. O resultado da gerao de uma anlise de disperso e de posio apresentada na Tabela 2.4.
18
Statisti cs EXPTRAB tempo de experincia de trabalho (em anos j complet os) 282 2 9. 3293 87. 0361 4. 000 10. 000 20. 000
Tabela 2.3 Resultado das anlises de tendncia central.
Valid Missing
Std. Dev iation Variance Percentiles 25 50 75
IDADE idade (j completa) em anos 274 10 10. 329 106.698 23. 00 29. 00 38. 25
Medidas de disperso (seta superior) e de posio (seta inferior).
Outra estratgia importante para descrio de dados o uso de grficos. Da mesma forma que os indicadores estatsticos os grficos so especficos para cada tipo de varivel em anlise. Grficos de barra e pizza so usados em variveis categricas e histogramas so representaes de variveis contnuas. A Figura 2.5 apresenta o menu chart da janela de dilogo frequencies, obtida pelo caminho Analyze Descriptives Statistics Frequencies e apresentada anteriormente na Figura 2.3.
Figura 2.5 Janela de grficos do comando Frequencies.
Selecione o tipo de grfico desejado de acordo com a varivel a ser descrita.
19
O Grfico 2.1 apresenta um grfico de pizza, obtido por meio do comando descrito na Figura 2.5.
Grfico 2.1 Grfico de pizza obtido por meio do menu chart do comando Frequencies.
Exemplos de histogramas, grficos destinados variveis contnuas, so apresentados no captulo 3 dessa apostila, destinado a obteno de acuracidade de banco de dados aps a digitao.
20
Captulo 3 Explorando e Adequando Arquivo de Dados
CAPTULO 3 Explorando e Adequando o Arquivo de Dados
Contedo: 1. 2. 3. 4. 5. Deteco e correo de erros de digitao Observao e tratamento de casos omissos Observao da normalidade de variveis Estudo e eliminao de casos extremos univariados Estudo e eliminao de casos extremos multivariados
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. 4. 5. 6. 7. Detectar erros de digitao em arquivos de dados Produzir arquivos de dados acurados Tratar os casos omissos por meio dos procedimentos apresentados Identificar a normalidade/anormalidade das variveis Identificar casos extremos univariados Tratar casos extremos univariados Tratar casos extremos multivaridos
21
Captulo 3 Explorando e Adequando Arquivo de Dados Aps os dados terem sido digitados fundamental que o primeiro passo do trabalho de anlise de dados seja a limpeza e a promoo da acuidade do arquivo. Para tanto alguns cuidados e procedimentos devem ser seguidos. Pode-se apontar quatro procedimentos padres, que sero apresentados no presente documento: (1) deteco e correo de erros de digitao, (2) observao e tratamento de casos omissos, (3) observao da normalidade das variveis do arquivo de dados e (4) estudo e eliminao de casos extremos univariados.
DETECO E CORREO DE ERROS DE DIGITAO
muito comum, durante o processo de insero de dados no SPSS, ocorrerem erros de digitao, por exemplo, a duplicao de nmeros em uma clula. Como os questionrios em avaliao de treinamento geralmente so associados a escalas de resposta tipo Likert, a duplicao de valores em uma clula vai acarretar em inflacionamento das estatsticas daquela varivel, prejudicando todo o procedimento de anlise de dados. Para que isso no ocorra fundamental, como primeiro passo para a anlise de dados, verificar se no existem erros de digitao no arquivo de dados. Esse procedimento pode ser realizados por meio do menu Analyze Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.1.
Figura 3.1 Janela do comando Explore.
Lista de variveis a serem analisadas.
22
Aps pressionado o boto statistics da janela da Figura 3.1 ser aberta a janela apresentada na Figura 3.2.
Opo outliers deve ser selecionada.
A seleo desta opo possibilitar a identificao de valores superiores a amplitude da escala de resposta dos itens do questionrio. Assim, erros de digitao do tipo duplicao de valores em uma clula sero identificados. Alm do valor ser apontado atravs deste procedimento, ele tambm possibilitar a identificao do caso onde se encontra esse valor errneo. O resultado do procedimento obtido atravs da janela apresentada na Figura 3.1 apresentado abaixo, na Tabela 3.1.
Extreme Val ues Cas e Number 2 19 217 136 40 279 115 182 198 190 Value 5 5 5 5 .a 1 1 1 1 1
Tabela 3.1 Resultado do procedimento Explore.
IMPAC1
Highest
Lowes t
1 2 3 4 5 1 2 3 4 5
Valores mnimos e mximos e respectivos casos.
a. Only a partial list of c ases wit h t he v alue 5 are shown in t he table of upper ext remes.
importante ressaltar que o procedimento explore apresenta vrias informaes na janela de output, mas apenas a tabela de extreme values possui as informaes disponveis na Tabela 3.1. Tambm possvel a identificao desses 23
Captulo 3 Explorando e Adequando Arquivo de Dados erros de digitao por meio de outros mdulos do SPSS, como Analyze Descriptives Statistics Frequencies. Aps identificados os casos com erros de digitao o operador do arquivo de dados deve retornar a sua fonte bruta de informaes (questionrios respondidos pelos treinandos) e inserir a informaes correta no local certo.
OBSERVAO E TRATAMENTO DE CASOS OMISSOS
O segundo passo a ser seguido a identificao e tratamento de casos omissos (missing data). Um caso omisso uma ausncia de resposta, ou seja, por algum motivo o participante no atribuiu valor a uma pergunta do questionrio. Essa ausncia de resposta pode ser decorrente de diferentes fatores, como saturao de informaes a serem processadas pelo respondente, inadequao da formatao do questionrio, incapacidade do participante opinar sobre a assero. A respeito dessa ltima possibilidade o cdigo no se aplica (NA) de questionrios buscam diminuir a ocorrncia deste tipo de ausncia de resposta. importante ressaltar que o excesso de casos omissos em determinado item de um questionrio pode trazer vrias indicaes e pode, inclusive, ser considerado como escopo de um relatrio, pois a incapacidade dos respondentes em avaliar questes pode indicar inadequao do instrumento, entre muitas outras possibilidades. Esse dado, por si mesmo, pode ser indicador um indicador relevante. A identificao dos casos omissos pode ser obtida por meio do menu Analyze Descriptives Statistics Frequencies, que resultar na janela apresentada abaixo na Figura 3.3.
24

Variveis selecionadas para anlise.
Para a identificao dos omissos, basta que sejam deixadas as especificaes padres do SPSS. A Tabela 3.2 apresenta o resultado dos procedimentos executados atravs da Figura 3.3.
IMPAC 1 Cumulat iv e Percent 1. 8 11. 3 20. 8 74. 1 100.0
Porcentagem de casos omissos observados na varivel. Tabela 3.2 Resultado procedimento Frequencies. do
Valid
Missing Tot al
1 Discordo Tot almente 2 Discordo Pouco 3 No concordo, nem disc ordo 4 Concordo 5 Concordo Totalmente Tot al Sy s tem
Frequency 5 26 26 146 71 274 5 279
Percent 1. 8 9. 3 9. 3 52. 3 25. 4 98. 2 1. 8 100.0
Valid Percent 1. 8 9. 5 9. 5 53. 3 25. 9 100.0
A Tabela 3.2 apresenta os resultados obtidos por meio dos procedimentos executados no comando frequencies. fundamental observar-se a percentagem de casos omissos observados em uma varivel. Valores superiores a 3% podem ser considerados problemticos e devem ser investigados com mais cuidado. Para variveis com valores omissos inferiores ou iguais a 3%, estes podem ser substitudos pela mdia, por meio dos procedimento Replace Missing Values, do menu Transform, j apresentados no primeiro captulo desta apostila. A literatura sobre tratamento de dados omissos ampla e bastante abrangente. De forma geral os pesquisadores e analistas de dados interessados no tema desenvolveram uma classificao para o tratamento destes casos. Um elemento central neste sistema de 25
Captulo 3 Explorando e Adequando Arquivo de Dados classificao diz respeito sistematicidade dos casos omissos. A presena de sistematicidade crucial para o pesquisador, pois se isto ocorre a forma de tratamento destes casos deve ser diferenciada. A classificao pressupe que os casos omissos de um banco de dados possam assumir as seguintes caractersticas: MCAR omissos completamente aleatrios; MAR omissos aleatrios; MNAR omissos sistemticos. O SPSS possui uma ferramenta til para anlise de casos omissos, o mdulo Missing Values Analysis MVA. Acesse o mesmo no menu Analyze Missing Values Analysis. Ser apresentada a janela da Figura 3.4.
Figura 3.4 Janela do comando MVA.
Varivel interesse estudada
de ser
Campo para estimao de valores omissos.
Variveis demogrficas serem checadas.
Em geral o estudo de sistematicidade de casos omissos est associada o observao de relao da varivel de interesse com variveis demogrficas, para obteno de indicaes da ocorrncia de sistematicidade entre a varivel de interesse (no caso do exemplo a varivel AJUDA) e estes indicadores. Para o estudo desta sistematicidade no boto Patterns da caixa de dilogo voc deve selecionar a opo All cases optionally sorted by selected variables. Esta opo trar na janela de sada de dados uma tabela apresentada todos os casos do banco e a ocorrncia de caso omisso na varivel de interesse. uma ferramenta prtica para a observao de algum tipo de 26
Captulo 3 Explorando e Adequando Arquivo de Dados associao entre a varivel de interesse e possveis dados categricos que possam estar associados a um padro de omisso de resposta. Este mdulo do programa tambm permite a estimao de valores para substituio de casos omissos. Como pode ser observado na Figura 3.4 possvel se selecionar estratgias de estimao de valores omissos, de acordo com a literatura da rea. Cada opo tem um tipo de uso e o pesquisador deve estar consciente para a escolha da forma mais adequada para realizar a substituio de valores omissos. Esta estimao pode e deve ser utilizada em conjunto ao comando Replace Missing Values.
OBSERVAO DA NORMALIDADE DAS VARIVEIS
Um outro procedimento muito importante para testar a adequao dos dados para emisso de relatrios o estudo da normalidade das variveis. A ausncia de normalidade na distribuio de uma varivel pode indicar muitas coisas, como ausncia de variabilidade (a grande maioria das pessoas concordam e/ou discordam de uma afirmativa de escala Likert). Essa informao, por si s, j resultado de um relatrio de avaliao de treinamento e pode ser utilizada como subsdio de um relatrio. O que deve-se observar a ausncia de normalidade das variveis que sero inseridas em anlises inferenciais multivariadas, como regresso mltipla. Caso alguma varivel anormal seja parte de uma anlise multivariada, deve-se adotar procedimentos de transformao da mesma (e.g. logartmica, raiz quadrada) atravs do comando compute, no menu transform. Para a deteco da normalidade das variveis deve-se executar o seguinte procedimento Analyze Descriptives Statistics Frequencies, que resultar na abertura da janela apresentada na Figura 3.5.
27

Figura 3.5 Janela do comando Frequencies. Selecionar anlises neste boto.
Selecionar tipo de grfico para estudo da normalidade.
Nesta janela de comando, a exemplo das outras janelas de comando estatstico do SPSS, o operador deve selecionar o conjunto de variveis a serem analisados e mov-las para a coluna da direita. Para a observao da normalidade, o operador deve pressionar em dois botes da borda inferior da janela, o statistics e o charts. As janelas de dilogo destes botes esto apresentadas nas Figuras 3.6 e 3.7.
Figura 3.6 Janela do comando Frequencies: Statistics. Selecione medidas de tendncia central.
fundamental a seleo destas duas medidas de distribuio.
28

Figura 3.7 Janela do comando Frequencies: Charts.
Selecione o histograma com curva densidade (normal).
Lembre-se que sempre aps selecionar um procedimento dentro de uma caixa de dilogo deve-se clicar o boto continue, para que o programa execute os procedimentos solicitados. Os resultados dos procedimentos acima descritos so apresentados na Tabela 3.3 e no Grfico 3.1.
Statisti cs TEMPO Tempo de Empresa N Valid Missing Mean Median Std. Dev iation Skewness Std. Error of Skewness Kurt osis Std. Error of Kurtos is
267 12 8. 6059 4. 0000 8. 9123 .782 .149 -1.036 .297
Tabela 3.3 Estatsticas descritivas do procedimento frequencies.
Valores de skewness e kurtosis e seus respectivos erros padro.
29
Tempo de Empresa
80
60
Grfico 3.1 Histograma observao normalidade.
para de
40
Frequency
20 Std. Dev = 8.91 Mean = 8.6 0 0.0 2.0 4.0 6.0 8.0 12.0 10.0 16.0 20.0 24.0 28.0 14.0 18.0 22.0 26.0 N = 267.00
T empo de Empresa
Para concluir se a distribuio de uma varivel normal deve-se observar para alguns indicadores apresentados na Tabela 2.3, como a skewness e a kurtosis. Quanto mais prximos de 0 estiverem esses valores, mais prximo da normalidade estar a distribuio da varivel. Alm de se observar o valor bruto dos indicadores de assimetria e achatamento deve-se dividir este indicador por seu erro padro. Se o resultado da diviso for superior a 1,96 significa que aquele indicador estatisticamente significativo. Tambm importante observar na mesma tabela o valor do desvio padro, que superior a mdia, o que j indica ausncia de normalidade na distribuio. Por fim podese comparar os resultados dos ndices da Tabela 3.3 com o efeito grfico do histograma, do Grfico 3.1. Claramente a curva densidade (normal) no se aproxima da normalidade. Essa normalidade na curva poderia ser comparada a silhueta de um sino com a boca apontada para baixo.
ESTUDO
ELIMINAO
DE
CASOS
EXTREMOS
UNIVARIADOS
MULTIVARIADOS
Casos extremos univariados so participantes que avaliaram de forma muito diferenciada do restante do grupo um determinado aspecto. Estes casos influenciam, por 30
Captulo 3 Explorando e Adequando Arquivo de Dados exemplo, a normalidade de uma distribuio. Casos extremos podem ser provenientes de sujeitos que respondem sem ateno ao questionrio, avaliando apenas um ponto da escala. Estes casos devem ser identificados, estudados e, se possvel, eliminados do banco, para que os relatrios no sejam mascarados por avaliaes severas ou lenientes em demasia. Para identificao de casos extremos univariados deve-se seguir Analyze Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.8.
Varivel selecionada para anlise.
Boto de grficos deve ser pressionado.
Aps pressionado o boto plots ser apresentada a janela da Figura 3.9.

Figura 3.9 Janela do comando Explore: Plots.
Selecionar dependentes juntos varivel inserida no campo das dependentes.
31
Captulo 3 Explorando e Adequando Arquivo de Dados A melhor anlise de casos extremos univariados pode ser obtida atravs do boxplot do SPSS, que apresenta os casos diretamente abaixo ou acima dos limites da distribuio. O Grfico 3.2 o resultado do procedimento descrito nas figuras anteriores.
Grfico 3.2 Box-plot para observao de casos extremos.
Caso extremo nmero 215 do arquivo de dados exemplo.
279 115 211
-1
N= 275
Escore de Impacto Pr
O grfico aponta qual(is) casos esto acima da amplitude interquartlica. O nmero disposto no caso indicado pelo grfico refere-se ao nmero automtico apresentado na planilha do programa. Caso o grfico indique vrios casos, inicie a deleo pelo nmero maior, para que a numerao dos mais baixos no seja alterada. H um outro tipo de caso extremo que tambm deve ser explorado pelo pesquisador, o caso multivariado. Este caso obtido a partir do estudo simultneo de mltiplas variveis de interesse. Existem alguns procedimentos no SPSS para a identificao dos casos extremos multivariados. A distncia de Mahalanobis a mais comumente utilizada. Voc acessa este procedimento por meio do menu Analyze Regression Linear. Voc obter a janela de dilogo apresentada na Figura 3.10.
32

Figura 3.10 Janela do comando Linear Regression. Selecionar uma varivel dependente que assuma qualquer valor (identificao do sujeito).
Selecione as variveis que sero analisadas em seu estudo (todas que entraro no modelo de anlise).
Pressione o boto save e selecione a opo mahalanobis em distncias.
O resultado desta anlise gerar uma nova coluna de varivel no seu banco de dados. Esta coluna conter a informao da distncia de Mahalanobis. Esta distncia uma distribuio de qui-quadrado e deve ser interpretada com auxlio de uma tabela de distribuio qui-quadrado. Valores superiores ao nvel de significncia determinado pelo pesquisador, considerando os graus de liberdade do modelo em teste (no exemplo gl= 2 pois so trs variveis em teste) determinam se o caso dever ou no ser excludo do banco de dados. Para se automatizar o processo de eliminao de casos extremos multivariados recomenda-se o uso do comando Select Cases do menu Data do SPSS. A seguir, no captulo 4, sero apresentados os procedimentos para realizao de anlises inferenciais via SPSS, mais especificamente ANOVA uma via, para teste de diferena de mdias, correlao para medidas paramtricas e no-paramtricas, teste de qui-quadrado para dados categricos e anlise de regresso linear simples.
33
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada
CAPTULO 4 Realizando Anlises Inferenciais: ANOVA uma via, Correlao Bivariada, Qui-quadrado e Regresso Linear Simples
Contedo: 1. 2. 3. 4. Comparao de Mdias via ANOVA uma via Correlao bivariada para variveis contnuas e categricas Teste de Qui-quadrado Regresso linear simples
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. 4. Realizar anlises de comparao de mdias de ANOVA uma via. Realizar anlises de correlao bivariada. Realizar teste qui-quadrado. Realizar anlise de regresso linear simples.
34
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada Para realizar procedimentos de anlises de teste da relao entre variveis devese efetivar procedimentos especficos, chamados de inferenciais. Caso se deseje testar a diferena de mdia para uma varivel dependente em diferentes grupos necessria a realizao de uma ANOVA uma via. A Figura 4.1 apresenta a caixa de dilogo da ANOVA uma via que obtida por meio do caminho Analyze Compare Means One-Way ANOVA.
Figura 4.1 Janela de dilogo da ANOVA uma via. Acima: Varivel dependente (contnua). Abaixo: Varivel independente (categrica).
Anlises posteriores para comparao par a par dos grupos em anlise.
A anlise solicitada na Figura 4.1 apresenta como resultado a Tabela 4.1, aonde so apresentados os ndices de significncia estatstica do teste de F da ANOVA. Se o ndice de significncia (sig.) for menor que 0,05, h diferenas significativas entre os grupos.
ANOVA EXPTRAB tempo de experincia de trabalho (em anos j c ompletos ) Sum of Squares 6299.377 18157. 758 24457. 135 df 4 277 281 Mean Square 1574.844 65. 551 F 24. 025 Sig. .000
Tabela 4.1 Resultados da ANOVA uma via.
Between Groups Within Groups Tot al
Para a realizao de uma correlao bivariada deve-se seguir o caminho Analyze Correlate Bivariate. Aparecer a janela de dilogo apresentada na Figura 4.2.
35
Figura 4.2 Janela de dilogo correlao bivariada.
Uma correlao bivariada exige ao menos duas variveis para anlise.
Faa a seleo dos coeficientes adequados para o tipo de varivel: Pearson contnuas e demais para categricas.
A Tabela 4.2 apresenta os resultados da anlise de correlao. O coeficiente de correlao varia de 1 a +1 e quanto mais prximo de 0 menor a associao entre duas variveis.
Correlations EXPTRAB tempo de experincia IDADE idade de trabalho (j complet a) (em anos j em anos complet os) 1 .909** . .000 274 272 .909** 1 .000 272 . 282
Tabela 4.2 Resultado da correlao bivariada.
IDADE idade (j complet a) em anos EXPTRAB tempo de experincia de t rabalho (em anos j c ompletos )
Pearson Correlation Sig. (2-t ailed) N Pearson Correlation Sig. (2-t ailed) N
Coeficiente de correlao. Asteriscos indicam o nvel de significncia da correlao.
**. Correlat ion is signif icant at t he 0.01 lev el (2-t ailed).
Para realizar comparao sobre a distribuio do nmero de casos em dois ou mais grupos distintos, pode-se utilizar o teste qui-quadrado. Este teste obtido por meio do caminho Analyze Nonparametric tests Qui-square. A Figura 4.3 apresenta a caixa de dilogo do qui-quadrado. 36

Figura 4.3 Janela de dilogo qui-quadrado.
Varivel a ser testada.
Especifica se o nmero de casos por grupo de tamanho idntico ou de tamanho diferente.
A Tabela 4.3 apresenta os resultados do qui-quadrado. A primeira tabela apresenta os valores observados no banco, os valores esperados e os resduos. A segunda tabela apresenta o teste de significncia. Se significativo, a distribuio dos casos diferente da esperada.
ESC OLAR escolaridade mais elevada Obs erv ed N 144 90 38 8 4 284 Expec ted N 56. 8 56. 8 56. 8 56. 8 56. 8 Res idual 87. 2 33. 2 -18.8 -48.8 -52.8
Tabela 4.3 Resultado do qui-quadrado.
3 Segundo grau 4 Curso s uperior 5 Espec ializao 6 Mes trado 7 Doutorado Tot al
Valores observados e esperados.
Test Statistics ESCOLAR esc olaridade mais elev ada Chi-Squarea 250.507 df 4 Asy mp. Sig. .000 a. 0 cells (.0%) hav e expec ted f requencies less than 5. The minimum expect ed cell f requency is 56.8.
Teste de significncia.
37
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada Para a realizao de anlises preditivas entre duas variveis pode-se realizar uma anlise de regresso simples. Esta anlise obtida por meio do caminho Analyze Regression Linear. A Figura 4.4 apresenta a caixa de dilogo da anlise de regresso.
Figura 4.4 Janela de dilogo da regresso linear. Defina a varivel dependente de anlise. Defina a varivel independente de anlise.
Mtodo de anlise de regresso.
Botes para seleo de procedimentos complementares de anlise.
O resultado da anlise apresentada na Tabela 4.4.

Model Summary Model 1 R R Square ,269a ,072 Adjust ed R Square ,071 Std. Error of the Estimat e 2, 975
Tabela 4.4 Resultado da anlise de regresso linear simples. Sumrio do modelo: R, R2, e R2 ajustado para o tamanho da amostra.
a. Predic tors: (Cons tant), Atribuio_1 SMEAN(Atribuio)

b ANOVA
Model 1
Regress ion Res idual Tot al
Sum of Squares 376,768 4823,688 5200,456
df 1 545 546
Mean Square 376,768 8, 851
F 42, 569
Sig. ,000a
a. Predic tors: (Cons tant ), Atribui o_1 SMEAN(Atribuio) b. Dependent Variable: AJUDA_1 SMEAN(AJ UDA)
a Coeffici ents
Valores de F para regresso e nvel de significncia.
Model 1
(Constant) Atribuio_1 SMEAN(At ribuio)
Uns tandardized Coef f icients B Std. Error 4, 147 ,316 ,529 ,081
Standardized Coef f icients Beta ,269
t 13, 141 6, 524
Sig. ,000 ,000
Coeficiente beta da relao entre VI e VD e respectivos nveis de significncia.
a. Dependent Variable: AJ UDA_1 SMEAN(AJUDA)
38
Captulo 5 Anlise Fatorial
CAPTULO 5 Anlise Fatorial em Avaliao do Treinamento
Contedo: 1. 2. Anlise Fatorial Procedimentos de Execuo da Anlise Fatorial via SPSS
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. 4. Definir Anlise Fatorial Identificar as funes da Anlise Fatorial Descrever os principais conceitos associados Anlise Fatorial Realizar uma Anlise Fatorial, seguindo todas as etapas, via SPSS
39
Captulo 5 Anlise Fatorial ANLISE FATORIAL EM AVALIAO DE TREINAMENTO
A anlise fatorial (AF) uma tcnica estatstica multivariada desenvolvida no incio do sculo XX por um psiclogo-estatstico chamado Spearman. Este pesquisador teve como objetivo estudar as capacidades humanas, por meio da identificao de construtos ou dimenses que so subjacentes estas capacidades. Ele props que traos latentes determinam o desempenho de uma pessoa, por exemplo, a inteligncia pode ser mensurada por meio de um conjunto de itens. A pressuposio que existem habilidades correlacionadas que determinam uma dimenso subjacente, que permite que as pessoas desempenhem em situaes que exijam o uso dessas habilidades. Diante desta pressuposio seria possvel desenvolver um conjunto de itens para mensurar determinado trao latente. Se esses itens fizerem parte da mesma dimenso subjacente sero relacionados entre si e podero ser considerados como indicadores de um determinado construto. Deve-se ressaltar que a construo de medidas deve respeitar alguns pressupostos da teoria psicomtrica, como a elaborao de um nmero suficiente de itens (nem muito pouco, nem em exagero; cada habilidade ou atitude humana necessitam de diferentes nmeros de itens) para mensurao de determinado trao latente. No caso de instrumentos relativos a avaliao de treinamento a pressuposio que os indicadores de modelos de avaliao constituem-se em habilidades e atitudes dos treinandos. Em um instrumento de reao, o trao subjacente a atitude do treinando a respeito do evento instrucional, enquanto uma medida de aprendizagem procura mensurar as habilidades subjacentes desenvolvidas durante o evento instrucional. A partir dessa pressuposio, a AF possibilita a reduo de dados. Essa reduo feita com base no estudo das dimenses latentes que determinariam as atitudes e/ou habilidades das pessoas, que causariam a sua resposta a um conjunto de itens de determinada forma. A implicao prtica deste tipo de procedimento est na reduo de dados, tendo em vista que conjuntos muito extensos de itens podem ser reduzidos a poucos escores, graas a pressuposio dos modelos de avaliao de treinamento, de que as atitudes dos sujeitos so organizadas em dimenses subjacentes. Desta forma, pode-se 40
Captulo 5 Anlise Fatorial obter dois ou trs ndices para a mensurao de reao ao treinamento e, na maioria das vezes, um ndice para o comportamento no cargo (impacto do treinamento no trabalho). , ainda, importante ressaltar que os ndices estatsticos do subsdio para o tcnico selecionar as dimenses, mas essa deve ser calcada, em ltima instncia, no sentido terico dos itens que se agregaram a um fator. Esta tcnica de anlise de dados tem sido muito utilizada na avaliao de treinamento, tanto na pesquisa acadmica quanto nos sistemas de avaliao das organizaes. Pode-se considerar que cada um dos nveis de anlise de um sistema de avaliao possui, no mnimo, uma dimenso latente, compartilhada pelo conjunto de treinandos envolvidos no processo instrucional. Para o nvel de aprendizagem, supe-se a observao de um conjunto de habilidades humanas para cada treinamento desenvolvido, mas os testes dimensionais para o nvel de aprendizagem tem sido mais complicados, pela dificuldade na construo de mltiplas medidas (uma para cada treinamento). Kline (1994) aponta que existem alguns conceitos que so fundamentais para o entendimentos e interpretao de resultados da AF. So esses: Correlao: conceito estatstico que busca captar o componente linear de variao conjunta de duas variveis. Esse coeficiente varia de 1 at +1. Uma correlao perfeita possui o valor 1 (seja esta negativa ou positiva). Quanto maior a correlao entre duas variveis mais estas possuem componentes de covariao em conjunto, ou seja, quanto mais uma varia (modifica de valor) mais a outra varia. A AF baseada nas correlaes entre os itens de um questionrio de avaliao de treinamento. O primeiro passo para o clculo de fatores em uma AF, realizado pelo computador, o clculo de uma matriz de correlao. Todos os itens de um instrumento de avaliao so correlacionados entre si, formando o ponto de partida para a AF. Fatores: busca-se obter, em uma anlise fatorial, dimenses. Essas dimenses so denominadas fatores. Estas so determinadas pela correlao
compartilhada por um conjunto de itens, ou seja, quanto mais correlacionados for um conjunto de itens eles tm uma grande chance de formar um fator. Essa 41
Captulo 5 Anlise Fatorial correlao proveniente desta estrutura subjacente das pessoas, que determina a forma como elas respondem a esse conjunto de questes. Cada fator extrado de uma AF significa a identificao de uma dimenso latente. Cargas Fatoriais: aps observada a correlao de todos os itens entre si e aps a deteco de que alguns grupos desses itens podem ser organizados em fatores necessrio traar qual a correlao de cada item com seu respectiva fator. Essa relao item-fator dada por meio da carga fatorial. Esse um coeficiente que varia de 1 a +1, como a correlao. Quanto mais prximo de 1 maior a relao entre o item e o fator. muito importante ter em mente a funo prtica da AF, que se traduz no conceito de validade. Em um modelo de avaliao, por exemplo no nvel de reao, se pressupe vrias categorias diferentes, como habilidades do instrutor, qualidade do material didtico, qualidade das instalaes do ambiente de treinamento, entre outras. Mas apenas pode-se dizer que uma medida valida quando submete-se o conjunto de instrumentos de avaliao em uma grande quantidade de treinandos e, posteriormente, realiza-se a reduo de dados por meio da AF. Essa tcnica fornece os parmetros para os tcnicos em avaliao de treinamento afirmarem que suas medidas conseguem mensurar o que eles propunham mensurar quando delinearam o modelo, ou seja, a validade da medida. Aps identificado o conjunto de estruturas subjacentes de um questionrio de avaliao de treinamento, faz-se necessrio extrair o ndice de confiabilidade desses fatores. Esse ndice de confiabilidade diz respeito a preciso da medida. Enquanto a AF apresenta a validade da medida, ou seja, o quanto aquele instrumento de avaliao valido, por exemplo, para mensurar a reao dos treinandos perante o treinamento, o ndice de confiabilidade informa qual a qualidade dessa medida.
Cuidado! Como toda tcnica estatstica deve-se tomar alguns cuidados com a AF. Atualmente, com a sofisticao dos microcomputadores e tambm dos softwares estatsticos muito fcil realizar procedimentos multivariados como o de AF. O tcnico 42
Captulo 5 Anlise Fatorial sempre deve-se lembrar da mxima garbage in, garbage out (lixo entra, lixo sai). O tcnico deve possuir uma pressuposio terica, na qual hipotetize a existncia de dimenses subjacentes. No caso de avaliao de treinamento, os modelos possuem tal pressuposio, pois so organizados em dimenses, constitudas por diferentes indicadores. Por este motivo que no coerente efetuar uma anlise fatorial em um conjunto de itens onde a pressuposio anterior de categorias no exista, pois podero ser extradas dimenses, formadas apenas por correlaes esprias entre itens. Devido a possibilidade de correlaes distorcidas que o sentido terico dos itens deve ser o principal critrio para identificao de dimenses latentes.
PROCEDIMENTOS PARA EXECUO DA ANLISE FATORIAL
Para a realizao de uma anlise fatorial exploratria deve-se observar uma seqncia lgica de procedimentos para a deteco dos fatores latentes em um conjunto de itens. Inicialmente, o tcnico deve realizar uma anlise dos componentes principais e, posteriormente, uma anlise fatorial propriamente dita. A anlise dos componentes principais uma tcnica mais flexvel, que tem como funo dar indicaes do nmero de fatores que devem ser extrados no segundo passo do procedimento. A figura 3.1 apresenta a janela de dilogo da AF, obtida atravs de Analyze Data Reduction Factor.
43

Figura 5.1 Janela do comando Factor
Pressione os botes indicados na parte inferior.
Figura 5.2 Janela do comando Factor: Descriptives.
Selecionar todas essas opes.
Figura 5.3 Janela do comando Factor: Extration.
Mantenha default selecione opo.
o e esta
44

Figura 5.4 Janela do comando Factor: Rotation.
Mantenha o default, que sem indicao de rotao.
Figura 5.5 Janela do comando Factor: Options Selecione esta opo, que ordenar todos os coeficientes. Selecione esta opo e modifique o valor para 0,30.
Todos esses procedimentos resultaro em tabelas e grficos no output. Os principais, importantes para a tomada de deciso, sero apresentados a seguir. A tabela 3.1 apresente o teste de KMO. Este um indicador de fatorabilidade da matriz de dados. Quanto mais prximo de 1 melhor. Acima de 0,80 j existe indicativo de que os dados so submetidos a AF. No caso deste exemplo existe indicao de adequao dos dados para serem submetidos a AF.
KMO and Bartlett's Test Kaiser-Mey er-Olkin Measure of Sampling Adequacy . Bart lett's Tes t of Sphericity Approx. Chi-Square df Sig. .889 971.990 66 .000
Tabela 5.1 ndice de KMO.
45
Captulo 5 Anlise Fatorial O prximo indicador, apresentado na tabela 3.2, aponta a quantidade de fatores apontado pela anlise de componentes principais. Essa informao obtida por meio dos eigenvalues. Valores superiores a 3,0 apontam para a existncia de dimenses. Em seguida, no grfico 3.1, so apresentados os eigenvalues. Quando a curva torna-se uma queda ordenada decrescente que existe indicao da estrutura fatorial.
Total Variance Expl ained Init ial Eigenv alues % of Variance Cumulat iv e % 39. 634 39. 634 10. 424 50. 058 7. 187 57. 246 6. 838 64. 084 6. 302 70. 386 6. 041 76. 428 4. 995 81. 423 4. 732 86. 155 4. 100 90. 255 3. 455 93. 710 3. 166 96. 875 3. 125 100.000 Extraction Sums of Squared Loadings Tot al % of Variance Cumulat iv e % 4. 756 39. 634 39. 634 1. 251 10. 424 50. 058
Component 1 2 3 4 5 6 7 8 9 10 11 12
Tot al 4. 756 1. 251 .862 .821 .756 .725 .599 .568 .492 .415 .380 .375
Tabela 5.2 Eigenvalues da soluo.
Somente um valor superior a 3, indicando apenas um fator.
Extraction Met hod: Princ ipal Component Analy sis.
Scree Plot
5
Grfico 5.1 Scree-plot grfico de eigenvalues.
Queda constante indica a presena de apenas um fator.
Eigenvalue
0 1 2 3 4 5 6 7 8 9 10 11 12
Component Number
Como resultado da anlise de principais componentes deste banco de dados observa-se que o conjunto de itens se agrega, adequadamente, em apenas um fator. A concluso final pode ser extrada da observao do scree plot, que claramente indica a 46
Captulo 5 Anlise Fatorial presena de um fator, com eigenvalue muito elevado, indicando uma alta explicao da varincia de todos os itens. Depois de concludo a estrutura fatorial a partir da anlise de componentes principais, deve-se proceder a anlise fatorial. Para tanto, sero necessrias alteraes em algumas das janelas (apresentadas nas figuras 3.1 a 3.5), como apresentado a seguir: Janela Factor (figura 3.1): matenha os mesmos itens selecionados para a anlise de componentes principais; Janela Factor: Descriptives (figura 3.2): retire a marcao de todas as opes. Estas informaes no so mais necessrias; Janela Factor: Extraction (figura 3.3): retire as marcaes do scree plot e unrotated factor solution. Marque a opo nmero de fatores, informando o nmero observado na anlise de componentes principais (um neste exemplo). V at o campo Method e selecione principal axis factoring (PAF). Janela Factor: Rotation (figura 3.4): mantenha o default, sem rotao. Isso deve ser feito para este exemplo, com indicao de apenas um fator. A ausncia de rotao aplica-se apenas para solues fatoriais de estrutura unifatorial. Janela Factor: Options (figura 3.5): matenha as mesmas informaes solicitadas na anlise de componentes principais. O arquivo de output desses procedimentos conter um nmero
consideravelmente menor de informaes do que aquele gerado pela anlise de componentes principais. interessante observar algumas informaes nestes resultados, como a tabela de porcentagem da varincia explicada, a mesma apresentada na tabela 3.2. Mas a principal informao que deve ser observada a matriz de cargas fatoriais da soluo, apresentada na tabela 3.3. bom ressalvar que esta matriz recebe este nome (factor matrix) quando a soluo unifatorial. Quando a soluo for com mais de um fator a matriz que deve ser observada denominada pattern matrix.
47

a Factor Matrix
IMPAC6 IMPAC1 IMPAC9 IMPAC3 IMPAC5 IMPAC2 IMPAC8 IMPAC12 IMPAC4 IMPAC7 IMPAC10 IMPAC11
Factor 1 .707 .706 .661 .628 .612 .589 .583 .574 .528 .479 .461 .431
Tabela 5.3 Cargas fatoriais dos itens da soluo.
Extraction Met hod: Princ ipal Axis Fac toring. a. 1 f actors extracted. 4 iterations required.
Na tabela 3.3 podem ser observadas duas colunas. A primeira possui o nome de cada um dos itens do fator. Neste exemplo todos os itens do fator obtiveram valor de carga fatorial superior a 0,30 e todos os itens analisados (12 ao total) fizeram parte da soluo final. A segunda coluna (direita) possui a carga fatorial de cada item, indicando o grau de correlao de cada um dos itens com o fator ao qual pertence. Aps finalizada a anlise fatorial, o ltimo procedimento diz respeito ao clculo do ndice de confiabilidade (preciso) do fator. Para tanto necessrio seguir o seguinte procedimento Analyze Scale Reliability Analysis, que resultar na abertura da janela apresentada na figura 3.6.
Figura 5.6 Janela do comando Reliability.
Pressione este boto e escolha scale if item deleted.
Selecione todos os itens que compem o fator a ser examinado
48
Captulo 5 Anlise Fatorial O tcnico deve pressionar o boto da janela da figura 3.6 e selecionar a opo, como indicada no texto explicativo ao lado da figura. Esse procedimento ir inserir na tabela o valor do alpha (coeficiente de confiabilidade) caso o item seja excludo da soluo fatorial. Esse mais um indicador para apontar a adequao do item na mensurao da estrutura latente. A tabela 3.4 apresenta as informaes relativas ao procedimento de teste de preciso da escala.
S C A L E (A L P H A)
Tabela 5.4 Resultados dos clculos de confiabilidade. Coluna com valores de alpha caso o item fosse eliminado.
Item-total Statistics Scale Mean if Item Deleted IMPAC1 IMPAC2 IMPAC3 IMPAC4 IMPAC5 IMPAC6 IMPAC7 IMPAC8 IMPAC9 IMPAC10 IMPAC11 IMPAC12 41.3916 41.2548 41.3042 41.6350 41.5247 41.4068 41.7947 41.3764 41.4030 42.0570 41.6540 41.7529 Scale Variance if Item Deleted 40.3384 42.6333 40.8537 42.4693 40.7542 40.8911 42.9424 41.1669 40.6156 41.6341 42.9905 41.1715 Corrected ItemTotal Correlation .6428 .5347 .5732 .4791 .5624 .6353 .4398 .5451 .6196 .4366 .4133 .5237 Alpha if Item Deleted .8383 .8462 .8430 .8494 .8438 .8393 .8519 .8450 .8399 .8537 .8538 .8466
ndice geral da escala, com todos os itens selecionados.
Reliability Coefficients N of Cases = Alpha = .8570 263.0 N of Items = 12
O valor obtido nesta escala do exemplo pode ser considerado bom, pois o valor superior a 0,80. Este coeficiente varia de 0 a 1 e os melhores ndices so aqueles superiores a 0,90. Todos os procedimentos apresentados neste captulo sero suficientes para a extrao de indicadores de validade e confiabilidade de questionrios de avaliao de treinamento via SPSS. Caso o leitor esteja interessado em aprofundamentos na tcnica de AF sugere-se recorrer a leitura recomendada ao final desta apostila. 49
Captulo 5 Anlise Fatorial Aps definidos os itens que compem cada fator do instrumento de avaliao de treinamento, necessria a criao de escores fatoriais por caso no arquivo de dados, gerando, finalmente, a reduo de um conjunto de itens a um nico indicador. Esse procedimento feito atravs do menu Transform Compute, resultando na janela apresentada na figura 3.7.
Figura 5.6 Janela do comando Reliability
Selecione a expresso numrica MEAN e defina as variveis que fazem parte do fator
Atribua um nome para a varivel que ser gerada
O campo Functions possui uma srie de expresses. Para a criao do escore fatorial a expresso MEAN deve ser selecionada e transportada para o campo superior. Em seguida todas as variveis que compem o fator devem ser inseridas entre os parnteses que seguem a expresso numrica. Aps esta seleo o boto OK deve ser pressionado. Isto ir gerar uma coluna ao final do arquivo de dados, atribuindo um escore para cada treinando que participou da avaliao do treinamento. Esse mesmo procedimento pode gerar escores para qualquer estrutura fatorial observada. Aps a execuo desse procedimento todas as anlises que iro subsidiar o relatrio podero ser feitas com base nesses escores, deixando de lado os itens que os constituram. Os itens podem ser usados novamente, a depender do interesse dos tcnicos em treinamento.
50
Captulo 6 Gerao e Uso de Syntax
CAPTULO 6 Gerao e Manipulao de Syntax
Contedo: 1. Funo e Uso da Syntax no SPSS
Objetivos: Ao final do captulo o aluno dever ser capaz de: 1. 2. 3. Identificar quais os possveis usos dos comandos da syntax Descrever alguns comandos da syntax Criar syntax de comandos para gerao de rotinas de relatrios em avaliao de
treinamento
51
Captulo 6 Gerao e Uso de Syntax FUNO E USO DA SYNTAX NO SPSS Como apresentado no primeiro captulo desta apostila, o SPSS possui um tipo de arquivo que possibilita a gerao e arquivamento de informaes relativas a procedimentos de anlise de dados. Este tipo de arquivo muito til quando o tcnico necessita (a) realizar rotinas de anlise de dados, como relatrios peridicos, onde os procedimentos no so diferenciados; (b) realizar anlises complexas, onde um mesmo procedimento estatstico deve ser realizado, mas com diferentes variveis de um mesmo arquivo de dados ou de arquivos de dados diferentes; e (c) trabalhar com mltiplos procedimentos de anlise em um mesmo arquivo, como anlise exploratria complexa. Na manuteno de um sistema de avaliao de treinamento interessante a utilizao de arquivos de syntax para a realizao de rotinas peridicas de trabalho, como o caso da elaborao de relatrios. importante chamar a ateno que a presente apostila tem como funo informar sobre alguns tipos de comandos da syntax do SPSS. Existem uma quantidade muito grande de comandos via syntax e existem manuais especficos para a manipulao desses procedimentos. O menu help do SPSS traz muita informao sobre a syntax, podendo auxiliar na manipulao de dados por meio deste comando. O arquivo de syntax pode ser obtido atravs do uso do boto Paste, presente na grande maioria das janelas de dilogo do SPSS. A figura 4.1 apresenta o procedimento para gerao do comando GET em um arquivo de syntax. A janela obtida por meio do File Open Data.
52
Captulo 6 Gerao e Uso de Syntax

Figura 6.1 Janela do comando Open Escolha o arquivo desejado e pressione o boto indicado.
Esse mesmo procedimento, o boto Paste, pode ser utilizado em diversas caixas de dilogo do SPSS para gerao dos arquivos syntax de comando. A figura 6.2 apresenta uma janela syntax com diferentes comandos j copiados em sua estrutura.
Figura 6.2 Janela de arquivo syntax
Resultado do comando executado na figura anterior
Variveis selecionadas para anlise descritiva.
Na mesma figura ainda so apresentados outros procedimentos de anlise e transformao de dados. O comando COMPUTE faz a criao de escores fatoriais, como 53
Captulo 6 Gerao e Uso de Syntax apresentado na Figura 5.6. Dois comandos GRAPH, para gerao de grficos; no exemplo um grfico de disperso e um histograma. Tambm apresentado no exemplo um comando CORRELATIONS. Utilizando este procedimento possvel a gerao de arquivos de dados com rotinas de trabalho, para gerao de relatrios em avaliao de treinamento. A Figura 6.3 apresenta um exemplo de comandos para relatrio de avaliao de treinamento, nos nveis de reao, aprendizagem, comportamento no cargo (impacto do treinamento) e mudana na organizao.
Figura 6.3 Janela de syntax com exemplo de rotina de relatrio
Neste exemplo so solicitados vrios tipos de anlises que podem ser teis em um relatrio de avaliao de treinamento. Inicialmente foram solicitadas freqncias das variveis discretas do banco de dados. Neste comando a inteno identificar a frequencia de casos de cada uma das variveis indicadas no comando. Em seguida foi solicitado o comando FREQUENCIES com especificao de ndices relativos as variveis contnuas (e.g. impacto do treinamento em amplitude e profundidade). Essas informaes iniciais possibilitam identificar os ndices descritivos do resultado do
54
Captulo 6 Gerao e Uso de Syntax treinamento, j indicando se o treinamento modificou o comportamento do treinando no cargo. Em seguida, foram solicitadas duas correlaes, para obter o grau de relao existente entre algumas variveis. Neste caso a inteno comparar se existe algum tipo e relao entre o resultado do treinamento no trabalho e variveis de contexto e dos indivduos. Tambm foi solicitada uma correlao no paramtrica, indicada para relacionar variveis contnuas e categorias, neste exemplo escolaridade com o resultado do treinamento no trabalho. Neste exemplo, tambm foi solicitado o clculo de um teste T, para averiguao do nvel de significncia dos escores desta amostra em relao a populao. Por ltimo foi solicitado um grfico interativo, atravs do comando IGRAPH, para observao do padro de distribuio da varivel impacto do treinamento no trabalho. Este exemplo hipottico pode ser o escopo de informaes de um relatrio de apresentao dos resultados de impacto do treinamento no trabalho de um grupo de treinandos. Obviamente que a equipe de tcnicos da organizao deve definir quais so suas necessidades e tambm o interesse dos consumidores do resultado de um sistema de avaliao de treinamento.
55

Apostila SPSS

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila SPSS

Enviado por

Direitos autorais:

Formatos disponíveis

APOSTILA PARA TRATAMENTO DE DADOS VIA SPSS

Ronaldo Pilati Juliana B. Porto

1 1 1 14 14 21 21 34 CORRELAO BIVARIADA, QUI34 39 39 51 51

CAPTULO 5 ANLISE FATORIAL EM AVALIAO DO TREINAMENTO CAPTULO 6 GERAO E MANIPULAO DE SYNTAX

Captulo 1 Apresentao do programa

CAPTULO 1 Apresentao do SPSS

Contedo: 1. 2. Apresentao das Janelas de Trabalho Descrio dos Menus de Comando

Captulo 1 Apresentao do programa JANELAS DE TRABALHO

Colunas: representam as variveis em um banco de dados.

Linhas: representam os casos em um banco de dados

Acesso a janela de definio dos parmetros das variveis.

Figura 1.3 Caixa de dilogo Variable Type..

Caixa de dilogo de definio de tipo da varivel.

Clicando-se com o boto da direita do mouse abre-se esta janela explicativa.

Sumrio das informaes da janela de output.

Rgua de diviso: pode ser movida.

Resultado do procedimento para obteno de grfico de barras.

Comandos do SPSS para Anlise Fatorial.

Comandos para estatstica descritiva (mdia, desvio padro, etc)

Comandos gerao grfico disperso.

Captulo 1 Apresentao do programa

Figura 1.6 Janela de opes do programa.

Formato de apresentao do output nomes e labels.

Formato de apresentao da janela de input.

Captulo 1 Apresentao do programa

Captulo 2 Descrevendo Dados no SPSS

CAPTULO 2 Descrevendo Dados no SPSS

Caixa para requisio de tabela de freqncia.

Captulo 2 Descrevendo Dados no SPSS

Percent 50. 7 31. 7 13. 4 2. 8 1. 4 100.0

Valid Percent 50. 7 31. 7 13. 4 2. 8 1. 4 100.0

Colunas com freqncia, percentagem, percentagem vlida e percentagem acumulada.

Captulo 2 Descrevendo Dados no SPSS

ESCOLAR esc olaridade mais elev ada

Figura 2.3 Janela do comando Frequencies.

Desmarque essa opo. Clique no boto statistics para selecionar as anlises.

Figura 2.4 Janela de opes de estatstica do comando Frequencies.

Selecione as medidas de tendncia central desejadas: mdia, mediana e moda.

Nessa mesma caixa de dilogo so apresentadas as medidas de posio e disperso.

Depois de geradas as anlises os resultados so apresentados na Tabela 2.3.

N Mean Median Mode

Valid Miss ing

IDADE idade (j complet a) em anos 274 10 31. 50 29. 00 21a

As colunas apresentam as variveis e as linhas as anlise de tendncia central.

a. Mult iple modes ex is t. The smallest v alue is shown

Captulo 2 Descrevendo Dados no SPSS

Std. Dev iation Variance Percentiles 25 50 75

Medidas de disperso (seta superior) e de posio (seta inferior).

Selecione o tipo de grfico desejado de acordo com a varivel a ser descrita.

Captulo 2 Descrevendo Dados no SPSS

Captulo 3 Explorando e Adequando Arquivo de Dados

CAPTULO 3 Explorando e Adequando o Arquivo de Dados

DETECO E CORREO DE ERROS DE DIGITAO

Figura 3.1 Janela do comando Explore.

Lista de variveis a serem analisadas.

Captulo 3 Explorando e Adequando Arquivo de Dados

Opo outliers deve ser selecionada.

Valores mnimos e mximos e respectivos casos.

OBSERVAO E TRATAMENTO DE CASOS OMISSOS

Captulo 3 Explorando e Adequando Arquivo de Dados

Variveis selecionadas para anlise.

Frequency 5 26 26 146 71 274 5 279

Percent 1. 8 9. 3 9. 3 52. 3 25. 4 98. 2 1. 8 100.0

Valid Percent 1. 8 9. 5 9. 5 53. 3 25. 9 100.0