NDICE
1. INTRODUO AO SPSS ................................................................................... 3 1.1 - Banco de dados: definio .......................................................................... 4 1.2 - Como criar um banco de dados ................................................................... 4 1.3 - Como dar nome a uma varivel ................................................................... 6 1.4 - Como dar nome aos nveis de uma varivel ................................................ 6 1.5 - Como acessar um banco de dados j existente .......................................... 7 1.6 - Como exportar um banco de dados do spss para o excel ........................... 7 2. INTRODUO AOS MTODOS ESTATSTICOS.............................................. 8 2.1 - Tipos de variveis: definio ....................................................................... 8 2.2 - Descrio e explorao de dados................................................................ 8 2.3 - Anlise univariada ....................................................................................... 9
2.3.1 - Variveis quantitativas .................................................................................................9
2.3.1.1 - Como obter as estatsticas descritivas ................................................................................. 9 2.3.1.2 - Como obter um histograma ............................................................................................... 10 2.3.1.3 - Como obter um box-plot .................................................................................................... 11
2.4 - Como exportar o output para word ............................................................ 18 3 - CATEGORIZAO DE VARIVEIS ............................................................... 18 3.1 - Como categorizar uma varivel quantitativa .............................................. 18 3.2 - Como criar uma varivel a partir de datas ................................................. 21 3.3 - Como criar uma varivel atravs da combinao de outras duas .............. 22 3.4 - Como criar uma varivel atravs de um clculo com outras variveis ....... 23 3.5 - Como criar uma varivel a partir da contagem de outras ........................... 24 4. MANIPULAO DE DADOS........................................................................... 25 4.1 - Ordenao de casos: Sort Cases .............................................................. 25 4.2 - Seleo de casos: Select Cases ............................................................... 27 4.3 - Diviso de anlises por grupos: Split File .................................................. 30 4.4 - Juntar bancos de dados: Merge Files ........................................................ 32
4.4.1 - Juntando bancos com diferentes casos........................................................................32 4.4.2 - Juntando bancos com diferentes variveis ...................................................................32
4.5 - Manipulao de arquivos ........................................................................... 33 4.6 - Edio do arquivo de resultados (*.spo): como apagar anlises no desejadas no arquivo de resultados .................................................................. 34 5. ALGUMAS ANLISES BIVARIADAS .............................................................. 34 5.1 - Comparao de duas variveis categricas: Teste Qui quadrado ............. 34
5.1.1 - Como obter os resduos ajustados ...............................................................................36
5.2 - Como comparar mdias entre dois grupos: Teste t para Amostras Independentes. .................................................................................................. 37
1. INTRODUO AO SPSS
O pacote estatstico SPSS (Statistical Package for Social Sciences) uma ferramenta para anlise de dados utilizando tcnicas estatsticas bsicas e avanadas. um software estatstico de fcil manuseio e internacionalmente utilizado h muitas dcadas, desde suas verses para computadores de grande porte.
(a)
(b) Figura 1: Tela inicial do SSPS 18.0 for Windows. 1(a): Planilha Data View; 1(b): Planilha Variable View.
b)
c) d)
e)
f)
g) h)
VAR002,etc.), e uma margem vertical numerada a partir de 1 (como mostrado na Figura1a). Na primeira coluna, correspondendo 1 VAR, criar uma varivel, por exemplo, NumCaso com o nmero do questionrio ou do caso em estudo. Veja exemplo 1 abaixo. Para serem registradas as caractersticas das variveis em cada coluna, clique duas vezes sobre a coluna var. Aparece a planilha variable view na qual cada varivel est definida em uma linha. Na primeira coluna (Name), digitar o nome da varivel desejada (Ex: NumCaso). Para o nome das variveis utilize 8 dgitos no mximo e no utilize espao em branco, nem os smbolos -, . e /. O SPSS no permite que o nome de uma varivel comece com um nmero. Clicar na coluna Type para definir o tipo de varivel. Aparece uma janela Variable Type onde deve-se deixar a opo Numeric se a varivel for numrica ou String se a varivel for alfa-numrica (texto). Preferencialmente use sempre a modalidade Numeric para variveis categricas, como por exemplo, sexo, estado civil, municpio, etc. criando-se um cdigo para as categorias. No caso de no-resposta ou respostas que no se desejam considerar para o tratamento estatstico, como por exemplo, respostas no corretas, no se aplica, sem resposta, etc..., clicar na coluna Missing, abre-se uma janela (Missing Values), registrar, na opo Discrete Missing Values, o cdigo de no-resposta, preferencialmente 9, 99, 999, etc. Clicar em OK. Entretanto, a melhor opo para no resposta deixar o espao em branco no banco de dados. Retornar planilha Data View e passar a digitar, em cada linha da coluna identificada, o valor da varivel. medida que as informaes vo sendo registradas no BANCO DE DADOS importante salv-las. Para tanto, se procede da seguinte forma: clicar em File Save as... (abre-se a janela na qual se escolhe o caminho desejado para salvar o arquivo) e criar um nome para o Banco de dados, que ter automaticamente a terminao .sav.
Exemplo 1: A tabela a seguir contm informaes sobre 5 indivduos para as seguintes variveis: 1) Nmero de identificao (numcaso) 2) Nome (nome) 3) Sexo (sexo) 4) Data de nascimento (datanasc) 5) Altura em metros (altura) Digite as informaes no SPSS:
sexo* 1 0 0 1 1
importante dar ao arquivo o nome mais claro possvel para facilitar sua localizao e acesso. Os arquivos de dados so do tipo . sav. RECOMENDAO: A primeira coluna da matriz deve corresponder ao nmero do questionrio, nmero do caso, ou ainda cdigo do registro, pois facilita a localizao de informaes no caso de serem identificados equvocos de digitao.
criar um nome para o Banco de dados; b) Em Save as type escolher Excel; c) Clicar em Save. No local escolhido ser salvo um novo arquivo com a terminao .xls. Para exportar para outros programas procede-se da mesma maneira, penas mudando em Save as type para o tipo de sua preferncia.
OBSERVAO: No podemos calcular mdia, varincia ou desvio-padro de variveis qualitativas ou variveis categricas.
2.3 - Anlise univariada 2.3.1 - Variveis quantitativas 2.3.1.1 - Como obter as estatsticas descritivas
A partir daqui ser utilizado o banco WORLD95.SAV. Para calcular as
estatsticas descritivas possvel proceder de 2 formas: 1 - Atravs do comando Frequencies a) Clicar em Analyze Descriptive Statistics Frequencies; b) Localizar na janela esquerda a varivel de interesse (por exemplo, babymort: mortalidade infantil) e clicar na ; c) Clicar em Statistics, e assinalar as opes desejadas (ex: quartiles, mean, standard deviation, minimum, maximum); d) Clicar em Continue; OK; e) Os resultados da anlise estatstica aparecem na janela de resultados (OUTPUT), que poder ser salva, dando origem a um arquivo do tipo .spo (SPSS output). EXEMPLO: Frequencies
Statistics Infant mortality (deaths per 1000 live births) N Mean Median Std. Deviation Minimum Maximum Valid Missing 109 0 42,313 27,700 38,0792 4,0 168,0
2 - Atravs do comando Descriptives f) Clicar em Analyze Descriptive Statistics Descriptives; g) Localizar na janela esquerda a varivel de interesse (por exemplo, mortalidade infantil (babymort)) e clicar na ; h) Clicar em Options, e assinalar as opes desejadas; i) Clicar em Continue; OK;
j)
Os resultados da anlise estatstica aparecem na janela de resultados (OUTPUT), que poder ser salva, dando origem a um arquivo do tipo .spo (SPSS output).
EXEMPLO: Descriptives
Descriptive Statistics N Infant mortality (deaths per 1000 live births) Valid N (listwise) 109 109 Minimum Maximum 4,0 168,0 Mean 42,313 Std. Deviation 38,0792
10
11
INTERPRETAO: A tabela acima apresenta o nmero de casos vlidos (valid), o nmero de no respostas (missing) e o nmero total das observaes. Infant mortality (deaths per 1000 live births)
INTERPRETAO: Atravs do Box-plot possvel observar como as variveis esto distribudas em relao homogeneidade dos dados, valores de tendncia central, valores mximos e mnimos e valores atpicos, se existirem. Quando a caixinha (box) muito pequena, significa que os dados esto muito concentrados em torno da mediana, e se a caixinha for grande, significa que os dados so mais hetereogneos.
12
LEGENDA: Md: Mediana (linha horizontal escura dentro do box) Q1: Quartil inferior - 1quartil (limite inferior do box) Q3: Quartil superior - 3quartil (limite superior do box) d: diferena interquartlica (d = Q3 Q1) o : outlier (valores acima de 1,5 x d) x : outlier (valores acima de 3,0 x d) Se no existir nenhum valor abaixo de Q1-1,5d ou acima de Q3+1,5d, os limites do boxplot correspondem aos valores mnimo e mximo da varivel.
a) Clicar em Analyze Descriptive Statistics Frequencies; b) Selecionar a varivel desejada (por exemplo, region), clicar na c) Selecionar Display frequency tables; d) Clicar em OK. ;
RESULTADO:
13
Statistics Region or economic group N Valid 109 Missing 0 Region or economic group Valid Cumulative Frequency Percent Percent Percent Valid OECD 21 19,3 19,3 19,3 East Europe 14 12,8 12,8 32,1 Pacific/Asia 17 15,6 15,6 47,7 Africa 19 17,4 17,4 65,1 Middle East 17 15,6 15,6 80,7 Latin America 21 19,3 19,3 100,0 Total 109 100,0 100,0 INTERPRETAO: A tabela acima apresenta na 1 coluna a freqncia simples de casos, na 2 coluna a freqncia relativa, na 3 coluna a freqncia relativa excluindo os missings e na 4 coluna a freqncia relativa acumulada.
14
a) Clicar em Graphs, Legacy dialogs selecionar Bar; b) Selecionar a opo Simple e, em Data in chart are, selecionar a opo Summaries for groups of cases e clicar em Define; c) Na opo Bars represent selecionar % of cases; d) Na opo Category axes selecionar a varivel region, clicar OK. RESULTADO:
Para colocar o valor percentual de cada categoria no grfico: a) Clicar duas vezes no grfico; b) Abre o SPSS Chart Editor; clicar em elements/show data labels; c) Na janela properties, em data value labels, selecionar percents; d) Clicar OK. RESULTADO:
15
a) Clicar em Graphs, selecionar Pie; b) Selecionar a opo Summaries for groups of cases e clicar em Define; c) Na opo Define Slices by selecionar a varivel region.
RESULTADO:
16
Para colocar no grfico o valor percentual de cada categoria: a) Clicar duas vezes no grfico; b) Abrir a janela de edio de grficos (SPSS Chart Editor); c) Nesta janela, clicar em elements/show data labels; d) Abrir uma nova janela properties; e) Ir em data value labels, selecionar a opo percents; f) Clicar em OK. RESULTADO:
17
18
RESULTADOS: Frequencies
Statistics Population in thous ands N Valid Miss ing Perc entiles 25 50 75
2.
Criar uma varivel com 4 categorias, definidas pelos quartis, da seguinte maneira: Categoria 1 2 3 4 Intervalo de valores Mnimo at 5000,00 5001,00 at 10400,00 10401,00 at 37100,00 37101,00 at o valor mximo da varivel
Para categorizar a varivel populatn, usando os limites dados pelos quartis procede-se da seguinte forma: a) Clicar em Transform Recode Into Different Variables; b) Localizar, na janela esquerda, a varivel a ser categorizada ( populatn) e clicar na ; c) Digitar um novo nome para a varivel de sada ( Output Variable) - por exemplo POPREC - e clicar em Change; d) Clicar em Old and New Values; e) Clicar em Range (lowest through) e digitar o valor obtido para o primeiro quartil, no caso 5000; f) Em New Value, digitar 1; g) Clicar em ADD; h) Assinalar Range, colocando: 5001 at (Through) 10400 (segundo quartil); i) Na opo New Value, digitar 2; j) Clicar em ADD; k) Assinalar Range, 10401 at (Through) o terceiro quartil 37100; l) Na opo New Value, digitar 3; m) Clicar em ADD;
19
n) Clicar em Range (Through Highest) e digitar o valor imediatamente superior ao 3 quartil, no caso 37101; o) Na opo New Value, digitar 4; p) Clicar em ADD; Continue, OK. A nova varivel POPREC corresponde varivel populatn categorizada, sendo esta automaticamente includa no final banco de dados que estamos utilizando (World95.sav - Arquivo de dados). OBS: voc pode dar nome aos nveis desta nova varivel. Para isso, proceda da seguinte forma: a) No banco de dados, clique 2 vezes sobre a nova varivel Poprec, obtendo-se a planilha Variable View. b) Na linha da varivel Poprec, clicar em Values. Abre-se uma nova janela - Value Labels; c) Em Value, digitar 1; d) Em Label, digitar pop. inferior a 5000,00; e) Clicar em ADD; f) Procede-se da mesma forma para os demais nveis de categorizao: 2, 3 e 4; g) Clicar em Continue; OK.
2 OPO: utilizando o comando VISUAL BINNING a) Clicar em Transform Recode Visual Binning; b) Localizar, na janela esquerda, a varivel a ser categorizada ( populatn) e clicar na ; c) Clicar continue; d) Na caixa Binned variable incluir o novo nome da varivel em quartis (ex:popQuartis); e) Em make cutpoints, escolher a opo equal percentiles based on scanned cases; f) Preencher uma das seguintes opes: a. Number of cutpoints: n de grupos - 1, no caso, 4 - 1 = 3; OU b. Width (%): % de casos em cada grupo, no caso como so 4 grupos de mesmo tamanho, 100%/4 = 25% g) Clicar apply; h) Clicar em make labels; i) Clicar OK.
20
22
l) Clicar em Continue e OK ou Paste. A varivel SEXRACE aparecer no final do banco de dados. m) Para criar as demais categorias da varivel SEXRACE procede-se de maneira anloga, alterando o cdigo na janela Numeric Expression para 2, 3, 4, 5 e 6 e a expresso da janela Include if case satisfies condition. Resultado das janelas: Numeric Expression 1 2 3 4 5 6
Include if case satisfies condition sex=1 & race=1 sex=2 & race=1 sex=1 & race=2 sex=2 & race=2 sex=1 & race=3 sex=2 & race=3
3.4 - Como criar uma varivel atravs de um clculo com outras variveis
Nesta seo, ser utilizado o banco imc.sav. Para criar a varivel IMC, a partir da combinao de outras duas (peso e altura), cuja frmula a seguinte: IMC = peso(kg) / altura(m), utilizaremos o seguinte procedimento para criar a varivel IMC. a) Selecionar Transform, Compute variable; b) Em Target Variable digite o nome da varivel IMC; c) Localizar na janela abaixo de Target Variable a varivel peso e clicar na ; d) No teclado virtual localizado no centro da janela, clicar em / (funo de diviso); e) Localizar na janela abaixo de Target Variable a varivel altura e clicar na ; f) No teclado virtual localizado no centro da janela, clicar em ** (funo de exponenciao) e 2; g) Clicar em OK ou PASTE. Salve o banco de dados, pois o mesmo ser utilizado em outro exerccio. Exerccio:
1) Categorize a varivel IMC (criada no banco IMC) nas seguintes categorias: 23
1: < 25 2: de 25 a 29,9 (sobrepeso) 3: 30 (obesidade) - Realizar a anlise descritiva adequada para a varivel IMC em categorias.
2) Com o banco de dados HAS.SAV, criar a varivel HAS (hipertenso arterial sistmica) que definida pela PAS >= 140 ou PAD >= 90.
- Realizar a anlise descritiva adequada para as variveis PAS, PAD e HAS.
24
Quantidade de estilos musicais Cumulative Frequency Valid ,00 1,00 2,00 3,00 4,00 5,00 6,00 Total 95 345 383 375 229 54 19 1500 Percent 6,3 23,0 25,5 25,0 15,3 3,6 1,3 100,0 Valid Percent 6,3 23,0 25,5 25,0 15,3 3,6 1,3 100,0 Percent 6,3 29,3 54,9 79,9 95,1 98,7 100,0
Exerccio: - Com o banco stroke.sav, crie uma varivel (p.ex: numeroFR) que seja a quantidade de fatores de risco (sedentarismo, DM, obesidade, fumo e hipercolesterolemia) de cada paciente. - Realizar a anlise descritiva adequada para a varivel numeroFR.
25
Podemos escolher tambm entre ordem crescente ou decrescente de ordenao para cada uma das variveis. Isso feito atravs do quadro Sort Order opes Descending (decrescente) ou Ascending (crescente). Vamos fazer uma ordenao segundo age (ordem decrescente) dentro dos cdigos de sex (ordem crescente). Para isso procede-se da seguinte forma: a) Mover a varivel sex para ao quadro Sort Cases e escolher a opo Ascending no quadro Sort Order. b) Mover em seguida a varivel age para o quadro Sort Cases e escolher a opo Descending no quadro Sort Order. c) Clicar OK para executar a ordenao.
Note que aps a execuo deste comando a posio dos indivduos nas linhas fica completamente alterada, pois o indivduo na linha 1 do banco de dados aps ordenado pode no ser o primeiro caso digitado. Para que esta informao no se perca essencial que exista uma varivel com o nmero do indivduo.
26
Outro jeito de ordenar os casos clicando com o boto direito do mouse no nome da varivel (retngulo cinza). Um menu com alguns comandos aberto. Vamos experimentar clicando na varivel ID, colocar o banco de dados em ordem novamente.
27
No quadro central Select, esto presentes cinco opes diferentes para seleo: All cases opo usada por default, utiliza todas as observaes do banco de dados; If condition is satisfied atravs dessa opo, podemos definir expresses condicionais para seleo de casos; Random sample of cases podemos selecionar uma porcentagem ou nmero exato de casos; a seleo feita aleatoriamente; Based on time or case range usamos essa opo quando estamos interessados em selecionar uma faixa especfica de valores, por exemplo, os casos do nmero 100 ao 200; tambm utilizada para fazer selees baseadas em datas; User filter variable uma varivel escolhida no banco de dados e usada como filtro; todos os casos para os quais a varivel filtro assume o valor 0 no sero selecionados. Voc tem duas opes para o tratamento dos casos que no sero selecionados. atravs do quadro Unselected Cases Are que podemos fazer a escolha: Filter... os casos (linhas) que no so selecionados no so includos nas anlises posteriores, porm, permanecem na janela de dados; caso voc mude de idia e queira usar os casos no selecionados na mesma sesso do SPSS, basta desligar o filtro; Copy... - Nesta opo, o SPSS cria uma nova janela de dados com os casos selecionados. O nome da janela deve ser fornecido pelo usurio na lacuna Dataset name. Deleted os casos (linhas) no selecionados so apagados da janela de dados; caso voc mude de idia e queira usar os casos no selecionados, voc dever ler novamente o arquivo de dados original. Neste caso deve-se tomar o cuidado de salvar o banco de dados com outro nome (File...Save As). Suponha que estamos interessados em selecionar as mulheres que se casaram com menos de 20 anos (varivel agewed) no banco de dados GSS93.sav. A funo condicional para seleo nesse caso dada por: sex = 2 & agewed >= 13 & agewed <= 19 Portanto, o tipo de seleo de dados que faremos deve possibilitar a criao de sentenas matemticas lgicas para seleo dos casos. Para isso, clicamos em If condition is satisfied e entramos no retngulo If...
28
Atravs da janela que aberta, usamos o retngulo superior para escrever uma funo lgica na qual a seleo vai ser baseada. Para a construo da funo, podemos usar todas as variveis que esto no quadro esquerda e as funes disponveis no quadro inferior direito.
Uma vez escrita a funo que determina a regra de seleo dos casos, clique Continue e voc voltar janela anterior. No quadro inferior (Unselected cases are), vamos optar pelo modo Filtered (ou seja, os casos no selecionados permanecem na tela de dados, porm, no sero utilizados em anlises futuras) e clicar OK. Voc pode perceber que, depois de feita a seleo, a janela de dados sofre algumas alteraes. As linhas (casos) que no foram selecionadas apresentam uma listra no canto esquerdo da janela de dados. A barra localizada na parte inferior da janela apresenta a mensagem Filter On. Alm disso, uma coluna de nome filter_$ adicionada janela de dados. Essa nova coluna apresenta valor 0 para as linhas que no foram selecionadas e valor 1 para as linhas que foram selecionadas.
29
Apesar de voc conseguir ver os casos que no foram selecionados, qualquer anlise efetuada da para frente no leva em conta esses casos. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Temos duas maneiras de cancelar a seleo de casos, se a opo Filtered foi usada para efetuar a seleo. A primeira delas ativar a opo All Cases da janela de seleo de casos (menu Select Cases) e clicar OK. A Segunda maneira deletar a coluna filter_$ da janela de dados.
Para esse tipo de situao, podemos utilizar o procedimento Split File, presente no menu Data. Por default sempre analisamos todos os casos juntos, sem separao por grupos. Por esse motivo, a opo selecionada na janela Analyze all cases. Para repetir a anlise para as categorias de uma determinada varivel, clicamos em Compare groups ou Organize output by groups, e ento o quadro Groups Based on fica disponvel. Moveremos para esse quadro a varivel (ou variveis) que definiro os grupos para os quais a anlise deve ser repetida. Se mais do que uma varivel for selecionada, os grupos sero definidos pela combinao das categorias de todas as variveis. Podemos ainda escolher se o banco de dados deve ser ordenado pela varivel que definir os grupos ( Sort the file by group variables) ou se o banco de dados j est ordenado pela varivel que definir os grupos (File is already sorted). Se o banco no estiver ordenado corretamente, o comando no ser executado de forma adequada. No nosso caso, selecionamos a varivel gender e a movemos para o quadro Groups Based on e clicamos OK. A nica mudana que acontece na janela de dados a mensagem Split File On na barra inferior, ou a ordenao dos casos pela varivel que definiu os grupos, caso o banco de dados ainda no estivesse ordenado. Porm, qualquer anlise ou grfico feitos de agora em diante vo gerar dois resultados, uma para os homens e outro para as mulheres. Para exemplificar, vamos pedir uma anlise descritiva (mdia, desviopadro, quartis, mnimo e mximo) da varivel age separada por sexo do banco de dados GSS93.sav. A partir dos passos anteriores para dividir a amostra de acordo com o sexo, clicamos em Analize, depois em Descriptives e depois em Frequencies. Selecionamos a varivel age e, em Statistics, selecionamos as opes desejadas (quartiles, mean, std deviation, minimum, maximum). Aps clicamos em continue e em OK. Note que os resultados so apresentados em dois blocos, o primeiro para o sexo masculino e o segundo para o sexo feminino se a opo escolhida foi Organize output by groups. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Para cancelar o procedimento Split File basta ativar a opo Analyze all cases presente na janela de definio da opo Split File menu Data.
31
dos indivduos e no segundo as respostas de um questionrio de opinies e preferncias. Para juntar os bancos IMPRESCINDVEL que eles NO possuam as mesmas variveis e que os casos estejam ordenados. O procedimento o seguinte. a) Abrir o banco de dados GSS93 p1 var.sav (File -> Open -> data); b) Ordenar o banco de dados pela varivel Id: clicar com o boto da direita e em Sort Ascending; c) Clicar no menu Data -> Merge files -> Add variables; d) Na janela Add variables, voc deve escolher: a. An open dataset: se o outro banco de dados j estiver aberto em alguma janela e clique no Dataset que voc deseja mesclar; b. An external PASW statistics data file: se o banco estiver fechado, lembrando que o mesmo j deve estar em formato do SPSS, ou seja, ter sido salvo como .sav e clique em Browse para localizar o arquivo de dados. i) Clicar em continue; j) Clicar em Match cases on key variables in sorted files; ao clicar aqui, voc deve optar: a. Both files provide cases: se voc sabe que cada banco possui uma linha para cada indivduo da amostra; b. Non-active ou active dataset is keyed table: se um dos bancos possuir mais de um registro (linha) por paciente, que devem estar identificados pela mesma varivel chave (key variable); k) Clicar na varivel que identifica o nmero do caso (deve estar na janela Excluded Variables), que no nosso exemplo a varivel id e depois clicar em (a varivel dever aparecer na caixa Key variables; l) Na janela Excluded Variables, variveis seguidas de * esto no primeiro banco de dados e aquelas seguidas de + esto no banco novo; m) Clicar em OK ou Paste.
33
Procede-se da seguinte maneira: a) Clica-se na opo de menu Window; b) Seleciona-se a janela de sada desejada que consta na lista de arquivos abertos ou disponveis, clicando uma vez sobre sua indicao.
4.6 - Edio do arquivo de resultados (*.spo): como apagar anlises no desejadas no arquivo de resultados
Quando inadvertidamente realiza-se um procedimento no desejado, para corrigir o equvoco, procede-se da seguinte forma: a) Clica-se no menu Edit Select Output Block a partir deste momento ser selecionada a ltima sada executada , o que vai dar origem a uma tarja preta; b) Aperta-se o boto Delete, tornando sem efeito o ltimo procedimento efetuado. Tambm podem-se apagar outros blocos de resultados, bastando para tal colocar o cursor sobre o bloco que se deseja apagar e repetir a operao explicada acima.
5. ALGUMAS ANLISES BIVARIADAS 5.1 - Comparao de duas variveis categricas: Teste Qui quadrado
Para avaliar a associao entre duas variveis categricas, ou ainda, para fazer uma comparao de uma varivel categrica entre dois (ou mais) grupos, utilizado o teste de de associao ou de heterogeneidade, respectivamente. Na prtica, ambos so obtidos no mesmo comando. Para exemplificar, vamos verificar se homens e mulheres diferem em suas opinies sobre a permisso de porte de armas utilizando o banco GSS93.SAV. a) Entrar no menu Analyze Descriptive statistics Crosstabs; b) Como vamos comparar os sexos, incluir gunlaw nas colunas e a varivel sex na linha: procurar a varivel sex na lista de variveis esquerda e clicar em ao lado da caixa Row e depois localizar a varivel gunlaw e clicar em ao lado da caixa Column; c) Clicar em Exact e depois marcar exact, esta opo realiza os testes exatos ao invs dos assintticos, que so uma aproximao clicar em continue;
34
d) Clicar em Statistics, depois em Chi-square esta a opo para pedir que ele realize o teste de e depois clique em Continue; e) Na opo Cells, podemos pedir diversos valores que aparecero nas caselas da tabela. Clicar em Cells, depois em Row no quadrado das percentages e depois em continue; f) Clicar em Ok ou Paste. RESULTADO: gunlaw Favor or Oppose Gun Permits * sex Respondent's Sex
Crosstab
Favor or Oppose Gun Permits Favor Respondent's Sex Male Count % within Respondent's Sex Female Count % within Respondent's Sex Total Count % within Respondent's Sex Oppose Total
Podemos observar que, enquanto 73,9% dos homens opinaram a favor da permisso de uso de armas, 88,9% das mulheres manifestaram a mesma opinio.
Chi-Square Tests Asymp. Sig. Value Pearson Chi-Square Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association 37,584
c b
Point Probability
df
a
37,622
36,592 37,417
,000 ,000
,000
,000
35
N of Valid Cases
984
a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 74,72. b. Computed only for a 2x2 table c. The standardized statistic is -6,131.
Pelo teste de , podemos concluir que a diferena entre homens e mulheres estatisticamente significativa (P<0,001).
314 -6,1
111 6,1
425 100,0%
36
Female
62 -6,1 173
Total
Count
CONCLUSO: A associao entre sex (sexo) e gunlaw (permisso de porte de armas) j foi considerada significativa. Agora a pergunta : Quais categorias esto associadas localmente? Olhando os resduos ajustados vemos que os maiores valores (positivos) indicam forte associao entre homem e ser contra o porte de armas, bem como h forte associao entre mulher e ser a favor de porte de armas.
5.2 - Como comparar mdias entre dois grupos: Teste t para Amostras Independentes.
O teste t apropriado para comparar as mdias de uma varivel quantitativa entre dois grupos independentes.
EXEMPLO: Comparar a mdia de idade no primeira casamento entre homens e mulheres usando os dados do banco GSS93.sav . a) Sexo (sex) varivel categrica com dois grupos b) Idade no 1 casamento (Agewed) - Varivel resposta quantitativa Para a aplicao do teste t nesta situao procede-se da seguinte forma: a) Clicar em Analyze, Compare Means, Independent Samples t test; b) Clicar sobre a varivel de teste (Test Variables): Agewed ou, conforme o caso em estudo, clicar na varivel correspondente; c) Clicar sobre a varivel de grupo (Grouping Variable) Gender; d) Clicar em: Define Group; e) Abre-se uma janela, na qual se define a categoria correspondente ao Group 1 (no caso masculino) digitando-se o cdigo da categoria atribuda quando da construo do Banco de Dados,
37
nesse caso 1 e Group 2 (no caso feminino) digitando-se o cdigo 2. (Observao: No caso de se desejar confirmar os valores atribudos s variveis, clicar sobre a varivel e escolher a opo options) g) Clicar em Continue e OK.
RESULTADO:
Group Statistics Respondent's Sex Age When First Married Male Female N Mean Std. Deviation Std. Error Mean
492 710
24,16 21,84
4,867 4,929
,219 ,185
Independent Samples Test Levene's Test for Equality of Variances Sig. (2F Age When First Married Equal variances assumed Equal variances not assumed Sig. t df tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper t-test for Equality of Means
,342
,559
8,07 8,08
1200 1064,66
,000 ,000
2,320 2,320
,288 ,287
1,756 1,757
2,885 2,883
INTERPRETAO: Uma das suposies do teste t de que as varincias dos dois grupos sejam iguais. Por isso necessrio testar esta hiptese antes (atravs do teste de Levene) e com base no resultado deste teste, escolhe-se o resultado do teste t supondo varincias iguais ou supondo varincias diferentes.
38
Ao serem analisados os dados do exemplo acima vemos o seguinte: a) Observa-se o resultado do de Levene. Neste exemplo, o valor de p para o teste Levene 0,559, no se rejeita a hiptese de varincias iguais. b) O teste t a ser utilizado o que aparece na primeira linha ( Equal variances assumed), considerando que p < 0,001 (Sig 2-tailed), rejeita-se a hiptese nula (H0) de igualdade das mdias dos dois grupos, logo, pode-se concluir que as mdias da varivel agewed so significativamente diferentes entre os dois grupos de sexo.
As hipteses do teste Levene de igualdade de varincias so: Hiptese Nula (H0): As varincias dos dois grupos so iguais. Hiptese Alternativa (H1): As varincias dos dois grupos so diferentes. As hipteses do teste t para igualdade de mdias entre amostras independentes so: Hiptese Nula (H0): As mdias dos dois grupos so iguais. Hiptese Alternativa (H1): As mdias dos dois grupos so diferentes
39