Escolar Documentos
Profissional Documentos
Cultura Documentos
sebentaBBII PDF
sebentaBBII PDF
SPSS
Autores:
Ana Paula Nascimento, Agostinho Cunha, Carla Teixeira Lopes, Ftima Monteiro,
Liliana Pereira, Sandra Alves, Vtor Bento
Ano:
2005
Biomatemtica e Bioestatstica II 3
Sumrio
1. Introduo ao SPSS para Windows. .................................................................... 14
Menu principal..................................................................................................... 17
Barra de estado................................................................................................... 18
1.5. Grficos......................................................................................................... 19
2. Arquivo de Dados................................................................................................. 22
Criar um arquivo.................................................................................................. 22
Abrir um arquivo.................................................................................................. 23
Entrada de dados................................................................................................ 30
Edio de Dados................................................................................................. 30
Criao de variveis............................................................................................ 31
Recodificao de variveis.................................................................................. 34
Outras Transformaes....................................................................................... 38
Tabela de Frequncias........................................................................................ 48
Grficos .............................................................................................................. 55
Estatsticas.......................................................................................................... 65
Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel 90
R e R2 ............................................................................................................... 126
Sumrio de Figuras
Figura 2: Janela de entrada no SPSS. ........................................................................ 14
Figura 12: Menu para a criao de uma nova janela de edio de dados. .................. 22
Figura 13: Menu para abrir uma base de dados j existente. ...................................... 23
Figura 15: Janela de dilogo para a indicao da localizao de uma ficheiro a ser
aberto.................................................................................................................. 24
Figura 16: Janela de dilogo com Wizard para a importao de dados para SPSS. ... 25
Figura 18: cone para aceder informao acerca de uma varivel. .......................... 26
Figura 22: Janela de dilogo para introduzir valores para a varivel. .......................... 28
Figura 27: Janela de dilogo para criar variveis atravs de transformaes noutras. 32
Figura 28: Janela com a informao acerca de uma varivel do ficheiro Cars. ........... 33
Figura 29: Janela de dilogo para criar varivel accel_mi em funo da varivel accel
presente no ficheiro Cars. ................................................................................... 33
Figura 30: Janela de dilogo que permite seleccionar casos onde a transformao vai
ser efectuada. ..................................................................................................... 34
Figura 36: Janela de dados onde se mostra um exemplo de uma determinada base de
dados. ................................................................................................................. 39
Figura 38: Janela de dilogo que permite dar a condio para proceder contagem. 40
Figura 40: Janela de dilogo que permite ordenar os dados de acordo com vrios
critrios. .............................................................................................................. 42
Figura 42: Janela de dilogo que permite executar o Split file. ................................... 43
Figura 43: Janela que exemplifica o Split file efectuado pela varivel sexo (gender). . 44
Figura 46: Janela de dados onde se mostra uma base de dados contendo a
informao de altas verificadas num determinado hospital. ................................ 46
Figura 76 M-Estimators............................................................................................ 67
Figura 97: Janela onde se selecciona a opo para efectuar o teste normalidade... 83
Figura 99: Tabela resultante do teste normalidade, com os dois testes Kolmogorov-
Smirnov e Shapiro-Wilk....................................................................................... 84
Figura 102: Janela de dilogo onde possvel seleccionar as estatsticas a pedir. .... 86
Figura 105: Menu para a execuo do procedimento Teste t para uma amostra. ....... 88
Figura 106: Janela de dilogo resultante da seleco do teste t para uma mostra onde
possvel escolher qual a varivel e o valor a testar........................................... 88
Figura 107: Janela de dilogo onde se pode indicar o nvel de confiana para o
intervalo. ............................................................................................................. 89
Figura 108: Tabela resultante do teste t para uma amostra onde se apresentam
algumas estatsticas da varivel a testar. ............................................................ 90
Figura 109: Tabela resultante do teste t para uma amostra onde se apresenta entre
outras informaes o valor p, do respectivo teste................................................ 90
Figura 111: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a
testar assim como o nvel de significncia........................................................... 92
Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso
masculino e feminino). ........................................................................................ 92
Figura 113: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam entre outras informaes o valor p para os dois testes.
............................................................................................................................ 92
Figura 124: Janela de dilogo onde se pode optar por um teste exacto ou por uma
aproximao normal....................................................................................... 103
Figura 125: Janela de Dilogo onde se pode optar por pedir algumas estatsticas,
assim como o tratamento aos missings............................................................. 104
Figura 129: Janela de dilogo onde se podem pedir algumas estatsticas relativas s
variveis a testar no teste do qui-quadrado para a independncia de variveis107
Figura 130: Janela de dilogo onde se pode optar por quais as informaes a
apresentar na clula da tabela de contingncia................................................. 108
Figura 131: Janela de dilogo onde se pode optar qual a forma de ordenao dos
dados. ............................................................................................................... 109
Figura 135: Janela dilogo para a execuo do teste da binomial, onde se devem
indicar as variveis assim como as propores a testar. ................................... 112
Figura 140: Janela de dilogo para a execuo dos testes no paramtricos para
amostras emparelhadas.................................................................................... 116
Figura 142: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p. .... 118
Figura 143: Representao das possveis relaes lineares entre duas variveis. ... 120
Figura 147: Tabela resultante de uma regresso linear mltipla onde se apresentam os
coeficientes. ...................................................................................................... 123
Este software foi inventado, nos Estados Unidos, por Norman H. Nie, C. Hadlai (Tex)
Hull e Dale H. Bent e desde a sua primeira verso, em 1968, j foram desenvolvidas
doze novas verses. Este software, alm da sua aplicao nas Cincias Sociais para
onde foi inicialmente concebido, tambm usado em pesquisas relacionadas com
sade e educao, pesquisas governamentais e de mercado e inmeros outros
sectores. O primeiro manual de usurio foi publicado em 1970 por Nie e Hall. A
primeira verso do SPSS para computadores pessoais surgiu em 1984.
Tambm podemos abrir uma sesso do SPSS fazendo duplo clique sobre o cone
correspondente o qualquer arquivo do tipo SPSS:
O editor de dados activa uma janela com uma estrutura semelhante a uma folha de
clculo clssica que contm o arquivo de dados que estamos a utilizar. Esta janela
abre-se automaticamente ao iniciar a sesso do SPSS.
A janela de grficos permite modificar e guardar grficos e arquivos com extenso .cht.
Existe ainda uma outra janela que a janela de sintaxe onde podemos colar os
comandos seleccionados a partir de qualquer caixa de dilogo que corresponde
efectuao de uma ou mais anlises estatsticas. Podemos guardar estes comandos
num ficheiro de sintaxe (com extenso .sps) o que nos permite aplicar as mesmas
anlises estatsticas a ficheiros de dados com igual estrutura.
Menu principal.
A partir deste menu acedemos maioria das funes do SPSS. O menu principal tem
dez opes:
File- criar um novo ficheiro SPSS, abrir um existente, guardar, ler dados
criados com outra aplicaes, etc.
Edit- contm as habituais opes do Windows para copiar dados, procurar, etc.
Data- contm opes para efectuar mudanas que afectam todo o arquivo de
dados (unir arquivos, transpor variveis e casos, criar subconjuntos de casos,
etc.). Estas mudanas so temporrias enquanto no se guarda explicitamente
o ficheiro.
Barra de ferramentas.
Situada abaixo da barra do menu principal, a barra de ferramentas exibe um conjunto
de cones que, uma vez activados com o rato, realizam os procedimentos mais
frequentes. Colocando o rato sobre o cone, exibida uma descrio sobre a tarefa
activada.
Barra de estado.
Situada na base da janela da aplicao, indica o estado actual do processo e as
seguintes informaes complementares:
1.5. Grficos.
A representao em grficos dos dados de tabelas, quadros e folhas de clculo
propicia uma leitura fcil e sedutora da informao. A informao estatstica
representada em grficos apreendida pelo destinatrio de uma forma fcil e intuitiva.
Para alm dos grficos de utilizao corrente, acessveis em qualquer folha de clculo,
o aplicativo SPSS apresenta formatos particulares de grficos de grande qualidade
visual, adequados, quer representao de informao especfica, quer ao resumo de
grandes quantidades de informao.
3,5
6
3,4
3,3 2
Std. Dev = ,91
Mean = 3,3
0 N = 20,00
Mean
3,2 CLAS_MAT
CLAS_MAT CLA_POR
10 7
6
8
6
4
3
4
2
SEXO
2
Count
0 N = 20,00 0 Feminino
ALTURA CLA_POR
Grfico de rea
Grfico pareto
Grfico circular
Boxplot
Histograma
Diagrama de caule-e-folhas
2. Arquivo de Dados
Os dados so uma parte fundamental do processo de anlise estatstica, o SPSS
possibilita, para alm da anlise estatstica dos dados, o armazenamento. Este
armazenamento pode ser encarado sobre duas perspectivas; conforme os dados so
organizados pela primeira vez no SPSS, e se cria a base de dados no programa, ou se
a informao j foi de alguma forma organizada, e o armazenamento apenas
temporrio, i.e., apenas do tempo de anlise.
Criar um arquivo
Criar um arquivo de dados no SPSS onde se faa o registo da informao, ou seja
onde se crie uma nova base de dados, pode ser conseguido atravs do menu
FileNewData. Uma nova janela de dados (Data Editor) em branco
disponibilizada.
Figura 11: Menu para a criao de uma nova janela de edio de dados.
Abrir um arquivo
Para abrir um arquivo de dados j existentes, basta aceder ao menu
FileOpenData
Em qualquer um dos casos aparecer uma janela de dilogo onde dever ser
indicada a directoria, ou pasta onde se encontra o ficheiro pretendido, assim como o
tipo de ficheiro que o arquivo e finalmente o seu nome.
Figura 14: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.
De entre os tipos de arquivos que o SPSS reconhece esto os ficheiros Excel (*.xls),
os ficheiros gravados em dBase (*.dbf) e os ficheiros de texto (*.txt). A extenso dos
ficheiros gravados em SPSS sav.
O software ir ler dos ficheiros Excel e dBase, o nome das variveis, que devero
cumprir certos requisitos (ver seco 2.2.1.), assim como abrir casos e linhas
conforme o n. de colunas e linhas ocupadas. Os ficheiros de texto so importados
com ajuda de um Wizard, que vai guiando cada passo e que possibilita a importao
de ficheiros de dados delimitados por vrgulas, espaos, etc.
Figura 15: Janela de dilogo com Wizard para a importao de dados para SPSS.
Guardar um arquivo
As alteraes feitas sobre um ficheiro s so vlidas durante a sesso de SPSS em
que so feitas, a no ser que o ficheiro seja gravado. Tal pode ser conseguido atravs
do menu FileSave. O ficheiro alterado guardado por cima do existente.
Uma outra forma de guardar arquivos atravs do menu FileSave as, onde se deve
indicar o tipo de ficheiro e o nome que queremos dar ao ficheiro.
Uma outra forma de aceder a informao sobre uma varivel atravs do cone
presente na barra de ferramentas.
Definio de variveis
Esta definio feita na janela de edio de dados na janela variable view. Nesta
janela cada linha contm informao de uma varivel, informao essa que definida
atravs das colunas.
Name: deve ser indicada o nome da varivel, este nome estar presente numa coluna
da janela data view. Este nome deve seguir determinadas regras:
Mximo 8 caracteres;
Type: deve ser indicado o tipo de varivel, de uma escolha que o programa oferece na
maioria dos casos os tipos utilizados so o tipo numrico (Numeric) e o data (Date),
visto que mesmo que a natureza da varivel seja string possvel codific-la atravs
de um cdigo numrico.
Decimals: deve indicar-se o n. de casas decimais que a varivl pode tomar caso seja
do tipo numrica. Do mesmo modo do campo width pode ser preenchido na janela
variable view na coluna respectiva ou ento na janela de dilogo do type.
Label: no um campo obrigatrio mas pode ser de extrema utilidade. Por exemplo,
pode conter o nome por extenso da varivel que devido ao facto de poder conter
apenas 8 caracteres pode no ser explcito. Pode conter, por exemplo, a unidade na
qual a varivel est medida.
Values: onde indicado o cdigo utilizado para introduzir os valores da varivel. Por
exemplo: suponha-se que, para simplificar a introduo, se definia o valor 1 para o
sexo masculino e 2 para o sexo feminino, ento aqui que se deve informar o sistema
deste cdigo.
Para se informar o sistema acerca do que significam tais valores deve ser usada a
coluna values.
Entrada de dados
A edio de dados feita na janela Data View. Nesta janela:
Edio de Dados
possvel modificar total ou parcialmente o contedo de uma clula basta para isso
seleccion-la.
possvel apagar e copiar clulas, deve ter-se ateno quando se copia valores de
clulas para que a clula destino tenha as mesmas caractersticas (type,).
Criao de variveis
Para alm da criao das variveis atravs da janela variable view, o SPSS
possibilita a criao de variveis novas atravs de transformaes nas j existentes.
O menu TransformCompute atribui valores a uma varivel nova, cujo nome deve
ser indicado na target variable, atravs de transformaes executadas noutras
variveis j existentes.
Figura 26: Janela de dilogo para criar variveis atravs de transformaes noutras.
Exemplo1
No ficheiro Cars 1, encontra-se a varivel accel, que guarda o tempo de acelerao das
0 s 60 milhas por hora, como visvel na janela que se segue.
1
Este ficheiro disponibilizado com o software SPSS, pode ser acedido (a no ser que se
tenha procedido a alguma mudana de ficheiros) na pasta do SPSS que abre por defeito.
Figura 27: Janela com a informao acerca de uma varivel do ficheiro Cars.
Suponha, agora que pretende alterar o tempo de acelerao para milhas por minuto,
ento o que deveria fazer era, por exemplo, criar uma varivel nova, design-la, por
exemplo, accel_mi, e igual-la funo CTIME.MINUTES, com argumento accel.
Figura 28: Janela de dilogo para criar varivel accel_mi em funo da varivel accel
presente no ficheiro Cars.
(Continua)
Exemplo1 (Continuao):
Suponha que no exemplo, queremos apenas criar a nova varivel accel_mi, quando o
ano do carro for o ano 70. Ento o procedimento a seguir seria na janela
disponibilizada pelo boto If, inserir a condio year=70 (year, varivel que guarda o
ano do automvel)
Figura 29: Janela de dilogo que permite seleccionar casos onde a transformao vai ser
efectuada.
Recodificao de variveis
Este procedimento possibilita a substituio dos valores de uma varivel por outros. O
SPSS possibilita esta transformao de duas formas uma das quais automtica.
Exemplo 2
Suponha que no ficheiro flying2, que queria transformar a varivel cityname, do tipo
string numa varivel numrica de nome city_2. Este nome dever ser introduzido no
rectngulo em branco mais pequeno e depois para que o nome seja aceite deve ser
pressionado o boto New Name.
O output criado pelo SPSS o seguinte, onde se podem ver os valores antigos, os
novos valores e as suas etiquetas. Como se pode observar o software codificou
tambm as clulas vazias, os missings.
(Continua)
2
De igual modo o ficheiro encontra-se (a no ser que se tenha procedido a alguma mudana
de ficheiros) na pasta do SPSS que abre por defeito.
atravs do boto Old and New Values que o novo cdigo dever ser definido.
Existem, duas zonas na janela que decorre do boto Old and New Values; uma para a
zona dos antigos valores e uma zona para os novos valores.
Old Value:
Range: through: atravs desta opo pode ser recodificada toda uma gama
de valores, indicando o valor mais baixo e o mais alto.
Range: Lowest through: atravs desta opo pode ser recodificada toda uma
gama de valores desde o valor mais baixo at a um valor indicado.
Range: through highest: atravs desta opo pode ser recodificada toda uma
gama de valores desde um valor indicado at o maior valor.
New Value:
Copy old value: os valores antigos vo ser iguais aos novos. importante
referir que se existirem valores que se mantm eles devem ser referidos seno
sero excludos na nova varivel.
Exemplo 2 (Continuao):
Suponha que agora quer recodificar a varivel city_2, numa nova varivel city_3, do
seguinte modo:
missing 99
Ento dever recorrer opo Into Different Variables, nos Old and New Values
dever definir os novos valores usando os System-missing nos old values
Outras Transformaes
O menu TransformCategorize Variables tambm possibilita a criao de
categorias, mas de uma forma automtica, o utilizador s tem a possibilidade de
especificar o nmero de categorias a criar. Este procedimento til para agrupar
dados de uma varivel contnua, pois nem sempre fcil neste tipo de varivel a
explicitao das categorias, assim basta ao utilizador dizer qual o nmero de
categorias a criar e criada uma varivel contendo as categorias. O utilizador deve
atravs de uma tabela de frequncia, por exemplo, analisar quais os limites das
classes criadas e criar rtulos.
Exemplo 3:
Suponha que tem um ficheiro de SPSS que contm para cada ms e para cada zona,
o nmero de mortes por acidente, por causa natural e o nmero de acidentes devido a
doena prolongada.
Figura 35: Janela de dados onde se mostra um exemplo de uma determinada base de
dados.
Suponha que quer saber quantas vezes o n. de mortes devido a cada uma das
causas foi superior a 100 em cada ms e em cada zona. Ento poder aceder ao
menu TransformCount, onde dever explicitar o nome da nova varivel, assim
como o nome das variveis onde pretende que o programa procure a condio que
dever ser definida atravs do boto Define Values.
Figura 37: Janela de dilogo que permite dar a condio para proceder contagem.
(Continua)
Nota:
Exemplo 3 (Continuao):
Suponha que pretende organizar o ficheiro por ordem crescente de nmero de mortos
por acidente e dentro desta ordenao pretende ordenar por ordem crescente de
nmero de mortos devido a uma causa natural. Ento deveria proceder da seguinte
forma:
Figura 39: Janela de dilogo que permite ordenar os dados de acordo com vrios
critrios.
Analyze all cases, do not create groups: desactiva qualquer separao feita
anteriormente; esta opo est por defeito seleccionada, antes de qualquer diviso;
Groups Based on: aqui que se dever indicar quais as variveis que serviro para
criar os grupos, caso sejam introduzidas mais do que uma o programa agrupar pela
ordem de introduo.
Exemplo 4:
Suponha que pretende analisar as diferenas entre sexos dos empregados de uma
determinada firma, cuja informao se encontra guardada no ficheiro Employee Data3.
Ento a varivel que ir criar grupos ser a varivel Gender, como se pode ver na
figura seguinte.
Figura 42: Janela que exemplifica o Split file efectuado pela varivel sexo (gender).
3
Este ficheiro tambm disponibilizado pelo SPSS.
Sempre que este procedimento for efectuado criada uma nova varivel filter
constituda apenas de 0 (zeros) e 1 (uns), conforme o caso no pertena ou pertena
amostra.
Atravs do menu DataWeight Cases possvel criar uma ponderao cujos valores
representam o nmero de casos observados.
Exemplo 5:
Figura 45: Janela de dados onde se mostra uma base de dados contendo a informao
de altas verificadas num determinado hospital.
3. Estatstica Descritiva
A anlise estatstica univariada inicia o tratamento estatstico e deve ter em conta a
tabela de frequncias, a representao grfica da distribuio da varivel e as
estatsticas apropriadas ao resumo dos dados em questo.
Medidas de
Medidas da forma global
tendncia Medidas de disperso
da distribuio
central
Escala intervalar Mdia Desvio-padro Coeficiente de assimetria
ou escala racional de Pearson
Moda Varincia
Medida de curtose
Mediana Percentis
Desvio interquartis
Intervalo interquartis
Intervalo absoluto
Coeficiente de variao
Score z
Escala ordinal Moda Percentis
Intervalo interquartis
Intervalo absoluto
Escala nominal Moda
3.2. Frequncias
O procedimento Analyze/Descriptive Statistics/Frequencies permite obter
informao sobre a distribuio dos valores da varivel atravs de tabelas de
frequncias, de estatsticas descritivas e grficos.
Este procedimento til para uma primeira anlise de qualquer tipo de varivel. A
informao aqui obtida pode ajudar a determinar os valores tpicos das variveis (Que
valores so mais frequentes? Qual a gama de valores que uma varivel toma?), a
verificar o cumprimento de determinadas assumpes necessrias para
procedimentos estatsticos (Existe um nmero suficiente de observaes? A
distribuio da varivel adequada?) e a avaliar a qualidade dos dados (Existem
valores omissos ou mal introduzidos? Existem valores que necessitam de ser
recodificados?).
Tabela de Frequncias
A tabela de frequncias distribui os valores da varivel em frequncias simples e
acumuladas, que podem ser absolutas ou relativas.
4. Clicar em OK.
Na janela de frequncias, na opo Format (ver figura 5), existem vrias opes que
permitem ordenar segundo diferentes critrios a tabela de frequncias:
Estatsticas Descritivas
Atravs do procedimento Analyze/Descriptive Statistics/Frequencies
tambm possvel calcular vrias estatsticas de tendncia central, de disperso e de
forma da distribuio.
6. Clicar em OK.
Cut Points for n equal groups (Pontos de corte para n grupos iguais)
apresenta os valores da varivel que divide a amostra em n grupos com o
mesmo nmero de casos. Depois de seleccionar esta estatstica o utilizador
dever inserir o nmero (entre 2 e 100) de grupos pretendido. Por omisso, a
distribuio dividida em 10 grupos iguais.
Grficos
Como j foi referido, o procedimento Analyze/Descriptive
3. Na janela que surge, deve seleccionar-se o tipo de grfico pretendido. Nos grficos
de barras e nos grficos circulares, existe a opo de elaborar o grfico com base
nas frequncias absolutas (Frequencies) ou com base nas frequncias relativas
(Percentages).
6. Clicar em OK.
Figura 62 Histograma
Para edio dos grficos gerados pelo SPSS, deve-se fazer um duplo-clique sobre o
grfico, que provocar a abertura da janela de edio de grficos do SPSS:
Para alm destas estatsticas, permite tambm calcular valores padro (scores z).
Quando os valores padro so guardados, so adicionados janela de edio de
dados e ficam disponveis para qualquer procedimento estatstico.
Figura 69 Scores z
Estatsticas
Atravs do procedimento Explore possvel criar diversas estatsticas. Para tal,
dever, a partir da janela Explore:
d. Percentiles apresenta os seguintes percentis: 10, 25, 50, 75, 90, 95.
Figura 75 M-Estimators
Figura 76 - Outliers
Figura 77 Percentiles
O comprimento mximo dos bigodes vai at 1,5 vezes o valor da amplitude interquartil,
abaixo do 1 quartil e acima do 3 quartil. As observaes que se situem para alm
destes limites so representadas com um crculo ou um asterisco, consoante sejam
respectivamente outliers moderados ou severos. Os outliers so moderados quando
se encontram entre 1,5 e 3 amplitudes interquartis abaixo do 1 quartil ou acima do 3
quartil. Os outliers so severos severos quando se encontram para alm de 3
amplitudes interquartis para baixo do 1 quartil ou para cima do 3 quartil.
Outlier Severo
*
Outlier Moderado
Valor Mximo
3 Quartil
50% das
observaes
centrais, isto , Mediana (2 Quartil)
amplitude inter-
1 Quartil
Valor Mnimo
Para criar um diagrama de caixa e fio no SPSS, a partir da janela Explore, dever:
1200
77
427
250
2980
1000 1812
4929
150
2535
2001
800
1263
4277
3254
2844
5530
1706
4709
600 5840
4057
5363
4937
5237
4797
2364
5204
42
5542
3618
5370
539
2384
1147
506
5845
6017
1557
4386
6046
97
992
1760
3600
5066
5434
6196
4365
2096
4719
3221
4533
4575
4327
3565
5323
1194
5385
5871
4641
3452
400 1425
5805
4965
2432
5606
278
1953
3008
2415
4466
79
5376
525
4793
185
6147
991
2898
3261
934
6197
6176
1183
2136
5481
189
3726
155
4767
2271
325
4014
6153
319
393
3436
886
1074
4653
5947
255
2389
944
2442
5245
4468
1205
2290
6095
732
2702
5184
5784
69
883
2218
4031
4207
5303
4055
5415
4260
306
1016
1848
2922
2108
3576
4570
214
1433
1199
3444
2785
4129
6382
202
876
5495
3161
4899
2076
5968
909
4939
5470
3042
3758
4925
4005
1143
2049
241
2308
212
1870
864
4415
6338
2333
803
3844
276
2215
3212
4887
5780
672
2030
3015
4485
4499
4941
5210
988
5146
1465
2902
2949
3081
3509
4735
1769
3635
29
807
3729
1668
2033
3766
5331
1276
3629
3721
200
-200
N= 1841 2275 2284
Para criar um diagrama de tronco e folha no SPSS, a partir da janela Explore, dever:
podemos verificar que existem 30 casos (Each Leaf = 30 casos), com rendimento de
1,0; 30 casos com rendimento 1,1; 30 casos com rendimento 1,2; etc.
3.5. Tabelas
As tabelas produzidas pelo SPSS so apresentadas como tabelas pivot na janela de
sada. Este tipo de tabelas tem uma grande flexibilidade na estruturao e formatao
das tabelas.
Modificao de estrutura
Para modificar a estrutura de uma tabela, dever:
2. Clicar com o boto direito em cima da tabela e escolher a opo Pivoting Trays.
por . Para saber a que se refere cada um destes smbolos, basta situar o rato por
cima do smbolo durante um breve instante. Depois poder alterar a localizao de
cada bloco de informao entre as linhas (Row ), colunas (Column ) ou entre uma nova
camada de informao (Layer). Para alterar a localizao, basta arrastar o smbolo
para a localizao pretendida.
Modificao de formatao
Para modificar a formatao associada a uma tabela, dever:
3. Ficar visvel a barra de formatao, com o que poder formatar todo o aspecto
visual da tabela. Para seleccionar a totalidade de uma coluna ou linha, dever
fazer Ctrl + Alt em cima do nome da coluna ou linha.
5. Surgir ento uma janela, onde poder escolher um dos modelos pr-definidos.
Teste de Kolmogorov-Smirnov
Neste teste pretende-se testar se a distribuio da varivel normal, com parmetros
e quaisquer:
H0 : X ~ N ( ,) Vs H1 : X ~ N ( ,)
/
Rejeita-se H0 se o valor prova (p_value) for inferior ou igual ao nvel de significncia
(), em que o p_value um valor produzido pelo SPSS usando a correco de
Lilliefors s tabelas com os valores crticos da distribuio de Kolmogorov-Smirnov.
Teste de Shapiro-Wilk
Este teste apresentado, adicionalmente, pelo SPSS. uma alternativa ao Teste de
Kolmogorov-Smirnov no teste normalidade da varivel em estudo.
Teste de Normalidade
Figura 96: Janela onde se selecciona a opo para efectuar o teste normalidade.
G
O
R N N N
m
d
a
re
T e
h 8 %
,
0
1 0 ,
%
0 8 %
0
i i
d 0
1 %
0 0 %
,0 0
1 %
,
0
1
Figura 97: Tabela de resultado do teste normalidade, que apresenta o nmero de casos
vlidos, missings e totais.
ity lT
a
rm
o
N
tf
s
e
a
o kliW
ro
p
a
h
-S
G
P
U
O
R f
d f
d
T
m
d
a
re
til h
te
l
a ,
5
6
2 8 ,
3
0
1 ,
4
2
9 8 ,
2
6
4
i s i e
d 0
6
,2 0
1 4
5
,0 5
3
,7 0
1 *
1
,0
*. siT h
. n
a o
iC
tfa
c
reg
S
s
lL
Figura 98: Tabela resultante do teste normalidade, com os dois testes Kolmogorov-
Smirnov e Shapiro-Wilk.
Como foi referido nas aulas tericas a anlise normalidade ser sempre efectuada a
partir do Teste de Kolmogorov-Smirnov.
4.3. Mdias
A mdia uma Medida de Tendncia Central muito usada na investigao, em reas
como as cincias biolgicas.
Por este motivo, torna-se fundamental o estudo de mtodos para analisar dados
quantitativos (intervalares e racionais) cuja Medida de Tendncia Central adequada
seja a mdia.
No menu
possvel calcular uma srie de medidas estatsticas sumrias como mdia, desvio
padro, varincia, etc., para um conjunto de variveis em grupos, categorias ou
variveis distintas.
Figura 100: Janela de dilogo do procedimento Compare Means-> Means onde visvel
onde se devero colocar as variveis dependentes e independentes.
m
u
S s
e
c
o
r n
i
C
se
a
d
e
u
cl
In d
e
uxcl
E l
ta
o
T
N tn
rc
e
P N tn
rc
e
P N tn
rc
e
P
m
d
a
re
T
8
1 % 0 %
,0 8
1 %
0
d*
n
co
se
Figura 102: Tabela resultante o procedimento Compare Means-> Means onde se mostram
nmero de casos includos, excludos e total.
r
o
p
e
R
r
T l
G
O
R N
e
h 9
0
,5
8
2 8 2
1
i
d 0
6 0
1
t
o
T 8
1
O segundo quadro diz respeito aos valores das estatsticas pretendidas de cada
varivel treadmill time in seconds em cada group.
Para aplicar este teste necessrio ter em conta a normalidade dos dados. Se a
dimenso amostral for superior ou igual a 30, com base no Teorema do Limite Central,
pode assumir-se que a distribuio das mdias normal, independentemente da
distribuio da populao. Se a dimenso da amostra for inferior a 30 necessrio
efectuar um teste da normalidade (ver introduo ao Captulo 4).
Fazer
Figura 104: Menu para a execuo do procedimento Teste t para uma amostra.
Figura 105: Janela de dilogo resultante da seleco do teste t para uma mostra onde
possvel escolher qual a varivel e o valor a testar.
Test Value valor numrico contra o qual se vai testar a mdia das variveis
seleccionadas.
Figura 106: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo.
Janela OPTIONS:
Missing values
4
Este intervalo de confiana baseado na diferena da mdia da amostra e o valor de
referncia introduzido no teste. Note que diferente do intervalo de confiana para a mdia da
populao apresentado na terica.
d .
N n
a
e
M M
n
a
e
t
a
s u 0
6 7
,4
6
2 2
,4
3
Figura 107: Tabela resultante do teste t para uma amostra onde se apresentam algumas
estatsticas da varivel a testar.
Este primeiro quadro apresenta o nmero de casos vlidos (N), a mdia amostral
(Mean), o desvio padro (Std. Deviation) e o erro padro da mdia (Std. Error
Mean).
n
a
e
M c
rn
e Di
t f
d r
e
w
o
L r
e
p
U
tu
sa 9 9
5 2
,6 0
,5
-1 4
,3
-8 4
,3
5
Figura 108: Tabela resultante do teste t para uma amostra onde se apresenta entre
outras informaes o valor p, do respectivo teste.
Para isso, era necessrio comear por separar os dados de acordo com o sexo.
Figura 110: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar
assim como o nvel de significncia.
e
n
O - S
e
alm
p
iS
d
o
x
e v
i N n
a
e
M n
a
e
M
M a ts
a u 3
1 2
3
,8
6 4
2
,8
ni
m
e
F i t
a
s u 9
2 ,6
0
9 3
,6
5
2 6
,7
4
Figura 111: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso
masculino e feminino).
.3
7 V
st
e
T
f
De
c
rn
S
d
xo
e t f
d r
e
w
o
L r
e
p
U
M a ts
a u 16 3
0 ,
7
1
2 -
7
,0
6 -
,9
5
1 3
,7
nm
e
iF
o ro
tu
sa
2
1
,7 8
2 2
8
,4 ,9
3 ,3
-6 ,4
3
1
Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam entre outras informaes o valor p para os dois testes.
Para aplicar este teste necessrio que as variveis dependentes sigam uma
distribuio normal e que as varincias sejam homogneas.
Grouping variable variveis que dividem os casos pelos dois grupos teste.
Define groups
s
tiG
p
u
ro
a
S
P
U
O
R
G N n
a
e
M n
o n
a
e
M
md
a
re
T yhte
l
a 8 0 2
,
8
3
1 4
,3
8
o
cni
e
s esai
d 0
1 0
,
4
6
7 5
,7
3
1
2 9
,5
7
6
Figura 115: Tabela resultante da realizao do teste t para duas amostras independentes
na qual so visveis algumas estatsticas.
t
s
t t-e
s ila
u
q
E
r
fh
lo
a
rv
te
In
ro
E
.
td
S
F .
ig
S t f
d e
ld
-ta)
.(2
ig
S r
e
w
o
L r
e
p
U
T
m
d
a
re lE
a
u
q irv
n
7
3
,1 6
1
,7 3
7
,8
1 6
1 8
,0 0
,9
3
6
1 2
,5
7
8 4
,6
1
-2 ,
9
4
3
i s
a
r
lv
a
u
q
E
6
,9
1 9
3
,4
5
1 8
6
,0 0
,9
3
6
1 ,9
3
8 0
,4
3
-1 0
,2
1
4
3
sm
ta
o
neu
Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes
na qual so mostrados os valores p assim como o intervalo de confiana para a
diferena de mdias.
Neste tipo de teste, comparada a mdia das diferenas com um valor que pode ser
ou no zero. No fundo, so calculadas as diferenas entre os valores das observaes
de cada varivel das amostras.
Para aplicar este teste necessrio que as variveis dependentes sigam uma
distribuio normal.
Pretende-se testar:
H0: D = 0 Vs H1: D 0
Neste caso queremos comparar a mdia das diferenas com o valor zero, para
analisar se o tratamento teve ou no efeitos.
Figura 117: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas.
lire
p
m d
a
S P
N n
o n
a
e
M
rP
i
a P
e
05 0
2 5
1
,8
9 5
9
,1
2
1 e
d a
t
s
e
P
0
8
,6
4
7 0
2 8
,3
9 9
,0
2
to
n
e
m
a
r
Figura 118: Tabela resultante da realizao do teste t para amostras emparelhadas, onde
so visveis algumas estatsticas.
sa
le
p
m
S
ird
P
N .
ig
S
rP
i
a P
e
1 d
0
2
s
e
P
to
n
e
m
ra
Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde
visvel o coeficiente de correlao.
Numa segunda tabela aparece informao que permite inferir acerca da correlao
entre o par seleccionado (nmero de casos vlidos para ambas as variveis,
coeficiente de correlao e nvel de significncia). Convm destacar que o coeficiente
de correlao varia entre -1 e 1. Quanto mais prximo de -1 ou +1 estiver, mais
linearmente relacionadas se encontram as variveis. Se o valor prova (p_value) for
inferior ao nvel de significncia as variveis esto relacionadas.
n
a
e
M n
o n
a
e
M r
e
w
o
L r
e
p
U t f
d t
rP
i
a P
e
1 d
07 5
2
,3
1 7
9
,6
0
2 3
,4
6
2 ,3
7
1 9
1 ,0
s
e
P
trae
on
m
O ltimo quadro contm informao acerca das variveis seleccionadas: mdia, desvio
padro, erro amostral da mdia, os limites do Intervalo de Confiana, o valor da
estatstica t para o teste, o nmero de graus de liberdade e o nvel de significncia.
Neste caso, o p-value (Sig. (2-tailled)) tem o valor de 0.000 que inferior ao nvel de
significncia (0.05), pelo que se rejeita a hiptese nula. Por este motivo pode concluir-
se que as mdias so significativamente diferentes, isto , a mdia no grupo mudou
como resultado do tratamento.
geralmente aceite que a potncia dos Testes Paramtricos superior dos Testes
No Paramtricos, isto , a probabilidade de rejeitar correctamente H0 maior num
Teste Paramtrico. No entanto, h autores que afirmam que os testes no
paramtricos aplicados a amostras de pequena dimenso podem ser mais potentes.
Figura 122: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem
indicar as variveis assim como os valores a testar.
Figura 123: Janela de dilogo onde se pode optar por um teste exacto ou por uma
aproximao normal.
Time limit per Test limite de tempo por teste - introduzir um valor entre 1 e
9.999.999.999 como tempo mximo permitido para calcular cada teste.
Figura 124: Janela de Dilogo onde se pode optar por pedir algumas estatsticas,
assim como o tratamento aos missings.
Exemplo Prtico
Num dado inqurito solicitava-se aos inquiridos que assinalassem a sua posio
poltica, em termos de direita, centro e esquerda. Os resultados encontram-se na base
de dados Inquerito1, na varivel politica.
e
vO
sr
b x
E
a
rd
e
u
sq 4
0 4
,2
1 2
tro
n
e
C 1
5 ,2
7
6
5
tra iD
e 3
0
5 ,6
9
3
4 ,4
3
6
l
ta
o
T 8
4
1
Resultados:
is
C
h a 0
f
d 2
.
p
sym
A 1
,0
. ce
a l0
em
h
.T
5
n
i
u
valor p.
Concluso:
O valor de prova (p) = 0,001, pelo que se conclui pela rejeio da hiptese nula, para
um =0,05. Ou seja conclui-se pela no representatividade da amostra na varivel
posio poltica para a populao.
Figura 127: Janela de dilogo para proceder realizao do teste do qui-quadrado para
a independncia de variveis, onde se devero indicar quais as variveis a testar.
Figura 128: Janela de dilogo onde se podem pedir algumas estatsticas relativas s
variveis a testar no teste do qui-quadrado para a independncia de variveis
Figura 129: Janela de dilogo onde se pode optar por quais as informaes a apresentar
na clula da tabela de contingncia.
Figura 130: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a sua intensidade com
que vivem a religio e a frequncia de actos religiosos. Os resultados encontram-se na
base de dados Inquerito1, na varivel freqreli e intenrel. Teste a hiptese destas
variveis serem independentes.
se
a
C s
N t
rcn
e
P N N
F
u
q
re
servio 9
3
1 ,%
6
7 7
4
3 , %
3
2 0 0
1 %
te
In
s
o
ig
c
ra
F ra
e
d
o
M rte
o
F l
ta
o
T
rF M
s
o
n
e
vd
a
m
u C
n
u
o 7
5 9 9 9
3
rv
s
e
d o
p t
c
e
p
x
E ,
7
3 ,
1 ,2
4 ,0
3
9
re .R
td
S i
s
le
a
u ,1
6 -,6 ,3
-5
e
v
a
m
U u
o
C 0
3
1 9
1 6
2 5
7
1
t
c
e
p
x
E ,0
1
7 ,9
0
2 ,1
3
8
.R
td
S i
s
le
a
u ,0
7 -,4 ,3
-6
a
ri
V u
o
C 0
1 5
2 5
4 0
7
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 3
,7 1
,0
v
a
m
U u
o
C 4
6 3
1 2
3 9
0
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 3
,0 ,
0
u
o
2 u
o
C 6
4 4
2 4
6 4
3
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 2
,0 ,
0
Q
e
s
a
u u
o
C 9 2
1 3
5 7
4
e
s t
c
e
p
x
E ,
0
3 ,
8 ,1
5
3 ,0
4
7
.R
td
S i
s
le
a
u ,8
-3 ,
1 ,0
3
se
a
d
o
Tm u
o
C 5
3 0
3 5
9
1 0
6
2
t
c
e
p
x
E ,0
1
3
.R
td
S i
s
le
a
u -
,9
6 -,2 6
,4
sd
ie
a
Mr
o
p
z
v
m
u u
o
C 3 4 7
1 4
2
1
n
a
m
e
s t
c
e
p
x
E ,3
0
5 ,8
4
1 ,9
8
5
.R
td
S i
s
le
a
u ,7
-6 ,8
-2 ,6
7
l
ta
o
T u
o
C 2
6
4 6
3
1 1
4
5 9
3
1
t
c
e
p
x
E
Resultados:
e f
d -si
(2
P
rso
a
e -n
i
h
C a
1
4 ,
0
h
iko lL
e 4
1 ,0
n i-b
rL
a
e y
1 ,0
ci
so
A
f
o
N 9
3
1
. sl0
a ce (
n
m ctid
xp
e
u
Concluso:
No presente exemplo o valor de prova (p) < 0,001. Pelo que se conclui pela rejeio
da hiptese nula, para um =0,05. Ou seja conclui-se que os actos religiosos e a
intensidade com que se vive a religio no so independentes ao nvel de significncia
estabelecido.
5.2. Binomial
O procedimento binomial permite testar se a proporo de uma categoria de uma
varivel dicotmica, ou tornada dicotmica, da amostra difere de uma determinada
constante, por ex. a proporo do sexo na populao.
Figura 134: Janela dilogo para a execuo do teste da binomial, onde se devem indicar
as variveis assim como as propores a testar.
Surgem igualmente as opes para definir a dicotomia, pode ser a definida na varivel
(atribui os casos com a categoria mais baixa a um grupo e os de categoria mais alta a
outro), ou definir a dicotomia por um ponto de corte, o valor a inserir deve
corresponder ao value da categoria a ficar no segundo grupo, as categorias com value
inferior ficam no grupo 1, o grupo 2 constitudo pelo valor inserido e superiores. A
varivel deve estar bem definida para no misturar diferentes itens.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a seu sexo. Os resultados
encontram-se na base de dados Inquerito1, na varivel sexo. Nos ltimos censos
realizados a proporo do sexo feminino era de 55%.
Resultados:
ia
p
sym
A
N .
p
ro
P st
e
T
d
xo
e
S G
ro a
F
m
e 3
4
8 7
,5 ,5 4
9
,0
ro
G scu
a
M
3
4
6 3
,4
o
ta
o
T 6
8
4
1 ,0
1
. B
a
Concluso:
No presente exemplo o valor de prova (p) = 0.188. Pelo que se conclui pela no
rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no
representatividade da amostra na varivel sexo para a populao.
Figura 136: Janela de dilogo para a execuo de testes no paramtricos para amostras
independentes, onde se deve indicar quais as variveis e grupos a testar.
Tipo de teste
Moses extreme reactios concebido para testar hipteses nas quais se esperam que
a varivel experimental afectar alguns casos numa direco e outros casos na
direco oposta. Teste para respostas extremas comparadas com o grupo de controlo.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem o seu sexo e os anos de
escolaridade completos. Os resultados encontram-se na base de dados Inquerito1, na
varivel sexo e educ. Teste a hiptese de os anos completos de escolaridade no
diferirem entre os dois sexos.
Resultados
d
xo
e
S N kM
n
a
Re
sA
o
n M 6
9
3 5
7 ,7
4
m
co e
F 0
4
8 9
0
l
ta
o
T
riq
d u
tn
i
h
-W
a
M
y
e 0
W 0
Z 4
m
y
s
A 0
,9
. G
a u
ro
Concluso:
No presente exemplo o valor de prova (p) = 0,909. Pelo que se conclui pela no
rejeio da hiptese nula. Ou seja no se pode concluir que os anos de escolaridade
nos dois sexos no so idnticos, ao nvel de significncia 0.05.
Figura 139: Janela de dilogo para a execuo dos testes no paramtricos para
amostras emparelhadas.
Tipo de teste
Sign teste dos sinais testa a hiptese de duas variveis serem provenientes da
mesma populao. As diferenas entre as duas variveis para todos os casos so
calculados e classificados como positivos, negativos ou empate. Se duas variveis
forem similarmente distribudas, as diferenas positivas e negativas no so
estatisticamente significativas.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem os anos de escolaridade
completos do pai e da me. Os resultados encontram-se na base de dados
Inquerito1, na varivel maeeduc e paieduc. Teste a hiptese de os anos completos
de escolaridade no diferirem entre o pai e a me do inquirido.
Resultados
skR
n
a
N k
R
n
a
e
M
A
sd
o
n tiN
a
g
e v a
3
8
1 6,3
0 1 0
eltsd
p
m
co a tP si
o b
0
1
3 0
e
sd
o
n
A e i
sT c3
2
5
e ltsd
p
m
co
t
o
T 0
8
9
. A
a
i
a
p
. A
b
i
a
p
c. A
i
a
p
Figura 140: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma
das posies.
b
is
e
d
e
l
p
scm
to
i
a
p
Z a
6
sym
A 1
7
,9
. a
a B
. W
b
Concluso:
No presente exemplo o valor de prova (p) = 0,971. Pelo que se conclui pela no
rejeio da hiptese nula. Ou seja no se pode concluir que distribuio das variveis
anos escolaridade do pai e da me sejam idnticas na populao, ao nvel de
significncia 0.05.
6. Regresso
A anlise da regresso permite, atravs da relao entre variveis, prever a evoluo
de uma em funo da outra. Esta previso em termos mdios ou de valores
esperados. Por exemplo, podemos definir a nota mdia dos alunos disciplina de BBII
em funo do nmero de horas de estudo que dedicaram cadeira, supondo que
existe entre estas duas variveis uma relao neste sentido. Neste exemplo, estamos
a considerar a nota de BBII como varivel dependente e o nmero de horas de estudo
como varivel independente e Y= f(X).
Esta relao funcional pode traduzir uma relao linear, exponencial, entre outras.
Vamos considerar a regresso linear.
Y Y
Y=a+bX Y=a+bX
X X
Figura 142: Representao das possveis relaes lineares entre duas variveis.
No SPSS aps introduo dos dados amostrais, para obter a anlise da regresso
linear entre duas variveis devemos seguir os seguintes passos:
Figura 144:Janela de dilogo para a execuo da regresso linear onde se deve indicar
quais as variveis dependente e independentes.
M
d
o B t
1 ( 0
e
W
y
d
o
B 0
,3 4
. D
a p
e r e
e
p
y
d
o
B tc o
p n
i
Neste caso, em que a nossa varivel dependente era a Percepo Corporal (o SPSS
indica qual a varivel dependente em baixo do quadro) e a independente o Peso,
obtemos a seguinte equao:
Y= 1,800 + 0,163X
Quando o peso zero a percepo corporal em mdia 1,800. Neste caso, no faz
sentido a anlise do coeficiente a porque zero no pertence regio de validade do
modelo.
Quando o peso varia uma unidade (1Kg) a percepo corporal aumenta em mdia
0,163.
Y= a+b1X1+b2X2
M
d
o B t .
ig
S
1 (
C ,
4
6 ,
9
1
5
u
P ,
4
7
0 -
7
4
,0 1
-,7 8
7
,4
rac
e
p
y
Ht ,
9
5
6 4
3
,1 8
2
,3 8 ,0
y
d
o
B 8
9
,3 2
,1 6
1
,2 2 1
,0
. d
a tD
n
ep
Figura 146: Tabela resultante de uma regresso linear mltipla onde se apresentam os
coeficientes.
Yi=0+1Xi+i
onde temos diversos modelos para opo. Podemos igualmente optar por construir a
anlise de regresso atravs de uma srie temporal escolhendo a opo Time na
definio da varivel independente. A srie temporal permite-nos definir a evoluo ao
longo do tempo de uma determinada varivel e prever o valor mdio esperado na
varivel dependente para um determinado momento do tempo.
Para 0
H0: 0 = 0
H1: 0 0
O valor p obtido aproximadamente zero (ver quadro supra dos coeficientes), logo
inferior ao nvel de significncia escolhido (0,05), pelo que rejeitamos H0 e conclumos
que para o nvel de significncia de 0,05 temos evidncia estatstica para considerar
que o valor de 0 significativamente diferente de zero
R e R2
Na anlise da regresso h duas medidas de associao entre a varivel dependente
e a(s) variveis independentes:
M
d
o R
1 a 9
,0 6
8
,0 5
9
,6
. P
a d
re g
h
Figura 148:Tabela resultante da regresso linear onde se apresentam os coeficientes de
determinao e correlao.
Neste caso, R2= 0,090, ou seja, a varivel Peso explica apenas 9% da variao da
Percepo Corporal e R=30% o que nos d indicao de uma relao fraca entre as
variveis.