Você está na página 1de 126

Biomatemtica e Bioestatstica II

SPSS

Departamento de Produo e Sistemas

Escola Superior de Tecnologia da Sade do Porto


Ttulo:
Biomatemtica e Bioestatstica II - SPSS

Autores:
Ana Paula Nascimento, Agostinho Cunha, Carla Teixeira Lopes, Ftima Monteiro,
Liliana Pereira, Sandra Alves, Vtor Bento

Ano:
2005
Biomatemtica e Bioestatstica II 3

Sumrio
1. Introduo ao SPSS para Windows. .................................................................... 14

1.1. Opes gerais do programa .......................................................................... 14

1.2. Janelas do SPSS .......................................................................................... 15

1.3. Menu principal. Barra de ferramentas. Barra de estado................................. 17

Menu principal..................................................................................................... 17

Barra de ferramentas. ......................................................................................... 18

Barra de estado................................................................................................... 18

1.4. Procedimento bsico para uma anlise de estatstica. .................................. 19

1.5. Grficos......................................................................................................... 19

2. Arquivo de Dados................................................................................................. 22

2.1. Arquivo de Dados em SPSS ......................................................................... 22

Criar um arquivo.................................................................................................. 22

Abrir um arquivo.................................................................................................. 23

Guardar um arquivo ............................................................................................ 25

Informao sobre arquivos de dados .................................................................. 26

2.2. Janela de edio de dados............................................................................ 26

Definio de variveis ......................................................................................... 27

Entrada de dados................................................................................................ 30

Edio de Dados................................................................................................. 30

2.3. Transformaes sobre os dados ................................................................... 31

Criao de variveis............................................................................................ 31

Recodificao de variveis.................................................................................. 34

Outras Transformaes....................................................................................... 38

2.4. Manipulao de arquivos............................................................................... 41

3. Estatstica Descritiva ............................................................................................ 47

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 4

3.1. Medidas de Estatstica Descritiva .................................................................. 47

3.2. Frequncias .................................................................................................. 48

Tabela de Frequncias........................................................................................ 48

Estatsticas Descritivas ....................................................................................... 52

Grficos .............................................................................................................. 55

3.3. Clculo de estatsticas bsicas...................................................................... 60

3.4. Anlise exploratria....................................................................................... 63

Estatsticas.......................................................................................................... 65

Diagrama de caixa e fio (Boxplots)...................................................................... 68

Diagrama de tronco e folha (Steam-and-leaf)...................................................... 71

3.5. Tabelas ......................................................................................................... 74

Modificao de estrutura ..................................................................................... 74

Modificao de formatao ................................................................................. 78

4. Testes de hipteses paramtricos........................................................................ 80

4.1. Condies de aplicao dos Testes Paramtricos ........................................ 80

Teste de Kolmogorov-Smirnov ............................................................................ 80

Teste de Shapiro-Wilk ......................................................................................... 80

Teste de Normalidade ......................................................................................... 81

4.2. Resultados ao Teste de Normalidade............................................................ 83

4.3. Mdias .......................................................................................................... 84

4.4. Uma amostra................................................................................................. 87

Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel 90

4.5. Duas amostras com dados independentes.................................................... 93

4.6. Duas amostras com dados emparelhados..................................................... 95

5. Testes de hipteses no paramtricos............................................................... 100

5.1. Teste do Qui-Quadrado............................................................................... 101

Qui- quadrado para a qualidade do ajuste......................................................... 101

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 5

Exemplo Prtico ................................................................................................ 104

Qui-Quadrado para independncia de variveis................................................ 106

Exemplo Prtico ................................................................................................ 109

5.2. Binomial ...................................................................................................... 111

Exemplo Prtico ................................................................................................ 112

5.3. Duas amostras Independentes (Mann-Whitney).......................................... 113

Exemplo Prtico ................................................................................................ 115

5.4. Two Related Samples (Wilcoxon)................................................................ 116

Exemplo Prtico ................................................................................................ 117

6. Regresso ......................................................................................................... 120

6.1. Regresso Linear Simples .......................................................................... 120

6.2. Regresso Linear Mltipla ........................................................................... 123

6.3. Estimao da Curva .................................................................................... 124

Teste aos coeficientes....................................................................................... 125

R e R2 ............................................................................................................... 126

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 6

Sumrio de Figuras
Figura 2: Janela de entrada no SPSS. ........................................................................ 14

Figura 3: Janela de Edio de Dados. ........................................................................ 15

Figura 4: Janelas de Edio de Dados, de Resultados e de Sintaxe. ......................... 16

Figura 5: Janela de Edio de Grficos. ..................................................................... 16

Figura 6: Janela de Sintaxe. ....................................................................................... 17

Figura 7: Barras de menus e ferramentas. .................................................................. 17

Figura 8: Grfico com a representao de duas variveis........................................... 20

Figura 9: Grfico com a representao de uma varivel. ........................................... 20

Figura 10: Grfico Simples.......................................................................................... 20

Figura 11: Grfico encaixado. ..................................................................................... 20

Figura 12: Menu para a criao de uma nova janela de edio de dados. .................. 22

Figura 13: Menu para abrir uma base de dados j existente. ...................................... 23

Figura 14: cone para abrir uma base de dados. ......................................................... 23

Figura 15: Janela de dilogo para a indicao da localizao de uma ficheiro a ser
aberto.................................................................................................................. 24

Figura 16: Janela de dilogo com Wizard para a importao de dados para SPSS. ... 25

Figura 17: Menu para guardar um ficheiro. ................................................................. 25

Figura 18: cone para aceder informao acerca de uma varivel. .......................... 26

Figura 19: Janela de Data View. ................................................................................. 26

Figura 20: Janela de Variable View............................................................................. 27

Figura 21: Janela de dilogo para definir o tipo de varivel......................................... 28

Figura 22: Janela de dilogo para introduzir valores para a varivel. .......................... 28

Figura 23: Janela de dilogo para definir missings...................................................... 29

Figura 24: Menus para inserir casos e variveis. ........................................................ 30

Figura 25: cone para posicionar-se num determinado caso. ...................................... 31

Figura 26: cone para encontrar dados. ...................................................................... 31

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 7

Figura 27: Janela de dilogo para criar variveis atravs de transformaes noutras. 32

Figura 28: Janela com a informao acerca de uma varivel do ficheiro Cars. ........... 33

Figura 29: Janela de dilogo para criar varivel accel_mi em funo da varivel accel
presente no ficheiro Cars. ................................................................................... 33

Figura 30: Janela de dilogo que permite seleccionar casos onde a transformao vai
ser efectuada. ..................................................................................................... 34

Figura 31: Janela de dilogo para a recodificao automtica da varivel cityname... 35

Figura 32: Resultado da recodificao automtica da varivel cityname..................... 35

Figura 33: Janela de dilogo para a indicao do novo cdigo. .................................. 36

Figura 34: Janela onde exemplificada a recodificao dos missings........................ 38

Figura 35: Janela de dilogo para criar categorias de forma automtica..................... 38

Figura 36: Janela de dados onde se mostra um exemplo de uma determinada base de
dados. ................................................................................................................. 39

Figura 37: Janela de dilogo que permite executar a funo count............................. 40

Figura 38: Janela de dilogo que permite dar a condio para proceder contagem. 40

Figura 39: Janela de dados resultante do procedimento Transform Count. ................ 41

Figura 40: Janela de dilogo que permite ordenar os dados de acordo com vrios
critrios. .............................................................................................................. 42

Figura 41: Janela de dados resultante do procedimento Data Sort. ............................ 42

Figura 42: Janela de dilogo que permite executar o Split file. ................................... 43

Figura 43: Janela que exemplifica o Split file efectuado pela varivel sexo (gender). . 44

Figura 44: Janela de dilogo para seleccionar dados. ................................................ 45

Figura 45: Janela de dilogo para especificar a amostra aleatria.............................. 45

Figura 46: Janela de dados onde se mostra uma base de dados contendo a
informao de altas verificadas num determinado hospital. ................................ 46

Figura 47: Tabela de frequncias da varivel dia da semana. .................................... 46

Figura 48 Menu Analyze > Descriptive Statistics > Frequencies .............................. 48

Figura 49 Janela de Frequncias ............................................................................. 49

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 8

Figura 50 Tabela de frequncias.............................................................................. 49

Figura 51 Tabela de Frequncias com casos omissos............................................. 51

Figura 52 Janela de Frequncias opo Format. .................................................. 52

Figura 53 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 52

Figura 54 Janela de Frequncias ............................................................................. 53

Figura 55 Frequencies: Statistics ............................................................................. 53

Figura 56 Estatsticas descritivas ............................................................................. 54

Figura 57 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 56

Figura 58 Janela de Frequncias ............................................................................. 56

Figura 59 Frequencies: Charts................................................................................. 57

Figura 60 Grfico de barras por frequncia absoluta ............................................... 57

Figura 61 Grfico de barras por frequncia relativa ................................................. 58

Figura 62 - Grfico circular.......................................................................................... 58

Figura 63 Histograma .............................................................................................. 59

Figura 64 Histograma com curva normal ................................................................. 59

Figura 65 Janela de edio de Grficos ................................................................... 60

Figura 66 Analyze / Descriptive Statistics / Descriptives .......................................... 61

Figura 67 Janela Descriptives .................................................................................. 61

Figura 68 Janela Descriptives / Options ................................................................... 62

Figura 69 Resultado do procedimento Descriptives ................................................. 62

Figura 70 Scores z................................................................................................... 63

Figura 71 Menu Explore........................................................................................... 64

Figura 72 Janela Explore ......................................................................................... 64

Figura 73 Boto Statistics na janela Explore ............................................................ 65

Figura 74 Explore: Statistics .................................................................................... 66

Figura 75 Estatsticas Descriptives do procedimento Explore para um grupo da


categoria Primary Vehicle ................................................................................... 66

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 9

Figura 76 M-Estimators............................................................................................ 67

Figura 77 - Outliers ..................................................................................................... 67

Figura 78 Percentiles ............................................................................................... 67

Figura 80 Boto Plots na janela Explore .................................................................. 69

Figura 81 Plots em Explore ...................................................................................... 70

Figura 82 - Diagrama caixa e fio ................................................................................. 71

Figura 83 Boto Plots na janela Explore .................................................................. 72

Figura 84 Plots em Explore ...................................................................................... 72

Figura 85 Tabela do SPSS ...................................................................................... 74

Figura 86- Menu de configurao de tabelas .............................................................. 75

Figura 87 Pivoting Trays .......................................................................................... 76

Figura 88 Inserir informao numa nova camada .................................................... 76

Figura 89 Tabela com uma nova camada ................................................................ 77

Figura 90 Troca de linha para coluna....................................................................... 77

Figura 91 Tabela com varivel Primary vehicle em coluna....................................... 78

Figura 92 Opo Toolbar ......................................................................................... 78

Figura 93 Opo TableLooks ................................................................................... 79

Figura 94 Janela TableLooks ................................................................................... 79

Figura 95: Menu a seguir para efectuar o teste normalidade.................................... 81

Figura 96: Janela de dilogo no teste normalidade onde se colocam as variveis a


testar e as que vo criar grupos. ......................................................................... 82

Figura 97: Janela onde se selecciona a opo para efectuar o teste normalidade... 83

Figura 98: Tabela de resultado do teste normalidade, que apresenta o nmero de


casos vlidos, missings e totais. ......................................................................... 83

Figura 99: Tabela resultante do teste normalidade, com os dois testes Kolmogorov-
Smirnov e Shapiro-Wilk....................................................................................... 84

Figura 100: Menu para efectuar o procedimento Compare Means-> Means............... 85

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 10

Figura 101: Janela de dilogo do procedimento Compare Means-> Means onde


visvel onde se devero colocar as variveis dependentes e independentes. ..... 85

Figura 102: Janela de dilogo onde possvel seleccionar as estatsticas a pedir. .... 86

Figura 103: Tabela resultante o procedimento Compare Means-> Means onde se


mostram nmero de casos includos, excludos e total........................................ 86

Figura 104: Tabela resultante do procedimento Compare Means-> Means onde se


apresentam as estatsticas pedidas. ................................................................... 87

Figura 105: Menu para a execuo do procedimento Teste t para uma amostra. ....... 88

Figura 106: Janela de dilogo resultante da seleco do teste t para uma mostra onde
possvel escolher qual a varivel e o valor a testar........................................... 88

Figura 107: Janela de dilogo onde se pode indicar o nvel de confiana para o
intervalo. ............................................................................................................. 89

Figura 108: Tabela resultante do teste t para uma amostra onde se apresentam
algumas estatsticas da varivel a testar. ............................................................ 90

Figura 109: Tabela resultante do teste t para uma amostra onde se apresenta entre
outras informaes o valor p, do respectivo teste................................................ 90

Figura 110: Janela onde se efectuar uma partio de todos os procedimentos em


funo da varivel sexo....................................................................................... 91

Figura 111: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a
testar assim como o nvel de significncia........................................................... 92

Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso
masculino e feminino). ........................................................................................ 92

Figura 113: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam entre outras informaes o valor p para os dois testes.
............................................................................................................................ 92

Figura 114: Menu para a execuo do teste t para amostras independentes.............. 93

Figura 115: Janela de Dilogo onde se devem especificar os grupos. ........................ 94

Figura 116: Tabela resultante da realizao do teste t para duas amostras


independentes na qual so visveis algumas estatsticas.................................... 94

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 11

Figura 117: Tabela resultante da realizao do teste t para duas amostras


independentes na qual so mostrados os valores p assim como o intervalo de
confiana para a diferena de mdias. ................................................................ 95

Figura 118: Janelas de Dilogo para a realizao do teste t para amostras


emparelhadas. .................................................................................................... 97

Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas,


onde so visveis algumas estatsticas................................................................ 98

Figura 120: Tabela resultante da realizao do teste t para amostras emparelhadas,


onde visvel o coeficiente de correlao. .......................................................... 98

Figura 121: resultante da realizao do teste t para amostras emparelhadas, onde


visvel o valor p, assim como o intervalo de confiana para a mdia das
diferenas. .......................................................................................................... 98

Figura 122: Menu onde se encontram os testes no paramtricos. .......................... 101

Figura 123: Janela de Dilogo para a realizao do teste do qui-quadrado onde se


devem indicar as variveis assim como os valores a testar............................... 102

Figura 124: Janela de dilogo onde se pode optar por um teste exacto ou por uma
aproximao normal....................................................................................... 103

Figura 125: Janela de Dilogo onde se pode optar por pedir algumas estatsticas,
assim como o tratamento aos missings............................................................. 104

Figura 126: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam


valores observados e esperados, assim como os resduos............................... 105

Figura 127: Tabela resultante do teste do qui-quadrado do ajuste onde se apresenta o


.......................................................................................................................... 105

Figura 128: Janela de dilogo para proceder realizao do teste do qui-quadrado


para a independncia de variveis, onde se devero indicar quais as variveis a
testar................................................................................................................. 107

Figura 129: Janela de dilogo onde se podem pedir algumas estatsticas relativas s
variveis a testar no teste do qui-quadrado para a independncia de variveis107

Figura 130: Janela de dilogo onde se pode optar por quais as informaes a
apresentar na clula da tabela de contingncia................................................. 108

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 12

Figura 131: Janela de dilogo onde se pode optar qual a forma de ordenao dos
dados. ............................................................................................................... 109

Figura 132: Tabela resultante do teste do qui-quadrado para independncia, onde se


mostra o nmero de casos vlidos, missings e total.......................................... 109

Figura 133: Tabela de contingncia resultante da execuo do teste do qui-quadrado.


.......................................................................................................................... 110

Figura 134: Tabela resultante da execuo do teste do qui-quadrado onde se mostram


os valores prova. ............................................................................................... 110

Figura 135: Janela dilogo para a execuo do teste da binomial, onde se devem
indicar as variveis assim como as propores a testar. ................................... 112

Figura 136: Tabela resultante do teste da binomial onde so visveis as propores


observadas, a proporo a testar assim como o valor p.................................... 113

Figura 137: Janela de dilogo para a execuo de testes no paramtricos para


amostras independentes, onde se deve indicar quais as variveis e grupos a
testar................................................................................................................. 114

Figura 138: Tabela resultante do teste de Mann-Whitney onde se apresentam os


grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de
posies............................................................................................................ 115

Figura 139: Tabela resultante do teste de Mann-Whitney, onde se apresenta o valor p.


.......................................................................................................................... 115

Figura 140: Janela de dilogo para a execuo dos testes no paramtricos para
amostras emparelhadas.................................................................................... 116

Figura 141: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e


soma das posies. .......................................................................................... 118

Figura 142: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p. .... 118

Figura 143: Representao das possveis relaes lineares entre duas variveis. ... 120

Figura 144: Menu para a execuo da regresso linear. .......................................... 121

Figura 145:Janela de dilogo para a execuo da regresso linear onde se deve


indicar quais as variveis dependente e independentes.................................... 122

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 13

Figura 146: Tabela resultante de uma regresso linear onde se apresentam os


coeficientes. ...................................................................................................... 122

Figura 147: Tabela resultante de uma regresso linear mltipla onde se apresentam os
coeficientes. ...................................................................................................... 123

Figura 148:Menu para a estimao da curva. ........................................................... 125

Figura 149:Tabela resultante da regresso linear onde se apresentam os coeficientes


de determinao e correlao. .......................................................................... 126

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 14

1. Introduo ao SPSS para Windows.


O SPSS (Statistical Package for Social Sciences Pacote Estatstico para as Cincias
Sociais) uma Soluo modular para anlise estatstica de dados, incluindo
poderosos sistemas de gesto de dados e de aplicao de procedimentos estatsticos
num ambiente grfico, utilizando menus e caixas de dilogo de utilizao muito fcil,
segundo a empresa Produtos e Servios de Estatstica, Lda, que detm o direitos de
comercializao em Portugal deste software.

Este software foi inventado, nos Estados Unidos, por Norman H. Nie, C. Hadlai (Tex)
Hull e Dale H. Bent e desde a sua primeira verso, em 1968, j foram desenvolvidas
doze novas verses. Este software, alm da sua aplicao nas Cincias Sociais para
onde foi inicialmente concebido, tambm usado em pesquisas relacionadas com
sade e educao, pesquisas governamentais e de mercado e inmeros outros
sectores. O primeiro manual de usurio foi publicado em 1970 por Nie e Hall. A
primeira verso do SPSS para computadores pessoais surgiu em 1984.

1.1. Opes gerais do programa


Para entrar no SPSS basta fazer um duplo clique no cone SPSS. Aparecer uma
janela, como exemplificado a seguir:

Figura 1: Janela de entrada no SPSS.

Onde se ter que escolher uma das opes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 15

Tambm podemos abrir uma sesso do SPSS fazendo duplo clique sobre o cone
correspondente o qualquer arquivo do tipo SPSS:

de dados: tm extenso .sav e esto no formato SPSS

de grficos: tm extenso .cht (grfico de barras, histograma, etc.)

de texto: tm extenso .sps (arquivo de sintaxe)ou .lst (arquivo de resultados).

1.2. Janelas do SPSS


Basicamente a aplicao SPSS dispe de trs janelas onde os dados e os resultados
estatsticos podem ser criados e manipulados ou exibidos. A janela de edio de
dados, a janela de exibio de resultados e grficos, e a janela de edio de grficos.

O editor de dados activa uma janela com uma estrutura semelhante a uma folha de
clculo clssica que contm o arquivo de dados que estamos a utilizar. Esta janela
abre-se automaticamente ao iniciar a sesso do SPSS.

Figura 2: Janela de Edio de Dados.

A janela de exibio de resultados e grficos onde aparecem os resultados das


anlises realizadas com o programa. Podemos arquivar os resultados para utilizao
posterior.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 16

Figura 3: Janelas de Edio de Dados, de Resultados e de Sintaxe.

A janela de grficos permite modificar e guardar grficos e arquivos com extenso .cht.

Figura 4: Janela de Edio de Grficos.

Existe ainda uma outra janela que a janela de sintaxe onde podemos colar os
comandos seleccionados a partir de qualquer caixa de dilogo que corresponde
efectuao de uma ou mais anlises estatsticas. Podemos guardar estes comandos
num ficheiro de sintaxe (com extenso .sps) o que nos permite aplicar as mesmas
anlises estatsticas a ficheiros de dados com igual estrutura.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 17

Figura 5: Janela de Sintaxe.

1.3. Menu principal. Barra de ferramentas. Barra de


estado.
O conjunto de comandos disponvel na barra de menus e na barra de ferramentas
permite manipular ficheiros de dados (criar, editar, transformar, gravar e imprimir),
realizar procedimentos estatsticos e criar grficos.

Figura 6: Barras de menus e ferramentas.

Menu principal.
A partir deste menu acedemos maioria das funes do SPSS. O menu principal tem
dez opes:

File- criar um novo ficheiro SPSS, abrir um existente, guardar, ler dados
criados com outra aplicaes, etc.

Edit- contm as habituais opes do Windows para copiar dados, procurar, etc.

View- permite alterar o aspecto da janela de edio de dados.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 18

Data- contm opes para efectuar mudanas que afectam todo o arquivo de
dados (unir arquivos, transpor variveis e casos, criar subconjuntos de casos,
etc.). Estas mudanas so temporrias enquanto no se guarda explicitamente
o ficheiro.

Transform- efectua mudanas sobre as variveis seleccionadas, permite a


criao de novas variveis.

Analyze- a partir desta opo so executados todos os procedimentos


estatsticos.

Graphs- grficos de barras, histogramas, etc.

Utilities- obter informao completa do arquivo de dados, aceder a um ndice


de comandos do SPSS, etc.

Window- ordenar, seleccionar, controlar atributos das janelas abertas.

Help- permite aceder ajuda da aplicao.

Barra de ferramentas.
Situada abaixo da barra do menu principal, a barra de ferramentas exibe um conjunto
de cones que, uma vez activados com o rato, realizam os procedimentos mais
frequentes. Colocando o rato sobre o cone, exibida uma descrio sobre a tarefa
activada.

Tanto a barra de ferramentas como a de estado se podem activar ou desactivar a


partir da opo do menu View/Toolbar ou Status Bar. Tambm podemos mudar o
tamanho dos cones com a opo View/Toolbar.

Barra de estado.
Situada na base da janela da aplicao, indica o estado actual do processo e as
seguintes informaes complementares:

O nmero de casos processados.

Filtro de dados, se utilizarmos somente uma parte do arquivo de dados.


apresentada a mensagem Filter on.

Varivel ponderada, se utilizarmos o critrio de ponderao. apresentada a


mensagem Weight on.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 19

Segmentao de dados, se trabalharmos com o arquivo de dados dividido em


subgrupos a partir de uma ou mais variveis de agrupamento. apresentada a
mensagem Split File on.

1.4. Procedimento bsico para uma anlise de


estatstica.
Para levar a cabo qualquer tipo de anlise com SPSS necessrio efectuar estas trs
operaes bsicas:

1. Seleccionar uma base de dados

2. Seleccionar o procedimento estatstico pretendido (menu principal)

3. Seleccionar as variveis a incluir na anlise e outros parmetros adicionais


(que surgem nas caixas de dilogo)

1.5. Grficos.
A representao em grficos dos dados de tabelas, quadros e folhas de clculo
propicia uma leitura fcil e sedutora da informao. A informao estatstica
representada em grficos apreendida pelo destinatrio de uma forma fcil e intuitiva.

Para alm dos grficos de utilizao corrente, acessveis em qualquer folha de clculo,
o aplicativo SPSS apresenta formatos particulares de grficos de grande qualidade
visual, adequados, quer representao de informao especfica, quer ao resumo de
grandes quantidades de informao.

Em termos gerais, em SPSS, os grficos so estruturados do seguinte modo:

1. Em funo da natureza da varivel estatstica nominal, dicotmica ou


contnua.

2. Do nmero de variveis a representar no mesmo grfico.

3. Da natureza independente ou encaixada dos dados a representar.

Decorrentes dessa estrutura, em termos genricos, os grficos do SPSS podem ser


tipificados de duas formas:

1. Considerando o nmero de variveis a representar no grfico:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 20

Grfico com medidas (de localizao ou Grfico de uma varivel.


disperso) de duas ou mais variveis
contnuas.
10

3,5

6
3,4

3,3 2
Std. Dev = ,91
Mean = 3,3

0 N = 20,00
Mean

2,0 3,0 4,0 5,0

3,2 CLAS_MAT
CLAS_MAT CLA_POR

Figura 8: Grfico com a representao de


Figura 7: Grfico com a representao
uma varivel.
de duas variveis.

2. Considerando a natureza independente ou encaixada das variveis


representadas:

Grfico simples Alturas dos alunos de Grficos encaixados Notas em matemtica


uma turma. dos rapazes e raparigas de uma turma.

10 7

6
8

6
4

3
4

2
SEXO
2
Count

Std. Dev = 9,23 1


Masculino
Mean = 164,5

0 N = 20,00 0 Feminino

150,0 160,0 170,0 180,0 2,00 3,00 4,00 5,00

ALTURA CLA_POR

Figura 9: Grfico Simples. Figura 10: Grfico encaixado.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 21

Uma proposta de resumo dos grficos mais populares em SPSS a apresentada no


quadro seguinte:

Tipos de variveis Tipos de grficos

Resumo dos valores de uma varivel nominal Grfico de barras


ou quantitativa discreta
Grfico de linhas
Casos individuais.
Grfico circular

Grfico de rea

Grfico pareto

Estatsticas de duas ou mais variveis Grfico de barras


contnuas
Grfico de linha

Grfico circular

Boxplot

Variveis contnuas Boxplot

Histograma

Diagrama de caule-e-folhas

A aplicao SPSS apresenta um conjunto de formatos de grfico susceptveis de ser


configurados em funo da natureza da varivel ou variveis que se pretendem
representar. Quando se cria um grfico no menu Graph, exibida uma caixa de
dilogo onde se realizam as seleces adequadas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 22

2. Arquivo de Dados
Os dados so uma parte fundamental do processo de anlise estatstica, o SPSS
possibilita, para alm da anlise estatstica dos dados, o armazenamento. Este
armazenamento pode ser encarado sobre duas perspectivas; conforme os dados so
organizados pela primeira vez no SPSS, e se cria a base de dados no programa, ou se
a informao j foi de alguma forma organizada, e o armazenamento apenas
temporrio, i.e., apenas do tempo de anlise.

2.1. Arquivo de Dados em SPSS

Criar um arquivo
Criar um arquivo de dados no SPSS onde se faa o registo da informao, ou seja
onde se crie uma nova base de dados, pode ser conseguido atravs do menu
FileNewData. Uma nova janela de dados (Data Editor) em branco
disponibilizada.

Figura 11: Menu para a criao de uma nova janela de edio de dados.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 23

Abrir um arquivo
Para abrir um arquivo de dados j existentes, basta aceder ao menu
FileOpenData

Figura 12: Menu para abrir uma base de dados j existente.

Ou aceder ao cone disponvel na barra de ferramentas

Figura 13: cone para abrir uma base de dados.

Em qualquer um dos casos aparecer uma janela de dilogo onde dever ser
indicada a directoria, ou pasta onde se encontra o ficheiro pretendido, assim como o
tipo de ficheiro que o arquivo e finalmente o seu nome.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 24

Figura 14: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.

Tipos de arquivos que o SPSS reconhece

De entre os tipos de arquivos que o SPSS reconhece esto os ficheiros Excel (*.xls),
os ficheiros gravados em dBase (*.dbf) e os ficheiros de texto (*.txt). A extenso dos
ficheiros gravados em SPSS sav.

O software ir ler dos ficheiros Excel e dBase, o nome das variveis, que devero
cumprir certos requisitos (ver seco 2.2.1.), assim como abrir casos e linhas
conforme o n. de colunas e linhas ocupadas. Os ficheiros de texto so importados
com ajuda de um Wizard, que vai guiando cada passo e que possibilita a importao
de ficheiros de dados delimitados por vrgulas, espaos, etc.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 25

Figura 15: Janela de dilogo com Wizard para a importao de dados para SPSS.

Guardar um arquivo
As alteraes feitas sobre um ficheiro s so vlidas durante a sesso de SPSS em
que so feitas, a no ser que o ficheiro seja gravado. Tal pode ser conseguido atravs
do menu FileSave. O ficheiro alterado guardado por cima do existente.

Figura 16: Menu para guardar um ficheiro.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 26

Uma outra forma de guardar arquivos atravs do menu FileSave as, onde se deve
indicar o tipo de ficheiro e o nome que queremos dar ao ficheiro.

Informao sobre arquivos de dados


possvel aceder a informao sobre nome de todas as variveis, formato das
variveis assim como informao acerca das etiquetas que as descrevem e os seus
valores, de um ficheiro que se encontre aberto, atravs do menu UtilitiesFile Info. A
execuo deste menu produz um ficheiro de output contendo toda a informao
acima referida.

Uma outra forma de aceder a informao sobre uma varivel atravs do cone
presente na barra de ferramentas.

Figura 17: cone para aceder informao acerca de uma varivel.

Finalmente possvel obter informao acerca de um ficheiro que no esteja aberto


atravs do menu FileDisplay Data Info.

2.2. Janela de edio de dados


A janela de edio de dados composta por duas janelas: a janela Data View e a
janela Variable View. A primeira contm a informao sobre os dados dos casos em
estudo a segunda a informao acerca das variveis.

Figura 18: Janela de Data View.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 27

Figura 19: Janela de Variable View.

Definio de variveis
Esta definio feita na janela de edio de dados na janela variable view. Nesta
janela cada linha contm informao de uma varivel, informao essa que definida
atravs das colunas.

Name: deve ser indicada o nome da varivel, este nome estar presente numa coluna
da janela data view. Este nome deve seguir determinadas regras:

Mximo 8 caracteres;

Devem comear por uma letra e no acabar num ponto;

No sero aceites nomes em duplicado (o programa no distingue maisculas


de minsculas, o que significa que as variveis exp e EXP tm o mesmo
nome);

Type: deve ser indicado o tipo de varivel, de uma escolha que o programa oferece na
maioria dos casos os tipos utilizados so o tipo numrico (Numeric) e o data (Date),
visto que mesmo que a natureza da varivel seja string possvel codific-la atravs
de um cdigo numrico.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 28

Figura 20: Janela de dilogo para definir o tipo de varivel.

Width: este campo corresponde dimenso da varivel, define o n mximo de


algarismos ou caracteres que o valor da varivel pode tomar. Pode ser preenchido na
janela variable view na coluna respectiva ou ento na janela de dilogo do tipo.

Decimals: deve indicar-se o n. de casas decimais que a varivl pode tomar caso seja
do tipo numrica. Do mesmo modo do campo width pode ser preenchido na janela
variable view na coluna respectiva ou ento na janela de dilogo do type.

Label: no um campo obrigatrio mas pode ser de extrema utilidade. Por exemplo,
pode conter o nome por extenso da varivel que devido ao facto de poder conter
apenas 8 caracteres pode no ser explcito. Pode conter, por exemplo, a unidade na
qual a varivel est medida.

Values: onde indicado o cdigo utilizado para introduzir os valores da varivel. Por
exemplo: suponha-se que, para simplificar a introduo, se definia o valor 1 para o
sexo masculino e 2 para o sexo feminino, ento aqui que se deve informar o sistema
deste cdigo.

Figura 21: Janela de dilogo para introduzir valores para a varivel.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 29

Missing: onde se informa o sistema que um determinado valor representa uma


situao anmala e no um valor aceitvel para a varivel. Este missing designado
user-missing, uma vez que o utilizador se d conta e informa o sistema sobre essa
possibilidade. Existem tambm system-missing, quando o sistema no informado
sobre a situao (qualquer clula em branco). Por exemplo, quando um indivduo
responde a um questionrio e no responde a uma questo o utilizador pode deixar
essa clula em branco (system-missing) ou informar o sistema que quando for
introduzido um valor fora da gama admitida para a varivel ele deve interpretar como
uma no resposta.

Estes missings podem ser definidos de duas formas:

Figura 22: Janela de dilogo para definir missings.

Atravs de pelo menos 3 valores discretos;

Atravs de um intervalo de valores acrescido de um valor discreto.

Para se informar o sistema acerca do que significam tais valores deve ser usada a
coluna values.

Columns: contm a definio do tamanho da coluna que conter a informao da


varivel na janela data view.

Align: onde se define qual o alinhamento da informao da coluna que conter a


informao da varivel na janela data view. Pode ser alinhamento esquerda, direita
ou ao centro.

Measure: onde se indica a escala de medida da varivel, pode ser Nominal ou


Ordinal para as variveis qualitativas e Scale para as variveis quantitativas.

NOTA (importante): A correcta definio das caractersticas das variveis essencial


e pode comprometer, se no for feita correctamente, a anlise a efectuar na varivel.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 30

Entrada de dados
A edio de dados feita na janela Data View. Nesta janela:

As linhas correspondem a casos, i.e., suponha-se que queremos introduzir os dados


de um questionrio respondido por um certo n. de indivduos, cada linha
corresponder informao contida num questionrio.

As colunas correspondem as variveis.

As clulas, que so o cruzamento dos casos com as variveis, contero a informao


desse caso relativo a essa varivel.

necessrio prudncia para no ter casos e variveis abertas que no contenham


informao, pois sero consideradas para as variveis numricas, system-missings e
para as variveis string sero consideradas vlidas e consideradas para anlise.

Edio de Dados
possvel modificar total ou parcialmente o contedo de uma clula basta para isso
seleccion-la.

possvel apagar e copiar clulas, deve ter-se ateno quando se copia valores de
clulas para que a clula destino tenha as mesmas caractersticas (type,).

possvel inserir casos e variveis atravs do menu DataInsert.

Figura 23: Menus para inserir casos e variveis.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 31

possvel retirar casos ou variveis atravs do menu EditClear.

possvel encontrar um caso sem ser sequencialmente, atravs do menu DataGo


to Case. Ou atravs do cone que se segue ,presente na barra de ferramentas.

Figura 24: cone para posicionar-se num determinado caso.

possvel encontrar dados atravs do menu EditFind, ou atravs do cone que se


segue, presente na barra de ferramentas.

Figura 25: cone para encontrar dados.

2.3. Transformaes sobre os dados

Criao de variveis
Para alm da criao das variveis atravs da janela variable view, o SPSS
possibilita a criao de variveis novas atravs de transformaes nas j existentes.

O menu TransformCompute atribui valores a uma varivel nova, cujo nome deve
ser indicado na target variable, atravs de transformaes executadas noutras
variveis j existentes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 32

Figura 26: Janela de dilogo para criar variveis atravs de transformaes noutras.

Essas transformaes devem ser definidas atravs da construo da expresso


numrica (numeric expression). Nesta expresso numrica podero constar variveis
existentes no ficheiro, constantes, operadores aritmticos e uma gama de funes,
disponibilizadas pelo software, como o valor absoluto, o logaritmo, funes que
transformam variveis com valores em segundos em valores em minutos ou horas,
como se pode verificar atravs do exemplo 1.

Exemplo1

No ficheiro Cars 1, encontra-se a varivel accel, que guarda o tempo de acelerao das
0 s 60 milhas por hora, como visvel na janela que se segue.

1
Este ficheiro disponibilizado com o software SPSS, pode ser acedido (a no ser que se
tenha procedido a alguma mudana de ficheiros) na pasta do SPSS que abre por defeito.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 33

Figura 27: Janela com a informao acerca de uma varivel do ficheiro Cars.

Suponha, agora que pretende alterar o tempo de acelerao para milhas por minuto,
ento o que deveria fazer era, por exemplo, criar uma varivel nova, design-la, por
exemplo, accel_mi, e igual-la funo CTIME.MINUTES, com argumento accel.

Figura 28: Janela de dilogo para criar varivel accel_mi em funo da varivel accel
presente no ficheiro Cars.

(Continua)

O boto Type & Label permite ao utilizador a especificao do tipo e atribuio de


labels, de igual forma ao exposto no ponto 2.2. Uma opo importante nesta operao
a opo disponibilizada pelo boto If, que permite efectuar a alterao apenas aos
casos que verifiquem a condio indicada pela expresso.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 34

Exemplo1 (Continuao):

Suponha que no exemplo, queremos apenas criar a nova varivel accel_mi, quando o
ano do carro for o ano 70. Ento o procedimento a seguir seria na janela
disponibilizada pelo boto If, inserir a condio year=70 (year, varivel que guarda o
ano do automvel)

Figura 29: Janela de dilogo que permite seleccionar casos onde a transformao vai ser
efectuada.

Recodificao de variveis
Este procedimento possibilita a substituio dos valores de uma varivel por outros. O
SPSS possibilita esta transformao de duas formas uma das quais automtica.

Atravs do menu TransformAutomatic Recode, o programa permite a


transformao dos valores de uma varivel noutros automaticamente. Um dos
exemplos mais teis na utilizao deste menu, a transformao de uma varivel
string em numrica, cujo nome deve ser explicitado na janela que resulta da execuo
desta opo. Automaticamente, o programa criar uma janela de output onde dar
informao ao utilizador de qual a codificao que realizou.

Exemplo 2

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 35

Suponha que no ficheiro flying2, que queria transformar a varivel cityname, do tipo
string numa varivel numrica de nome city_2. Este nome dever ser introduzido no
rectngulo em branco mais pequeno e depois para que o nome seja aceite deve ser
pressionado o boto New Name.

Figura 30: Janela de dilogo para a recodificao automtica da varivel cityname.

O output criado pelo SPSS o seguinte, onde se podem ver os valores antigos, os
novos valores e as suas etiquetas. Como se pode observar o software codificou
tambm as clulas vazias, os missings.

Figura 31: Resultado da recodificao automtica da varivel cityname.

(Continua)

2
De igual modo o ficheiro encontra-se (a no ser que se tenha procedido a alguma mudana
de ficheiros) na pasta do SPSS que abre por defeito.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 36

Atravs do menu TransformRecode, o programa possibilita tambm, a


recodificao, no entanto o utilizador que dever dar indicaes de como essa
recodificao ser feita. Este menu possibilita, ele prprio, duas possibilidades: a
recodificao Into Same Variables e a recodificao Into Different Variables. A
diferena entre as duas possibilidades apenas o lugar onde se guarda a nova
codificao, na primeira possibilidade o novo cdigo guardado na varivel original,
na segunda o novo cdigo guardado numa nova varivel, cujo nome dever ser
indicado na janela possibilitada pelo menu TransformRecode Into Different
Variables. Em ambas as opes existe a possibilidade de realizar as transformaes
apenas a alguns casos, aqueles que verificam uma determinada condio que dever
ser definida atravs do boto If

atravs do boto Old and New Values que o novo cdigo dever ser definido.

Figura 32: Janela de dilogo para a indicao do novo cdigo.

Existem, duas zonas na janela que decorre do boto Old and New Values; uma para a
zona dos antigos valores e uma zona para os novos valores.

Old Value:

 Value: o valor antigo a ser codificado;

 System-missing: se seleccionarmos esta opo recodifica-se os missing de


sistema;

 System-or user-missing: se seleccionarmos esta opo recodifica-se os


missing de sistema e os do utilizador;

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 37

 Range: through: atravs desta opo pode ser recodificada toda uma gama
de valores, indicando o valor mais baixo e o mais alto.

 Range: Lowest through: atravs desta opo pode ser recodificada toda uma
gama de valores desde o valor mais baixo at a um valor indicado.

 Range: through highest: atravs desta opo pode ser recodificada toda uma
gama de valores desde um valor indicado at o maior valor.

 All other values: nesta opo esto englobados todos os valores no


includos nas situaes anteriores.

New Value:

 Value: onde dever ser indicado o novo valor;

 System-missing: os novos valores sero desconhecidos do sistema;

 Copy old value: os valores antigos vo ser iguais aos novos. importante
referir que se existirem valores que se mantm eles devem ser referidos seno
sero excludos na nova varivel.

Esta opo s est presente na opo Into Different Variables.

Exemplo 2 (Continuao):

Suponha que agora quer recodificar a varivel city_2, numa nova varivel city_3, do
seguinte modo:

missing 99

Todos os outros valores igual

Ento dever recorrer opo Into Different Variables, nos Old and New Values
dever definir os novos valores usando os System-missing nos old values

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 38

Figura 33: Janela onde exemplificada a recodificao dos missings.

Outras Transformaes
O menu TransformCategorize Variables tambm possibilita a criao de
categorias, mas de uma forma automtica, o utilizador s tem a possibilidade de
especificar o nmero de categorias a criar. Este procedimento til para agrupar
dados de uma varivel contnua, pois nem sempre fcil neste tipo de varivel a
explicitao das categorias, assim basta ao utilizador dizer qual o nmero de
categorias a criar e criada uma varivel contendo as categorias. O utilizador deve
atravs de uma tabela de frequncia, por exemplo, analisar quais os limites das
classes criadas e criar rtulos.

Figura 34: Janela de dilogo para criar categorias de forma automtica.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 39

Atravs do menu TransformCount possibilita a criao de uma nova varivel que


contm, por cada caso, o nmero de vezes que um determinado valor apareceu nas
variveis seleccionadas.

Exemplo 3:

Suponha que tem um ficheiro de SPSS que contm para cada ms e para cada zona,
o nmero de mortes por acidente, por causa natural e o nmero de acidentes devido a
doena prolongada.

Figura 35: Janela de dados onde se mostra um exemplo de uma determinada base de
dados.

Suponha que quer saber quantas vezes o n. de mortes devido a cada uma das
causas foi superior a 100 em cada ms e em cada zona. Ento poder aceder ao
menu TransformCount, onde dever explicitar o nome da nova varivel, assim
como o nome das variveis onde pretende que o programa procure a condio que
dever ser definida atravs do boto Define Values.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 40

Figura 36: Janela de dilogo que permite executar a funo count.

Figura 37: Janela de dilogo que permite dar a condio para proceder contagem.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 41

Figura 38: Janela de dados resultante do procedimento Transform Count.

(Continua)

Nota:

Em todos estes procedimentos que resultam na criao de novas variveis se dever


proceder confirmao de todas as caractersticas da varivel criada na janela
Variable View.

2.4. Manipulao de arquivos


De seguida, expor-se-o alguns procedimentos que permitem a manipulao de
arquivos de dados, como o caso do procedimento disponibilizado no menu
DataSort Cases, que permite ordenar os casos atravs das caractersticas de uma
ou mais variveis. A primeira varivel determina a primeira ordenao, as restantes
determinam as ordenaes dentro da primeira ordenao.

Exemplo 3 (Continuao):

Suponha que pretende organizar o ficheiro por ordem crescente de nmero de mortos
por acidente e dentro desta ordenao pretende ordenar por ordem crescente de
nmero de mortos devido a uma causa natural. Ento deveria proceder da seguinte
forma:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 42

Figura 39: Janela de dilogo que permite ordenar os dados de acordo com vrios
critrios.

Figura 40: Janela de dados resultante do procedimento Data Sort.

Atravs do menu DataSplit File possvel separar o ficheiro de dados em grupos


definidos pelos valores de uma ou mais variveis. Este procedimento importante
quando existe a suspeita da diferena entre determinados grupos, pois possibilita que
toda a anlise seja feita para cada grupo em separado.

Vejamos a janela disponibilizada pelo menu DataSplit File:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 43

Figura 41: Janela de dilogo que permite executar o Split file.

Analyze all cases, do not create groups: desactiva qualquer separao feita
anteriormente; esta opo est por defeito seleccionada, antes de qualquer diviso;

Compare groups: separa o ficheiro em grupos de modo a efectuar comparaes;

Organize output by groups: qualquer procedimento produzir outputs separados


para cada grupo;

Groups Based on: aqui que se dever indicar quais as variveis que serviro para
criar os grupos, caso sejam introduzidas mais do que uma o programa agrupar pela
ordem de introduo.

Sort the file by grouping variables: Ordena o ficheiro por grupos;

File is already sorted: d-nos a indicao se o ficheiro j se encontra ou no


ordenado;

Na parte inferior desta janela encontra-se uma indicao de como o ficheiro se


encontra, Current Status.

Exemplo 4:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 44

Suponha que pretende analisar as diferenas entre sexos dos empregados de uma
determinada firma, cuja informao se encontra guardada no ficheiro Employee Data3.
Ento a varivel que ir criar grupos ser a varivel Gender, como se pode ver na
figura seguinte.

Figura 42: Janela que exemplifica o Split file efectuado pela varivel sexo (gender).

Atravs do menu DataSelect Cases possvel seleccionar um grupo de casos a


partir de um critrio que pode incluir variveis e expresses mais complexas.
possvel atravs deste menu seleccionar uma amostra aleatria. Este procedimento
possibilita a opo de apagar os casos que no satisfaam as condies (unselected
cases are: deleted) ou apenas no os incluir na anlise (unselected cases are:
filtered).

3
Este ficheiro tambm disponibilizado pelo SPSS.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 45

Figura 43: Janela de dilogo para seleccionar dados.

No caso da seleco de uma amostra aleatria ento o utilizador tem a opo de


indicar qual a percentagem de casos a incluir na amostra ou a possibilidade de indicar
o nmero exacto de casos a escolher dos primeiros x (nmero tambm a indicar pelo
utilizador).

Figura 44: Janela de dilogo para especificar a amostra aleatria.

Sempre que este procedimento for efectuado criada uma nova varivel filter
constituda apenas de 0 (zeros) e 1 (uns), conforme o caso no pertena ou pertena
amostra.

Atravs do menu DataWeight Cases possvel criar uma ponderao cujos valores
representam o nmero de casos observados.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 46

Exemplo 5:

Suponha que possui um ficheiro de dados contendo a seguinte informao relativa s


altas verificadas num determinado Hospital.

Figura 45: Janela de dados onde se mostra uma base de dados contendo a informao
de altas verificadas num determinado hospital.

Se proceder ponderao da varivel dia da semana atravs da varivel altas, ento


esta ltima passa a ser a frequncia da primeira, como visvel se procedermos
execuo de uma tabela de frequncias.

Figura 46: Tabela de frequncias da varivel dia da semana.

Note que se no procedermos ponderao teramos que introduzir o Domingo 20


vezes, a Segunda 175, a Tera 655, procedendo de igual forma para os restantes dias
da semana.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 47

3. Estatstica Descritiva
A anlise estatstica univariada inicia o tratamento estatstico e deve ter em conta a
tabela de frequncias, a representao grfica da distribuio da varivel e as
estatsticas apropriadas ao resumo dos dados em questo.

3.1. Medidas de Estatstica Descritiva


As medidas de estatstica descritivas apropriadas ao resumo dos dados dependem da
escala de medida da varivel a analisar. A seguinte tabela apresenta, resumidamente,
as estatsticas apropriadas a cada tipo de varivel.

Medidas de
Medidas da forma global
tendncia Medidas de disperso
da distribuio
central
Escala intervalar Mdia Desvio-padro Coeficiente de assimetria
ou escala racional de Pearson
Moda Varincia
Medida de curtose
Mediana Percentis

Desvio interquartis

Intervalo interquartis

Intervalo absoluto

Coeficiente de variao

Score z
Escala ordinal Moda Percentis

Mediana Desvio interquartis

Intervalo interquartis

Intervalo absoluto
Escala nominal Moda

Tabela 1 Medidas estatsticas apropriadas aos vrios tipos de variveis

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 48

3.2. Frequncias
O procedimento Analyze/Descriptive Statistics/Frequencies permite obter
informao sobre a distribuio dos valores da varivel atravs de tabelas de
frequncias, de estatsticas descritivas e grficos.

Este procedimento til para uma primeira anlise de qualquer tipo de varivel. A
informao aqui obtida pode ajudar a determinar os valores tpicos das variveis (Que
valores so mais frequentes? Qual a gama de valores que uma varivel toma?), a
verificar o cumprimento de determinadas assumpes necessrias para
procedimentos estatsticos (Existe um nmero suficiente de observaes? A
distribuio da varivel adequada?) e a avaliar a qualidade dos dados (Existem
valores omissos ou mal introduzidos? Existem valores que necessitam de ser
recodificados?).

Tabela de Frequncias
A tabela de frequncias distribui os valores da varivel em frequncias simples e
acumuladas, que podem ser absolutas ou relativas.

Para criar uma tabela de frequncias no SPSS:

1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Figura 47 Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar a(s) varivel(is) que se pretende(m) analisar da


lista de variveis que aparece no lado esquerdo e atravs da seta, coloca-la no
lado direito.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 49

Figura 48 Janela de Frequncias

3. Seleccione a caixa de seleco Display frequency table. Por omisso, esta


caixa encontra-se seleccionada.

4. Clicar em OK.

Na janela de sada sero apresentadas duas tabelas.

Figura 49 Tabela de frequncias

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 50

A primeira (Statistics), apresenta o nmero de casos vlidos e casos omissos


(missing). A segunda tabela a tabela de frequncias propriamente dita. Para os
vrios valores que a varivel toma, so apresentados as seguintes frequncias:

Frequency (frequncia simples e absoluta) nmero de casos para um


determinado valor (ou conjunto de valores) da varivel. Por exemplo, no caso
apresentado, 1390 pessoas no completaram o ensino secundrio.

Percent (frequncia simples e relativa) - percentagem do nmero de casos


em relao ao nmero total de casos (incluindo casos omissos). No caso
apresentado, a % de pessoas que completou o ensino secundrio de 21,7%,
valor que se obtm do quociente 1390/6400, sendo 6400 o nmero de casos
total (vlidos + omissos).

Valid Percent (frequncia simples e relativa) percentagem do nmero de


casos em relao ao nmero de casos vlidos. No caso apresentado, o
nmero de casos vlidos igual ao nmero de casos total, pelo que a
percentagem vlida igual percentagem.

Cumulative Percent (frequncia acumulada e relativa) percentagem


acumulada at ao respectivo valor ou categoria, excluindo valores omissos.

A ttulo de exemplo, apresenta-se de seguida uma tabela de frequncias para uma


situao onde existem casos omissos. Verifique-se na diferena entre a percentagem
e a percentagem vlida e numa nova linha no final da tabela para os casos omissos.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 51

Figura 50 Tabela de Frequncias com casos omissos

Na janela de frequncias, na opo Format (ver figura 5), existem vrias opes que
permitem ordenar segundo diferentes critrios a tabela de frequncias:

Ascending Values organiza a tabela de acordo com os valores das variveis


em ordem ascendente (do menor para o maior valor).

Descending Values - organiza a tabela de acordo com os valores das variveis


em ordem descendente.

Ascending Counts - organiza a tabela de acordo com as frequncias de


ocorrncia dos valores das variveis em ordem ascendente (do menos
frequente para o mais frequente).

Descending Counts - organiza a tabela de acordo com as frequncias de


ocorrncia dos valores das variveis em ordem descendente.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 52

Figura 51 Janela de Frequncias opo Format.

Estatsticas Descritivas
Atravs do procedimento Analyze/Descriptive Statistics/Frequencies
tambm possvel calcular vrias estatsticas de tendncia central, de disperso e de
forma da distribuio.

Para o clculo destas estatsticas, fazer:

1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Figura 52 - Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar as variveis pretendidas e seleccionar a opo


Statistics.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 53

Figura 53 Janela de Frequncias

3. Surge ento uma nova janela, onde se podero escolher as estatsticas


pretendidas.

Figura 54 Frequencies: Statistics

4. Quando estiverem seleccionadas todas as estatsticas pretendidas, deve-se clicar


em Continue.

5. Na janela Frequencies, ento visvel, remover a seleco da opo Display


frequency table, para no ser apresentada a tabela de frequncias.

6. Clicar em OK.

Na janela de sada de dados ir surgir uma tabela semelhante a:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 54

Figura 55 Estatsticas descritivas

As vrias estatsticas disponveis atravs deste procedimento so descritas de


seguida:

Quartiles (Quartis) calcula o percentil 25, percentil 50 (mediana) e o


percentil 75.

Cut Points for n equal groups (Pontos de corte para n grupos iguais)
apresenta os valores da varivel que divide a amostra em n grupos com o
mesmo nmero de casos. Depois de seleccionar esta estatstica o utilizador
dever inserir o nmero (entre 2 e 100) de grupos pretendido. Por omisso, a
distribuio dividida em 10 grupos iguais.

Percentiles (Percentis) calcula os percentis inseridos pelo utilizador. Para


inserir um percentil o utilizador dever seleccionar a caixa de seleco
associada estatstica, inserir o valor do percentil desejado e fazer Add.

Std. Deviation (Desvio padro) Apresenta uma medida da disperso em


redor da mdia.

Variance (Varincia) Calcula a soma do quadrado dos desvios em relao


mdia dividida pelo nmero de casos menos 1.

Range (Intervalo absoluto) Calcula a diferena entre o valor mais alto e o


valor mais baixo.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 55

Minimum (Mnimo) Apresenta o menor valor.

Maximum (Mximo) Apresenta o maior valor.

S.E. mean (Erro padro mdio) Apresenta uma estimativa da variabilidade


amostral em relao mdia. O seu clculo obtm-se atravs do quociente
entre o desvio padro amostral e a raiz quadrada da dimenso da amostra.

Mean (Mdia aritmtica) Devolve a soma de todos os valores dividido pelo


nmero total de casos.

Median (Mediana) Calcula o valor acima e abaixo do qual se encontram


metade dos valores da varivel.

Mode (Moda) Calcula o valor que ocorre mais frequentemente na distribuio.

Sum (Somatrio) calcula a soma de todos os valores que a varivel toma.

Skewness (Coeficiente de Assimetria) Apresenta uma medida relativa de


assimetria. Um sinal positivo indica um pico com uma cauda direita alongada e
um sinal negativo uma cauda esquerda alongada. Se a distribuio for
simtrica, esta medida tem o valor 0.

Kurtosis (Medida de curtose) apresenta uma medida que indica se a curva


achatada (valores negativos) ou alongada (valores positivos). Uma
distribuio normal, tem uma medida de curtose igual a 0.

Para mais esclarecimentos acerca de cada medida estatsticas, dever consultar a


ajuda, clicando com o boto direito sobre o nome da medida estatstica em questo.

Grficos
Como j foi referido, o procedimento Analyze/Descriptive

Statistics/Frequencies tambm permite visualizar o comportamento da(s)


varivel(is) graficamente, atravs de grficos de barras, grficos circulares e
histogramas.

Para criar um grfico utilizando este procedimento, fazer:

1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 56

Figura 56 - Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar as variveis pretendidas e seleccionar a opo


Charts.

Figura 57 Janela de Frequncias

3. Na janela que surge, deve seleccionar-se o tipo de grfico pretendido. Nos grficos
de barras e nos grficos circulares, existe a opo de elaborar o grfico com base
nas frequncias absolutas (Frequencies) ou com base nas frequncias relativas
(Percentages).

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 57

Figura 58 Frequencies: Charts

4. Depois de seleccionado o grfico pretendido, clicar em Continue.

5. Na janela Frequencies, ento visvel, remover a seleco da opo Display


frequency table, para no ser apresentada a tabela de frequncias.

6. Clicar em OK.

De seguida apresentam-se exemplos dos vrios tipos de grficos.

Figura 59 Grfico de barras por frequncia absoluta

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 58

Figura 60 Grfico de barras por frequncia relativa

Figura 61 - Grfico circular

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 59

Figura 62 Histograma

Figura 63 Histograma com curva normal

Para edio dos grficos gerados pelo SPSS, deve-se fazer um duplo-clique sobre o
grfico, que provocar a abertura da janela de edio de grficos do SPSS:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 60

Figura 64 Janela de edio de Grficos

3.3. Clculo de estatsticas bsicas


O procedimento Analyze/Descriptive Statistics/Descriptives permite, tal
como o procedimento Analyze/Descriptive Statistics/Frequencies, obter
algumas estatsticas descritivas. As variveis podem ser ordenadas pelo valor da sua
mdia (ordem ascendente ou descendente), alfabeticamente ou pela ordem pela qual
se selecciona as variveis no procedimento (opo por omisso).

Para alm destas estatsticas, permite tambm calcular valores padro (scores z).
Quando os valores padro so guardados, so adicionados janela de edio de
dados e ficam disponveis para qualquer procedimento estatstico.

Este procedimento til para obter comparaes de variveis quantitativas


(intervalares ou racionais) e para identificar casos anormais entre as variveis
atravs do clculo dos valores padro.

Para executar este procedimento:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 61

1. No menu Analyze escolher Descriptive Statistics / Descriptives

Figura 65 Analyze / Descriptive Statistics / Descriptives

2. Na janela que surge, dever seleccionar as variveis que pretende


analisar. Se pretender guardar os valores padro das variveis, dever
seleccionar a caixa Save standardized values as variables.

Figura 66 Janela Descriptives

3. Para seleccionar as estatsticas clique em Options. Na nova janela,


poder tambm escolher a ordem pela qual pretende que sejam apresentados
os resultados.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 62

Figura 67 Janela Descriptives / Options

4. Clique em Continue. Na janela que surge clicar em ok. Na janela de sada


aparecer uma tabela com os valores de cada estatstica seleccionada para
cada varivel.

Figura 68 Resultado do procedimento Descriptives

5. Caso tenha seleccionado a opo Save standardized values as


variables sero criadas novas variveis, que aparecero nas ltimas colunas
da janela de edio de dados. Estas variveis tero o nome das variveis em
anlise, antecedido pela letra z. No caso apresentado, as variveis em anlise
chamam-se longmon e tollmon e as variveis criadas chamam-se zlongmon e
ztollmon.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 63

Figura 69 Scores z

3.4. Anlise exploratria


O procedimento Explore produz estatsticas sumrias e representaes grficas para
todos os casos ou para grupos de casos separadamente. Atravs deste procedimento
possvel:

Examinar os dados e sua distribuio (detectar valores anormais, intervalos


de dados vazios, outliers, variabilidades inesperadas e outras peculiaridades)

Verificar o cumprimento de condies para a aplicao de procedimentos


estatsticos (p.ex. para determinar se ser necessrio aplicar testes no
paramtricos ou para determinar se ser necessrio transformar os dados
para tcnicas que requeiram distribuies normais)

Caracterizar as diferenas existentes entre diferentes grupos de casos.

Para executar o procedimento dever:

1. Escolher a opo Analyze/Descriptive Statistics/Explore.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 64

Figura 70 Menu Explore

2. Na janela que surge, dever escolher as variveis a analisar e coloca-las na caixa


Dependent List. As variveis a analisar tm de ser numricas. Para produzir
anlises separadas por grupos de casos, dever introduzir na caixa Factor List
as variveis segundo as quais pretende fazer o agrupamento. Se introduzir mais
do que uma varivel na caixa Factor List, sero apresentados resultados
separados para cada varivel. Ainda nesta janela poder escolher o tipo de
representao que pretende: estatsticas, grficos ou ambos.

Figura 71 Janela Explore

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 65

Estatsticas
Atravs do procedimento Explore possvel criar diversas estatsticas. Para tal,
dever, a partir da janela Explore:

1. Seleccionar as variveis, seleccionar a opo Both ou Statistics em Display e


clicar no boto Statistics.

Figura 72 Boto Statistics na janela Explore

2. Na janela que surge, poder escolher uma das seguintes opes:

a. Descriptives para calcular as seguintes estatsticas: mdia, moda, trimdia


a 5% (mdia calculada eliminando 5% das observaes mais baixas e 5% das
observaes mais altas), erro padro, varincia, desvio padro, mnimo,
mximo, intervalo absoluto, intervalo interquartil, coeficiente de assimetria, erro
padro de assimetria, coeficiente de curtose, erro padro de curtose.

b. M-estimators para calcular 4 alternativas de medidas de tendncia central


(Huber's M-estimator, Andrews' wave estimator, Hampel's redescending M-
estimator e Tukey's biweight estimator). Estas quatro medidas utilizam critrios
distintos de ponderao dos casos, cujo peso vai diminuindo medida que os
casos se afastam da mdia. Quando os dados provm de uma distribuio com
longas caudas, ou quando existem outliers, estas medidas so mais precisas
do que a mdia ou mediana.

c. Outliers apresenta os casos com os 5 maiores valores e os casos com os 5


menores valores.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 66

d. Percentiles apresenta os seguintes percentis: 10, 25, 50, 75, 90, 95.

Figura 73 Explore: Statistics

e. Depois de seleccionadas as estatsticas pretendidas, dever fazer Continue e


depois OK na janela Explore. Sero ento apresentados os resultados na
janela de sada do SPSS.

Figura 74 Estatsticas Descriptives do procedimento Explore para um grupo da


categoria Primary Vehicle

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 67

Figura 75 M-Estimators

Figura 76 - Outliers

Figura 77 Percentiles

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 68

Diagrama de caixa e fio (Boxplots)


Os diagramas de caixa e fio ou boxplots so uma representao grfica til para
explorar e sumariar os dados, permitindo analisar as frequncias e identificar outliers,
que tendem a distorcer a mdia e o desvio padro. D-nos tambm informao
importante sobre o centro, disperso e assimetria dos dados.

Como se pode observar no diagrama abaixo, a base inferior do rectngulo (caixa) o


1 quartil (percentil 25) e a base superior corresponde ao 3 quartil (percenti 75), ou
seja, a caixa corresponde a 50% das observaes totais. A mediana (2 quartil ou
percentil 50) representada pela linha dentro da caixa.

O comprimento mximo dos bigodes vai at 1,5 vezes o valor da amplitude interquartil,
abaixo do 1 quartil e acima do 3 quartil. As observaes que se situem para alm
destes limites so representadas com um crculo ou um asterisco, consoante sejam
respectivamente outliers moderados ou severos. Os outliers so moderados quando
se encontram entre 1,5 e 3 amplitudes interquartis abaixo do 1 quartil ou acima do 3
quartil. Os outliers so severos severos quando se encontram para alm de 3
amplitudes interquartis para baixo do 1 quartil ou para cima do 3 quartil.

Outlier Severo
*
Outlier Moderado

Valor Mximo

3 Quartil

50% das
observaes
centrais, isto , Mediana (2 Quartil)

amplitude inter-

1 Quartil

Valor Mnimo

Figura 78 Diagrama caixa e fio

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 69

Para criar um diagrama de caixa e fio no SPSS, a partir da janela Explore, dever:

3. Seleccionar as variveis, seleccionar a opo Both ou Plots em Display e clicar


no boto Plots.

Figura 79 Boto Plots na janela Explore

4. Na janela que surge, dever escolher uma das seguintes opes:

a. Factor levels together para cada varivel dependente, os diagramas de


caixa e fio de cada grupo so apresentados lado a lado. Desta forma,
facilmente se compara como os valores da varivel dependente varia nos
vrios grupos. Se no for introduzida nenhuma varivel na caixa Factor List
ser apresentado apenas um nico diagrama de caixa e fio para a totalidade
dos casos.

b. Dependents together para cada grupo, so apresentados os diagramas de


caixa e fio de cada varivel dependente lado a lado. Desta forma, facilmente se
compara os valores das variveis dependentes num grupo especfico. Esta
opo til quando as diferentes variveis dependentes representam uma
nica caracterstica medida em diferentes instantes temporais.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 70

Figura 80 Plots em Explore

5. Se seleccionar a opo None, no ser criado nenhum diagrama de caixa e fio.


Caso no pretenda a criao de um diagrama de tronco e folha, dever remover a
seleco da opo Steam-and-Leaf. Depois dever clicar em Continue e na
janela Explore em OK.

6. Na janela de sada, ser apresentado o diagrama de caixa e fio. O diagrama


abaixo apresenta a relao entre o rendimento do agregado familiar e a categoria
do principal veculo do agregado. Os outliers moderados so apresentados por um
crculo e os outliers severos por um asterisco.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 71

1200
77
427
250
2980
1000 1812

4929
150
2535
2001
800
1263
4277
3254
2844
5530
1706
4709
600 5840
4057
5363
4937
5237
4797
2364
5204
42
5542
3618
5370
539
2384
1147
506
5845
6017
1557
4386
6046
97
992
1760
3600
5066
5434
6196
4365
2096
4719
3221
4533
4575
4327
3565
5323
1194
5385
5871
4641
3452
400 1425
5805
4965
2432
5606
278
1953
3008
2415
4466
79
5376
525
4793
185
6147
991
2898
3261
934
6197
6176
1183
2136
5481
189
3726
155
4767
2271
325
4014
6153
319
393
3436
886
1074
4653
5947
255
2389
944
2442
5245
4468
1205
2290
6095
732
2702
5184
5784
69
883
2218
4031
4207
5303
4055
5415
4260
306
1016
1848
2922
2108
3576
4570
214
1433
1199
3444
2785
4129
6382
202
876
5495
3161
4899
2076
5968
909
4939
5470
3042
3758
4925
4005
1143
2049
241
2308
212
1870
864
4415
6338
2333
803
3844
276
2215
3212
4887
5780
672
2030
3015
4485
4499
4941
5210
988
5146
1465
2902
2949
3081
3509
4735
1769
3635
29
807
3729
1668
2033
3766
5331
1276
3629
3721

200

-200
N= 1841 2275 2284

Economy Standard Luxury

Figura 81 - Diagrama caixa e fio

Diagrama de tronco e folha (Steam-and-leaf)


O diagrama de tronco e folha uma representao similar ao histograma, mas que,
em relao a este ltimo, apresenta mais informao acerca dos valores dentro de
cada intervalo.

Para criar um diagrama de tronco e folha no SPSS, a partir da janela Explore, dever:

7. Seleccionar as variveis, seleccionar a opo Both ou Plots em Display e clicar


no boto Plots.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 72

Figura 82 Boto Plots na janela Explore

8. Na janela que surge, dever seleccionar a opo Steam-and-leaf. Caso no


pretenda a criao de um diagrama caixa e fio, dever seleccionar a opo None,
em Boxplots. Se tambm pretender a criao de um histograma, dever
seleccionar a opo Histogram. Dever ento fazer Continue e depois OK na
janela Explore.

Figura 83 Plots em Explore

9. Na janela de sada, ser apresentado o diagrama de tronco e folha. O diagrama


abaixo relativo varivel que contm o rendimento do agregado familiar.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 73

Grfico 1 Diagrama tronco e folha

esquerda do diagrama apresenta-se a frequncia associada a cada intervalo. Cada


caso representado dentro da linha com o valor observado. Para tal, divide-se o valor
observado em duas componentes: dgito(s) inicial(is) (tronco) e dgitos finais (folha).

O diagrama variar em funo das unidades em que est medida a varivel e do


intervalo de valores. Na parte inferior do diagrama explicado o modo como deve ser
interpretado cada valor. O Stem width indica o valor pelo qual deveremos multiplicar
os valores para obter a unidade real e o Each Leaf indica o nmero de casos que
cada elemento na folha representa.

No caso apresentado, o tronco corresponde parte inteira das dezenas de milhares


do rendimento (a unidade inicial era milhares e o stem width 10) do agregado
familiar e a folha parte decimal. Na 1 linha do diagrama, podemos verificar que
existem 25 casos com rendimento familiar igual a 0,9 dezenas de milhar. No 2 caso,

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 74

podemos verificar que existem 30 casos (Each Leaf = 30 casos), com rendimento de
1,0; 30 casos com rendimento 1,1; 30 casos com rendimento 1,2; etc.

3.5. Tabelas
As tabelas produzidas pelo SPSS so apresentadas como tabelas pivot na janela de
sada. Este tipo de tabelas tem uma grande flexibilidade na estruturao e formatao
das tabelas.

Modificao de estrutura
Para modificar a estrutura de uma tabela, dever:

1. Activar a tabela, fazendo um duplo clique em cima da tabela.

Figura 84 Tabela do SPSS

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 75

2. Clicar com o boto direito em cima da tabela e escolher a opo Pivoting Trays.

Figura 85- Menu de configurao de tabelas

Aparecer ento a seguinte janela, onde cada conjunto de informao representada

por . Para saber a que se refere cada um destes smbolos, basta situar o rato por
cima do smbolo durante um breve instante. Depois poder alterar a localizao de
cada bloco de informao entre as linhas (Row ), colunas (Column ) ou entre uma nova
camada de informao (Layer). Para alterar a localizao, basta arrastar o smbolo
para a localizao pretendida.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 76

Figura 86 Pivoting Trays

3. Se para o caso da tabela apresentada na figura 37, movimentar a varivel Primary


Vehicle para uma nova camada, obtenho a tabela apresentada a figura 41, onde
poderei escolher atravs de uma caixa de seleco qual o valor desta varivel para
o qual pretendo consultar as estatsticas.

Figura 87 Inserir informao numa nova camada

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 77

Figura 88 Tabela com uma nova camada

4. Se para o caso da tabela apresentada na figura 37, colocar a varivel Primary


Vehicle em colunas, obtenho a tabela apresentada na figura 43.

Figura 89 Troca de linha para coluna

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 78

Figura 90 Tabela com varivel Primary vehicle em coluna

Como se pode verificar pelos exemplos apresentados, a estruturao de tabelas no


SPSS tem bastante potencial e possibilidades.

Modificao de formatao
Para modificar a formatao associada a uma tabela, dever:

1. Activar a tabela, fazendo um duplo clique em cima da tabela.

2. Clicar com o boto direito em cima da tabela e escolher a opo Toolbar.

Figura 91 Opo Toolbar

3. Ficar visvel a barra de formatao, com o que poder formatar todo o aspecto
visual da tabela. Para seleccionar a totalidade de uma coluna ou linha, dever
fazer Ctrl + Alt em cima do nome da coluna ou linha.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 79

4. Outra opo possibilidade de formatao o acesso a modelos predefinidos.


Para tal dever clicar com o boto direito em cima da tabela e seleccionar a
opo tableLooks.

Figura 92 Opo TableLooks

5. Surgir ento uma janela, onde poder escolher um dos modelos pr-definidos.

Figura 93 Janela TableLooks

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 80

4. Testes de hipteses paramtricos


Em anlise estatstica necessrio comparar parmetros da populao (mdia,
varincia, mediana, etc.) a partir de amostras aleatrias. Este tipo de procedimento
inferencial muito usado na avaliao dos efeitos de determinados tratamentos.

Este tipo de testes pode ser feito segundo duas metodologias:

- Testes Paramtricos que exigem o conhecimento da distribuio amostral,


geralmente a Normal;
- Testes No Paramtricos no exigem o conhecimento da distribuio
amostral.
Convm destacar que a potncia dos Testes Paramtricos superior dos Testes
No Paramtricos, isto , a probabilidade de rejeitar correctamente H0 maior num
Teste Paramtrico. Por este motivo, apenas se recorre aos Testes No Paramtricos
quando no possvel satisfazer as condies de aplicao dos Testes Paramtricos.

4.1. Condies de aplicao dos Testes Paramtricos


Para se poderem aplicar os Testes Paramtricos abordados neste captulo
necessrio verificar se a varivel (dependente) segue uma distribuio normal.

Para testar a normalidade da varivel em estudo, usa-se, normalmente, o Teste de


Kolmogorov-Smirnov.

Teste de Kolmogorov-Smirnov
Neste teste pretende-se testar se a distribuio da varivel normal, com parmetros
e  quaisquer:

H0 : X ~ N ( ,) Vs H1 : X ~ N ( ,)
/
Rejeita-se H0 se o valor prova (p_value) for inferior ou igual ao nvel de significncia
(), em que o p_value um valor produzido pelo SPSS usando a correco de
Lilliefors s tabelas com os valores crticos da distribuio de Kolmogorov-Smirnov.

Teste de Shapiro-Wilk
Este teste apresentado, adicionalmente, pelo SPSS. uma alternativa ao Teste de
Kolmogorov-Smirnov no teste normalidade da varivel em estudo.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 81

Teste de Normalidade

Figura 94: Menu a seguir para efectuar o teste normalidade.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 82

Figura 95: Janela de dilogo no teste normalidade onde se colocam as variveis a


testar e as que vo criar grupos.

Seleccionar, como se mostra na figura seguinte,

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 83

Figura 96: Janela onde se selecciona a opo para efectuar o teste normalidade.

Fazer CONTINUE. Depois em DISPLAY seleccionar apenas PLOTS.

4.2. Resultados ao Teste de Normalidade

G
O
R N N N
m
d
a
re
T e
h 8 %
,
0
1 0 ,
%
0 8 %
0
i i
d 0
1 %
0 0 %
,0 0
1 %
,
0
1

Figura 97: Tabela de resultado do teste normalidade, que apresenta o nmero de casos
vlidos, missings e totais.

Neste primeiro quadro output apresentado um pequeno resumo acerca da varivel


em estudo, para cada grupo.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 84

ity lT
a
rm
o
N
tf
s
e
a
o kliW
ro
p
a
h
-S
G
P
U
O
R f
d f
d
T
m
d
a
re
til h
te
l
a ,
5
6
2 8 ,
3
0
1 ,
4
2
9 8 ,
2
6
4
i s i e
d 0
6
,2 0
1 4
5
,0 5
3
,7 0
1 *
1
,0
*. siT h
. n
a o
iC
tfa
c
reg
S
s
lL

Figura 98: Tabela resultante do teste normalidade, com os dois testes Kolmogorov-
Smirnov e Shapiro-Wilk.

O segundo quadro apresenta o Teste de Kolmogorov-Smirnov com a correco de


Lilliefors para as duas amostras da varivel group, com p_value de 0.103 e 0.054
respectivamente. Como o nvel de significncia 0.05, no se rejeita a hiptese nula.
Pode, por isso, aplicar-se o Teste de t- Student.

Adicionalmente tambm apresentado o Teste de Shapiro-Wilk.

Como foi referido nas aulas tericas a anlise normalidade ser sempre efectuada a
partir do Teste de Kolmogorov-Smirnov.

4.3. Mdias
A mdia uma Medida de Tendncia Central muito usada na investigao, em reas
como as cincias biolgicas.

Por este motivo, torna-se fundamental o estudo de mtodos para analisar dados
quantitativos (intervalares e racionais) cuja Medida de Tendncia Central adequada
seja a mdia.

No menu

>ANALYZE >COMPARE MEANS >MEANS

possvel calcular uma srie de medidas estatsticas sumrias como mdia, desvio
padro, varincia, etc., para um conjunto de variveis em grupos, categorias ou
variveis distintas.

No ficheiro Coronary artery data,

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 85

Figura 99: Menu para efectuar o procedimento Compare Means-> Means.

Figura 100: Janela de dilogo do procedimento Compare Means-> Means onde visvel
onde se devero colocar as variveis dependentes e independentes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 86

Seleccionar treadmil time in seconds para a Dependent List e a group para a


Independent List.

Figura 101: Janela de dilogo onde possvel seleccionar as estatsticas a pedir.

Na janela OPTIONS podem seleccionar-se as estatsticas que se pretendem calcular.

Como output obtm-se dois quadros:

m
u
S s
e
c
o
r n
i

C
se
a
d
e
u
cl
In d
e
uxcl
E l
ta
o
T
N tn
rc
e
P N tn
rc
e
P N tn
rc
e
P
m
d
a
re
T
8
1 % 0 %
,0 8
1 %
0
d*
n
co
se

Figura 102: Tabela resultante o procedimento Compare Means-> Means onde se mostram
nmero de casos includos, excludos e total.

O primeiro quadro apresenta o nmero de casos vlidos, invlidos e total.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 87

r
o
p
e
R

r
T l
G
O
R N
e
h 9
0
,5
8
2 8 2
1
i
d 0
6 0
1
t
o
T 8
1

Figura 103: Tabela resultante do procedimento Compare Means-> Means onde se


apresentam as estatsticas pedidas.

O segundo quadro diz respeito aos valores das estatsticas pretendidas de cada
varivel treadmill time in seconds em cada group.

4.4. Uma amostra


Quando se pretende verificar se a mdia de um determinado grupo de observaes
igual a um valor padro, usa-se um teste-t para uma amostra (One sample t- test).

Para aplicar este teste necessrio ter em conta a normalidade dos dados. Se a
dimenso amostral for superior ou igual a 30, com base no Teorema do Limite Central,
pode assumir-se que a distribuio das mdias normal, independentemente da
distribuio da populao. Se a dimenso da amostra for inferior a 30 necessrio
efectuar um teste da normalidade (ver introduo ao Captulo 4).

Abrir o ficheiro saturaoex1. Este ficheiro contm valores de um estudo efectuado em


31 homens e 29 mulheres saudveis, sobre a saturao da blis por colesterol.

Suponha-se que se realizou um estudo semelhante e que se obteve uma mdia de


saturao da blis de 87.3%.

De seguida, verifique-se se a estimativa da mdia da saturao da blis do estudo


realizado significativamente diferente da mdia populacional do estudo anterior.
Pretende-se testar:

H0: = 87.3 Vs H1:  87.3

Fazer

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 88

Figura 104: Menu para a execuo do procedimento Teste t para uma amostra.

Figura 105: Janela de dilogo resultante da seleco do teste t para uma mostra onde
possvel escolher qual a varivel e o valor a testar.

Janela ONE-SAMPLE T TEST:

 Test Variable(s) variveis que se pretendem analisar;

 Test Value valor numrico contra o qual se vai testar a mdia das variveis
seleccionadas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 89

Figura 106: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo.

Janela OPTIONS:

 Confidence interval intervalo de confiana para a diferena das mdias 4;

 Missing values

- Exclude cases analysis by analysis so excludos os casos com valores


desconhecidos para a varivel seleccionada;

- Exclude cases listwise so excludos todos os valores desconhecidos da


base de dados.

Mais uma vez surgem dois quadros.

4
Este intervalo de confiana baseado na diferena da mdia da amostra e o valor de
referncia introduzido no teste. Note que diferente do intervalo de confiana para a mdia da
populao apresentado na terica.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 90

d .
N n
a
e
M M
n
a
e
t
a
s u 0
6 7
,4
6
2 2
,4
3

Figura 107: Tabela resultante do teste t para uma amostra onde se apresentam algumas
estatsticas da varivel a testar.

Este primeiro quadro apresenta o nmero de casos vlidos (N), a mdia amostral
(Mean), o desvio padro (Std. Deviation) e o erro padro da mdia (Std. Error
Mean).

n
a
e
M c
rn
e Di
t f
d r
e
w
o
L r
e
p
U
tu
sa 9 9
5 2
,6 0
,5
-1 4
,3
-8 4
,3
5

Figura 108: Tabela resultante do teste t para uma amostra onde se apresenta entre
outras informaes o valor p, do respectivo teste.

No segundo quadro so apresentados o valor testado (Test value), o valor da


estatstica t, o nmero de graus de liberdade (df), o p_value (Sig.(2-tailed)), a
diferena entre as mdias (Mean Difference) e o intervalo de 95% de confiana para
a diferena das mdias.

Neste caso, como o p_value (=0.662) superior ao nvel de significncia (=0.05), no


se rejeita H0, pelo que no se conclui, com uma confiana de 95%, que a mdia do
estudo seja significativamente diferente de 87.3.

Testes-t simultneos para a mdia de uma varivel agrupada por


outra varivel
Considere-se o mesmo ficheiro, saturaoex1. Suponha que se pretende avaliar se a
mdia do nvel de saturao da blis ou no igual a 87.3% em cada sexo.

Para isso, era necessrio comear por separar os dados de acordo com o sexo.

> DATA > SPLIT FILE

> COMPARE GROUPS, BASED ON sexo

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 91

Figura 109: Janela onde se efectuar uma partio de todos os procedimentos em


funo da varivel sexo.

De seguida, fazer como se descreveu anteriormente:

> ANALYZE >COMPARE MEANS >ONE SAMPLE T-TEST

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 92

Figura 110: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar
assim como o nvel de significncia.

e
n
O - S
e
alm
p

iS
d
o
x
e v
i N n
a
e
M n
a
e
M
M a ts
a u 3
1 2
3
,8
6 4
2
,8
ni
m
e
F i t
a
s u 9
2 ,6
0
9 3
,6
5
2 6
,7
4

Figura 111: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso
masculino e feminino).

.3
7 V
st
e
T
f

De
c
rn
S
d
xo
e t f
d r
e
w
o
L r
e
p
U
M a ts
a u 16 3
0 ,
7
1
2 -
7
,0
6 -
,9
5
1 3
,7
nm
e
iF
o ro
tu
sa
2
1
,7 8
2 2
8
,4 ,9
3 ,3
-6 ,4
3
1

Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por
outra, onde se apresentam entre outras informaes o valor p para os dois testes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 93

No primeiro quadro so apresentados, para a varivel pretendida, tantos grupos de


estatsticas quantas as categorias criadas. Neste caso, uma para o sexo feminino e
outra para o masculino.

O p_value superior ao nvel de significncia (=0.05) em ambos os casos, pelo que,


no se rejeita H0 e, com uma confiana de 95%, no se pode concluir que a mdia do
estudo em cada sexo, seja significativamente diferente de 87.3.

4.5. Duas amostras com dados independentes


O teste t-student tambm pode ser usado para testar se as mdias de dois grupos
independentes so iguais, isto , se so ou no significativamente diferentes.

Para aplicar este teste necessrio que as variveis dependentes sigam uma
distribuio normal e que as varincias sejam homogneas.

Abrir o ficheiro Coronary artery data.


Averiguar se o tempo mdio (treadmill time in seconds) igual para o grupo 1
(saudvel) e para o grupo 2 (doentes).
Pretende-se testar:
H0: 1 = 2 Vs H1: 1  2
Fazer

Figura 113: Menu para a execuo do teste t para amostras independentes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 94

Figura 114: Janela de Dilogo onde se devem especificar os grupos.

Janela INDEPENDENT-SAMPLES T TEST:

Test variable variveis escolhidas para a anlise;

Grouping variable variveis que dividem os casos pelos dois grupos teste.

Define groups

Use specified values se os grupos esto j codificados;


Cut point seleccionar um ponto de corte para criar dois grupos: um abaixo
e outro acima desse ponto.

s
tiG
p
u
ro
a
S

P
U
O
R
G N n
a
e
M n
o n
a
e
M
md
a
re
T yhte
l
a 8 0 2
,
8
3
1 4
,3
8
o
cni
e
s esai
d 0
1 0
,
4
6
7 5
,7
3
1
2 9
,5
7
6

Figura 115: Tabela resultante da realizao do teste t para duas amostras independentes
na qual so visveis algumas estatsticas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 95

t
s

t t-e
s ila
u
q
E
r

fh
lo
a
rv
te
In
ro
E
.
td
S
F .
ig
S t f
d e
ld
-ta)
.(2
ig
S r
e
w
o
L r
e
p
U
T
m
d
a
re lE
a
u
q irv
n
7
3
,1 6
1
,7 3
7
,8
1 6
1 8
,0 0
,9
3
6
1 2
,5
7
8 4
,6
1
-2 ,
9
4
3
i s
a
r
lv
a
u
q
E
6
,9
1 9
3
,4
5
1 8
6
,0 0
,9
3
6
1 ,9
3
8 0
,4
3
-1 0
,2
1
4
3
sm
ta
o
neu

Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes
na qual so mostrados os valores p assim como o intervalo de confiana para a
diferena de mdias.

Na primeira tabela aparecem algumas estatsticas descritivas.

Na segunda tabela, apresentado um conjunto de informao acerca da varivel


pretendida.

Comea com o Teste de Levene para a homogeneidade de varincias (F representa o


valor da estatstica de Levene e o respectivo Sig. ou p_value). Depois apresentado o
valor da estatstica t (t), o nmero de graus de liberdade (df), o p_value (Sig.(2-
tailed)), a diferena de mdias (Mean Difference), o erro amostral da diferena de
mdias (Std. Error Difference) e os limites inferior e superior do Intervalo de
Confiana da diferena.

Neste caso, como o p_value para o Teste de Levene superior ao nvel de


significncia, no se rejeita H0 e assume-se a igualdade das varincias, dever ento
ler-se o valor p, relativamente ao teste de igualdade das mdias na 1 linha (Equal
variances assumed), como o p_value superior a 0.05 (0.080) no se rejeita a
hiptese nula e no se rejeita a igualdade das mdias nos dois grupos ao nvel de
significncia estabelecido.

4.6. Duas amostras com dados emparelhados


Em anlise estatstica muito comum o recurso a amostras emparelhadas. Este tipo
de amostras permite que os mesmos indivduos sejam medidos em diferentes
situaes experimentais. O objectivo principal deste tipo de amostragem controlar
fontes de variabilidade que possam influenciar o efeito de um determinado tratamento.

Neste tipo de teste, comparada a mdia das diferenas com um valor que pode ser
ou no zero. No fundo, so calculadas as diferenas entre os valores das observaes
de cada varivel das amostras.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 96

Para aplicar este teste necessrio que as variveis dependentes sigam uma
distribuio normal.

Considere-se o exemplo seguinte:

Para testar a eficcia de um novo tratamento de emagrecimento, foram usados os


dados relativos a 20 pacientes. Na tabela da pgina seguinte, apresentam-se os
valores do peso de cada indivduo antes e aps o tratamento. Para analisar o efeito do
tratamento efectua-se um teste para duas amostras com dados emparelhados.

Sujeito Idade Sexo Altura Peso inicial Peso final


1 20 Masculino 1,77 99,8 85,3
2 45 Feminino 1,60 90,0 73,2
3 33 Feminino 1,65 100,7 68,0
4 51 Masculino 1,72 99,1 75,5
5 29 Feminino 1,69 92,4 74,2
6 18 Feminino 1,70 101,2 80,4
7 35 Feminino 1,59 79,1 60,1
8 44 Masculino 1,77 110,6 82,1
9 57 Feminino 1,62 85,3 62,4
10 61 Feminino 1,71 114,3 81,1
11 24 Masculino 1,76 101,2 74,2
12 36 Feminino 1,68 100,3 78,4
13 38 Masculino 1,81 99,5 85,3
14 46 Masculino 1,57 80,5 54,1
15 54 Masculino 1,86 116,9 90,8
16 49 Feminino 1,66 90,8 70,0
17 27 Masculino 1,69 100,5 68,1
18 21 Feminino 1,71 98,9 79,3
19 32 Feminino 1,72 103,5 83,4
20 41 Masculino 1,64 98,4 67,7

Tabela 2: Tabela contendo informao acerca de 20 indivduos, relativa a avariveis


como idade, sexo, altura, peso inicial e peso final.

Pretende-se testar:

H0: D = 0 Vs H1: D  0

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 97

Neste caso queremos comparar a mdia das diferenas com o valor zero, para
analisar se o tratamento teve ou no efeitos.

Para isso fazer,

ANALYZE >COMPARE MEANS >PAIRED - SAMPLES T-TEST

Figura 117: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas.

Ao seleccionar a primeira varivel - peso_i esta assumida como variable 1; ao


seleccionar a segunda varivel peso_f esta aparece como variable 2. S depois de
seleccionadas estas duas variveis que o par colocado na lista.

Em OPTIONS seleccionado o nvel para o Intervalo de Confiana. Neste caso 95%.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 98

lire
p
m d
a
S P

N n
o n
a
e
M
rP
i
a P
e
05 0
2 5
1
,8
9 5
9
,1
2
1 e
d a
t
s
e
P
0
8
,6
4
7 0
2 8
,3
9 9
,0
2
to
n
e
m
a
r

Figura 118: Tabela resultante da realizao do teste t para amostras emparelhadas, onde
so visveis algumas estatsticas.

Num primeiro quadro apresentado um conjunto de mediadas estatsticas (mdia,


nmero de casos vlidos, desvio padro e erro amostral da mdia) para as variveis
seleccionadas.

sa
le
p
m
S
ird
P

N .
ig
S
rP
i
a P
e
1 d
0
2
s
e
P
to
n
e
m
ra

Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde
visvel o coeficiente de correlao.

Numa segunda tabela aparece informao que permite inferir acerca da correlao
entre o par seleccionado (nmero de casos vlidos para ambas as variveis,
coeficiente de correlao e nvel de significncia). Convm destacar que o coeficiente
de correlao varia entre -1 e 1. Quanto mais prximo de -1 ou +1 estiver, mais
linearmente relacionadas se encontram as variveis. Se o valor prova (p_value) for
inferior ao nvel de significncia as variveis esto relacionadas.

n
a
e
M n
o n
a
e
M r
e
w
o
L r
e
p
U t f
d t
rP
i
a P
e
1 d
07 5
2
,3
1 7
9
,6
0
2 3
,4
6
2 ,3
7
1 9
1 ,0
s
e
P
trae
on
m

Figura 120: resultante da realizao do teste t para amostras emparelhadas, onde


visvel o valor p, assim como o intervalo de confiana para a mdia das diferenas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 99

O ltimo quadro contm informao acerca das variveis seleccionadas: mdia, desvio
padro, erro amostral da mdia, os limites do Intervalo de Confiana, o valor da
estatstica t para o teste, o nmero de graus de liberdade e o nvel de significncia.

Neste caso, o p-value (Sig. (2-tailled)) tem o valor de 0.000 que inferior ao nvel de
significncia (0.05), pelo que se rejeita a hiptese nula. Por este motivo pode concluir-
se que as mdias so significativamente diferentes, isto , a mdia no grupo mudou
como resultado do tratamento.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 100

5. Testes de hipteses no paramtricos


Os testes no paramtricos so, geralmente, considerados uma alternativa aos testes
paramtricos, nomeadamente quando as condies de aplicao dos paramtricos
(normalidade da varivel em estudo e homogeneidade de varincias) no se verificam.

geralmente aceite que a potncia dos Testes Paramtricos superior dos Testes
No Paramtricos, isto , a probabilidade de rejeitar correctamente H0 maior num
Teste Paramtrico. No entanto, h autores que afirmam que os testes no
paramtricos aplicados a amostras de pequena dimenso podem ser mais potentes.

Os testes paramtricos requerem geralmente variveis quantitativas, enquanto que os


no paramtricos podem ser aplicados a qualquer varivel, com algumas limitaes.
Como tal, os Testes No Paramtricos so aplicados sempre que no seja prtico, ou
possvel, medir numa escala quantitativa.

necessrio considerar que alguns dos Testes No Paramtricos foram


desenvolvidos exclusivamente para variveis ordinais, e que estes testes no so uma
alternativa a utilizar numa m recolha de dados. Assim necessrio, como em
qualquer inferncia, assegurar a representatividade da amostra.

Os teste no paramtricos so requeridos no SPSS no menu Analyze, em


Nonparametrics Tests.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 101

Figura 121: Menu onde se encontram os testes no paramtricos.

5.1. Teste do Qui-Quadrado

Qui- quadrado para a qualidade do ajuste


O teste do qui-quadrado permite verificar a aderncia entre uma distribuio de
frequncias associada a uma amostra constituda por observaes expressas em
qualquer escala de medio e uma distribuio terica. um dos testes includos nos
testes de qualidade do ajuste, ou seja permite verificar a representatividade de uma
dada amostra relativamente populao.

O procedimento Qui-Quadrado executa-se Analyze  Nonparametric Test  Chi-


square, obtendo-se a seguinte janela:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 102

Figura 122: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem
indicar as variveis assim como os valores a testar.

Na janela surge a localizao da varivel ou variveis em estudo test variable list. As


variveis que se pretendem analisar devem ser seleccionadas para esta lista.

Surgem igualmente opes para definir as categorias em anlise Expected Range:

definida na varivel Get from data, (atribui a mediante a codificao, e todas


esto em anlise),
definir as categorias mediante um intervalo Use specified range, (neste caso
apenas as categorias codificados pelo intervalo esto em anlise).
A opo Expected Values corresponde ao valor que se pretende testar, ou seja
frequncia esperada para cada categoria. Pode-se assumir como todas as categorias
apresentam igual proporo (All categories equal), ou especificar os valores de
proporo tericos. Deve-se ter em ateno a introduo dos valores (values) pela
ordem em que se encontram as categorias.

A Janela do Chi-Square apresenta tambm dois botes, Exact e Options.

Na janela Exact Tests existe a possibilidade de ajustar a exactido do teste a realizar.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 103

Figura 123: Janela de dilogo onde se pode optar por um teste exacto ou por uma
aproximao normal.

As opes so as mesmas que surgem na Janela Exact Tests que surge no


procedimento Analyze  Descritives Statistics Crosstabs. Esta janela igual para
todos os testes no paramtricos.

Asymptotic only apenas assimpttica o nvel de significncia baseado numa


distribuio assimpttica da estatstica de teste geralmente de 5%. Baseia-se na
hiptese de o conjunto de dados ser elevado. Caso a amostra apresente uma
dimenso pequenas, ou pobremente distribuda, pode no ser uma boa indicao para
a significncia do teste.

Monte Carlo uma estimativa no enviesada do nvel de significncia exacto,


calculado repetidamente por amostragens a partir de um conjunto de tabelas com as
mesmas dimenses da tabela em estudo. Permite calcular significncias exactas.

Confidence Level nvel de confiana introduzir um valor entre 0,1 e 99,9


para especificar a probabilidade com que o intervalo de confiana, baseado
nos valores amostras, inclui a mdia da populao.

Number of Samples nmero de amostras - introduzir um valor entre 1 e


1.000.000.000 para o nmero de amostras a utilizar no calculo da estatstica.
Nmeros mais elevados aumentam a fiabilidade, mas demoram mais tempo a
serem executados.

Exact exacto a probabilidade do resultado observado ou um resultado mais


extremo ser calculado com exactido. Tipicamente um valor menor que 0,05
considerado significativo.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 104

Time limit per Test limite de tempo por teste - introduzir um valor entre 1 e
9.999.999.999 como tempo mximo permitido para calcular cada teste.

Na janela de opes tem-se a possibilidade de requerer as estatsticas descritivas


(mdia, desvio padro, mnimo, mximo e dimenso da amostra) e os quartis.

Figura 124: Janela de Dilogo onde se pode optar por pedir algumas estatsticas,
assim como o tratamento aos missings.

Surgem igualmente as opes de tratamento de missings. O caso com um missing


numa determinada varivel pode ser excludo, apenas se a varivel estiver envolvida
no teste em questo (Exclude cases test-by-test) (tal significa que os dados desse
caso sero usados em todos os procedimentos nos quais a varivel no esteja
envolvida) ou em todos os procedimentos mesmo que a varivel no esteja envolvida
(Exclude cases listwise).

Esta janela igual para todos os testes no paramtricos.

Exemplo Prtico
Num dado inqurito solicitava-se aos inquiridos que assinalassem a sua posio
poltica, em termos de direita, centro e esquerda. Os resultados encontram-se na base
de dados Inquerito1, na varivel politica.

Nas ltimas eleies os eleitores votaram de acordo com a tabela seguinte:

Direita Centro Esquerda

Proporo(n) 0,29 0,40 0,31

Tabela 3: Tabela contendo resultados de uma eleio.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 105

Teste a hiptese desta amostra ser representativa da populao em estudo para a


varivel em causa.

Esta primeira tabela contm os valores observados (Observed N) e os valores


esperados (Expected N). Esta tabela foi ponderada pelos valores tericos. O resduos
correspondem diferena entre os valores observados e os valores esperados.

e
vO
sr
b x
E
a
rd
e
u
sq 4
0 4
,2
1 2
tro
n
e
C 1
5 ,2
7
6
5
tra iD
e 3
0
5 ,6
9
3
4 ,4
3
6
l
ta
o
T 8
4
1
Resultados:

Figura 125: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam


valores observados e esperados, assim como os resduos.

A tabela seguinte contm o valor da estatstica do teste (Chi-square), o nmero de


graus de liberdade (df), e o nvel de significncia (Asymp. Sig.) neste caso
assimttica. Adicionalmente fornece informao sobre o prprio rigor do teste e da sua
aplicao.

is

C
h a 0
f
d 2
.
p
sym
A 1
,0
. ce
a l0
em
h
.T
5
n
i
u

Figura 126: Tabela resultante do teste do qui-quadrado do ajuste onde se apresenta o

valor p.

Genericamente as hipteses em estudo so:

Ho: a populao segue uma distribuio especfica

H1: a populao no segue essa distribuio especfica

Concluso:

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 106

No presente exemplo verificam-se os pressupostos para a aplicao do Qui-quadrado


(a no existncia de valores observados =0; apenas 20% dos valores esperados
podem ser < 5; nenhum valor esperado poder ser <1)

O valor de prova (p) = 0,001, pelo que se conclui pela rejeio da hiptese nula, para
um =0,05. Ou seja conclui-se pela no representatividade da amostra na varivel
posio poltica para a populao.

Qui-Quadrado para independncia de variveis


Tabelas dupla entrada Crosstabs

O procedimento Crosstabs permite a criao de tabelas de contingncia de duas ou


mais variveis. Permite igualmente a realizao de testes e de medidas de associao
de variveis, o teste a realizar determinado pelo tipo de variveis presentes na
anlise.

Neste procedimento as variveis em anlise devem ter um nmero limitado de


categorias. No devem ser utilizadas variveis do tipo quantitativo.

Na janela crosstabs surgem as opes de visualizar grficos de barras agrupados e a


de suprimir as tabelas (neste caso apenas se obtm medidas estatsticas). Nas linhas
(Row(s)) e nas colunas (Column(s)) colocam-se as variveis em anlise, deve existir
pelo menos uma varivel em cada.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 107

Figura 127: Janela de dilogo para proceder realizao do teste do qui-quadrado para
a independncia de variveis, onde se devero indicar quais as variveis a testar.

Os botes Statistics, Cells e Format, abrem as janelas correspondentes.

Na janela Statistics pode-se proceder aos testes de independncia de variveis e de


correlaes.

Figura 128: Janela de dilogo onde se podem pedir algumas estatsticas relativas s
variveis a testar no teste do qui-quadrado para a independncia de variveis

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 108

O qui-quadrado (Chi-square) testa apenas a hiptese de associao entre as


variveis, no indicando a intensidade ou direco da associao.

As correlaes (Correlations) apresentam o coeficiente de Pearson e o de Spearman,


o primeiro para variveis intervalares/racionais e o segundo para variveis ordinais.
Variam entre 1 e 1, o 0 corresponde a uma ausncia de relao, o sinal ou +
corresponde direco da associao.

possvel requerer outros coeficientes de correlao, tendo sempre em considerao


o tipo de varivel. A interpretao do resultado idntica realizada para o coeficiente
de Pearson ou de Spearman. As correlaes nominais so isentas de sinal, a ordem
de codificao aleatria, no segue uma ordem, logo no existe uma direco de
associao.

Na janela cell display proporciona a opo de seleccionar os valores a visualizar na


tabela de contingncia, para alm dos observados pode-se requerer os valores
esperados, percentagem e resduos. Os resduos padronizados permitem uma
comparao mais rpida dos desvios relativos aos valores esperados dos observados.
Os resduos padronizados so significativos quando superiores a 2 em termos
absolutos. Resduos padronizados superiores a 2 so suspeitos de existncia de
associao entre as variveis.

Figura 129: Janela de dilogo onde se pode optar por quais as informaes a apresentar
na clula da tabela de contingncia.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 109

A janela Format apresenta as opes de ordenao dos resultados.

Figura 130: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a sua intensidade com
que vivem a religio e a frequncia de actos religiosos. Os resultados encontram-se na
base de dados Inquerito1, na varivel freqreli e intenrel. Teste a hiptese destas
variveis serem independentes.

Na primeira tabela temos um resumo da anlise realizada em termos de nmero de


casos vlidos e missings.

se
a
C s

N t
rcn
e
P N N
F

u
q
re
servio 9
3
1 ,%
6
7 7
4
3 , %
3
2 0 0
1 %
te
In

Figura 131: Tabela resultante do teste do qui-quadrado para independncia, onde se


mostra o nmero de casos vlidos, missings e total.

A segunda tabela, tabela de dupla entrada, apresenta-nos os valores observados, os


valores esperados e os resduos padronizados. Pela anlise desta tabela pode-se
prever a dependncia entre as variveis. Os resduos padronizados elevados, e o
facto de seguirem uma linearidade na oblqua leva-nos a pensar que tal se verifica.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 110

s
o
ig

c
ra
F ra
e
d
o
M rte
o
F l
ta
o
T
rF M
s
o
n
e
vd
a
m
u C
n
u
o 7
5 9 9 9
3
rv
s
e
d o
p t
c
e
p
x
E ,
7
3 ,
1 ,2
4 ,0
3
9
re .R
td
S i
s
le
a
u ,1
6 -,6 ,3
-5
e
v
a
m
U u
o
C 0
3
1 9
1 6
2 5
7
1
t
c
e
p
x
E ,0
1
7 ,9
0
2 ,1
3
8
.R
td
S i
s
le
a
u ,0
7 -,4 ,3
-6
a
ri

V u
o
C 0
1 5
2 5
4 0
7
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 3
,7 1
,0
v
a
m
U u
o
C 4
6 3
1 2
3 9
0
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 3
,0 ,
0
u
o
2 u
o
C 6
4 4
2 4
6 4
3
1
t
c
e
p
x
E
.R
td
S i
s
le
a
u 2
,0 ,
0
Q
e
s
a
u u
o
C 9 2
1 3
5 7
4
e
s t
c
e
p
x
E ,
0
3 ,
8 ,1
5
3 ,0
4
7
.R
td
S i
s
le
a
u ,8
-3 ,
1 ,0
3
se
a
d
o
Tm u
o
C 5
3 0
3 5
9
1 0
6
2
t
c
e
p
x
E ,0
1
3
.R
td
S i
s
le
a
u -
,9
6 -,2 6
,4
sd
ie
a
Mr
o
p
z
v
m
u u
o
C 3 4 7
1 4
2
1
n
a
m
e
s t
c
e
p
x
E ,3
0
5 ,8
4
1 ,9
8
5
.R
td
S i
s
le
a
u ,7
-6 ,8
-2 ,6
7
l
ta
o
T u
o
C 2
6
4 6
3
1 1
4
5 9
3
1
t
c
e
p
x
E

Figura 132: Tabela de contingncia resultante da execuo do teste do qui-quadrado.

Resultados:

A terceira tabela apresenta-nos as estatsticas do teste e o valor de prova.

e f
d -si
(2
P
rso
a
e -n
i
h
C a
1
4 ,
0
h
iko lL
e 4
1 ,0
n i-b
rL
a
e y
1 ,0
ci
so
A
f
o
N 9
3
1
. sl0
a ce (
n
m ctid
xp
e
u

Figura 133: Tabela resultante da execuo do teste do qui-quadrado onde se mostram os


valores prova.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 111

Genericamente as hipteses em estudo so:

Ho: as variveis so independentes

H1: as variveis no so independentes

Neste exemplo podem ser concretizadas da seguinte forma:

Ho: Os actos religiosos e a intensidade com que se vive a religio so independentes.

H1: Os actos religiosos e a intensidade com que se vive a religio no so


independentes.

Concluso:

No presente exemplo o valor de prova (p) < 0,001. Pelo que se conclui pela rejeio
da hiptese nula, para um =0,05. Ou seja conclui-se que os actos religiosos e a
intensidade com que se vive a religio no so independentes ao nvel de significncia
estabelecido.

5.2. Binomial
O procedimento binomial permite testar se a proporo de uma categoria de uma
varivel dicotmica, ou tornada dicotmica, da amostra difere de uma determinada
constante, por ex. a proporo do sexo na populao.

Na janela surge a localizao da varivel em estudo test variable e o valor com


que se vai proceder ao teste test Proportion, note que este valor a testar ficar
associado ao 1 grupo, a proporo para o segundo grupo ser 1 menos o valor
introduzido.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 112

Figura 134: Janela dilogo para a execuo do teste da binomial, onde se devem indicar
as variveis assim como as propores a testar.

Surgem igualmente as opes para definir a dicotomia, pode ser a definida na varivel
(atribui os casos com a categoria mais baixa a um grupo e os de categoria mais alta a
outro), ou definir a dicotomia por um ponto de corte, o valor a inserir deve
corresponder ao value da categoria a ficar no segundo grupo, as categorias com value
inferior ficam no grupo 1, o grupo 2 constitudo pelo valor inserido e superiores. A
varivel deve estar bem definida para no misturar diferentes itens.

A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas


anteriormente.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a seu sexo. Os resultados
encontram-se na base de dados Inquerito1, na varivel sexo. Nos ltimos censos
realizados a proporo do sexo feminino era de 55%.

Teste a hiptese desta amostra ser representativa da populao em estudo para a


varivel em causa.

Resultados:

A tabela de resultados apresenta a dicotomia em anlise, a dimenso de cada


categoria, a proporo observada. E o nvel de significncia do teste.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 113

ia

p
sym
A
N .
p
ro
P st
e
T
d
xo
e
S G
ro a
F
m
e 3
4
8 7
,5 ,5 4
9
,0
ro
G scu
a
M
3
4
6 3
,4
o
ta
o
T 6
8
4
1 ,0
1
. B
a

Figura 135: Tabela resultante do teste da binomial onde so visveis as propores


observadas, a proporo a testar assim como o valor p.

As hipteses em estudo so:

Ho: a populao apresenta uma proporo de femininos = 0,55

H1: a populao apresenta uma proporo de femininos  0,55

necessrio ter em ateno se os resultados gerados so para um teste bilateral ou


unilateral. O SPSS quando testa uma proporo diferente de 0,5 apresenta um teste
unilateral. O nvel de significncia do teste, cujas hipteses foram referidas
anteriormente, obtm-se multiplicando o resultado Asymp. Sig. (1-tailed) por 2.

Concluso:

No presente exemplo o valor de prova (p) = 0.188. Pelo que se conclui pela no
rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no
representatividade da amostra na varivel sexo para a populao.

5.3. Duas amostras Independentes (Mann-Whitney)


O procedimento two independent samples compara dois grupos de casos (amostras)
independentes e verifica se provm da mesma populao.

Os testes no paramtricos utilizam as ordens para obter os resultados, ou seja,


procedem ao ordenamento crescente dos valores das variveis e calculam a sua
posio mdia. com este valor que procedem comparao entre as amostras.

Na janela surge a localizao da varivel ou variveis em estudo test variable e a


varivel que vai dividir nos dois grupos em teste. A grouping variable deve ser uma
varivel dicotmica ou com os grupos que se querem testar.

Na definio dos grupos a comparar introduz-se os values correspondentes s


categorias que se pretendem comparar.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 114

Figura 136: Janela de dilogo para a execuo de testes no paramtricos para amostras
independentes, onde se deve indicar quais as variveis e grupos a testar.

Tipo de teste

Mann-Whitney U o teste no paramtrico equivalente ao teste t, testa a hiptese


de duas amostras serem provenientes da mesma populao. Requer que as variveis
se encontrem pelo menos numa escala ordinal. mais potente que o teste de
medianas por utilizar a ordem de casos. O valor de U o nmero de vezes que um
valor do primeiro grupo precede um valor no segundo grupo, quando ordenados de
forma crescente.

Kolmogorov-sminorv Z testa a hiptese de duas amostras serem provenientes da


mesma populao. sensvel a qualquer tipo de diferena entre as duas distribuies.
O teste baseado na maior diferena entre as duas distribuies acumuladas.

Moses extreme reactios concebido para testar hipteses nas quais se esperam que
a varivel experimental afectar alguns casos numa direco e outros casos na
direco oposta. Teste para respostas extremas comparadas com o grupo de controlo.

Wald-Wolfowitz runs testa a hiptese de duas variveis serem provenientes da


mesma populao. Os valores de ambas as amostras so combinados e ordenados
de forma crescente. Se as variveis forem provenientes da mesma populao, os dois
grupos devero estar distribudos aleatoriamente ao longa da ordenao.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 115

A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas


anteriormente.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem o seu sexo e os anos de
escolaridade completos. Os resultados encontram-se na base de dados Inquerito1, na
varivel sexo e educ. Teste a hiptese de os anos completos de escolaridade no
diferirem entre os dois sexos.

Resultados

d
xo
e
S N kM
n
a
Re
sA
o
n M 6
9
3 5
7 ,7
4
m
co e
F 0
4
8 9
0
l
ta
o
T

Figura 137: Tabela resultante do teste de Mann-Whitney onde se apresentam os


grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies.

riq
d u
tn
i
h
-W
a
M
y
e 0
W 0
Z 4
m
y
s
A 0
,9
. G
a u
ro

Figura 138: Tabela resultante do teste de Mann-Whitney, onde se apresenta o valor p.

A primeira tabela apresenta os grupos em anlise, a dimenso, a posio mdia do


grupo e o somatrio de posies.

A segunda tabela apresenta os valores do teste estatstico, e a seu valor de prova.

Genericamente as hipteses em estudo so:

Ho: A distribuio da varivel nas duas populaes idntica.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 116

H1: A distribuio da varivel nas duas populaes no idntica.

No exemplo podem ser concretizadas da seguinte forma:

Ho: Os anos de escolaridade completos so idnticos nos dois sexos.

H1: Os anos de escolaridade completos no so idnticos nos dois sexos.

Concluso:

No presente exemplo o valor de prova (p) = 0,909. Pelo que se conclui pela no
rejeio da hiptese nula. Ou seja no se pode concluir que os anos de escolaridade
nos dois sexos no so idnticos, ao nvel de significncia 0.05.

5.4. Two Related Samples (Wilcoxon)


O procedimento Two Related-samples compara as distribuies de duas amostras
emparelhadas.

Na janela do comando procede-se seleco do par de variveis a testar, a


visualizao da seleco projectada em current selections, deve-se marcar a
primeira das variveis e ela dever surgir em variable 1, marca-se a segunda das
variveis e ela dever surgir com variable 2. S aps seleccionar o par de variveis
que possvel colocar o par na lista de variveis a testar.

Figura 139: Janela de dilogo para a execuo dos testes no paramtricos para
amostras emparelhadas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 117

Tipo de teste

Wilcoxon testa a hiptese de duas variveis serem provenientes da mesma


populao, sem postular qualquer hiptese sobre a forma de distribuio das duas
variveis. A estatstica do teste baseia-se nas ordens dos valores absolutos das
diferenas entre as duas variveis.

Sign teste dos sinais testa a hiptese de duas variveis serem provenientes da
mesma populao. As diferenas entre as duas variveis para todos os casos so
calculados e classificados como positivos, negativos ou empate. Se duas variveis
forem similarmente distribudas, as diferenas positivas e negativas no so
estatisticamente significativas.

McNemar Teste no paramtrico para duas variveis emparelhadas dicotmicas.


Testa as modificaes nas respostas recorrendo a uma distribuio do Qui-Quadrado.
um teste til para detectar as mudanas de opinio aps uma interveno (antes-
depois).

Marginal Homogeneity Teste semelhante ao McNemar, mas para variveis


multinomiais.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem os anos de escolaridade
completos do pai e da me. Os resultados encontram-se na base de dados
Inquerito1, na varivel maeeduc e paieduc. Teste a hiptese de os anos completos
de escolaridade no diferirem entre o pai e a me do inquirido.

Resultados

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 118

skR
n
a

N k
R
n
a
e
M
A
sd
o
n tiN
a
g
e v a
3
8
1 6,3
0 1 0
eltsd
p
m
co a tP si
o b
0
1
3 0
e
sd
o
n
A e i
sT c3
2
5
e ltsd
p
m
co
t
o
T 0
8
9
. A
a
i
a
p
. A
b
i
a
p
c. A
i
a
p

Figura 140: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma
das posies.

b
is

e
d

e
l
p
scm
to
i
a
p
Z a
6
sym
A 1
7
,9
. a
a B
. W
b

Figura 141: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p.

A primeira tabela apresenta os resultados das diferenas, a dimenso, a posio


mdia dos grupos positivo e negativo e o somatrio de posies para os mesmos.

A segunda tabela apresenta os valores do teste estatstico, e o seu valor de prova.

Genericamente as hipteses em estudo so:

Ho: As distribuies das variveis so idnticas.

H1: As distribuies das variveis no so idnticas.

No exemplo podem ser concretizadas da seguinte forma:

Ho: As distribuies das variveis anos de escolaridade completos da me e anos de


escolaridade completos do pai so idnticas.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 119

H1: As distribuies das variveis anos de escolaridade completos da me e anos de


escolaridade completos do pai no so idnticas.

Concluso:

No presente exemplo o valor de prova (p) = 0,971. Pelo que se conclui pela no
rejeio da hiptese nula. Ou seja no se pode concluir que distribuio das variveis
anos escolaridade do pai e da me sejam idnticas na populao, ao nvel de
significncia 0.05.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 120

6. Regresso
A anlise da regresso permite, atravs da relao entre variveis, prever a evoluo
de uma em funo da outra. Esta previso em termos mdios ou de valores
esperados. Por exemplo, podemos definir a nota mdia dos alunos disciplina de BBII
em funo do nmero de horas de estudo que dedicaram cadeira, supondo que
existe entre estas duas variveis uma relao neste sentido. Neste exemplo, estamos
a considerar a nota de BBII como varivel dependente e o nmero de horas de estudo
como varivel independente e Y= f(X).

Esta relao funcional pode traduzir uma relao linear, exponencial, entre outras.
Vamos considerar a regresso linear.

6.1. Regresso Linear Simples


Sendo Y varivel dependente e X a varivel independente podemos considerar a
funo mais simples, a equao linear Y= a + bX que traduz um grande nmero de
relaes entre variveis e uma boa aproximao em relaes matematicamente
mais difceis de descrever.

Nesta equao, a e b so constantes que se calculam com base em dados amostrais.

A partir do momento em que conhecemos as constantes a e b podemos prever o valor


mdio de Y para qualquer valor de X que pertena regio de validade do modelo.

Y Y

Y=a+bX Y=a+bX

X X

Relao positiva entre X e Y Relao inversa entre X e Y

Figura 142: Representao das possveis relaes lineares entre duas variveis.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 121

O coeficiente a d-nos o valor mdio de Y quando X assume o valor zero. S faz


sentido proceder sua anlise quando o valor zero para X pertence regio de
validade do modelo.

O coeficiente b d-nos a variao mdia de Y quando X varia uma unidade. Se for um


valor positivo traduz uma relao positiva entre as duas variveis, ou seja, quando X
aumenta, Y aumenta. Se for um valor negativo traduz uma relao inversa entre as
duas variveis, ou seja, quando uma aumenta a outra diminui.

No SPSS aps introduo dos dados amostrais, para obter a anlise da regresso
linear entre duas variveis devemos seguir os seguintes passos:

Analyse Regression Linear

Figura 143: Menu para a execuo da regresso linear.

Seleccionamos a varivel dependente e independente e OK.


X Y

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 122

Figura 144:Janela de dilogo para a execuo da regresso linear onde se deve indicar
quais as variveis dependente e independentes.

E obtemos, entre outros, o quadro com os coeficientes a e b.

M
d
o B t
1 ( 0
e
W
y
d
o
B 0
,3 4
. D
a p
e r e
e
p
y
d
o
B tc o
p n
i

Figura 145: Tabela resultante de uma regresso linear onde se apresentam os


coeficientes.

Neste caso, em que a nossa varivel dependente era a Percepo Corporal (o SPSS
indica qual a varivel dependente em baixo do quadro) e a independente o Peso,
obtemos a seguinte equao:

Y= 1,800 + 0,163X

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 123

Quando o peso zero a percepo corporal em mdia 1,800. Neste caso, no faz
sentido a anlise do coeficiente a porque zero no pertence regio de validade do
modelo.

Quando o peso varia uma unidade (1Kg) a percepo corporal aumenta em mdia
0,163.

6.2. Regresso Linear Mltipla


A regresso linear simples considera apenas uma varivel independente. No entanto,
as situaes reais mostram-nos muitas vezes que para explicar a variao de uma
varivel existe mais do que uma varivel a explicar essa variao.

Assim, a equao da regresso linear mltipla

Y= a+b1X1+b2X2

onde o coeficiente a o valor mdio de Y quando X1 e X2 assumem simultaneamente


o valor zero. S faz sentido a sua anlise quando o valor zero para X1 e X2 pertence
regio de validade do modelo.

O coeficiente b1 traduz a variao mdia de Y quando X1 varia uma unidade e o


coeficiente b2 traduz a variao mdia de Y quando X2 varia uma unidade, na regio
de validade do modelo.

No SPSS para obter os coeficientes da equao procedemos da mesma forma da


considerada na regresso linear simples, definindo como varivel independente no
uma mas as n variveis independentes que estivermos a considerar no modelo.

M
d
o B t .
ig
S
1 (
C ,
4
6 ,
9
1
5
u
P ,
4
7
0 -
7
4
,0 1
-,7 8
7
,4
rac
e
p
y
Ht ,
9
5
6 4
3
,1 8
2
,3 8 ,0
y
d
o
B 8
9
,3 2
,1 6
1
,2 2 1
,0
. d
a tD
n
ep

Figura 146: Tabela resultante de uma regresso linear mltipla onde se apresentam os
coeficientes.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 124

A equao que obtemos Y= 0,242-0,053X1+0,659X2+0,398X3

6.3. Estimao da Curva


O modelo de regresso linear pode ser definido teoricamente das seguintes forma:

Yi=0+1Xi+i

Onde 0 e 1 so parmetros e i representa o erro aleatrio de mdia zero e


2
varincia  . Assumimos que os erros das observaes i e j no esto relacionados.

O valor esperado de Y pode ser definido como E(Yi)= 0+1Xi

No SPSS podemos pedir a estimao da curva de duas formas. Se pretendemos um


modelo linear podemos seguir o definido nos pontos acima. Se o nosso objectivo for
construir um modelo linear ou no linear podemos optar em

Analyse Regression Curve Estimation

onde temos diversos modelos para opo. Podemos igualmente optar por construir a
anlise de regresso atravs de uma srie temporal escolhendo a opo Time na
definio da varivel independente. A srie temporal permite-nos definir a evoluo ao
longo do tempo de uma determinada varivel e prever o valor mdio esperado na
varivel dependente para um determinado momento do tempo.

A estimao dos coeficientes da equao baseada no mtodo dos mnimos


quadrados que nos permite encontrar estimadores no tendenciosos e com varincia
mnima. Este mtodo considera para cada observao o desvio entre o valor Yi e o
valor esperado E(Yi), encontrando os estimadores a e b que minimizam o quadrado
deste desvio.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 125

Figura 147:Menu para a estimao da curva.

Teste aos coeficientes


Podemos testar a hiptese de os coeficientes serem ou no iguais a zero, ou seja,
avaliar se apesar do valor positivo ou negativo encontrado na estimao da recta para
os coeficientes podemos considerar que na populao eles apresentam um valor
significativamente diferente de zero.

Para 0

H0: 0 = 0

H1: 0  0

O valor p obtido aproximadamente zero (ver quadro supra dos coeficientes), logo
inferior ao nvel de significncia escolhido (0,05), pelo que rejeitamos H0 e conclumos
que para o nvel de significncia de 0,05 temos evidncia estatstica para considerar
que o valor de 0 significativamente diferente de zero

O teste para 1 obedece ao mesmo critrio de anlise.

Departamento de Produo e Sistemas ESTSP


Biomatemtica e Bioestatstica II 126

R e R2
Na anlise da regresso h duas medidas de associao entre a varivel dependente
e a(s) variveis independentes:

Coeficiente de Determinao (R2) indica-nos a proporo da variao total de


Y que explicada por X

Coeficiente de Correlao (R) indica-nos o nvel de associao entre as


variveis. Apresenta um sinal positivo ou negativo consoante o coeficiente b
for positivo ou negativo.

O SPSS quando procede anlise da regresso sumaria o modelo utilizando o


coeficiente de determinao e o coeficiente de correlao.

M
d
o R
1 a 9
,0 6
8
,0 5
9
,6
. P
a d
re g
h
Figura 148:Tabela resultante da regresso linear onde se apresentam os coeficientes de
determinao e correlao.

Neste caso, R2= 0,090, ou seja, a varivel Peso explica apenas 9% da variao da
Percepo Corporal e R=30% o que nos d indicao de uma relao fraca entre as
variveis.

Departamento de Produo e Sistemas ESTSP

Você também pode gostar