Você está na página 1de 126

Biomatemtica e Bioestatstica II SPSS

Departamento de Produo e Sistemas

Escola Superior de Tecnologia da Sade do Porto

Ttulo:
Biomatemtica e Bioestatstica II - SPSS

Autores:
Ana Paula Nascimento, Agostinho Cunha, Carla Teixeira Lopes, Ftima Monteiro, Liliana Pereira, Sandra Alves, Vtor Bento

Ano:
2005

Biomatemtica e Bioestatstica II

Sumrio
1. Introduo ao SPSS para Windows. .................................................................... 14 1.1. 1.2. 1.3. Opes gerais do programa .......................................................................... 14 Janelas do SPSS .......................................................................................... 15 Menu principal. Barra de ferramentas. Barra de estado................................. 17

Menu principal..................................................................................................... 17 Barra de ferramentas. ......................................................................................... 18 Barra de estado................................................................................................... 18 1.4. 1.5. 2. Procedimento bsico para uma anlise de estatstica. .................................. 19 Grficos......................................................................................................... 19

Arquivo de Dados................................................................................................. 22 2.1. Arquivo de Dados em SPSS ......................................................................... 22

Criar um arquivo.................................................................................................. 22 Abrir um arquivo.................................................................................................. 23 Guardar um arquivo ............................................................................................ 25 Informao sobre arquivos de dados .................................................................. 26 2.2. Janela de edio de dados............................................................................ 26

Definio de variveis ......................................................................................... 27 Entrada de dados................................................................................................ 30 Edio de Dados................................................................................................. 30 2.3. Transformaes sobre os dados ................................................................... 31

Criao de variveis............................................................................................ 31 Recodificao de variveis.................................................................................. 34 Outras Transformaes....................................................................................... 38 2.4. 3. Manipulao de arquivos............................................................................... 41

Estatstica Descritiva ............................................................................................ 47

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

3.1. 3.2.

Medidas de Estatstica Descritiva .................................................................. 47 Frequncias .................................................................................................. 48

Tabela de Frequncias........................................................................................ 48 Estatsticas Descritivas ....................................................................................... 52 Grficos .............................................................................................................. 55 3.3. 3.4. Clculo de estatsticas bsicas...................................................................... 60 Anlise exploratria....................................................................................... 63

Estatsticas.......................................................................................................... 65 Diagrama de caixa e fio (Boxplots)...................................................................... 68 Diagrama de tronco e folha (Steam-and-leaf)...................................................... 71 3.5. Tabelas ......................................................................................................... 74

Modificao de estrutura ..................................................................................... 74 Modificao de formatao ................................................................................. 78 4. Testes de hipteses paramtricos........................................................................ 80 4.1. Condies de aplicao dos Testes Paramtricos ........................................ 80

Teste de Kolmogorov-Smirnov ............................................................................ 80 Teste de Shapiro-Wilk ......................................................................................... 80 Teste de Normalidade ......................................................................................... 81 4.2. 4.3. 4.4. Resultados ao Teste de Normalidade............................................................ 83 Mdias .......................................................................................................... 84 Uma amostra................................................................................................. 87

Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel 90 4.5. 4.6. 5. Duas amostras com dados independentes.................................................... 93 Duas amostras com dados emparelhados..................................................... 95

Testes de hipteses no paramtricos............................................................... 100 5.1. Teste do Qui-Quadrado............................................................................... 101

Qui- quadrado para a qualidade do ajuste......................................................... 101

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

Exemplo Prtico ................................................................................................ 104 Qui-Quadrado para independncia de variveis................................................ 106 Exemplo Prtico ................................................................................................ 109 5.2. Binomial ...................................................................................................... 111

Exemplo Prtico ................................................................................................ 112 5.3. Duas amostras Independentes (Mann-Whitney).......................................... 113

Exemplo Prtico ................................................................................................ 115 5.4. Two Related Samples (Wilcoxon)................................................................ 116

Exemplo Prtico ................................................................................................ 117 6. Regresso ......................................................................................................... 120 6.1. 6.2. 6.3. Regresso Linear Simples .......................................................................... 120 Regresso Linear Mltipla ........................................................................... 123 Estimao da Curva .................................................................................... 124

Teste aos coeficientes....................................................................................... 125 R e R2 ............................................................................................................... 126

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

Sumrio de Figuras
Figura 2: Janela de entrada no SPSS. ........................................................................ 14 Figura 3: Janela de Edio de Dados. ........................................................................ 15 Figura 4: Janelas de Edio de Dados, de Resultados e de Sintaxe. ......................... 16 Figura 5: Janela de Edio de Grficos. ..................................................................... 16 Figura 6: Janela de Sintaxe. ....................................................................................... 17 Figura 7: Barras de menus e ferramentas. .................................................................. 17 Figura 8: Grfico com a representao de duas variveis........................................... 20 Figura 9: Grfico com a representao de uma varivel. ........................................... 20 Figura 10: Grfico Simples.......................................................................................... 20 Figura 11: Grfico encaixado. ..................................................................................... 20 Figura 12: Menu para a criao de uma nova janela de edio de dados. .................. 22 Figura 13: Menu para abrir uma base de dados j existente. ...................................... 23 Figura 14: cone para abrir uma base de dados. ......................................................... 23 Figura 15: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.................................................................................................................. 24 Figura 16: Janela de dilogo com Wizard para a importao de dados para SPSS. ... 25 Figura 17: Menu para guardar um ficheiro. ................................................................. 25 Figura 18: cone para aceder informao acerca de uma varivel. .......................... 26 Figura 19: Janela de Data View. ................................................................................. 26 Figura 20: Janela de Variable View............................................................................. 27 Figura 21: Janela de dilogo para definir o tipo de varivel......................................... 28 Figura 22: Janela de dilogo para introduzir valores para a varivel. .......................... 28 Figura 23: Janela de dilogo para definir missings...................................................... 29 Figura 24: Menus para inserir casos e variveis. ........................................................ 30 Figura 25: cone para posicionar-se num determinado caso. ...................................... 31 Figura 26: cone para encontrar dados. ...................................................................... 31

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

Figura 27: Janela de dilogo para criar variveis atravs de transformaes noutras. 32 Figura 28: Janela com a informao acerca de uma varivel do ficheiro Cars. ........... 33 Figura 29: Janela de dilogo para criar varivel accel_mi em funo da varivel accel presente no ficheiro Cars. ................................................................................... 33 Figura 30: Janela de dilogo que permite seleccionar casos onde a transformao vai ser efectuada. ..................................................................................................... 34 Figura 31: Janela de dilogo para a recodificao automtica da varivel cityname... 35 Figura 32: Resultado da recodificao automtica da varivel cityname..................... 35 Figura 33: Janela de dilogo para a indicao do novo cdigo. .................................. 36 Figura 34: Janela onde exemplificada a recodificao dos missings........................ 38 Figura 35: Janela de dilogo para criar categorias de forma automtica..................... 38 Figura 36: Janela de dados onde se mostra um exemplo de uma determinada base de dados. ................................................................................................................. 39 Figura 37: Janela de dilogo que permite executar a funo count............................. 40 Figura 38: Janela de dilogo que permite dar a condio para proceder contagem. 40 Figura 39: Janela de dados resultante do procedimento Transform Count. ................ 41 Figura 40: Janela de dilogo que permite ordenar os dados de acordo com vrios critrios. .............................................................................................................. 42 Figura 41: Janela de dados resultante do procedimento Data Sort. ............................ 42 Figura 42: Janela de dilogo que permite executar o Split file. ................................... 43 Figura 43: Janela que exemplifica o Split file efectuado pela varivel sexo (gender). . 44 Figura 44: Janela de dilogo para seleccionar dados. ................................................ 45 Figura 45: Janela de dilogo para especificar a amostra aleatria.............................. 45 Figura 46: Janela de dados onde se mostra uma base de dados contendo a informao de altas verificadas num determinado hospital. ................................ 46 Figura 47: Tabela de frequncias da varivel dia da semana. .................................... 46 Figura 48 Menu Analyze > Descriptive Statistics > Frequencies .............................. 48 Figura 49 Janela de Frequncias ............................................................................. 49

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

Figura 50 Tabela de frequncias.............................................................................. 49 Figura 51 Tabela de Frequncias com casos omissos............................................. 51 Figura 52 Janela de Frequncias opo Format. .................................................. 52 Figura 53 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 52 Figura 54 Janela de Frequncias ............................................................................. 53 Figura 55 Frequencies: Statistics ............................................................................. 53 Figura 56 Estatsticas descritivas ............................................................................. 54 Figura 57 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 56 Figura 58 Janela de Frequncias ............................................................................. 56 Figura 59 Frequencies: Charts................................................................................. 57 Figura 60 Grfico de barras por frequncia absoluta ............................................... 57 Figura 61 Grfico de barras por frequncia relativa ................................................. 58 Figura 62 - Grfico circular.......................................................................................... 58 Figura 63 Histograma .............................................................................................. 59 Figura 64 Histograma com curva normal ................................................................. 59 Figura 65 Janela de edio de Grficos ................................................................... 60 Figura 66 Analyze / Descriptive Statistics / Descriptives .......................................... 61 Figura 67 Janela Descriptives .................................................................................. 61 Figura 68 Janela Descriptives / Options ................................................................... 62 Figura 69 Resultado do procedimento Descriptives ................................................. 62 Figura 70 Scores z................................................................................................... 63 Figura 71 Menu Explore........................................................................................... 64 Figura 72 Janela Explore ......................................................................................... 64 Figura 73 Boto Statistics na janela Explore ............................................................ 65 Figura 74 Explore: Statistics .................................................................................... 66 Figura 75 Estatsticas Descriptives do procedimento Explore para um grupo da categoria Primary Vehicle ................................................................................... 66

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

Figura 76 M-Estimators............................................................................................ 67 Figura 77 - Outliers ..................................................................................................... 67 Figura 78 Percentiles ............................................................................................... 67 Figura 80 Boto Plots na janela Explore .................................................................. 69 Figura 81 Plots em Explore ...................................................................................... 70 Figura 82 - Diagrama caixa e fio ................................................................................. 71 Figura 83 Boto Plots na janela Explore .................................................................. 72 Figura 84 Plots em Explore ...................................................................................... 72 Figura 85 Tabela do SPSS ...................................................................................... 74 Figura 86- Menu de configurao de tabelas .............................................................. 75 Figura 87 Pivoting Trays .......................................................................................... 76 Figura 88 Inserir informao numa nova camada .................................................... 76 Figura 89 Tabela com uma nova camada ................................................................ 77 Figura 90 Troca de linha para coluna....................................................................... 77 Figura 91 Tabela com varivel Primary vehicle em coluna....................................... 78 Figura 92 Opo Toolbar ......................................................................................... 78 Figura 93 Opo TableLooks ................................................................................... 79 Figura 94 Janela TableLooks ................................................................................... 79 Figura 95: Menu a seguir para efectuar o teste normalidade.................................... 81 Figura 96: Janela de dilogo no teste normalidade onde se colocam as variveis a testar e as que vo criar grupos. ......................................................................... 82 Figura 97: Janela onde se selecciona a opo para efectuar o teste normalidade... 83 Figura 98: Tabela de resultado do teste normalidade, que apresenta o nmero de casos vlidos, missings e totais. ......................................................................... 83 Figura 99: Tabela resultante do teste normalidade, com os dois testes KolmogorovSmirnov e Shapiro-Wilk....................................................................................... 84 Figura 100: Menu para efectuar o procedimento Compare Means-> Means............... 85

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

10

Figura 101: Janela de dilogo do procedimento Compare Means-> Means onde visvel onde se devero colocar as variveis dependentes e independentes. ..... 85 Figura 102: Janela de dilogo onde possvel seleccionar as estatsticas a pedir. .... 86 Figura 103: Tabela resultante o procedimento Compare Means-> Means onde se mostram nmero de casos includos, excludos e total........................................ 86 Figura 104: Tabela resultante do procedimento Compare Means-> Means onde se apresentam as estatsticas pedidas. ................................................................... 87 Figura 105: Menu para a execuo do procedimento Teste t para uma amostra. ....... 88 Figura 106: Janela de dilogo resultante da seleco do teste t para uma mostra onde possvel escolher qual a varivel e o valor a testar........................................... 88 Figura 107: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo. ............................................................................................................. 89 Figura 108: Tabela resultante do teste t para uma amostra onde se apresentam algumas estatsticas da varivel a testar. ............................................................ 90 Figura 109: Tabela resultante do teste t para uma amostra onde se apresenta entre outras informaes o valor p, do respectivo teste................................................ 90 Figura 110: Janela onde se efectuar uma partio de todos os procedimentos em funo da varivel sexo....................................................................................... 91 Figura 111: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar assim como o nvel de significncia........................................................... 92 Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso masculino e feminino). ........................................................................................ 92 Figura 113: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam entre outras informaes o valor p para os dois testes. ............................................................................................................................ 92 Figura 114: Menu para a execuo do teste t para amostras independentes.............. 93 Figura 115: Janela de Dilogo onde se devem especificar os grupos. ........................ 94 Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes na qual so visveis algumas estatsticas.................................... 94

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

11

Figura 117: Tabela resultante da realizao do teste t para duas amostras independentes na qual so mostrados os valores p assim como o intervalo de confiana para a diferena de mdias. ................................................................ 95 Figura 118: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas. .................................................................................................... 97 Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde so visveis algumas estatsticas................................................................ 98 Figura 120: Tabela resultante da realizao do teste t para amostras emparelhadas, onde visvel o coeficiente de correlao. .......................................................... 98 Figura 121: resultante da realizao do teste t para amostras emparelhadas, onde visvel o valor p, assim como o intervalo de confiana para a mdia das diferenas. .......................................................................................................... 98 Figura 122: Menu onde se encontram os testes no paramtricos. .......................... 101 Figura 123: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem indicar as variveis assim como os valores a testar............................... 102 Figura 124: Janela de dilogo onde se pode optar por um teste exacto ou por uma aproximao normal....................................................................................... 103 Figura 125: Janela de Dilogo onde se pode optar por pedir algumas estatsticas, assim como o tratamento aos missings............................................................. 104 Figura 126: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam valores observados e esperados, assim como os resduos............................... 105 Figura 127: Tabela resultante do teste do qui-quadrado do ajuste onde se apresenta o .......................................................................................................................... 105 Figura 128: Janela de dilogo para proceder realizao do teste do qui-quadrado para a independncia de variveis, onde se devero indicar quais as variveis a testar................................................................................................................. 107 Figura 129: Janela de dilogo onde se podem pedir algumas estatsticas relativas s variveis a testar no teste do qui-quadrado para a independncia de variveis107 Figura 130: Janela de dilogo onde se pode optar por quais as informaes a apresentar na clula da tabela de contingncia................................................. 108

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

12

Figura 131: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados. ............................................................................................................... 109 Figura 132: Tabela resultante do teste do qui-quadrado para independncia, onde se mostra o nmero de casos vlidos, missings e total.......................................... 109 Figura 133: Tabela de contingncia resultante da execuo do teste do qui-quadrado. .......................................................................................................................... 110 Figura 134: Tabela resultante da execuo do teste do qui-quadrado onde se mostram os valores prova. ............................................................................................... 110 Figura 135: Janela dilogo para a execuo do teste da binomial, onde se devem indicar as variveis assim como as propores a testar. ................................... 112 Figura 136: Tabela resultante do teste da binomial onde so visveis as propores observadas, a proporo a testar assim como o valor p.................................... 113 Figura 137: Janela de dilogo para a execuo de testes no paramtricos para amostras independentes, onde se deve indicar quais as variveis e grupos a testar................................................................................................................. 114 Figura 138: Tabela resultante do teste de Mann-Whitney onde se apresentam os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies............................................................................................................ 115 Figura 139: Tabela resultante do teste de Mann-Whitney, onde se apresenta o valor p. .......................................................................................................................... 115 Figura 140: Janela de dilogo para a execuo dos testes no paramtricos para amostras emparelhadas.................................................................................... 116 Figura 141: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma das posies. .......................................................................................... 118 Figura 142: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p. .... 118 Figura 143: Representao das possveis relaes lineares entre duas variveis. ... 120 Figura 144: Menu para a execuo da regresso linear. .......................................... 121 Figura 145:Janela de dilogo para a execuo da regresso linear onde se deve indicar quais as variveis dependente e independentes.................................... 122

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

13

Figura 146: Tabela resultante de uma regresso linear onde se apresentam os coeficientes. ...................................................................................................... 122 Figura 147: Tabela resultante de uma regresso linear mltipla onde se apresentam os coeficientes. ...................................................................................................... 123 Figura 148:Menu para a estimao da curva. ........................................................... 125 Figura 149:Tabela resultante da regresso linear onde se apresentam os coeficientes de determinao e correlao. .......................................................................... 126

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

14

1. Introduo ao SPSS para Windows.


O SPSS (Statistical Package for Social Sciences Pacote Estatstico para as Cincias Sociais) uma Soluo modular para anlise estatstica de dados, incluindo poderosos sistemas de gesto de dados e de aplicao de procedimentos estatsticos num ambiente grfico, utilizando menus e caixas de dilogo de utilizao muito fcil, segundo a empresa Produtos e Servios de Estatstica, Lda, que detm o direitos de comercializao em Portugal deste software. Este software foi inventado, nos Estados Unidos, por Norman H. Nie, C. Hadlai (Tex) Hull e Dale H. Bent e desde a sua primeira verso, em 1968, j foram desenvolvidas doze novas verses. Este software, alm da sua aplicao nas Cincias Sociais para onde foi inicialmente concebido, tambm usado em pesquisas relacionadas com sade e educao, pesquisas governamentais e de mercado e inmeros outros sectores. O primeiro manual de usurio foi publicado em 1970 por Nie e Hall. A primeira verso do SPSS para computadores pessoais surgiu em 1984.

1.1. Opes gerais do programa


Para entrar no SPSS basta fazer um duplo clique no cone SPSS. Aparecer uma janela, como exemplificado a seguir:

Figura 1: Janela de entrada no SPSS.

Onde se ter que escolher uma das opes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

15

Tambm podemos abrir uma sesso do SPSS fazendo duplo clique sobre o cone correspondente o qualquer arquivo do tipo SPSS: de dados: tm extenso .sav e esto no formato SPSS de grficos: tm extenso .cht (grfico de barras, histograma, etc.) de texto: tm extenso .sps (arquivo de sintaxe)ou .lst (arquivo de resultados).

1.2. Janelas do SPSS


Basicamente a aplicao SPSS dispe de trs janelas onde os dados e os resultados estatsticos podem ser criados e manipulados ou exibidos. A janela de edio de dados, a janela de exibio de resultados e grficos, e a janela de edio de grficos. O editor de dados activa uma janela com uma estrutura semelhante a uma folha de clculo clssica que contm o arquivo de dados que estamos a utilizar. Esta janela abre-se automaticamente ao iniciar a sesso do SPSS.

Figura 2: Janela de Edio de Dados.

A janela de exibio de resultados e grficos onde aparecem os resultados das anlises realizadas com o programa. Podemos arquivar os resultados para utilizao posterior.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

16

Figura 3: Janelas de Edio de Dados, de Resultados e de Sintaxe.

A janela de grficos permite modificar e guardar grficos e arquivos com extenso .cht.

Figura 4: Janela de Edio de Grficos.

Existe ainda uma outra janela que a janela de sintaxe onde podemos colar os comandos seleccionados a partir de qualquer caixa de dilogo que corresponde efectuao de uma ou mais anlises estatsticas. Podemos guardar estes comandos num ficheiro de sintaxe (com extenso .sps) o que nos permite aplicar as mesmas anlises estatsticas a ficheiros de dados com igual estrutura.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

17

Figura 5: Janela de Sintaxe.

1.3. Menu principal. Barra de ferramentas. Barra de estado.


O conjunto de comandos disponvel na barra de menus e na barra de ferramentas permite manipular ficheiros de dados (criar, editar, transformar, gravar e imprimir), realizar procedimentos estatsticos e criar grficos.

Figura 6: Barras de menus e ferramentas.

Menu principal.
A partir deste menu acedemos maioria das funes do SPSS. O menu principal tem dez opes: File- criar um novo ficheiro SPSS, abrir um existente, guardar, ler dados criados com outra aplicaes, etc. Edit- contm as habituais opes do Windows para copiar dados, procurar, etc. View- permite alterar o aspecto da janela de edio de dados.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

18

Data- contm opes para efectuar mudanas que afectam todo o arquivo de dados (unir arquivos, transpor variveis e casos, criar subconjuntos de casos, etc.). Estas mudanas so temporrias enquanto no se guarda explicitamente o ficheiro.

Transform- efectua mudanas sobre as variveis seleccionadas, permite a criao de novas variveis.

Analyze- a partir desta opo so executados todos os procedimentos estatsticos.

Graphs- grficos de barras, histogramas, etc. Utilities- obter informao completa do arquivo de dados, aceder a um ndice de comandos do SPSS, etc.

Window- ordenar, seleccionar, controlar atributos das janelas abertas. Help- permite aceder ajuda da aplicao.

Barra de ferramentas.
Situada abaixo da barra do menu principal, a barra de ferramentas exibe um conjunto de cones que, uma vez activados com o rato, realizam os procedimentos mais frequentes. Colocando o rato sobre o cone, exibida uma descrio sobre a tarefa activada. Tanto a barra de ferramentas como a de estado se podem activar ou desactivar a partir da opo do menu View/Toolbar ou Status Bar. Tambm podemos mudar o tamanho dos cones com a opo View/Toolbar.

Barra de estado.
Situada na base da janela da aplicao, indica o estado actual do processo e as seguintes informaes complementares: O nmero de casos processados. Filtro de dados, se utilizarmos somente uma parte do arquivo de dados. apresentada a mensagem Filter on. Varivel ponderada, se utilizarmos o critrio de ponderao. apresentada a mensagem Weight on.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

19

Segmentao de dados, se trabalharmos com o arquivo de dados dividido em subgrupos a partir de uma ou mais variveis de agrupamento. apresentada a mensagem Split File on.

1.4. Procedimento estatstica.

bsico

para

uma

anlise

de

Para levar a cabo qualquer tipo de anlise com SPSS necessrio efectuar estas trs operaes bsicas: 1. Seleccionar uma base de dados 2. Seleccionar o procedimento estatstico pretendido (menu principal) 3. Seleccionar as variveis a incluir na anlise e outros parmetros adicionais (que surgem nas caixas de dilogo)

1.5. Grficos.
A representao em grficos dos dados de tabelas, quadros e folhas de clculo propicia uma leitura fcil e sedutora da informao. A informao estatstica representada em grficos apreendida pelo destinatrio de uma forma fcil e intuitiva. Para alm dos grficos de utilizao corrente, acessveis em qualquer folha de clculo, o aplicativo SPSS apresenta formatos particulares de grficos de grande qualidade visual, adequados, quer representao de informao especfica, quer ao resumo de grandes quantidades de informao. Em termos gerais, em SPSS, os grficos so estruturados do seguinte modo: 1. Em funo da natureza da varivel estatstica nominal, dicotmica ou contnua. 2. Do nmero de variveis a representar no mesmo grfico. 3. Da natureza independente ou encaixada dos dados a representar. Decorrentes dessa estrutura, em termos genricos, os grficos do SPSS podem ser tipificados de duas formas: 1. Considerando o nmero de variveis a representar no grfico:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

20

Grfico com medidas (de localizao ou disperso) de duas ou mais variveis contnuas.
10
3,5

Grfico de uma varivel.

6
3,4

3,3

2 Std. Dev = ,91 Mean = 3,3 0 N = 20,00 2,0 3,0 4,0 5,0

Mean

3,2 CLAS_MAT CLA_POR

CLAS_MAT

Figura 7: Grfico com a representao de duas variveis.

Figura 8: Grfico com a representao de uma varivel.

2. Considerando representadas:

natureza

independente

ou

encaixada

das

variveis

Grfico simples Alturas dos alunos de uma turma.

Grficos encaixados Notas em matemtica dos rapazes e raparigas de uma turma.

10

8
5

4
2

SEXO
Std. Dev = 9,23 Mean = 164,5 0 150,0 160,0 170,0 180,0 N = 20,00

Count

Masculino Feminino 2,00 3,00 4,00 5,00

ALTURA

CLA_POR

Figura 9: Grfico Simples.

Figura 10: Grfico encaixado.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

21

Uma proposta de resumo dos grficos mais populares em SPSS a apresentada no quadro seguinte: Tipos de variveis Tipos de grficos

Resumo dos valores de uma varivel nominal Grfico de barras ou quantitativa discreta Casos individuais. Grfico de linhas Grfico circular Grfico de rea Grfico pareto Estatsticas contnuas de duas ou mais variveis Grfico de barras Grfico de linha Grfico circular Boxplot Variveis contnuas Boxplot Histograma Diagrama de caule-e-folhas A aplicao SPSS apresenta um conjunto de formatos de grfico susceptveis de ser configurados em funo da natureza da varivel ou variveis que se pretendem representar. Quando se cria um grfico no menu Graph, exibida uma caixa de dilogo onde se realizam as seleces adequadas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

22

2. Arquivo de Dados
Os dados so uma parte fundamental do processo de anlise estatstica, o SPSS possibilita, para alm da anlise estatstica dos dados, o armazenamento. Este armazenamento pode ser encarado sobre duas perspectivas; conforme os dados so organizados pela primeira vez no SPSS, e se cria a base de dados no programa, ou se a informao j foi de alguma forma organizada, e o armazenamento apenas temporrio, i.e., apenas do tempo de anlise.

2.1. Arquivo de Dados em SPSS


Criar um arquivo
Criar um arquivo de dados no SPSS onde se faa o registo da informao, ou seja onde se crie uma nova base de dados, pode ser conseguido atravs do menu File New Data. Uma nova janela de dados (Data Editor) em branco

disponibilizada.

Figura 11: Menu para a criao de uma nova janela de edio de dados.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

23

Abrir um arquivo
Para File abrir Open um Data arquivo de dados j existentes, basta aceder ao menu

Figura 12: Menu para abrir uma base de dados j existente.

Ou aceder ao cone disponvel na barra de ferramentas

Figura 13: cone para abrir uma base de dados.

Em qualquer um dos casos aparecer uma janela de dilogo onde dever ser indicada a directoria, ou pasta onde se encontra o ficheiro pretendido, assim como o tipo de ficheiro que o arquivo e finalmente o seu nome.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

24

Figura 14: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.

Tipos de arquivos que o SPSS reconhece De entre os tipos de arquivos que o SPSS reconhece esto os ficheiros Excel (*.xls), os ficheiros gravados em dBase (*.dbf) e os ficheiros de texto (*.txt). A extenso dos ficheiros gravados em SPSS sav. O software ir ler dos ficheiros Excel e dBase, o nome das variveis, que devero cumprir certos requisitos (ver seco 2.2.1.), assim como abrir casos e linhas conforme o n. de colunas e linhas ocupadas. Os ficheiros de texto so importados com ajuda de um Wizard, que vai guiando cada passo e que possibilita a importao de ficheiros de dados delimitados por vrgulas, espaos, etc.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

25

Figura 15: Janela de dilogo com Wizard para a importao de dados para SPSS.

Guardar um arquivo
As alteraes feitas sobre um ficheiro s so vlidas durante a sesso de SPSS em que so feitas, a no ser que o ficheiro seja gravado. Tal pode ser conseguido atravs do menu File Save. O ficheiro alterado guardado por cima do existente.

Figura 16: Menu para guardar um ficheiro.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

26

Uma outra forma de guardar arquivos atravs do menu File

Save as, onde se deve

indicar o tipo de ficheiro e o nome que queremos dar ao ficheiro.

Informao sobre arquivos de dados


possvel aceder a informao sobre nome de todas as variveis, formato das variveis assim como informao acerca das etiquetas que as descrevem e os seus valores, de um ficheiro que se encontre aberto, atravs do menu Utilities File Info. A

execuo deste menu produz um ficheiro de output contendo toda a informao acima referida. Uma outra forma de aceder a informao sobre uma varivel atravs do cone presente na barra de ferramentas.

Figura 17: cone para aceder informao acerca de uma varivel.

Finalmente possvel obter informao acerca de um ficheiro que no esteja aberto atravs do menu File Display Data Info.

2.2. Janela de edio de dados


A janela de edio de dados composta por duas janelas: a janela Data View e a janela Variable View. A primeira contm a informao sobre os dados dos casos em estudo a segunda a informao acerca das variveis.

Figura 18: Janela de Data View.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

27

Figura 19: Janela de Variable View.

Definio de variveis
Esta definio feita na janela de edio de dados na janela variable view. Nesta janela cada linha contm informao de uma varivel, informao essa que definida atravs das colunas. Name: deve ser indicada o nome da varivel, este nome estar presente numa coluna da janela data view. Este nome deve seguir determinadas regras: Mximo 8 caracteres; Devem comear por uma letra e no acabar num ponto; No sero aceites nomes em duplicado (o programa no distingue maisculas de minsculas, o que significa que as variveis exp e EXP tm o mesmo nome); Type: deve ser indicado o tipo de varivel, de uma escolha que o programa oferece na maioria dos casos os tipos utilizados so o tipo numrico (Numeric) e o data (Date), visto que mesmo que a natureza da varivel seja string possvel codific-la atravs de um cdigo numrico.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

28

Figura 20: Janela de dilogo para definir o tipo de varivel.

Width: este campo corresponde dimenso da varivel, define o n mximo de algarismos ou caracteres que o valor da varivel pode tomar. Pode ser preenchido na janela variable view na coluna respectiva ou ento na janela de dilogo do tipo. Decimals: deve indicar-se o n. de casas decimais que a varivl pode tomar caso seja do tipo numrica. Do mesmo modo do campo width pode ser preenchido na janela variable view na coluna respectiva ou ento na janela de dilogo do type. Label: no um campo obrigatrio mas pode ser de extrema utilidade. Por exemplo, pode conter o nome por extenso da varivel que devido ao facto de poder conter apenas 8 caracteres pode no ser explcito. Pode conter, por exemplo, a unidade na qual a varivel est medida. Values: onde indicado o cdigo utilizado para introduzir os valores da varivel. Por exemplo: suponha-se que, para simplificar a introduo, se definia o valor 1 para o sexo masculino e 2 para o sexo feminino, ento aqui que se deve informar o sistema deste cdigo.

Figura 21: Janela de dilogo para introduzir valores para a varivel.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

29

Missing: onde se informa o sistema que um determinado valor representa uma situao anmala e no um valor aceitvel para a varivel. Este missing designado user-missing, uma vez que o utilizador se d conta e informa o sistema sobre essa possibilidade. Existem tambm system-missing, quando o sistema no informado sobre a situao (qualquer clula em branco). Por exemplo, quando um indivduo responde a um questionrio e no responde a uma questo o utilizador pode deixar essa clula em branco (system-missing) ou informar o sistema que quando for introduzido um valor fora da gama admitida para a varivel ele deve interpretar como uma no resposta. Estes missings podem ser definidos de duas formas:

Figura 22: Janela de dilogo para definir missings.

Atravs de pelo menos 3 valores discretos; Atravs de um intervalo de valores acrescido de um valor discreto.

Para se informar o sistema acerca do que significam tais valores deve ser usada a coluna values. Columns: contm a definio do tamanho da coluna que conter a informao da varivel na janela data view. Align: onde se define qual o alinhamento da informao da coluna que conter a informao da varivel na janela data view. Pode ser alinhamento esquerda, direita ou ao centro. Measure: onde se indica a escala de medida da varivel, pode ser Nominal ou Ordinal para as variveis qualitativas e Scale para as variveis quantitativas. NOTA (importante): A correcta definio das caractersticas das variveis essencial e pode comprometer, se no for feita correctamente, a anlise a efectuar na varivel.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

30

Entrada de dados
A edio de dados feita na janela Data View. Nesta janela: As linhas correspondem a casos, i.e., suponha-se que queremos introduzir os dados de um questionrio respondido por um certo n. de indivduos, cada linha corresponder informao contida num questionrio. As colunas correspondem as variveis. As clulas, que so o cruzamento dos casos com as variveis, contero a informao desse caso relativo a essa varivel. necessrio prudncia para no ter casos e variveis abertas que no contenham informao, pois sero consideradas para as variveis numricas, system-missings e para as variveis string sero consideradas vlidas e consideradas para anlise.

Edio de Dados
possvel modificar total ou parcialmente o contedo de uma clula basta para isso seleccion-la. possvel apagar e copiar clulas, deve ter-se ateno quando se copia valores de clulas para que a clula destino tenha as mesmas caractersticas (type,). possvel inserir casos e variveis atravs do menu Data Insert.

Figura 23: Menus para inserir casos e variveis.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

31

possvel retirar casos ou variveis atravs do menu Edit

Clear. Go

possvel encontrar um caso sem ser sequencialmente, atravs do menu Data to Case. Ou atravs do cone que se segue ,presente na barra de ferramentas.

Figura 24: cone para posicionar-se num determinado caso.

possvel encontrar dados atravs do menu Edit segue, presente na barra de ferramentas.

Find, ou atravs do cone que se

Figura 25: cone para encontrar dados.

2.3. Transformaes sobre os dados


Criao de variveis
Para alm da criao das variveis atravs da janela variable view, o SPSS possibilita a criao de variveis novas atravs de transformaes nas j existentes. O menu Transform Compute atribui valores a uma varivel nova, cujo nome deve

ser indicado na target variable, atravs de transformaes executadas noutras variveis j existentes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

32

Figura 26: Janela de dilogo para criar variveis atravs de transformaes noutras.

Essas transformaes devem ser definidas atravs da construo da expresso numrica (numeric expression). Nesta expresso numrica podero constar variveis existentes no ficheiro, constantes, operadores aritmticos e uma gama de funes, disponibilizadas pelo software, como o valor absoluto, o logaritmo, funes que transformam variveis com valores em segundos em valores em minutos ou horas, como se pode verificar atravs do exemplo 1. Exemplo1 No ficheiro Cars 1, encontra-se a varivel accel, que guarda o tempo de acelerao das 0 s 60 milhas por hora, como visvel na janela que se segue.

Este ficheiro disponibilizado com o software SPSS, pode ser acedido (a no ser que se

tenha procedido a alguma mudana de ficheiros) na pasta do SPSS que abre por defeito.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

33

Figura 27: Janela com a informao acerca de uma varivel do ficheiro Cars.

Suponha, agora que pretende alterar o tempo de acelerao para milhas por minuto, ento o que deveria fazer era, por exemplo, criar uma varivel nova, design-la, por exemplo, accel_mi, e igual-la funo CTIME.MINUTES, com argumento accel.

Figura 28: Janela de dilogo para criar varivel accel_mi em funo da varivel accel presente no ficheiro Cars.

(Continua) O boto Type & Label permite ao utilizador a especificao do tipo e atribuio de labels, de igual forma ao exposto no ponto 2.2. Uma opo importante nesta operao a opo disponibilizada pelo boto If, que permite efectuar a alterao apenas aos casos que verifiquem a condio indicada pela expresso.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

34

Exemplo1 (Continuao): Suponha que no exemplo, queremos apenas criar a nova varivel accel_mi, quando o ano do carro for o ano 70. Ento o procedimento a seguir seria na janela disponibilizada pelo boto If, inserir a condio year=70 (year, varivel que guarda o ano do automvel)

Figura 29: Janela de dilogo que permite seleccionar casos onde a transformao vai ser efectuada.

Recodificao de variveis
Este procedimento possibilita a substituio dos valores de uma varivel por outros. O SPSS possibilita esta transformao de duas formas uma das quais automtica. Atravs do menu Transform Automatic Recode, o programa permite a

transformao dos valores de uma varivel noutros automaticamente. Um dos exemplos mais teis na utilizao deste menu, a transformao de uma varivel string em numrica, cujo nome deve ser explicitado na janela que resulta da execuo desta opo. Automaticamente, o programa criar uma janela de output onde dar informao ao utilizador de qual a codificao que realizou. Exemplo 2

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

35

Suponha que no ficheiro flying2, que queria transformar a varivel cityname, do tipo string numa varivel numrica de nome city_2. Este nome dever ser introduzido no rectngulo em branco mais pequeno e depois para que o nome seja aceite deve ser pressionado o boto New Name.

Figura 30: Janela de dilogo para a recodificao automtica da varivel cityname.

O output criado pelo SPSS o seguinte, onde se podem ver os valores antigos, os novos valores e as suas etiquetas. Como se pode observar o software codificou tambm as clulas vazias, os missings.

Figura 31: Resultado da recodificao automtica da varivel cityname.

(Continua)
2

De igual modo o ficheiro encontra-se (a no ser que se tenha procedido a alguma mudana

de ficheiros) na pasta do SPSS que abre por defeito.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

36

Atravs

do

menu

Transform

Recode,

programa

possibilita

tambm,

recodificao, no entanto o utilizador que dever dar indicaes de como essa recodificao ser feita. Este menu possibilita, ele prprio, duas possibilidades: a recodificao Into Same Variables e a recodificao Into Different Variables. A diferena entre as duas possibilidades apenas o lugar onde se guarda a nova codificao, na primeira possibilidade o novo cdigo guardado na varivel original, na segunda o novo cdigo guardado numa nova varivel, cujo nome dever ser indicado na janela possibilitada pelo menu Transform Recode Into Different

Variables. Em ambas as opes existe a possibilidade de realizar as transformaes apenas a alguns casos, aqueles que verificam uma determinada condio que dever ser definida atravs do boto If atravs do boto Old and New Values que o novo cdigo dever ser definido.

Figura 32: Janela de dilogo para a indicao do novo cdigo.

Existem, duas zonas na janela que decorre do boto Old and New Values; uma para a zona dos antigos valores e uma zona para os novos valores. Old Value: Value: o valor antigo a ser codificado; System-missing: se seleccionarmos esta opo recodifica-se os missing de sistema; System-or user-missing: se seleccionarmos esta opo recodifica-se os missing de sistema e os do utilizador;

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

37

Range: through: atravs desta opo pode ser recodificada toda uma gama de valores, indicando o valor mais baixo e o mais alto. Range: Lowest through: atravs desta opo pode ser recodificada toda uma gama de valores desde o valor mais baixo at a um valor indicado. Range: through highest: atravs desta opo pode ser recodificada toda uma gama de valores desde um valor indicado at o maior valor. All other values: nesta opo esto englobados todos os valores no includos nas situaes anteriores.

New Value: Value: onde dever ser indicado o novo valor; System-missing: os novos valores sero desconhecidos do sistema; Copy old value: os valores antigos vo ser iguais aos novos. importante referir que se existirem valores que se mantm eles devem ser referidos seno sero excludos na nova varivel. Esta opo s est presente na opo Into Different Variables. Exemplo 2 (Continuao): Suponha que agora quer recodificar a varivel city_2, numa nova varivel city_3, do seguinte modo: missing Todos os outros valores 99 igual

Ento dever recorrer opo Into Different Variables, nos Old and New Values dever definir os novos valores usando os System-missing nos old values

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

38

Figura 33: Janela onde exemplificada a recodificao dos missings.

Outras Transformaes
O menu Transform Categorize Variables tambm possibilita a criao de categorias, mas de uma forma automtica, o utilizador s tem a possibilidade de especificar o nmero de categorias a criar. Este procedimento til para agrupar dados de uma varivel contnua, pois nem sempre fcil neste tipo de varivel a explicitao das categorias, assim basta ao utilizador dizer qual o nmero de categorias a criar e criada uma varivel contendo as categorias. O utilizador deve atravs de uma tabela de frequncia, por exemplo, analisar quais os limites das classes criadas e criar rtulos.

Figura 34: Janela de dilogo para criar categorias de forma automtica.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

39

Atravs do menu Transform

Count possibilita a criao de uma nova varivel que

contm, por cada caso, o nmero de vezes que um determinado valor apareceu nas variveis seleccionadas. Exemplo 3: Suponha que tem um ficheiro de SPSS que contm para cada ms e para cada zona, o nmero de mortes por acidente, por causa natural e o nmero de acidentes devido a doena prolongada.

Figura 35: Janela de dados onde se mostra um exemplo de uma determinada base de dados.

Suponha que quer saber quantas vezes o n. de mortes devido a cada uma das causas foi superior a 100 em cada ms e em cada zona. Ento poder aceder ao menu Transform Count, onde dever explicitar o nome da nova varivel, assim

como o nome das variveis onde pretende que o programa procure a condio que dever ser definida atravs do boto Define Values.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

40

Figura 36: Janela de dilogo que permite executar a funo count.

Figura 37: Janela de dilogo que permite dar a condio para proceder contagem.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

41

Figura 38: Janela de dados resultante do procedimento Transform Count.

(Continua) Nota: Em todos estes procedimentos que resultam na criao de novas variveis se dever proceder confirmao de todas as caractersticas da varivel criada na janela Variable View.

2.4. Manipulao de arquivos


De seguida, expor-se-o alguns procedimentos que permitem a manipulao de arquivos de dados, como o caso do procedimento disponibilizado no menu Data Sort Cases, que permite ordenar os casos atravs das caractersticas de uma

ou mais variveis. A primeira varivel determina a primeira ordenao, as restantes determinam as ordenaes dentro da primeira ordenao. Exemplo 3 (Continuao): Suponha que pretende organizar o ficheiro por ordem crescente de nmero de mortos por acidente e dentro desta ordenao pretende ordenar por ordem crescente de nmero de mortos devido a uma causa natural. Ento deveria proceder da seguinte forma:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

42

Figura 39: Janela de dilogo que permite ordenar os dados de acordo com vrios critrios.

Figura 40: Janela de dados resultante do procedimento Data Sort.

Atravs do menu Data

Split File possvel separar o ficheiro de dados em grupos

definidos pelos valores de uma ou mais variveis. Este procedimento importante quando existe a suspeita da diferena entre determinados grupos, pois possibilita que toda a anlise seja feita para cada grupo em separado. Vejamos a janela disponibilizada pelo menu Data Split File:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

43

Figura 41: Janela de dilogo que permite executar o Split file.

Analyze all cases, do not create groups: desactiva qualquer separao feita anteriormente; esta opo est por defeito seleccionada, antes de qualquer diviso; Compare groups: separa o ficheiro em grupos de modo a efectuar comparaes; Organize output by groups: qualquer procedimento produzir outputs separados para cada grupo; Groups Based on: aqui que se dever indicar quais as variveis que serviro para criar os grupos, caso sejam introduzidas mais do que uma o programa agrupar pela ordem de introduo. Sort the file by grouping variables: Ordena o ficheiro por grupos; File is already sorted: d-nos a indicao se o ficheiro j se encontra ou no ordenado; Na parte inferior desta janela encontra-se uma indicao de como o ficheiro se encontra, Current Status. Exemplo 4:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

44

Suponha que pretende analisar as diferenas entre sexos dos empregados de uma determinada firma, cuja informao se encontra guardada no ficheiro Employee Data3. Ento a varivel que ir criar grupos ser a varivel Gender, como se pode ver na figura seguinte.

Figura 42: Janela que exemplifica o Split file efectuado pela varivel sexo (gender).

Atravs do menu Data

Select Cases possvel seleccionar um grupo de casos a

partir de um critrio que pode incluir variveis e expresses mais complexas. possvel atravs deste menu seleccionar uma amostra aleatria. Este procedimento possibilita a opo de apagar os casos que no satisfaam as condies (unselected cases are: deleted) ou apenas no os incluir na anlise (unselected cases are: filtered).

Este ficheiro tambm disponibilizado pelo SPSS.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

45

Figura 43: Janela de dilogo para seleccionar dados.

No caso da seleco de uma amostra aleatria ento o utilizador tem a opo de indicar qual a percentagem de casos a incluir na amostra ou a possibilidade de indicar o nmero exacto de casos a escolher dos primeiros x (nmero tambm a indicar pelo utilizador).

Figura 44: Janela de dilogo para especificar a amostra aleatria.

Sempre que este procedimento for efectuado criada uma nova varivel filter constituda apenas de 0 (zeros) e 1 (uns), conforme o caso no pertena ou pertena amostra. Atravs do menu Data Weight Cases possvel criar uma ponderao cujos valores

representam o nmero de casos observados.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

46

Exemplo 5: Suponha que possui um ficheiro de dados contendo a seguinte informao relativa s altas verificadas num determinado Hospital.

Figura 45: Janela de dados onde se mostra uma base de dados contendo a informao de altas verificadas num determinado hospital.

Se proceder ponderao da varivel dia da semana atravs da varivel altas, ento esta ltima passa a ser a frequncia da primeira, como visvel se procedermos execuo de uma tabela de frequncias.

Figura 46: Tabela de frequncias da varivel dia da semana.

Note que se no procedermos ponderao teramos que introduzir o Domingo 20 vezes, a Segunda 175, a Tera 655, procedendo de igual forma para os restantes dias da semana.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

47

3. Estatstica Descritiva
A anlise estatstica univariada inicia o tratamento estatstico e deve ter em conta a tabela de frequncias, a representao grfica da distribuio da varivel e as estatsticas apropriadas ao resumo dos dados em questo.

3.1. Medidas de Estatstica Descritiva


As medidas de estatstica descritivas apropriadas ao resumo dos dados dependem da escala de medida da varivel a analisar. A seguinte tabela apresenta, resumidamente, as estatsticas apropriadas a cada tipo de varivel.
Medidas de tendncia central Escala intervalar Mdia Moda Mediana Desvio-padro Varincia Medida de curtose Percentis Desvio interquartis Intervalo interquartis Intervalo absoluto Coeficiente de variao Score z Escala ordinal Moda Mediana Percentis Desvio interquartis Intervalo interquartis Intervalo absoluto Escala nominal Moda Medidas de disperso Medidas da forma global da distribuio Coeficiente de assimetria de Pearson

ou escala racional

Tabela 1 Medidas estatsticas apropriadas aos vrios tipos de variveis

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

48

3.2. Frequncias
O procedimento Analyze/Descriptive Statistics/Frequencies permite obter informao sobre a distribuio dos valores da varivel atravs de tabelas de frequncias, de estatsticas descritivas e grficos. Este procedimento til para uma primeira anlise de qualquer tipo de varivel. A informao aqui obtida pode ajudar a determinar os valores tpicos das variveis (Que valores so mais frequentes? Qual a gama de valores que uma varivel toma?), a verificar o cumprimento de determinadas assumpes necessrias para

procedimentos estatsticos (Existe um nmero suficiente de observaes? A distribuio da varivel adequada?) e a avaliar a qualidade dos dados (Existem valores omissos ou mal introduzidos? Existem valores que necessitam de ser recodificados?).

Tabela de Frequncias
A tabela de frequncias distribui os valores da varivel em frequncias simples e acumuladas, que podem ser absolutas ou relativas. Para criar uma tabela de frequncias no SPSS: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Figura 47 Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar a(s) varivel(is) que se pretende(m) analisar da lista de variveis que aparece no lado esquerdo e atravs da seta, coloca-la no lado direito.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

49

Figura 48 Janela de Frequncias

3. Seleccione a caixa de seleco Display frequency table. Por omisso, esta caixa encontra-se seleccionada. 4. Clicar em OK. Na janela de sada sero apresentadas duas tabelas.

Figura 49 Tabela de frequncias

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

50

A primeira (Statistics), apresenta o nmero de casos vlidos e casos omissos (missing). A segunda tabela a tabela de frequncias propriamente dita. Para os vrios valores que a varivel toma, so apresentados as seguintes frequncias:
Frequency (frequncia simples e absoluta) nmero de casos para um

determinado valor (ou conjunto de valores) da varivel. Por exemplo, no caso apresentado, 1390 pessoas no completaram o ensino secundrio.
Percent (frequncia simples e relativa) - percentagem do nmero de casos

em relao ao nmero total de casos (incluindo casos omissos). No caso apresentado, a % de pessoas que completou o ensino secundrio de 21,7%, valor que se obtm do quociente 1390/6400, sendo 6400 o nmero de casos total (vlidos + omissos).
Valid Percent (frequncia simples e relativa) percentagem do nmero de

casos em relao ao nmero de casos vlidos. No caso apresentado, o nmero de casos vlidos igual ao nmero de casos total, pelo que a percentagem vlida igual percentagem.
Cumulative Percent (frequncia acumulada e relativa) percentagem

acumulada at ao respectivo valor ou categoria, excluindo valores omissos. A ttulo de exemplo, apresenta-se de seguida uma tabela de frequncias para uma situao onde existem casos omissos. Verifique-se na diferena entre a percentagem e a percentagem vlida e numa nova linha no final da tabela para os casos omissos.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

51

Figura 50 Tabela de Frequncias com casos omissos

Na janela de frequncias, na opo Format (ver figura 5), existem vrias opes que permitem ordenar segundo diferentes critrios a tabela de frequncias: Ascending Values organiza a tabela de acordo com os valores das variveis em ordem ascendente (do menor para o maior valor). Descending Values - organiza a tabela de acordo com os valores das variveis em ordem descendente. Ascending Counts - organiza a tabela de acordo com as frequncias de ocorrncia dos valores das variveis em ordem ascendente (do menos frequente para o mais frequente). Descending Counts - organiza a tabela de acordo com as frequncias de ocorrncia dos valores das variveis em ordem descendente.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

52

Figura 51 Janela de Frequncias opo Format.

Estatsticas Descritivas
Atravs do procedimento
Analyze/Descriptive Statistics/Frequencies

tambm possvel calcular vrias estatsticas de tendncia central, de disperso e de forma da distribuio. Para o clculo destas estatsticas, fazer: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Figura 52 - Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar as variveis pretendidas e seleccionar a opo


Statistics.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

53

Figura 53 Janela de Frequncias

3. Surge ento uma nova janela, onde se podero escolher as estatsticas pretendidas.

Figura 54 Frequencies: Statistics

4. Quando estiverem seleccionadas todas as estatsticas pretendidas, deve-se clicar em Continue. 5. Na janela Frequencies, ento visvel, remover a seleco da opo Display
frequency table, para no ser apresentada a tabela de frequncias.

6. Clicar em OK. Na janela de sada de dados ir surgir uma tabela semelhante a:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

54

Figura 55 Estatsticas descritivas

As vrias estatsticas disponveis atravs deste procedimento so descritas de seguida:


Quartiles (Quartis) calcula o percentil 25, percentil 50 (mediana) e o

percentil 75.
Cut Points for n equal groups (Pontos de corte para n grupos iguais)

apresenta os valores da varivel que divide a amostra em n grupos com o mesmo nmero de casos. Depois de seleccionar esta estatstica o utilizador dever inserir o nmero (entre 2 e 100) de grupos pretendido. Por omisso, a distribuio dividida em 10 grupos iguais.
Percentiles (Percentis) calcula os percentis inseridos pelo utilizador. Para

inserir um percentil o utilizador dever seleccionar a caixa de seleco associada estatstica, inserir o valor do percentil desejado e fazer Add.
Std. Deviation (Desvio padro) Apresenta uma medida da disperso em

redor da mdia.
Variance (Varincia) Calcula a soma do quadrado dos desvios em relao

mdia dividida pelo nmero de casos menos 1.


Range (Intervalo absoluto) Calcula a diferena entre o valor mais alto e o

valor mais baixo.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

55

Minimum (Mnimo) Apresenta o menor valor. Maximum (Mximo) Apresenta o maior valor. S.E. mean (Erro padro mdio) Apresenta uma estimativa da variabilidade

amostral em relao mdia. O seu clculo obtm-se atravs do quociente entre o desvio padro amostral e a raiz quadrada da dimenso da amostra.
Mean (Mdia aritmtica) Devolve a soma de todos os valores dividido pelo

nmero total de casos.


Median (Mediana) Calcula o valor acima e abaixo do qual se encontram

metade dos valores da varivel.


Mode (Moda) Calcula o valor que ocorre mais frequentemente na distribuio. Sum (Somatrio) calcula a soma de todos os valores que a varivel toma. Skewness (Coeficiente de Assimetria) Apresenta uma medida relativa de

assimetria. Um sinal positivo indica um pico com uma cauda direita alongada e um sinal negativo uma cauda esquerda alongada. Se a distribuio for simtrica, esta medida tem o valor 0.
Kurtosis (Medida de curtose) apresenta uma medida que indica se a curva

achatada (valores negativos) ou alongada (valores positivos). Uma distribuio normal, tem uma medida de curtose igual a 0. Para mais esclarecimentos acerca de cada medida estatsticas, dever consultar a ajuda, clicando com o boto direito sobre o nome da medida estatstica em questo.

Grficos
Como j foi referido, o procedimento
Analyze/Descriptive

Statistics/Frequencies

tambm permite visualizar

o comportamento da(s)

varivel(is) graficamente, atravs de grficos de barras, grficos circulares e histogramas. Para criar um grfico utilizando este procedimento, fazer: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

56

Figura 56 - Menu Analyze > Descriptive Statistics > Frequencies

2. Na janela que surge, seleccionar as variveis pretendidas e seleccionar a opo Charts.

Figura 57 Janela de Frequncias

3. Na janela que surge, deve seleccionar-se o tipo de grfico pretendido. Nos grficos de barras e nos grficos circulares, existe a opo de elaborar o grfico com base nas frequncias absolutas (Frequencies) ou com base nas frequncias relativas (Percentages).

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

57

Figura 58 Frequencies: Charts

4. Depois de seleccionado o grfico pretendido, clicar em Continue. 5. Na janela Frequencies, ento visvel, remover a seleco da opo Display frequency table, para no ser apresentada a tabela de frequncias. 6. Clicar em OK. De seguida apresentam-se exemplos dos vrios tipos de grficos.

Figura 59 Grfico de barras por frequncia absoluta

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

58

Figura 60 Grfico de barras por frequncia relativa

Figura 61 - Grfico circular

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

59

Figura 62 Histograma

Figura 63 Histograma com curva normal

Para edio dos grficos gerados pelo SPSS, deve-se fazer um duplo-clique sobre o grfico, que provocar a abertura da janela de edio de grficos do SPSS:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

60

Figura 64 Janela de edio de Grficos

3.3. Clculo de estatsticas bsicas


O procedimento Analyze/Descriptive
Statistics/Descriptives

permite, tal

como o procedimento Analyze/Descriptive

Statistics/Frequencies, obter

algumas estatsticas descritivas. As variveis podem ser ordenadas pelo valor da sua mdia (ordem ascendente ou descendente), alfabeticamente ou pela ordem pela qual se selecciona as variveis no procedimento (opo por omisso). Para alm destas estatsticas, permite tambm calcular valores padro (scores z). Quando os valores padro so guardados, so adicionados janela de edio de dados e ficam disponveis para qualquer procedimento estatstico. Este procedimento til para obter comparaes de variveis quantitativas (intervalares ou racionais) e para identificar casos anormais entre as variveis atravs do clculo dos valores padro. Para executar este procedimento:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

61

1.

No menu Analyze escolher Descriptive Statistics / Descriptives

Figura 65 Analyze / Descriptive Statistics / Descriptives

2.

Na janela que surge, dever seleccionar as variveis que pretende

analisar. Se pretender guardar os valores padro das variveis, dever seleccionar a caixa Save standardized values as variables.

Figura 66 Janela Descriptives

3.

Para seleccionar as estatsticas clique em Options. Na nova janela,

poder tambm escolher a ordem pela qual pretende que sejam apresentados os resultados.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

62

Figura 67 Janela Descriptives / Options

4. Clique em Continue. Na janela que surge clicar em ok. Na janela de sada aparecer uma tabela com os valores de cada estatstica seleccionada para cada varivel.

Figura 68 Resultado do procedimento Descriptives

5. Caso tenha seleccionado a opo Save

standardized

values

as

variables sero criadas novas variveis, que aparecero nas ltimas colunas

da janela de edio de dados. Estas variveis tero o nome das variveis em anlise, antecedido pela letra z. No caso apresentado, as variveis em anlise chamam-se longmon e tollmon e as variveis criadas chamam-se zlongmon e
ztollmon.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

63

Figura 69 Scores z

3.4. Anlise exploratria


O procedimento Explore produz estatsticas sumrias e representaes grficas para todos os casos ou para grupos de casos separadamente. Atravs deste procedimento possvel: Examinar os dados e sua distribuio (detectar valores anormais, intervalos de dados vazios, outliers, variabilidades inesperadas e outras peculiaridades) Verificar o cumprimento de condies para a aplicao de procedimentos estatsticos (p.ex. para determinar se ser necessrio aplicar testes no paramtricos ou para determinar se ser necessrio transformar os dados para tcnicas que requeiram distribuies normais) Caracterizar as diferenas existentes entre diferentes grupos de casos.

Para executar o procedimento dever: 1. Escolher a opo Analyze/Descriptive Statistics/Explore.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

64

Figura 70 Menu Explore

2. Na janela que surge, dever escolher as variveis a analisar e coloca-las na caixa


Dependent List. As variveis a analisar tm de ser numricas. Para produzir

anlises separadas por grupos de casos, dever introduzir na caixa Factor List as variveis segundo as quais pretende fazer o agrupamento. Se introduzir mais do que uma varivel na caixa Factor List, sero apresentados resultados separados para cada varivel. Ainda nesta janela poder escolher o tipo de representao que pretende: estatsticas, grficos ou ambos.

Figura 71 Janela Explore

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

65

Estatsticas
Atravs do procedimento Explore possvel criar diversas estatsticas. Para tal, dever, a partir da janela Explore: 1. Seleccionar as variveis, seleccionar a opo Both ou Statistics em Display e clicar no boto Statistics.

Figura 72 Boto Statistics na janela Explore

2. Na janela que surge, poder escolher uma das seguintes opes: a. Descriptives para calcular as seguintes estatsticas: mdia, moda, trimdia a 5% (mdia calculada eliminando 5% das observaes mais baixas e 5% das observaes mais altas), erro padro, varincia, desvio padro, mnimo, mximo, intervalo absoluto, intervalo interquartil, coeficiente de assimetria, erro padro de assimetria, coeficiente de curtose, erro padro de curtose. b. M-estimators para calcular 4 alternativas de medidas de tendncia central (Huber's M-estimator, Andrews' wave estimator, Hampel's redescending Mestimator e Tukey's biweight estimator). Estas quatro medidas utilizam critrios distintos de ponderao dos casos, cujo peso vai diminuindo medida que os casos se afastam da mdia. Quando os dados provm de uma distribuio com longas caudas, ou quando existem outliers, estas medidas so mais precisas do que a mdia ou mediana. c. Outliers apresenta os casos com os 5 maiores valores e os casos com os 5 menores valores.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

66

d. Percentiles apresenta os seguintes percentis: 10, 25, 50, 75, 90, 95.

Figura 73 Explore: Statistics

e. Depois de seleccionadas as estatsticas pretendidas, dever fazer Continue e depois OK na janela Explore. Sero ento apresentados os resultados na janela de sada do SPSS.

Figura 74 Estatsticas Descriptives do procedimento Explore para um grupo da categoria Primary Vehicle

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

67

Figura 75 M-Estimators

Figura 76 - Outliers

Figura 77 Percentiles

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

68

Diagrama de caixa e fio (Boxplots)


Os diagramas de caixa e fio ou boxplots so uma representao grfica til para explorar e sumariar os dados, permitindo analisar as frequncias e identificar outliers, que tendem a distorcer a mdia e o desvio padro. D-nos tambm informao importante sobre o centro, disperso e assimetria dos dados. Como se pode observar no diagrama abaixo, a base inferior do rectngulo (caixa) o 1 quartil (percentil 25) e a base superior corresponde ao 3 quartil (percenti 75), ou seja, a caixa corresponde a 50% das observaes totais. A mediana (2 quartil ou percentil 50) representada pela linha dentro da caixa. O comprimento mximo dos bigodes vai at 1,5 vezes o valor da amplitude interquartil, abaixo do 1 quartil e acima do 3 quartil. As observaes que se situem para alm destes limites so representadas com um crculo ou um asterisco, consoante sejam respectivamente outliers moderados ou severos. Os outliers so moderados quando se encontram entre 1,5 e 3 amplitudes interquartis abaixo do 1 quartil ou acima do 3 quartil. Os outliers so severos severos quando se encontram para alm de 3 amplitudes interquartis para baixo do 1 quartil ou para cima do 3 quartil.

Outlier Severo Outlier Moderado Valor Mximo

3 Quartil 50% das observaes centrais, isto , amplitude inter1 Quartil Mediana (2 Quartil)

Valor Mnimo

Figura 78 Diagrama caixa e fio

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

69

Para criar um diagrama de caixa e fio no SPSS, a partir da janela Explore, dever: 3. Seleccionar as variveis, seleccionar a opo Both ou Plots em Display e clicar no boto Plots.

Figura 79 Boto Plots na janela Explore

4. Na janela que surge, dever escolher uma das seguintes opes: a. Factor levels together para cada varivel dependente, os diagramas de caixa e fio de cada grupo so apresentados lado a lado. Desta forma, facilmente se compara como os valores da varivel dependente varia nos vrios grupos. Se no for introduzida nenhuma varivel na caixa Factor List ser apresentado apenas um nico diagrama de caixa e fio para a totalidade dos casos. b. Dependents together para cada grupo, so apresentados os diagramas de caixa e fio de cada varivel dependente lado a lado. Desta forma, facilmente se compara os valores das variveis dependentes num grupo especfico. Esta opo til quando as diferentes variveis dependentes representam uma nica caracterstica medida em diferentes instantes temporais.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

70

Figura 80 Plots em Explore

5. Se seleccionar a opo None, no ser criado nenhum diagrama de caixa e fio. Caso no pretenda a criao de um diagrama de tronco e folha, dever remover a seleco da opo Steam-and-Leaf. Depois dever clicar em Continue e na janela Explore em OK. 6. Na janela de sada, ser apresentado o diagrama de caixa e fio. O diagrama abaixo apresenta a relao entre o rendimento do agregado familiar e a categoria do principal veculo do agregado. Os outliers moderados so apresentados por um crculo e os outliers severos por um asterisco.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

71

1200
77 427 250 2980 1812 4929 150 2535 2001 1263 4277 3254 2844 5530 1706 4709 5840 4057 5363 4937 5237 4797 2364 5204 42 5542 3618 5370 539 2384 1147 506 5845 6017 1557 4386 6046 97 992 1760 3600 5066 5434 6196 4365 2096 4719 3221 4533 4575 4327 3565 5323 1194 5385 5871 4641 3452 1425 5805 4965 2432 5606 278 1953 3008 2415 4466 79 5376 525 4793 185 6147 991 2898 3261 934 6197 6176 1183 2136 5481 189 3726 155 4767 2271 325 4014 6153 319 393 3436 886 1074 4653 5947 255 2389 944 2442 5245 4468 1205 2290 6095 732 2702 5184 5784 69 883 2218 4031 4207 5303 4055 5415 4260 306 1016 1848 2922 2108 3576 4570 214 1433 1199 3444 2785 4129 6382 202 876 5495 3161 4899 2076 5968 909 4939 5470 3042 3758 4925 4005 1143 2049 241 2308 212 1870 864 4415 6338 2333 803 3844 276 2215 3212 4887 5780 672 2030 3015 4485 4499 4941 5210 988 5146 1465 2902 2949 3081 3509 4735 1769 3635 29 807 3729 1668 2033 3766 5331 1276 3629 3721

1000

800

600

400

200

0 -200
N= 1841 2275 2284

Economy

Standard

Luxury

Figura 81 - Diagrama caixa e fio

Diagrama de tronco e folha (Steam-and-leaf)


O diagrama de tronco e folha uma representao similar ao histograma, mas que, em relao a este ltimo, apresenta mais informao acerca dos valores dentro de cada intervalo. Para criar um diagrama de tronco e folha no SPSS, a partir da janela Explore, dever: 7. Seleccionar as variveis, seleccionar a opo Both ou Plots em Display e clicar no boto Plots.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

72

Figura 82 Boto Plots na janela Explore

8. Na janela que surge, dever seleccionar a opo Steam-and-leaf. Caso no pretenda a criao de um diagrama caixa e fio, dever seleccionar a opo None, em Boxplots. Se tambm pretender a criao de um histograma, dever seleccionar a opo Histogram. Dever ento fazer Continue e depois OK na janela Explore.

Figura 83 Plots em Explore

9. Na janela de sada, ser apresentado o diagrama de tronco e folha. O diagrama abaixo relativo varivel que contm o rendimento do agregado familiar.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

73

Grfico 1 Diagrama tronco e folha

esquerda do diagrama apresenta-se a frequncia associada a cada intervalo. Cada caso representado dentro da linha com o valor observado. Para tal, divide-se o valor observado em duas componentes: dgito(s) inicial(is) (tronco) e dgitos finais (folha). O diagrama variar em funo das unidades em que est medida a varivel e do intervalo de valores. Na parte inferior do diagrama explicado o modo como deve ser interpretado cada valor. O Stem width indica o valor pelo qual deveremos multiplicar os valores para obter a unidade real e o Each Leaf indica o nmero de casos que cada elemento na folha representa. No caso apresentado, o tronco corresponde parte inteira das dezenas de milhares do rendimento (a unidade inicial era milhares e o stem width 10) do agregado familiar e a folha parte decimal. Na 1 linha do diagrama, podemos verificar que existem 25 casos com rendimento familiar igual a 0,9 dezenas de milhar. No 2 caso,

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

74

podemos verificar que existem 30 casos (Each Leaf = 30 casos), com rendimento de 1,0; 30 casos com rendimento 1,1; 30 casos com rendimento 1,2; etc.

3.5. Tabelas
As tabelas produzidas pelo SPSS so apresentadas como tabelas pivot na janela de sada. Este tipo de tabelas tem uma grande flexibilidade na estruturao e formatao das tabelas.

Modificao de estrutura
Para modificar a estrutura de uma tabela, dever: 1. Activar a tabela, fazendo um duplo clique em cima da tabela.

Figura 84 Tabela do SPSS

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

75

2. Clicar com o boto direito em cima da tabela e escolher a opo Pivoting Trays.

Figura 85- Menu de configurao de tabelas

Aparecer ento a seguinte janela, onde cada conjunto de informao representada por . Para saber a que se refere cada um destes smbolos, basta situar o rato por

cima do smbolo durante um breve instante. Depois poder alterar a localizao de cada bloco de informao entre as linhas (Row ), colunas (Column ) ou entre uma nova camada de informao (Layer). Para alterar a localizao, basta arrastar o smbolo para a localizao pretendida.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

76

Figura 86 Pivoting Trays

3. Se para o caso da tabela apresentada na figura 37, movimentar a varivel Primary


Vehicle para uma nova camada, obtenho a tabela apresentada a figura 41, onde

poderei escolher atravs de uma caixa de seleco qual o valor desta varivel para o qual pretendo consultar as estatsticas.

Figura 87 Inserir informao numa nova camada

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

77

Figura 88 Tabela com uma nova camada

4. Se para o caso da tabela apresentada na figura 37, colocar a varivel Primary


Vehicle em colunas, obtenho a tabela apresentada na figura 43.

Figura 89 Troca de linha para coluna

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

78

Figura 90 Tabela com varivel Primary vehicle em coluna

Como se pode verificar pelos exemplos apresentados, a estruturao de tabelas no SPSS tem bastante potencial e possibilidades.

Modificao de formatao
Para modificar a formatao associada a uma tabela, dever: 1. Activar a tabela, fazendo um duplo clique em cima da tabela. 2. Clicar com o boto direito em cima da tabela e escolher a opo Toolbar.

Figura 91 Opo Toolbar

3. Ficar visvel a barra de formatao, com o que poder formatar todo o aspecto visual da tabela. Para seleccionar a totalidade de uma coluna ou linha, dever fazer Ctrl + Alt em cima do nome da coluna ou linha.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

79

4. Outra opo possibilidade de formatao o acesso a modelos predefinidos. Para tal dever clicar com o boto direito em cima da tabela e seleccionar a opo tableLooks.

Figura 92 Opo TableLooks

5. Surgir ento uma janela, onde poder escolher um dos modelos pr-definidos.

Figura 93 Janela TableLooks

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

80

4. Testes de hipteses paramtricos


Em anlise estatstica necessrio comparar parmetros da populao (mdia, varincia, mediana, etc.) a partir de amostras aleatrias. Este tipo de procedimento inferencial muito usado na avaliao dos efeitos de determinados tratamentos. Este tipo de testes pode ser feito segundo duas metodologias: Testes Paramtricos que exigem o conhecimento da distribuio amostral, geralmente a Normal; Testes No Paramtricos no exigem o conhecimento da distribuio amostral. Convm destacar que a potncia dos Testes Paramtricos superior dos Testes No Paramtricos, isto , a probabilidade de rejeitar correctamente H0 maior num Teste Paramtrico. Por este motivo, apenas se recorre aos Testes No Paramtricos quando no possvel satisfazer as condies de aplicao dos Testes Paramtricos.

4.1. Condies de aplicao dos Testes Paramtricos


Para se poderem aplicar os Testes Paramtricos abordados neste captulo necessrio verificar se a varivel (dependente) segue uma distribuio normal. Para testar a normalidade da varivel em estudo, usa-se, normalmente, o Teste de Kolmogorov-Smirnov.

Teste de Kolmogorov-Smirnov
Neste teste pretende-se testar se a distribuio da varivel normal, com parmetros e quaisquer: H0 : X ~ N ( , ) Vs H1 : X ~ N ( , )

/ Rejeita-se H0 se o valor prova (p_value) for inferior ou igual ao nvel de significncia ( ), em que o p_value um valor produzido pelo SPSS usando a correco de Lilliefors s tabelas com os valores crticos da distribuio de Kolmogorov-Smirnov.

Teste de Shapiro-Wilk
Este teste apresentado, adicionalmente, pelo SPSS. uma alternativa ao Teste de Kolmogorov-Smirnov no teste normalidade da varivel em estudo.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

81

Teste de Normalidade

Figura 94: Menu a seguir para efectuar o teste normalidade.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

82

Figura 95: Janela de dilogo no teste normalidade onde se colocam as variveis a testar e as que vo criar grupos.

Seleccionar, como se mostra na figura seguinte,

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

83

Figura 96: Janela onde se selecciona a opo para efectuar o teste normalidade.

Fazer CONTINUE. Depois em DISPLAY seleccionar apenas PLOTS.

4.2. Resultados ao Teste de Normalidade

m d a e r T i

O R G e h i d

N 8 0 1 % , 0 1 % 0

N 0 0 % 0 , % 0 ,

N 8 0 1 % 0 % , 0 1

Figura 97: Tabela de resultado do teste normalidade, que apresenta o nmero de casos vlidos, missings e totais.

Neste primeiro quadro output apresentado um pequeno resumo acerca da varivel em estudo, para cada grupo.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

84

y t i

lf a m r o N t s e T o
a

m d a e r T i t l i . i * s h T . o a n il tL c e r C f a g S s

P U O R G h t l a e i d e

f d 5 6 2 , 0 6 2 , 8 0 1 3 0 1 , 4 5 0 , 4 2 9 , 5 3 7 ,

k l i W r o p a h S f d 8 0 1 2 6 4 , * 1 0 ,

Figura 98: Tabela resultante do teste normalidade, com os dois testes KolmogorovSmirnov e Shapiro-Wilk.

O segundo quadro apresenta o Teste de Kolmogorov-Smirnov com a correco de Lilliefors para as duas amostras da varivel group, com p_value de 0.103 e 0.054 respectivamente. Como o nvel de significncia 0.05, no se rejeita a hiptese nula. Pode, por isso, aplicar-se o Teste de t- Student. Adicionalmente tambm apresentado o Teste de Shapiro-Wilk. Como foi referido nas aulas tericas a anlise normalidade ser sempre efectuada a partir do Teste de Kolmogorov-Smirnov.

4.3. Mdias
A mdia uma Medida de Tendncia Central muito usada na investigao, em reas como as cincias biolgicas. Por este motivo, torna-se fundamental o estudo de mtodos para analisar dados quantitativos (intervalares e racionais) cuja Medida de Tendncia Central adequada seja a mdia. No menu >ANALYZE >COMPARE MEANS >MEANS

possvel calcular uma srie de medidas estatsticas sumrias como mdia, desvio padro, varincia, etc., para um conjunto de variveis em grupos, categorias ou variveis distintas. No ficheiro Coronary artery data,

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

85

Figura 99: Menu para efectuar o procedimento Compare Means-> Means.

Figura 100: Janela de dilogo do procedimento Compare Means-> Means onde visvel onde se devero colocar as variveis dependentes e independentes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

86

Seleccionar treadmil time in seconds para a Dependent List e a group para a Independent List.

Figura 101: Janela de dilogo onde possvel seleccionar as estatsticas a pedir.

Na janela OPTIONS podem seleccionar-se as estatsticas que se pretendem calcular. Como output obtm-se dois quadros:
m u S e s a C d e u l c x E t n c r e P 8 1 % N 0 t n c r e P % 0 , N 8 1 s e c o r n i

d e u l c n I N m d a e r T d n o c e s *

l a t o T t n c r e P % 0

Figura 102: Tabela resultante o procedimento Compare Means-> Means onde se mostram nmero de casos includos, excludos e total.

O primeiro quadro apresenta o nmero de casos vlidos, invlidos e total.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

87

r o p e R r T O R G e h i d t o T N 0 5 , 8 2 9 0 6 8 0 1 8 1 2 1 l

Figura 103: Tabela resultante do procedimento Compare Means-> Means onde se apresentam as estatsticas pedidas.

O segundo quadro diz respeito aos valores das estatsticas pretendidas de cada varivel treadmill time in seconds em cada group.

4.4. Uma amostra


Quando se pretende verificar se a mdia de um determinado grupo de observaes igual a um valor padro, usa-se um teste-t para uma amostra (One sample t- test). Para aplicar este teste necessrio ter em conta a normalidade dos dados. Se a dimenso amostral for superior ou igual a 30, com base no Teorema do Limite Central, pode assumir-se que a distribuio das mdias normal, independentemente da distribuio da populao. Se a dimenso da amostra for inferior a 30 necessrio efectuar um teste da normalidade (ver introduo ao Captulo 4). Abrir o ficheiro saturaoex1. Este ficheiro contm valores de um estudo efectuado em 31 homens e 29 mulheres saudveis, sobre a saturao da blis por colesterol. Suponha-se que se realizou um estudo semelhante e que se obteve uma mdia de saturao da blis de 87.3%. De seguida, verifique-se se a estimativa da mdia da saturao da blis do estudo realizado significativamente diferente da mdia populacional do estudo anterior. Pretende-se testar: H0: = 87.3 Fazer Vs H1: 87.3

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

88

Figura 104: Menu para a execuo do procedimento Teste t para uma amostra.

Figura 105: Janela de dilogo resultante da seleco do teste t para uma mostra onde possvel escolher qual a varivel e o valor a testar.

Janela ONE-SAMPLE T TEST: Test Variable(s) variveis que se pretendem analisar; Test Value valor numrico contra o qual se vai testar a mdia das variveis seleccionadas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

89

Figura 106: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo.

Janela OPTIONS: Confidence interval intervalo de confiana para a diferena das mdias 4; Missing values Exclude cases analysis by analysis so excludos os casos com valores desconhecidos para a varivel seleccionada; Exclude cases listwise so excludos todos os valores desconhecidos da base de dados. Mais uma vez surgem dois quadros.

Este intervalo de confiana baseado na diferena da mdia da amostra e o valor de

referncia introduzido no teste. Note que diferente do intervalo de confiana para a mdia da populao apresentado na terica.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

90

N t a s u 0 6

n a e M 7 4 , 6 2

d n a e M

. 2 4 , 3

Figura 107: Tabela resultante do teste t para uma amostra onde se apresentam algumas estatsticas da varivel a testar.

Este primeiro quadro apresenta o nmero de casos vlidos (N), a mdia amostral (Mean), o desvio padro (Std. Deviation) e o erro padro da mdia (Std. Error Mean).

n a e M t t a su 9 f d 9 5 2 6 , 0 5 , 1 -

c n r e r e w o L 4 3 , 8 r e p U

D i 4 3 , 5

Figura 108: Tabela resultante do teste t para uma amostra onde se apresenta entre outras informaes o valor p, do respectivo teste.

No segundo quadro so apresentados o valor testado (Test value), o valor da estatstica t, o nmero de graus de liberdade (df), o p_value (Sig.(2-tailed)), a diferena entre as mdias (Mean Difference) e o intervalo de 95% de confiana para a diferena das mdias. Neste caso, como o p_value (=0.662) superior ao nvel de significncia (=0.05), no se rejeita H0, pelo que no se conclui, com uma confiana de 95%, que a mdia do estudo seja significativamente diferente de 87.3.

Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel
Considere-se o mesmo ficheiro, saturaoex1. Suponha que se pretende avaliar se a mdia do nvel de saturao da blis ou no igual a 87.3% em cada sexo. Para isso, era necessrio comear por separar os dados de acordo com o sexo. > DATA > SPLIT FILE

> COMPARE GROUPS, BASED ON sexo

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

91

Figura 109: Janela onde se efectuar uma partio de todos os procedimentos em funo da varivel sexo.

De seguida, fazer como se descreveu anteriormente: > ANALYZE >COMPARE MEANS >ONE SAMPLE T-TEST

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

92

Figura 110: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar assim como o nvel de significncia.
e n O S e a l p m

i d o x e S M n i m e F

v i a i t a s t a s u u

N 1 3 9 2

n a e M 6 , 0 9 3 8 , 6 2 3 6 , 5 2

n a e M 2 8 , 4 6 7 , 4

Figura 111: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso masculino e feminino).

3 . 7

V t s e T f De c n r

d o x e S M n o i m e F

t a t a s r u t a s o u 1 6 2 1 7 ,

f d 0 3 8 2 7 1 2 , 2 8 4 , 7 0 , 6 9 , 3

r e w o L 9 , 5 1 3 , 6 -

r e p U 7 , 3 4 , 3 1

Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam entre outras informaes o valor p para os dois testes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

93

No primeiro quadro so apresentados, para a varivel pretendida, tantos grupos de estatsticas quantas as categorias criadas. Neste caso, uma para o sexo feminino e outra para o masculino. O p_value superior ao nvel de significncia (=0.05) em ambos os casos, pelo que, no se rejeita H0 e, com uma confiana de 95%, no se pode concluir que a mdia do estudo em cada sexo, seja significativamente diferente de 87.3.

4.5. Duas amostras com dados independentes


O teste t-student tambm pode ser usado para testar se as mdias de dois grupos independentes so iguais, isto , se so ou no significativamente diferentes. Para aplicar este teste necessrio que as variveis dependentes sigam uma distribuio normal e que as varincias sejam homogneas. Abrir o ficheiro Coronary artery data. Averiguar se o tempo mdio (treadmill time in seconds) igual para o grupo 1 (saudvel) e para o grupo 2 (doentes). Pretende-se testar: H0: 1 = 2 Fazer Vs H1: 1 2

Figura 113: Menu para a execuo do teste t para amostras independentes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

94

Figura 114: Janela de Dilogo onde se devem especificar os grupos.

Janela INDEPENDENT-SAMPLES T TEST: Test variable variveis escolhidas para a anlise; Grouping variable variveis que dividem os casos pelos dois grupos teste. Define groups Use specified values se os grupos esto j codificados; Cut point seleccionar um ponto de corte para criar dois grupos: um abaixo e outro acima desse ponto.
s iS t p u o r G a

m d a e r T o c n e s i

P U O R G y h t l a e e s a i d

N 8 0 1

n a e M 0 0 , 4 6 7

n o 2 , 8 3 1 5 7 , 3 1 2

n a e M 3 , 8 4 9 5 , 7 6

Figura 115: Tabela resultante da realizao do teste t para duas amostras independentes na qual so visveis algumas estatsticas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

95

t s

t s e h f o l a v r e t n I o r E . d t S

i l a u q E r

F m d a e r T i li a u q E n r v s a r v l a u q E s a t o n e m u 7 3 1 ,

. g i S 6 1 7 ,

t 3 7 8 , 1 6 9 , 1

f d 6 1 9 3 4 , 5 1

e l) d a t 2 ( . g i S 8 0 , 8 6 0 , 0 9 , 3 6 1 0 9 , 3 6 1 2 5 , 7 8 9 , 3 8

r e w o L 4 6 , 1 2 0 4 , 3 1 -

r e p U , 9 4 3 0 2 , 1 4 3

Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes na qual so mostrados os valores p assim como o intervalo de confiana para a diferena de mdias.

Na primeira tabela aparecem algumas estatsticas descritivas. Na segunda tabela, apresentado um conjunto de informao acerca da varivel pretendida. Comea com o Teste de Levene para a homogeneidade de varincias (F representa o valor da estatstica de Levene e o respectivo Sig. ou p_value). Depois apresentado o valor da estatstica t (t), o nmero de graus de liberdade (df), o p_value (Sig.(2tailed)), a diferena de mdias (Mean Difference), o erro amostral da diferena de mdias (Std. Error Difference) e os limites inferior e superior do Intervalo de Confiana da diferena. Neste caso, como o p_value para o Teste de Levene superior ao nvel de significncia, no se rejeita H0 e assume-se a igualdade das varincias, dever ento ler-se o valor p, relativamente ao teste de igualdade das mdias na 1 linha (Equal variances assumed), como o p_value superior a 0.05 (0.080) no se rejeita a hiptese nula e no se rejeita a igualdade das mdias nos dois grupos ao nvel de significncia estabelecido.

4.6. Duas amostras com dados emparelhados


Em anlise estatstica muito comum o recurso a amostras emparelhadas. Este tipo de amostras permite que os mesmos indivduos sejam medidos em diferentes situaes experimentais. O objectivo principal deste tipo de amostragem controlar fontes de variabilidade que possam influenciar o efeito de um determinado tratamento. Neste tipo de teste, comparada a mdia das diferenas com um valor que pode ser ou no zero. No fundo, so calculadas as diferenas entre os valores das observaes de cada varivel das amostras.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

96

Para aplicar este teste necessrio que as variveis dependentes sigam uma distribuio normal. Considere-se o exemplo seguinte: Para testar a eficcia de um novo tratamento de emagrecimento, foram usados os dados relativos a 20 pacientes. Na tabela da pgina seguinte, apresentam-se os valores do peso de cada indivduo antes e aps o tratamento. Para analisar o efeito do tratamento efectua-se um teste para duas amostras com dados emparelhados. Sujeito 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Idade 20 45 33 51 29 18 35 44 57 61 24 36 38 46 54 49 27 21 32 41 Sexo Masculino Feminino Feminino Masculino Feminino Feminino Feminino Masculino Feminino Feminino Masculino Feminino Masculino Masculino Masculino Feminino Masculino Feminino Feminino Masculino Altura 1,77 1,60 1,65 1,72 1,69 1,70 1,59 1,77 1,62 1,71 1,76 1,68 1,81 1,57 1,86 1,66 1,69 1,71 1,72 1,64 Peso inicial 99,8 90,0 100,7 99,1 92,4 101,2 79,1 110,6 85,3 114,3 101,2 100,3 99,5 80,5 116,9 90,8 100,5 98,9 103,5 98,4 Peso final 85,3 73,2 68,0 75,5 74,2 80,4 60,1 82,1 62,4 81,1 74,2 78,4 85,3 54,1 90,8 70,0 68,1 79,3 83,4 67,7

Tabela 2: Tabela contendo informao acerca de 20 indivduos, relativa a avariveis como idade, sexo, altura, peso inicial e peso final.

Pretende-se testar: H0: D = 0 Vs H1: D 0

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

97

Neste caso queremos comparar a mdia das diferenas com o valor zero, para analisar se o tratamento teve ou no efeitos. Para isso fazer, ANALYZE >COMPARE MEANS >PAIRED - SAMPLES T-TEST

Figura 117: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas.

Ao seleccionar a primeira varivel - peso_i esta assumida como variable 1; ao seleccionar a segunda varivel peso_f esta aparece como variable 2. S depois de seleccionadas estas duas variveis que o par colocado na lista. Em OPTIONS seleccionado o nvel para o Intervalo de Confiana. Neste caso 95%.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

98

lS p m d e r i a

N r i a P 1 e P e d s e P o t n e m a r a t 0 5 0 8 6 , 4 7 0 2 0 2

n o 5 1 8 , 9 8 3 , 9

n a e M 5 9 1 , 2 9 0 , 2

Figura 118: Tabela resultante da realizao do teste t para amostras emparelhadas, onde so visveis algumas estatsticas.

Num primeiro quadro apresentado um conjunto de mediadas estatsticas (mdia, nmero de casos vlidos, desvio padro e erro amostral da mdia) para as variveis seleccionadas.
s e lS p m a d r i P N r i a P 1 e P d s e P o t n e m a r 0 2 . g i S

Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde visvel o coeficiente de correlao.

Numa segunda tabela aparece informao que permite inferir acerca da correlao entre o par seleccionado (nmero de casos vlidos para ambas as variveis, coeficiente de correlao e nvel de significncia). Convm destacar que o coeficiente de correlao varia entre -1 e 1. Quanto mais prximo de -1 ou +1 estiver, mais linearmente relacionadas se encontram as variveis. Se o valor prova (p_value) for inferior ao nvel de significncia as variveis esto relacionadas.

n a e M r i a P 1 e P d s e P a r t o n e m 0 7

n o

n a e M 5 2 3 , 1

r e w o L 7 9 6 , 0 2

r e p U 3 4 , 6 2

t 3 , 7 1

f d 9 1

t 0 ,

Figura 120: resultante da realizao do teste t para amostras emparelhadas, onde visvel o valor p, assim como o intervalo de confiana para a mdia das diferenas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

99

O ltimo quadro contm informao acerca das variveis seleccionadas: mdia, desvio padro, erro amostral da mdia, os limites do Intervalo de Confiana, o valor da estatstica t para o teste, o nmero de graus de liberdade e o nvel de significncia. Neste caso, o p-value (Sig. (2-tailled)) tem o valor de 0.000 que inferior ao nvel de significncia (0.05), pelo que se rejeita a hiptese nula. Por este motivo pode concluirse que as mdias so significativamente diferentes, isto , a mdia no grupo mudou como resultado do tratamento.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

100

5. Testes de hipteses no paramtricos


Os testes no paramtricos so, geralmente, considerados uma alternativa aos testes paramtricos, nomeadamente quando as condies de aplicao dos paramtricos (normalidade da varivel em estudo e homogeneidade de varincias) no se verificam. geralmente aceite que a potncia dos Testes Paramtricos superior dos Testes No Paramtricos, isto , a probabilidade de rejeitar correctamente H0 maior num Teste Paramtrico. No entanto, h autores que afirmam que os testes no paramtricos aplicados a amostras de pequena dimenso podem ser mais potentes. Os testes paramtricos requerem geralmente variveis quantitativas, enquanto que os no paramtricos podem ser aplicados a qualquer varivel, com algumas limitaes. Como tal, os Testes No Paramtricos so aplicados sempre que no seja prtico, ou possvel, medir numa escala quantitativa. necessrio considerar que alguns dos Testes No Paramtricos foram

desenvolvidos exclusivamente para variveis ordinais, e que estes testes no so uma alternativa a utilizar numa m recolha de dados. Assim necessrio, como em qualquer inferncia, assegurar a representatividade da amostra. Os teste no paramtricos so requeridos no SPSS no menu Analyze, em Nonparametrics Tests.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

101

Figura 121: Menu onde se encontram os testes no paramtricos.

5.1. Teste do Qui-Quadrado


Qui- quadrado para a qualidade do ajuste
O teste do qui-quadrado permite verificar a aderncia entre uma distribuio de frequncias associada a uma amostra constituda por observaes expressas em qualquer escala de medio e uma distribuio terica. um dos testes includos nos testes de qualidade do ajuste, ou seja permite verificar a representatividade de uma dada amostra relativamente populao. O procedimento Qui-Quadrado executa-se Analyze square, obtendo-se a seguinte janela: Nonparametric Test Chi-

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

102

Figura 122: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem indicar as variveis assim como os valores a testar.

Na janela surge a localizao da varivel ou variveis em estudo test variable list. As variveis que se pretendem analisar devem ser seleccionadas para esta lista. Surgem igualmente opes para definir as categorias em anlise Expected Range: definida na varivel Get from data, (atribui a mediante a codificao, e todas esto em anlise), definir as categorias mediante um intervalo Use specified range, (neste caso apenas as categorias codificados pelo intervalo esto em anlise). A opo Expected Values corresponde ao valor que se pretende testar, ou seja frequncia esperada para cada categoria. Pode-se assumir como todas as categorias apresentam igual proporo (All categories equal), ou especificar os valores de proporo tericos. Deve-se ter em ateno a introduo dos valores (values) pela ordem em que se encontram as categorias. A Janela do Chi-Square apresenta tambm dois botes, Exact e Options. Na janela Exact Tests existe a possibilidade de ajustar a exactido do teste a realizar.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

103

Figura 123: Janela de dilogo onde se pode optar por um teste exacto ou por uma aproximao normal.

As opes so as mesmas que surgem na Janela Exact Tests que surge no procedimento Analyze Descritives Statistics Crosstabs. Esta janela igual para

todos os testes no paramtricos. Asymptotic only apenas assimpttica o nvel de significncia baseado numa distribuio assimpttica da estatstica de teste geralmente de 5%. Baseia-se na hiptese de o conjunto de dados ser elevado. Caso a amostra apresente uma dimenso pequenas, ou pobremente distribuda, pode no ser uma boa indicao para a significncia do teste. Monte Carlo uma estimativa no enviesada do nvel de significncia exacto, calculado repetidamente por amostragens a partir de um conjunto de tabelas com as mesmas dimenses da tabela em estudo. Permite calcular significncias exactas. Confidence Level nvel de confiana introduzir um valor entre 0,1 e 99,9 para especificar a probabilidade com que o intervalo de confiana, baseado nos valores amostras, inclui a mdia da populao. Number of Samples nmero de amostras - introduzir um valor entre 1 e 1.000.000.000 para o nmero de amostras a utilizar no calculo da estatstica. Nmeros mais elevados aumentam a fiabilidade, mas demoram mais tempo a serem executados. Exact exacto a probabilidade do resultado observado ou um resultado mais extremo ser calculado com exactido. Tipicamente um valor menor que 0,05 considerado significativo.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

104

Time limit per Test limite de tempo por teste - introduzir um valor entre 1 e 9.999.999.999 como tempo mximo permitido para calcular cada teste. Na janela de opes tem-se a possibilidade de requerer as estatsticas descritivas (mdia, desvio padro, mnimo, mximo e dimenso da amostra) e os quartis.

Figura 124: Janela de Dilogo onde se pode optar por pedir algumas estatsticas, assim como o tratamento aos missings.

Surgem igualmente as opes de tratamento de missings. O caso com um missing numa determinada varivel pode ser excludo, apenas se a varivel estiver envolvida no teste em questo (Exclude cases test-by-test) (tal significa que os dados desse caso sero usados em todos os procedimentos nos quais a varivel no esteja envolvida) ou em todos os procedimentos mesmo que a varivel no esteja envolvida (Exclude cases listwise). Esta janela igual para todos os testes no paramtricos.

Exemplo Prtico
Num dado inqurito solicitava-se aos inquiridos que assinalassem a sua posio poltica, em termos de direita, centro e esquerda. Os resultados encontram-se na base de dados Inquerito1, na varivel politica. Nas ltimas eleies os eleitores votaram de acordo com a tabela seguinte: Direita Proporo(n) 0,29 Centro 0,40 Esquerda 0,31

Tabela 3: Tabela contendo resultados de uma eleio.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

105

Teste a hiptese desta amostra ser representativa da populao em estudo para a varivel em causa. Esta primeira tabela contm os valores observados (Observed N) e os valores esperados (Expected N). Esta tabela foi ponderada pelos valores tericos. O resduos correspondem diferena entre os valores observados e os valores esperados.
a e v r s b O a d r e u q s E o r t n e C t r a e i D l a t o T 0 4 1 5 3 0 5 8 4 1 x 2 , 1 4 2 , 7 6 5 6 , 9 3 4 2 4 , 3 6

Resultados:
Figura 125: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam valores observados e esperados, assim como os resduos.

A tabela seguinte contm o valor da estatstica do teste (Chi-square), o nmero de graus de liberdade (df), e o nvel de significncia (Asymp. Sig.) neste caso assimttica. Adicionalmente fornece informao sobre o prprio rigor do teste e da sua aplicao.
s i

h C f d . p m y s A . c a 0 l e e h T .n 5 m u i

0 2 1 0 ,

Figura 126: Tabela resultante do teste do qui-quadrado do ajuste onde se apresenta o


valor p.

Genericamente as hipteses em estudo so: Ho: a populao segue uma distribuio especfica H1: a populao no segue essa distribuio especfica Concluso:

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

106

No presente exemplo verificam-se os pressupostos para a aplicao do Qui-quadrado (a no existncia de valores observados =0; apenas 20% dos valores esperados podem ser < 5; nenhum valor esperado poder ser <1) O valor de prova (p) = 0,001, pelo que se conclui pela rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no representatividade da amostra na varivel

posio poltica para a populao.

Qui-Quadrado para independncia de variveis


Tabelas dupla entrada Crosstabs O procedimento Crosstabs permite a criao de tabelas de contingncia de duas ou mais variveis. Permite igualmente a realizao de testes e de medidas de associao de variveis, o teste a realizar determinado pelo tipo de variveis presentes na anlise. Neste procedimento as variveis em anlise devem ter um nmero limitado de categorias. No devem ser utilizadas variveis do tipo quantitativo. Na janela crosstabs surgem as opes de visualizar grficos de barras agrupados e a de suprimir as tabelas (neste caso apenas se obtm medidas estatsticas). Nas linhas (Row(s)) e nas colunas (Column(s)) colocam-se as variveis em anlise, deve existir pelo menos uma varivel em cada.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

107

Figura 127: Janela de dilogo para proceder realizao do teste do qui-quadrado para a independncia de variveis, onde se devero indicar quais as variveis a testar. Os botes Statistics, Cells e Format, abrem as janelas correspondentes.

Na janela Statistics pode-se proceder aos testes de independncia de variveis e de correlaes.

Figura 128: Janela de dilogo onde se podem pedir algumas estatsticas relativas s variveis a testar no teste do qui-quadrado para a independncia de variveis

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

108

O qui-quadrado (Chi-square) testa apenas a hiptese de associao entre as variveis, no indicando a intensidade ou direco da associao. As correlaes (Correlations) apresentam o coeficiente de Pearson e o de Spearman, o primeiro para variveis intervalares/racionais e o segundo para variveis ordinais. Variam entre 1 e 1, o 0 corresponde a uma ausncia de relao, o sinal ou + corresponde direco da associao. possvel requerer outros coeficientes de correlao, tendo sempre em considerao o tipo de varivel. A interpretao do resultado idntica realizada para o coeficiente de Pearson ou de Spearman. As correlaes nominais so isentas de sinal, a ordem de codificao aleatria, no segue uma ordem, logo no existe uma direco de associao. Na janela cell display proporciona a opo de seleccionar os valores a visualizar na tabela de contingncia, para alm dos observados pode-se requerer os valores esperados, percentagem e resduos. Os resduos padronizados permitem uma comparao mais rpida dos desvios relativos aos valores esperados dos observados. Os resduos padronizados so significativos quando superiores a 2 em termos absolutos. Resduos padronizados superiores a 2 so suspeitos de existncia de associao entre as variveis.

Figura 129: Janela de dilogo onde se pode optar por quais as informaes a apresentar na clula da tabela de contingncia.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

109

A janela Format apresenta as opes de ordenao dos resultados.

Figura 130: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a sua intensidade com que vivem a religio e a frequncia de actos religiosos. Os resultados encontram-se na base de dados Inquerito1, na varivel freqreli e intenrel. Teste a hiptese destas variveis serem independentes. Na primeira tabela temos um resumo da anlise realizada em termos de nmero de casos vlidos e missings.

e s a C N u q e r F io v r e s e t n I 9 3 1 t n c r e P % , 6 7 N 7 4 3 , 3 2 % N

0 % 1 0

Figura 131: Tabela resultante do teste do qui-quadrado para independncia, onde se mostra o nmero de casos vlidos, missings e total.

A segunda tabela, tabela de dupla entrada, apresenta-nos os valores observados, os valores esperados e os resduos padronizados. Pela anlise desta tabela pode-se prever a dependncia entre as variveis. Os resduos padronizados elevados, e o facto de seguirem uma linearidade na oblqua leva-nos a pensar que tal se verifica.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

110

s o g i

c a r F r F v r s e d e r s o n e M v a m u d o p e v a m U n u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E 5 7 , 7 3 1 , 6 0 3 1 0 , 1 7 0 , 7 0 1 7 , 3 4 6 0 , 3 6 4

a r e d o M 9 , 1 6 , 9 1 9 , 0 2 4 , 5 2 0 , 1 3 1 0 , 4 2 0 , 2 2 1 , 8 , 1 0 3 0 , 1 3 2 , 4 8 , 4 1 8 , 2 6 3 1

e t r o F 9 2 , 4 3 , 5 6 2 1 , 3 8 3 , 6 5 4

l a t o T 3 9 0 , 3 9 5 7 1

a i r V

0 7 1

v a m U

2 3

9 0 1

u o 2

4 6 0 , 3 5 1 , 5 3 0 , 3 5 9 1 4 , 6 7 1 9 , 8 5 6 , 7 1 4 5

4 3 1

e s a u Q e s s a d o T m e

9 , 0 3 8 , 3 5 3 9 , 6 3 3 , 0 5 7 , 6 2 6 4

4 7 0 , 4 7 0 6 2

s d ie a M r o p z v m u n a m e s l a t o T

4 2 1

9 3 1

Figura 132: Tabela de contingncia resultante da execuo do teste do qui-quadrado.

Resultados: A terceira tabela apresenta-nos as estatsticas do teste e o valor de prova.


e

e o s r a e P i h C n h i k o l e L n r a e iL y b i c o s A f o N . l a s e c 0 m n t c p x e u id

f d 4 1 4 1 1

i s 2 ( 0 , 0 , 0 ,

9 3 1 (

Figura 133: Tabela resultante da execuo do teste do qui-quadrado onde se mostram os valores prova.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

111

Genericamente as hipteses em estudo so: Ho: as variveis so independentes H1: as variveis no so independentes Neste exemplo podem ser concretizadas da seguinte forma: Ho: Os actos religiosos e a intensidade com que se vive a religio so independentes. H1: Os actos religiosos e a intensidade com que se vive a religio no so independentes. Concluso: No presente exemplo o valor de prova (p) < 0,001. Pelo que se conclui pela rejeio da hiptese nula, para um =0,05. Ou seja conclui-se que os actos religiosos e a

intensidade com que se vive a religio no so independentes ao nvel de significncia estabelecido.

5.2. Binomial
O procedimento binomial permite testar se a proporo de uma categoria de uma varivel dicotmica, ou tornada dicotmica, da amostra difere de uma determinada constante, por ex. a proporo do sexo na populao. Na janela surge a localizao da varivel em estudo test variable e o valor com que se vai proceder ao teste test Proportion, note que este valor a testar ficar associado ao 1 grupo, a proporo para o segundo grupo ser 1 menos o valor introduzido.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

112

Figura 134: Janela dilogo para a execuo do teste da binomial, onde se devem indicar as variveis assim como as propores a testar.

Surgem igualmente as opes para definir a dicotomia, pode ser a definida na varivel (atribui os casos com a categoria mais baixa a um grupo e os de categoria mais alta a outro), ou definir a dicotomia por um ponto de corte, o valor a inserir deve corresponder ao value da categoria a ficar no segundo grupo, as categorias com value inferior ficam no grupo 1, o grupo 2 constitudo pelo valor inserido e superiores. A varivel deve estar bem definida para no misturar diferentes itens. A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas anteriormente.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a seu sexo. Os resultados encontram-se na base de dados Inquerito1, na varivel sexo. Nos ltimos censos realizados a proporo do sexo feminino era de 55%. Teste a hiptese desta amostra ser representativa da populao em estudo para a varivel em causa. Resultados: A tabela de resultados apresenta a dicotomia em anlise, a dimenso de cada categoria, a proporo observada. E o nvel de significncia do teste.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

113

a i p m y s A N d o x e S o r G o r G a t o T . a B m e F u c s a M o 3 4 8 3 4 6 6 8 4 1 . p o r P 7 5 , 3 4 , 0 , 1 t s e T 5 ,
a

4 9 0 ,

Figura 135: Tabela resultante do teste da binomial onde so visveis as propores observadas, a proporo a testar assim como o valor p.

As hipteses em estudo so: Ho: a populao apresenta uma proporo de femininos = 0,55 H1: a populao apresenta uma proporo de femininos 0,55

necessrio ter em ateno se os resultados gerados so para um teste bilateral ou unilateral. O SPSS quando testa uma proporo diferente de 0,5 apresenta um teste unilateral. O nvel de significncia do teste, cujas hipteses foram referidas anteriormente, obtm-se multiplicando o resultado Asymp. Sig. (1-tailed) por 2. Concluso: No presente exemplo o valor de prova (p) = 0.188. Pelo que se conclui pela no rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no

representatividade da amostra na varivel sexo para a populao.

5.3. Duas amostras Independentes (Mann-Whitney)


O procedimento two independent samples compara dois grupos de casos (amostras) independentes e verifica se provm da mesma populao. Os testes no paramtricos utilizam as ordens para obter os resultados, ou seja, procedem ao ordenamento crescente dos valores das variveis e calculam a sua posio mdia. com este valor que procedem comparao entre as amostras. Na janela surge a localizao da varivel ou variveis em estudo test variable e a varivel que vai dividir nos dois grupos em teste. A grouping variable deve ser uma varivel dicotmica ou com os grupos que se querem testar. Na definio dos grupos a comparar introduz-se os values correspondentes s categorias que se pretendem comparar.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

114

Figura 136: Janela de dilogo para a execuo de testes no paramtricos para amostras independentes, onde se deve indicar quais as variveis e grupos a testar.

Tipo de teste Mann-Whitney U o teste no paramtrico equivalente ao teste t, testa a hiptese de duas amostras serem provenientes da mesma populao. Requer que as variveis se encontrem pelo menos numa escala ordinal. mais potente que o teste de medianas por utilizar a ordem de casos. O valor de U o nmero de vezes que um valor do primeiro grupo precede um valor no segundo grupo, quando ordenados de forma crescente. Kolmogorov-sminorv Z testa a hiptese de duas amostras serem provenientes da mesma populao. sensvel a qualquer tipo de diferena entre as duas distribuies. O teste baseado na maior diferena entre as duas distribuies acumuladas. Moses extreme reactios concebido para testar hipteses nas quais se esperam que a varivel experimental afectar alguns casos numa direco e outros casos na direco oposta. Teste para respostas extremas comparadas com o grupo de controlo. Wald-Wolfowitz runs testa a hiptese de duas variveis serem provenientes da mesma populao. Os valores de ambas as amostras so combinados e ordenados de forma crescente. Se as variveis forem provenientes da mesma populao, os dois grupos devero estar distribudos aleatoriamente ao longa da ordenao.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

115

A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas anteriormente.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem o seu sexo e os anos de escolaridade completos. Os resultados encontram-se na base de dados Inquerito1, na varivel sexo e educ. Teste a hiptese de os anos completos de escolaridade no diferirem entre os dois sexos. Resultados

k s o n A m o c d o x e S M e F l a t o T N 9 3 6 0 4 8 k n a R e M 7 5 9 0 , 7 4

Figura 137: Tabela resultante do teste de Mann-Whitney onde se apresentam os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies.

d r i u q t y e i h W n a M W Z m y s A . r a G u o 0 0 4 0 9 ,

Figura 138: Tabela resultante do teste de Mann-Whitney, onde se apresenta o valor p.

A primeira tabela apresenta os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies. A segunda tabela apresenta os valores do teste estatstico, e a seu valor de prova. Genericamente as hipteses em estudo so: Ho: A distribuio da varivel nas duas populaes idntica.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

116

H1: A distribuio da varivel nas duas populaes no idntica. No exemplo podem ser concretizadas da seguinte forma: Ho: Os anos de escolaridade completos so idnticos nos dois sexos. H1: Os anos de escolaridade completos no so idnticos nos dois sexos.

Concluso: No presente exemplo o valor de prova (p) = 0,909. Pelo que se conclui pela no rejeio da hiptese nula. Ou seja no se pode concluir que os anos de escolaridade nos dois sexos no so idnticos, ao nvel de significncia 0.05.

5.4. Two Related Samples (Wilcoxon)


O procedimento Two Related-samples compara as distribuies de duas amostras emparelhadas. Na janela do comando procede-se seleco do par de variveis a testar, a visualizao da seleco projectada em current selections, deve-se marcar a primeira das variveis e ela dever surgir em variable 1, marca-se a segunda das variveis e ela dever surgir com variable 2. S aps seleccionar o par de variveis que possvel colocar o par na lista de variveis a testar.

Figura 139: Janela de dilogo para a execuo dos testes no paramtricos para amostras emparelhadas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

117

Tipo de teste Wilcoxon testa a hiptese de duas variveis serem provenientes da mesma populao, sem postular qualquer hiptese sobre a forma de distribuio das duas variveis. A estatstica do teste baseia-se nas ordens dos valores absolutos das diferenas entre as duas variveis. Sign teste dos sinais testa a hiptese de duas variveis serem provenientes da mesma populao. As diferenas entre as duas variveis para todos os casos so calculados e classificados como positivos, negativos ou empate. Se duas variveis forem similarmente distribudas, as diferenas positivas e negativas no so estatisticamente significativas. McNemar Teste no paramtrico para duas variveis emparelhadas dicotmicas. Testa as modificaes nas respostas recorrendo a uma distribuio do Qui-Quadrado. um teste til para detectar as mudanas de opinio aps uma interveno (antesdepois). Marginal Homogeneity Teste semelhante ao McNemar, mas para variveis multinomiais.

Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem os anos de escolaridade completos do pai e da me. Os resultados encontram-se na base de dados Inquerito1, na varivel maeeduc e paieduc. Teste a hiptese de os anos completos de escolaridade no diferirem entre o pai e a me do inquirido. Resultados

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

118

s k n a R N d s o n A e lt p m o c a d s e d s o n A e lt p m o c d s . a A i a p . b A i a p . c A i a p iv t a g e N t i s o P e s i T t o T
a

k R n a e M 6 0 , 1 3 0 0

8 1 3 b 0 1 3 c 2 5 3 0 8 9

Figura 140: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma das posies.
s i
b

e d e s t l p m o c i a p Z m y s A . a a B . b W

6 1 7 9 ,

Figura 141: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p.

A primeira tabela apresenta os resultados das diferenas, a dimenso, a posio mdia dos grupos positivo e negativo e o somatrio de posies para os mesmos. A segunda tabela apresenta os valores do teste estatstico, e o seu valor de prova. Genericamente as hipteses em estudo so: Ho: As distribuies das variveis so idnticas. H1: As distribuies das variveis no so idnticas. No exemplo podem ser concretizadas da seguinte forma: Ho: As distribuies das variveis anos de escolaridade completos da me e anos de escolaridade completos do pai so idnticas.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

119

H1: As distribuies das variveis anos de escolaridade completos da me e anos de escolaridade completos do pai no so idnticas.

Concluso: No presente exemplo o valor de prova (p) = 0,971. Pelo que se conclui pela no rejeio da hiptese nula. Ou seja no se pode concluir que distribuio das variveis anos escolaridade do pai e da me sejam idnticas na populao, ao nvel de significncia 0.05.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

120

6. Regresso
A anlise da regresso permite, atravs da relao entre variveis, prever a evoluo de uma em funo da outra. Esta previso em termos mdios ou de valores esperados. Por exemplo, podemos definir a nota mdia dos alunos disciplina de BBII em funo do nmero de horas de estudo que dedicaram cadeira, supondo que existe entre estas duas variveis uma relao neste sentido. Neste exemplo, estamos a considerar a nota de BBII como varivel dependente e o nmero de horas de estudo como varivel independente e Y= f(X). Esta relao funcional pode traduzir uma relao linear, exponencial, entre outras. Vamos considerar a regresso linear.

6.1. Regresso Linear Simples


Sendo Y varivel dependente e X a varivel independente podemos considerar a funo mais simples, a equao linear Y= a + bX que traduz um grande nmero de relaes entre variveis e uma boa aproximao em relaes matematicamente mais difceis de descrever. Nesta equao, a e b so constantes que se calculam com base em dados amostrais. A partir do momento em que conhecemos as constantes a e b podemos prever o valor mdio de Y para qualquer valor de X que pertena regio de validade do modelo.
Y Y

Y=a+bX

Y=a+bX

X Relao positiva entre X e Y

X Relao inversa entre X e Y

Figura 142: Representao das possveis relaes lineares entre duas variveis.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

121

O coeficiente a d-nos o valor mdio de Y quando X assume o valor zero. S faz sentido proceder sua anlise quando o valor zero para X pertence regio de validade do modelo. O coeficiente b d-nos a variao mdia de Y quando X varia uma unidade. Se for um valor positivo traduz uma relao positiva entre as duas variveis, ou seja, quando X aumenta, Y aumenta. Se for um valor negativo traduz uma relao inversa entre as duas variveis, ou seja, quando uma aumenta a outra diminui. No SPSS aps introduo dos dados amostrais, para obter a anlise da regresso linear entre duas variveis devemos seguir os seguintes passos: Analyse Regression Linear

Figura 143: Menu para a execuo da regresso linear.

Seleccionamos a varivel dependente e independente e OK. X Y

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

122

Figura 144:Janela de dilogo para a execuo da regresso linear onde se deve indicar quais as variveis dependente e independentes.

E obtemos, entre outros, o quadro com os coeficientes a e b.


a

d o M 1 . e a D p

B ( e W y d o B r e p y c d t i o p n B e o 0 0 3 ,

t 4

Figura 145: Tabela resultante de uma regresso linear onde se apresentam os coeficientes.

Neste caso, em que a nossa varivel dependente era a Percepo Corporal (o SPSS indica qual a varivel dependente em baixo do quadro) e a independente o Peso, obtemos a seguinte equao: Y= 1,800 + 0,163X

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

123

Quando o peso zero a percepo corporal em mdia 1,800. Neste caso, no faz sentido a anlise do coeficiente a porque zero no pertence regio de validade do modelo. Quando o peso varia uma unidade (1Kg) a percepo corporal aumenta em mdia 0,163.

6.2. Regresso Linear Mltipla


A regresso linear simples considera apenas uma varivel independente. No entanto, as situaes reais mostram-nos muitas vezes que para explicar a variao de uma varivel existe mais do que uma varivel a explicar essa variao. Assim, a equao da regresso linear mltipla Y= a+b1X1+b2X2 onde o coeficiente a o valor mdio de Y quando X1 e X2 assumem simultaneamente o valor zero. S faz sentido a sua anlise quando o valor zero para X1 e X2 pertence regio de validade do modelo. O coeficiente b1 traduz a variao mdia de Y quando X1 varia uma unidade e o coeficiente b2 traduz a variao mdia de Y quando X2 varia uma unidade, na regio de validade do modelo. No SPSS para obter os coeficientes da equao procedemos da mesma forma da considerada na regresso linear simples, definindo como varivel independente no uma mas as n variveis independentes que estivermos a considerar no modelo.
a

d o M 1

B C ( u P a r e p y H t c y d o B . e a d t n p D 4 7 0 , 4 3 1 , 2 1 , 7 4 0 , 8 2 3 , 6 1 2 ,

t 4 6 , 1 7 , 8 2

. g i S 9 1 5 , 8 7 4 , 0 , 1 0 ,

9 5 6 , 8 9 3 ,

Figura 146: Tabela resultante de uma regresso linear mltipla onde se apresentam os coeficientes.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

124

A equao que obtemos Y= 0,242-0,053X1+0,659X2+0,398X3

6.3. Estimao da Curva


O modelo de regresso linear pode ser definido teoricamente das seguintes forma: Yi= 0+ 1Xi+ Onde
0 i

e
2

so parmetros e

representa o erro aleatrio de mdia zero e

varincia

. Assumimos que os erros das observaes i e j no esto relacionados.


0 + 1 Xi

O valor esperado de Y pode ser definido como E(Yi)=

No SPSS podemos pedir a estimao da curva de duas formas. Se pretendemos um modelo linear podemos seguir o definido nos pontos acima. Se o nosso objectivo for construir um modelo linear ou no linear podemos optar em Analyse Regression Curve Estimation

onde temos diversos modelos para opo. Podemos igualmente optar por construir a anlise de regresso atravs de uma srie temporal escolhendo a opo Time na definio da varivel independente. A srie temporal permite-nos definir a evoluo ao longo do tempo de uma determinada varivel e prever o valor mdio esperado na varivel dependente para um determinado momento do tempo. A estimao dos coeficientes da equao baseada no mtodo dos mnimos quadrados que nos permite encontrar estimadores no tendenciosos e com varincia mnima. Este mtodo considera para cada observao o desvio entre o valor Yi e o valor esperado E(Yi), encontrando os estimadores a e b que minimizam o quadrado deste desvio.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

125

Figura 147:Menu para a estimao da curva.

Teste aos coeficientes


Podemos testar a hiptese de os coeficientes serem ou no iguais a zero, ou seja, avaliar se apesar do valor positivo ou negativo encontrado na estimao da recta para os coeficientes podemos considerar que na populao eles apresentam um valor significativamente diferente de zero. Para H0: H1:
0 0

=0 0

O valor p obtido aproximadamente zero (ver quadro supra dos coeficientes), logo inferior ao nvel de significncia escolhido (0,05), pelo que rejeitamos H0 e conclumos que para o nvel de significncia de 0,05 temos evidncia estatstica para considerar que o valor de O teste para
1 0

significativamente diferente de zero

obedece ao mesmo critrio de anlise.

Departamento de Produo e Sistemas

ESTSP

Biomatemtica e Bioestatstica II

126

R e R2
Na anlise da regresso h duas medidas de associao entre a varivel dependente e a(s) variveis independentes: Coeficiente de Determinao (R2) indica-nos a proporo da variao total de Y que explicada por X Coeficiente de Correlao (R) indica-nos o nvel de associao entre as variveis. Apresenta um sinal positivo ou negativo consoante o coeficiente b for positivo ou negativo. O SPSS quando procede anlise da regresso sumaria o modelo utilizando o coeficiente de determinao e o coeficiente de correlao.

d o M 1 . r a P d e

9 0 , g h

6 8 0 ,

5 9 6 ,

Figura 148:Tabela resultante da regresso linear onde se apresentam os coeficientes de determinao e correlao.

Neste caso, R2= 0,090, ou seja, a varivel Peso explica apenas 9% da variao da Percepo Corporal e R=30% o que nos d indicao de uma relao fraca entre as variveis.

Departamento de Produo e Sistemas

ESTSP

Você também pode gostar