Escolar Documentos
Profissional Documentos
Cultura Documentos
Ttulo:
Biomatemtica e Bioestatstica II - SPSS
Autores:
Ana Paula Nascimento, Agostinho Cunha, Carla Teixeira Lopes, Ftima Monteiro, Liliana Pereira, Sandra Alves, Vtor Bento
Ano:
2005
Biomatemtica e Bioestatstica II
Sumrio
1. Introduo ao SPSS para Windows. .................................................................... 14 1.1. 1.2. 1.3. Opes gerais do programa .......................................................................... 14 Janelas do SPSS .......................................................................................... 15 Menu principal. Barra de ferramentas. Barra de estado................................. 17
Menu principal..................................................................................................... 17 Barra de ferramentas. ......................................................................................... 18 Barra de estado................................................................................................... 18 1.4. 1.5. 2. Procedimento bsico para uma anlise de estatstica. .................................. 19 Grficos......................................................................................................... 19
Criar um arquivo.................................................................................................. 22 Abrir um arquivo.................................................................................................. 23 Guardar um arquivo ............................................................................................ 25 Informao sobre arquivos de dados .................................................................. 26 2.2. Janela de edio de dados............................................................................ 26
Definio de variveis ......................................................................................... 27 Entrada de dados................................................................................................ 30 Edio de Dados................................................................................................. 30 2.3. Transformaes sobre os dados ................................................................... 31
ESTSP
Biomatemtica e Bioestatstica II
3.1. 3.2.
Tabela de Frequncias........................................................................................ 48 Estatsticas Descritivas ....................................................................................... 52 Grficos .............................................................................................................. 55 3.3. 3.4. Clculo de estatsticas bsicas...................................................................... 60 Anlise exploratria....................................................................................... 63
Estatsticas.......................................................................................................... 65 Diagrama de caixa e fio (Boxplots)...................................................................... 68 Diagrama de tronco e folha (Steam-and-leaf)...................................................... 71 3.5. Tabelas ......................................................................................................... 74
Modificao de estrutura ..................................................................................... 74 Modificao de formatao ................................................................................. 78 4. Testes de hipteses paramtricos........................................................................ 80 4.1. Condies de aplicao dos Testes Paramtricos ........................................ 80
Teste de Kolmogorov-Smirnov ............................................................................ 80 Teste de Shapiro-Wilk ......................................................................................... 80 Teste de Normalidade ......................................................................................... 81 4.2. 4.3. 4.4. Resultados ao Teste de Normalidade............................................................ 83 Mdias .......................................................................................................... 84 Uma amostra................................................................................................. 87
Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel 90 4.5. 4.6. 5. Duas amostras com dados independentes.................................................... 93 Duas amostras com dados emparelhados..................................................... 95
ESTSP
Biomatemtica e Bioestatstica II
Exemplo Prtico ................................................................................................ 104 Qui-Quadrado para independncia de variveis................................................ 106 Exemplo Prtico ................................................................................................ 109 5.2. Binomial ...................................................................................................... 111
Exemplo Prtico ................................................................................................ 112 5.3. Duas amostras Independentes (Mann-Whitney).......................................... 113
Exemplo Prtico ................................................................................................ 115 5.4. Two Related Samples (Wilcoxon)................................................................ 116
Exemplo Prtico ................................................................................................ 117 6. Regresso ......................................................................................................... 120 6.1. 6.2. 6.3. Regresso Linear Simples .......................................................................... 120 Regresso Linear Mltipla ........................................................................... 123 Estimao da Curva .................................................................................... 124
ESTSP
Biomatemtica e Bioestatstica II
Sumrio de Figuras
Figura 2: Janela de entrada no SPSS. ........................................................................ 14 Figura 3: Janela de Edio de Dados. ........................................................................ 15 Figura 4: Janelas de Edio de Dados, de Resultados e de Sintaxe. ......................... 16 Figura 5: Janela de Edio de Grficos. ..................................................................... 16 Figura 6: Janela de Sintaxe. ....................................................................................... 17 Figura 7: Barras de menus e ferramentas. .................................................................. 17 Figura 8: Grfico com a representao de duas variveis........................................... 20 Figura 9: Grfico com a representao de uma varivel. ........................................... 20 Figura 10: Grfico Simples.......................................................................................... 20 Figura 11: Grfico encaixado. ..................................................................................... 20 Figura 12: Menu para a criao de uma nova janela de edio de dados. .................. 22 Figura 13: Menu para abrir uma base de dados j existente. ...................................... 23 Figura 14: cone para abrir uma base de dados. ......................................................... 23 Figura 15: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.................................................................................................................. 24 Figura 16: Janela de dilogo com Wizard para a importao de dados para SPSS. ... 25 Figura 17: Menu para guardar um ficheiro. ................................................................. 25 Figura 18: cone para aceder informao acerca de uma varivel. .......................... 26 Figura 19: Janela de Data View. ................................................................................. 26 Figura 20: Janela de Variable View............................................................................. 27 Figura 21: Janela de dilogo para definir o tipo de varivel......................................... 28 Figura 22: Janela de dilogo para introduzir valores para a varivel. .......................... 28 Figura 23: Janela de dilogo para definir missings...................................................... 29 Figura 24: Menus para inserir casos e variveis. ........................................................ 30 Figura 25: cone para posicionar-se num determinado caso. ...................................... 31 Figura 26: cone para encontrar dados. ...................................................................... 31
ESTSP
Biomatemtica e Bioestatstica II
Figura 27: Janela de dilogo para criar variveis atravs de transformaes noutras. 32 Figura 28: Janela com a informao acerca de uma varivel do ficheiro Cars. ........... 33 Figura 29: Janela de dilogo para criar varivel accel_mi em funo da varivel accel presente no ficheiro Cars. ................................................................................... 33 Figura 30: Janela de dilogo que permite seleccionar casos onde a transformao vai ser efectuada. ..................................................................................................... 34 Figura 31: Janela de dilogo para a recodificao automtica da varivel cityname... 35 Figura 32: Resultado da recodificao automtica da varivel cityname..................... 35 Figura 33: Janela de dilogo para a indicao do novo cdigo. .................................. 36 Figura 34: Janela onde exemplificada a recodificao dos missings........................ 38 Figura 35: Janela de dilogo para criar categorias de forma automtica..................... 38 Figura 36: Janela de dados onde se mostra um exemplo de uma determinada base de dados. ................................................................................................................. 39 Figura 37: Janela de dilogo que permite executar a funo count............................. 40 Figura 38: Janela de dilogo que permite dar a condio para proceder contagem. 40 Figura 39: Janela de dados resultante do procedimento Transform Count. ................ 41 Figura 40: Janela de dilogo que permite ordenar os dados de acordo com vrios critrios. .............................................................................................................. 42 Figura 41: Janela de dados resultante do procedimento Data Sort. ............................ 42 Figura 42: Janela de dilogo que permite executar o Split file. ................................... 43 Figura 43: Janela que exemplifica o Split file efectuado pela varivel sexo (gender). . 44 Figura 44: Janela de dilogo para seleccionar dados. ................................................ 45 Figura 45: Janela de dilogo para especificar a amostra aleatria.............................. 45 Figura 46: Janela de dados onde se mostra uma base de dados contendo a informao de altas verificadas num determinado hospital. ................................ 46 Figura 47: Tabela de frequncias da varivel dia da semana. .................................... 46 Figura 48 Menu Analyze > Descriptive Statistics > Frequencies .............................. 48 Figura 49 Janela de Frequncias ............................................................................. 49
ESTSP
Biomatemtica e Bioestatstica II
Figura 50 Tabela de frequncias.............................................................................. 49 Figura 51 Tabela de Frequncias com casos omissos............................................. 51 Figura 52 Janela de Frequncias opo Format. .................................................. 52 Figura 53 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 52 Figura 54 Janela de Frequncias ............................................................................. 53 Figura 55 Frequencies: Statistics ............................................................................. 53 Figura 56 Estatsticas descritivas ............................................................................. 54 Figura 57 - Menu Analyze > Descriptive Statistics > Frequencies ............................... 56 Figura 58 Janela de Frequncias ............................................................................. 56 Figura 59 Frequencies: Charts................................................................................. 57 Figura 60 Grfico de barras por frequncia absoluta ............................................... 57 Figura 61 Grfico de barras por frequncia relativa ................................................. 58 Figura 62 - Grfico circular.......................................................................................... 58 Figura 63 Histograma .............................................................................................. 59 Figura 64 Histograma com curva normal ................................................................. 59 Figura 65 Janela de edio de Grficos ................................................................... 60 Figura 66 Analyze / Descriptive Statistics / Descriptives .......................................... 61 Figura 67 Janela Descriptives .................................................................................. 61 Figura 68 Janela Descriptives / Options ................................................................... 62 Figura 69 Resultado do procedimento Descriptives ................................................. 62 Figura 70 Scores z................................................................................................... 63 Figura 71 Menu Explore........................................................................................... 64 Figura 72 Janela Explore ......................................................................................... 64 Figura 73 Boto Statistics na janela Explore ............................................................ 65 Figura 74 Explore: Statistics .................................................................................... 66 Figura 75 Estatsticas Descriptives do procedimento Explore para um grupo da categoria Primary Vehicle ................................................................................... 66
ESTSP
Biomatemtica e Bioestatstica II
Figura 76 M-Estimators............................................................................................ 67 Figura 77 - Outliers ..................................................................................................... 67 Figura 78 Percentiles ............................................................................................... 67 Figura 80 Boto Plots na janela Explore .................................................................. 69 Figura 81 Plots em Explore ...................................................................................... 70 Figura 82 - Diagrama caixa e fio ................................................................................. 71 Figura 83 Boto Plots na janela Explore .................................................................. 72 Figura 84 Plots em Explore ...................................................................................... 72 Figura 85 Tabela do SPSS ...................................................................................... 74 Figura 86- Menu de configurao de tabelas .............................................................. 75 Figura 87 Pivoting Trays .......................................................................................... 76 Figura 88 Inserir informao numa nova camada .................................................... 76 Figura 89 Tabela com uma nova camada ................................................................ 77 Figura 90 Troca de linha para coluna....................................................................... 77 Figura 91 Tabela com varivel Primary vehicle em coluna....................................... 78 Figura 92 Opo Toolbar ......................................................................................... 78 Figura 93 Opo TableLooks ................................................................................... 79 Figura 94 Janela TableLooks ................................................................................... 79 Figura 95: Menu a seguir para efectuar o teste normalidade.................................... 81 Figura 96: Janela de dilogo no teste normalidade onde se colocam as variveis a testar e as que vo criar grupos. ......................................................................... 82 Figura 97: Janela onde se selecciona a opo para efectuar o teste normalidade... 83 Figura 98: Tabela de resultado do teste normalidade, que apresenta o nmero de casos vlidos, missings e totais. ......................................................................... 83 Figura 99: Tabela resultante do teste normalidade, com os dois testes KolmogorovSmirnov e Shapiro-Wilk....................................................................................... 84 Figura 100: Menu para efectuar o procedimento Compare Means-> Means............... 85
ESTSP
Biomatemtica e Bioestatstica II
10
Figura 101: Janela de dilogo do procedimento Compare Means-> Means onde visvel onde se devero colocar as variveis dependentes e independentes. ..... 85 Figura 102: Janela de dilogo onde possvel seleccionar as estatsticas a pedir. .... 86 Figura 103: Tabela resultante o procedimento Compare Means-> Means onde se mostram nmero de casos includos, excludos e total........................................ 86 Figura 104: Tabela resultante do procedimento Compare Means-> Means onde se apresentam as estatsticas pedidas. ................................................................... 87 Figura 105: Menu para a execuo do procedimento Teste t para uma amostra. ....... 88 Figura 106: Janela de dilogo resultante da seleco do teste t para uma mostra onde possvel escolher qual a varivel e o valor a testar........................................... 88 Figura 107: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo. ............................................................................................................. 89 Figura 108: Tabela resultante do teste t para uma amostra onde se apresentam algumas estatsticas da varivel a testar. ............................................................ 90 Figura 109: Tabela resultante do teste t para uma amostra onde se apresenta entre outras informaes o valor p, do respectivo teste................................................ 90 Figura 110: Janela onde se efectuar uma partio de todos os procedimentos em funo da varivel sexo....................................................................................... 91 Figura 111: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar assim como o nvel de significncia........................................................... 92 Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso masculino e feminino). ........................................................................................ 92 Figura 113: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam entre outras informaes o valor p para os dois testes. ............................................................................................................................ 92 Figura 114: Menu para a execuo do teste t para amostras independentes.............. 93 Figura 115: Janela de Dilogo onde se devem especificar os grupos. ........................ 94 Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes na qual so visveis algumas estatsticas.................................... 94
ESTSP
Biomatemtica e Bioestatstica II
11
Figura 117: Tabela resultante da realizao do teste t para duas amostras independentes na qual so mostrados os valores p assim como o intervalo de confiana para a diferena de mdias. ................................................................ 95 Figura 118: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas. .................................................................................................... 97 Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde so visveis algumas estatsticas................................................................ 98 Figura 120: Tabela resultante da realizao do teste t para amostras emparelhadas, onde visvel o coeficiente de correlao. .......................................................... 98 Figura 121: resultante da realizao do teste t para amostras emparelhadas, onde visvel o valor p, assim como o intervalo de confiana para a mdia das diferenas. .......................................................................................................... 98 Figura 122: Menu onde se encontram os testes no paramtricos. .......................... 101 Figura 123: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem indicar as variveis assim como os valores a testar............................... 102 Figura 124: Janela de dilogo onde se pode optar por um teste exacto ou por uma aproximao normal....................................................................................... 103 Figura 125: Janela de Dilogo onde se pode optar por pedir algumas estatsticas, assim como o tratamento aos missings............................................................. 104 Figura 126: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam valores observados e esperados, assim como os resduos............................... 105 Figura 127: Tabela resultante do teste do qui-quadrado do ajuste onde se apresenta o .......................................................................................................................... 105 Figura 128: Janela de dilogo para proceder realizao do teste do qui-quadrado para a independncia de variveis, onde se devero indicar quais as variveis a testar................................................................................................................. 107 Figura 129: Janela de dilogo onde se podem pedir algumas estatsticas relativas s variveis a testar no teste do qui-quadrado para a independncia de variveis107 Figura 130: Janela de dilogo onde se pode optar por quais as informaes a apresentar na clula da tabela de contingncia................................................. 108
ESTSP
Biomatemtica e Bioestatstica II
12
Figura 131: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados. ............................................................................................................... 109 Figura 132: Tabela resultante do teste do qui-quadrado para independncia, onde se mostra o nmero de casos vlidos, missings e total.......................................... 109 Figura 133: Tabela de contingncia resultante da execuo do teste do qui-quadrado. .......................................................................................................................... 110 Figura 134: Tabela resultante da execuo do teste do qui-quadrado onde se mostram os valores prova. ............................................................................................... 110 Figura 135: Janela dilogo para a execuo do teste da binomial, onde se devem indicar as variveis assim como as propores a testar. ................................... 112 Figura 136: Tabela resultante do teste da binomial onde so visveis as propores observadas, a proporo a testar assim como o valor p.................................... 113 Figura 137: Janela de dilogo para a execuo de testes no paramtricos para amostras independentes, onde se deve indicar quais as variveis e grupos a testar................................................................................................................. 114 Figura 138: Tabela resultante do teste de Mann-Whitney onde se apresentam os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies............................................................................................................ 115 Figura 139: Tabela resultante do teste de Mann-Whitney, onde se apresenta o valor p. .......................................................................................................................... 115 Figura 140: Janela de dilogo para a execuo dos testes no paramtricos para amostras emparelhadas.................................................................................... 116 Figura 141: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma das posies. .......................................................................................... 118 Figura 142: Tabela resultante do teste de Wilcoxon onde se apresenta o valor p. .... 118 Figura 143: Representao das possveis relaes lineares entre duas variveis. ... 120 Figura 144: Menu para a execuo da regresso linear. .......................................... 121 Figura 145:Janela de dilogo para a execuo da regresso linear onde se deve indicar quais as variveis dependente e independentes.................................... 122
ESTSP
Biomatemtica e Bioestatstica II
13
Figura 146: Tabela resultante de uma regresso linear onde se apresentam os coeficientes. ...................................................................................................... 122 Figura 147: Tabela resultante de uma regresso linear mltipla onde se apresentam os coeficientes. ...................................................................................................... 123 Figura 148:Menu para a estimao da curva. ........................................................... 125 Figura 149:Tabela resultante da regresso linear onde se apresentam os coeficientes de determinao e correlao. .......................................................................... 126
ESTSP
Biomatemtica e Bioestatstica II
14
ESTSP
Biomatemtica e Bioestatstica II
15
Tambm podemos abrir uma sesso do SPSS fazendo duplo clique sobre o cone correspondente o qualquer arquivo do tipo SPSS: de dados: tm extenso .sav e esto no formato SPSS de grficos: tm extenso .cht (grfico de barras, histograma, etc.) de texto: tm extenso .sps (arquivo de sintaxe)ou .lst (arquivo de resultados).
A janela de exibio de resultados e grficos onde aparecem os resultados das anlises realizadas com o programa. Podemos arquivar os resultados para utilizao posterior.
ESTSP
Biomatemtica e Bioestatstica II
16
A janela de grficos permite modificar e guardar grficos e arquivos com extenso .cht.
Existe ainda uma outra janela que a janela de sintaxe onde podemos colar os comandos seleccionados a partir de qualquer caixa de dilogo que corresponde efectuao de uma ou mais anlises estatsticas. Podemos guardar estes comandos num ficheiro de sintaxe (com extenso .sps) o que nos permite aplicar as mesmas anlises estatsticas a ficheiros de dados com igual estrutura.
ESTSP
Biomatemtica e Bioestatstica II
17
Menu principal.
A partir deste menu acedemos maioria das funes do SPSS. O menu principal tem dez opes: File- criar um novo ficheiro SPSS, abrir um existente, guardar, ler dados criados com outra aplicaes, etc. Edit- contm as habituais opes do Windows para copiar dados, procurar, etc. View- permite alterar o aspecto da janela de edio de dados.
ESTSP
Biomatemtica e Bioestatstica II
18
Data- contm opes para efectuar mudanas que afectam todo o arquivo de dados (unir arquivos, transpor variveis e casos, criar subconjuntos de casos, etc.). Estas mudanas so temporrias enquanto no se guarda explicitamente o ficheiro.
Transform- efectua mudanas sobre as variveis seleccionadas, permite a criao de novas variveis.
Graphs- grficos de barras, histogramas, etc. Utilities- obter informao completa do arquivo de dados, aceder a um ndice de comandos do SPSS, etc.
Window- ordenar, seleccionar, controlar atributos das janelas abertas. Help- permite aceder ajuda da aplicao.
Barra de ferramentas.
Situada abaixo da barra do menu principal, a barra de ferramentas exibe um conjunto de cones que, uma vez activados com o rato, realizam os procedimentos mais frequentes. Colocando o rato sobre o cone, exibida uma descrio sobre a tarefa activada. Tanto a barra de ferramentas como a de estado se podem activar ou desactivar a partir da opo do menu View/Toolbar ou Status Bar. Tambm podemos mudar o tamanho dos cones com a opo View/Toolbar.
Barra de estado.
Situada na base da janela da aplicao, indica o estado actual do processo e as seguintes informaes complementares: O nmero de casos processados. Filtro de dados, se utilizarmos somente uma parte do arquivo de dados. apresentada a mensagem Filter on. Varivel ponderada, se utilizarmos o critrio de ponderao. apresentada a mensagem Weight on.
ESTSP
Biomatemtica e Bioestatstica II
19
Segmentao de dados, se trabalharmos com o arquivo de dados dividido em subgrupos a partir de uma ou mais variveis de agrupamento. apresentada a mensagem Split File on.
bsico
para
uma
anlise
de
Para levar a cabo qualquer tipo de anlise com SPSS necessrio efectuar estas trs operaes bsicas: 1. Seleccionar uma base de dados 2. Seleccionar o procedimento estatstico pretendido (menu principal) 3. Seleccionar as variveis a incluir na anlise e outros parmetros adicionais (que surgem nas caixas de dilogo)
1.5. Grficos.
A representao em grficos dos dados de tabelas, quadros e folhas de clculo propicia uma leitura fcil e sedutora da informao. A informao estatstica representada em grficos apreendida pelo destinatrio de uma forma fcil e intuitiva. Para alm dos grficos de utilizao corrente, acessveis em qualquer folha de clculo, o aplicativo SPSS apresenta formatos particulares de grficos de grande qualidade visual, adequados, quer representao de informao especfica, quer ao resumo de grandes quantidades de informao. Em termos gerais, em SPSS, os grficos so estruturados do seguinte modo: 1. Em funo da natureza da varivel estatstica nominal, dicotmica ou contnua. 2. Do nmero de variveis a representar no mesmo grfico. 3. Da natureza independente ou encaixada dos dados a representar. Decorrentes dessa estrutura, em termos genricos, os grficos do SPSS podem ser tipificados de duas formas: 1. Considerando o nmero de variveis a representar no grfico:
ESTSP
Biomatemtica e Bioestatstica II
20
Grfico com medidas (de localizao ou disperso) de duas ou mais variveis contnuas.
10
3,5
6
3,4
3,3
2 Std. Dev = ,91 Mean = 3,3 0 N = 20,00 2,0 3,0 4,0 5,0
Mean
CLAS_MAT
2. Considerando representadas:
natureza
independente
ou
encaixada
das
variveis
10
8
5
4
2
SEXO
Std. Dev = 9,23 Mean = 164,5 0 150,0 160,0 170,0 180,0 N = 20,00
Count
ALTURA
CLA_POR
ESTSP
Biomatemtica e Bioestatstica II
21
Uma proposta de resumo dos grficos mais populares em SPSS a apresentada no quadro seguinte: Tipos de variveis Tipos de grficos
Resumo dos valores de uma varivel nominal Grfico de barras ou quantitativa discreta Casos individuais. Grfico de linhas Grfico circular Grfico de rea Grfico pareto Estatsticas contnuas de duas ou mais variveis Grfico de barras Grfico de linha Grfico circular Boxplot Variveis contnuas Boxplot Histograma Diagrama de caule-e-folhas A aplicao SPSS apresenta um conjunto de formatos de grfico susceptveis de ser configurados em funo da natureza da varivel ou variveis que se pretendem representar. Quando se cria um grfico no menu Graph, exibida uma caixa de dilogo onde se realizam as seleces adequadas.
ESTSP
Biomatemtica e Bioestatstica II
22
2. Arquivo de Dados
Os dados so uma parte fundamental do processo de anlise estatstica, o SPSS possibilita, para alm da anlise estatstica dos dados, o armazenamento. Este armazenamento pode ser encarado sobre duas perspectivas; conforme os dados so organizados pela primeira vez no SPSS, e se cria a base de dados no programa, ou se a informao j foi de alguma forma organizada, e o armazenamento apenas temporrio, i.e., apenas do tempo de anlise.
disponibilizada.
Figura 11: Menu para a criao de uma nova janela de edio de dados.
ESTSP
Biomatemtica e Bioestatstica II
23
Abrir um arquivo
Para File abrir Open um Data arquivo de dados j existentes, basta aceder ao menu
Em qualquer um dos casos aparecer uma janela de dilogo onde dever ser indicada a directoria, ou pasta onde se encontra o ficheiro pretendido, assim como o tipo de ficheiro que o arquivo e finalmente o seu nome.
ESTSP
Biomatemtica e Bioestatstica II
24
Figura 14: Janela de dilogo para a indicao da localizao de uma ficheiro a ser aberto.
Tipos de arquivos que o SPSS reconhece De entre os tipos de arquivos que o SPSS reconhece esto os ficheiros Excel (*.xls), os ficheiros gravados em dBase (*.dbf) e os ficheiros de texto (*.txt). A extenso dos ficheiros gravados em SPSS sav. O software ir ler dos ficheiros Excel e dBase, o nome das variveis, que devero cumprir certos requisitos (ver seco 2.2.1.), assim como abrir casos e linhas conforme o n. de colunas e linhas ocupadas. Os ficheiros de texto so importados com ajuda de um Wizard, que vai guiando cada passo e que possibilita a importao de ficheiros de dados delimitados por vrgulas, espaos, etc.
ESTSP
Biomatemtica e Bioestatstica II
25
Figura 15: Janela de dilogo com Wizard para a importao de dados para SPSS.
Guardar um arquivo
As alteraes feitas sobre um ficheiro s so vlidas durante a sesso de SPSS em que so feitas, a no ser que o ficheiro seja gravado. Tal pode ser conseguido atravs do menu File Save. O ficheiro alterado guardado por cima do existente.
ESTSP
Biomatemtica e Bioestatstica II
26
execuo deste menu produz um ficheiro de output contendo toda a informao acima referida. Uma outra forma de aceder a informao sobre uma varivel atravs do cone presente na barra de ferramentas.
Finalmente possvel obter informao acerca de um ficheiro que no esteja aberto atravs do menu File Display Data Info.
ESTSP
Biomatemtica e Bioestatstica II
27
Definio de variveis
Esta definio feita na janela de edio de dados na janela variable view. Nesta janela cada linha contm informao de uma varivel, informao essa que definida atravs das colunas. Name: deve ser indicada o nome da varivel, este nome estar presente numa coluna da janela data view. Este nome deve seguir determinadas regras: Mximo 8 caracteres; Devem comear por uma letra e no acabar num ponto; No sero aceites nomes em duplicado (o programa no distingue maisculas de minsculas, o que significa que as variveis exp e EXP tm o mesmo nome); Type: deve ser indicado o tipo de varivel, de uma escolha que o programa oferece na maioria dos casos os tipos utilizados so o tipo numrico (Numeric) e o data (Date), visto que mesmo que a natureza da varivel seja string possvel codific-la atravs de um cdigo numrico.
ESTSP
Biomatemtica e Bioestatstica II
28
Width: este campo corresponde dimenso da varivel, define o n mximo de algarismos ou caracteres que o valor da varivel pode tomar. Pode ser preenchido na janela variable view na coluna respectiva ou ento na janela de dilogo do tipo. Decimals: deve indicar-se o n. de casas decimais que a varivl pode tomar caso seja do tipo numrica. Do mesmo modo do campo width pode ser preenchido na janela variable view na coluna respectiva ou ento na janela de dilogo do type. Label: no um campo obrigatrio mas pode ser de extrema utilidade. Por exemplo, pode conter o nome por extenso da varivel que devido ao facto de poder conter apenas 8 caracteres pode no ser explcito. Pode conter, por exemplo, a unidade na qual a varivel est medida. Values: onde indicado o cdigo utilizado para introduzir os valores da varivel. Por exemplo: suponha-se que, para simplificar a introduo, se definia o valor 1 para o sexo masculino e 2 para o sexo feminino, ento aqui que se deve informar o sistema deste cdigo.
ESTSP
Biomatemtica e Bioestatstica II
29
Missing: onde se informa o sistema que um determinado valor representa uma situao anmala e no um valor aceitvel para a varivel. Este missing designado user-missing, uma vez que o utilizador se d conta e informa o sistema sobre essa possibilidade. Existem tambm system-missing, quando o sistema no informado sobre a situao (qualquer clula em branco). Por exemplo, quando um indivduo responde a um questionrio e no responde a uma questo o utilizador pode deixar essa clula em branco (system-missing) ou informar o sistema que quando for introduzido um valor fora da gama admitida para a varivel ele deve interpretar como uma no resposta. Estes missings podem ser definidos de duas formas:
Atravs de pelo menos 3 valores discretos; Atravs de um intervalo de valores acrescido de um valor discreto.
Para se informar o sistema acerca do que significam tais valores deve ser usada a coluna values. Columns: contm a definio do tamanho da coluna que conter a informao da varivel na janela data view. Align: onde se define qual o alinhamento da informao da coluna que conter a informao da varivel na janela data view. Pode ser alinhamento esquerda, direita ou ao centro. Measure: onde se indica a escala de medida da varivel, pode ser Nominal ou Ordinal para as variveis qualitativas e Scale para as variveis quantitativas. NOTA (importante): A correcta definio das caractersticas das variveis essencial e pode comprometer, se no for feita correctamente, a anlise a efectuar na varivel.
ESTSP
Biomatemtica e Bioestatstica II
30
Entrada de dados
A edio de dados feita na janela Data View. Nesta janela: As linhas correspondem a casos, i.e., suponha-se que queremos introduzir os dados de um questionrio respondido por um certo n. de indivduos, cada linha corresponder informao contida num questionrio. As colunas correspondem as variveis. As clulas, que so o cruzamento dos casos com as variveis, contero a informao desse caso relativo a essa varivel. necessrio prudncia para no ter casos e variveis abertas que no contenham informao, pois sero consideradas para as variveis numricas, system-missings e para as variveis string sero consideradas vlidas e consideradas para anlise.
Edio de Dados
possvel modificar total ou parcialmente o contedo de uma clula basta para isso seleccion-la. possvel apagar e copiar clulas, deve ter-se ateno quando se copia valores de clulas para que a clula destino tenha as mesmas caractersticas (type,). possvel inserir casos e variveis atravs do menu Data Insert.
ESTSP
Biomatemtica e Bioestatstica II
31
Clear. Go
possvel encontrar um caso sem ser sequencialmente, atravs do menu Data to Case. Ou atravs do cone que se segue ,presente na barra de ferramentas.
possvel encontrar dados atravs do menu Edit segue, presente na barra de ferramentas.
ser indicado na target variable, atravs de transformaes executadas noutras variveis j existentes.
ESTSP
Biomatemtica e Bioestatstica II
32
Figura 26: Janela de dilogo para criar variveis atravs de transformaes noutras.
Essas transformaes devem ser definidas atravs da construo da expresso numrica (numeric expression). Nesta expresso numrica podero constar variveis existentes no ficheiro, constantes, operadores aritmticos e uma gama de funes, disponibilizadas pelo software, como o valor absoluto, o logaritmo, funes que transformam variveis com valores em segundos em valores em minutos ou horas, como se pode verificar atravs do exemplo 1. Exemplo1 No ficheiro Cars 1, encontra-se a varivel accel, que guarda o tempo de acelerao das 0 s 60 milhas por hora, como visvel na janela que se segue.
Este ficheiro disponibilizado com o software SPSS, pode ser acedido (a no ser que se
tenha procedido a alguma mudana de ficheiros) na pasta do SPSS que abre por defeito.
ESTSP
Biomatemtica e Bioestatstica II
33
Figura 27: Janela com a informao acerca de uma varivel do ficheiro Cars.
Suponha, agora que pretende alterar o tempo de acelerao para milhas por minuto, ento o que deveria fazer era, por exemplo, criar uma varivel nova, design-la, por exemplo, accel_mi, e igual-la funo CTIME.MINUTES, com argumento accel.
Figura 28: Janela de dilogo para criar varivel accel_mi em funo da varivel accel presente no ficheiro Cars.
(Continua) O boto Type & Label permite ao utilizador a especificao do tipo e atribuio de labels, de igual forma ao exposto no ponto 2.2. Uma opo importante nesta operao a opo disponibilizada pelo boto If, que permite efectuar a alterao apenas aos casos que verifiquem a condio indicada pela expresso.
ESTSP
Biomatemtica e Bioestatstica II
34
Exemplo1 (Continuao): Suponha que no exemplo, queremos apenas criar a nova varivel accel_mi, quando o ano do carro for o ano 70. Ento o procedimento a seguir seria na janela disponibilizada pelo boto If, inserir a condio year=70 (year, varivel que guarda o ano do automvel)
Figura 29: Janela de dilogo que permite seleccionar casos onde a transformao vai ser efectuada.
Recodificao de variveis
Este procedimento possibilita a substituio dos valores de uma varivel por outros. O SPSS possibilita esta transformao de duas formas uma das quais automtica. Atravs do menu Transform Automatic Recode, o programa permite a
transformao dos valores de uma varivel noutros automaticamente. Um dos exemplos mais teis na utilizao deste menu, a transformao de uma varivel string em numrica, cujo nome deve ser explicitado na janela que resulta da execuo desta opo. Automaticamente, o programa criar uma janela de output onde dar informao ao utilizador de qual a codificao que realizou. Exemplo 2
ESTSP
Biomatemtica e Bioestatstica II
35
Suponha que no ficheiro flying2, que queria transformar a varivel cityname, do tipo string numa varivel numrica de nome city_2. Este nome dever ser introduzido no rectngulo em branco mais pequeno e depois para que o nome seja aceite deve ser pressionado o boto New Name.
O output criado pelo SPSS o seguinte, onde se podem ver os valores antigos, os novos valores e as suas etiquetas. Como se pode observar o software codificou tambm as clulas vazias, os missings.
(Continua)
2
De igual modo o ficheiro encontra-se (a no ser que se tenha procedido a alguma mudana
ESTSP
Biomatemtica e Bioestatstica II
36
Atravs
do
menu
Transform
Recode,
programa
possibilita
tambm,
recodificao, no entanto o utilizador que dever dar indicaes de como essa recodificao ser feita. Este menu possibilita, ele prprio, duas possibilidades: a recodificao Into Same Variables e a recodificao Into Different Variables. A diferena entre as duas possibilidades apenas o lugar onde se guarda a nova codificao, na primeira possibilidade o novo cdigo guardado na varivel original, na segunda o novo cdigo guardado numa nova varivel, cujo nome dever ser indicado na janela possibilitada pelo menu Transform Recode Into Different
Variables. Em ambas as opes existe a possibilidade de realizar as transformaes apenas a alguns casos, aqueles que verificam uma determinada condio que dever ser definida atravs do boto If atravs do boto Old and New Values que o novo cdigo dever ser definido.
Existem, duas zonas na janela que decorre do boto Old and New Values; uma para a zona dos antigos valores e uma zona para os novos valores. Old Value: Value: o valor antigo a ser codificado; System-missing: se seleccionarmos esta opo recodifica-se os missing de sistema; System-or user-missing: se seleccionarmos esta opo recodifica-se os missing de sistema e os do utilizador;
ESTSP
Biomatemtica e Bioestatstica II
37
Range: through: atravs desta opo pode ser recodificada toda uma gama de valores, indicando o valor mais baixo e o mais alto. Range: Lowest through: atravs desta opo pode ser recodificada toda uma gama de valores desde o valor mais baixo at a um valor indicado. Range: through highest: atravs desta opo pode ser recodificada toda uma gama de valores desde um valor indicado at o maior valor. All other values: nesta opo esto englobados todos os valores no includos nas situaes anteriores.
New Value: Value: onde dever ser indicado o novo valor; System-missing: os novos valores sero desconhecidos do sistema; Copy old value: os valores antigos vo ser iguais aos novos. importante referir que se existirem valores que se mantm eles devem ser referidos seno sero excludos na nova varivel. Esta opo s est presente na opo Into Different Variables. Exemplo 2 (Continuao): Suponha que agora quer recodificar a varivel city_2, numa nova varivel city_3, do seguinte modo: missing Todos os outros valores 99 igual
Ento dever recorrer opo Into Different Variables, nos Old and New Values dever definir os novos valores usando os System-missing nos old values
ESTSP
Biomatemtica e Bioestatstica II
38
Outras Transformaes
O menu Transform Categorize Variables tambm possibilita a criao de categorias, mas de uma forma automtica, o utilizador s tem a possibilidade de especificar o nmero de categorias a criar. Este procedimento til para agrupar dados de uma varivel contnua, pois nem sempre fcil neste tipo de varivel a explicitao das categorias, assim basta ao utilizador dizer qual o nmero de categorias a criar e criada uma varivel contendo as categorias. O utilizador deve atravs de uma tabela de frequncia, por exemplo, analisar quais os limites das classes criadas e criar rtulos.
ESTSP
Biomatemtica e Bioestatstica II
39
contm, por cada caso, o nmero de vezes que um determinado valor apareceu nas variveis seleccionadas. Exemplo 3: Suponha que tem um ficheiro de SPSS que contm para cada ms e para cada zona, o nmero de mortes por acidente, por causa natural e o nmero de acidentes devido a doena prolongada.
Figura 35: Janela de dados onde se mostra um exemplo de uma determinada base de dados.
Suponha que quer saber quantas vezes o n. de mortes devido a cada uma das causas foi superior a 100 em cada ms e em cada zona. Ento poder aceder ao menu Transform Count, onde dever explicitar o nome da nova varivel, assim
como o nome das variveis onde pretende que o programa procure a condio que dever ser definida atravs do boto Define Values.
ESTSP
Biomatemtica e Bioestatstica II
40
Figura 37: Janela de dilogo que permite dar a condio para proceder contagem.
ESTSP
Biomatemtica e Bioestatstica II
41
(Continua) Nota: Em todos estes procedimentos que resultam na criao de novas variveis se dever proceder confirmao de todas as caractersticas da varivel criada na janela Variable View.
ou mais variveis. A primeira varivel determina a primeira ordenao, as restantes determinam as ordenaes dentro da primeira ordenao. Exemplo 3 (Continuao): Suponha que pretende organizar o ficheiro por ordem crescente de nmero de mortos por acidente e dentro desta ordenao pretende ordenar por ordem crescente de nmero de mortos devido a uma causa natural. Ento deveria proceder da seguinte forma:
ESTSP
Biomatemtica e Bioestatstica II
42
Figura 39: Janela de dilogo que permite ordenar os dados de acordo com vrios critrios.
definidos pelos valores de uma ou mais variveis. Este procedimento importante quando existe a suspeita da diferena entre determinados grupos, pois possibilita que toda a anlise seja feita para cada grupo em separado. Vejamos a janela disponibilizada pelo menu Data Split File:
ESTSP
Biomatemtica e Bioestatstica II
43
Analyze all cases, do not create groups: desactiva qualquer separao feita anteriormente; esta opo est por defeito seleccionada, antes de qualquer diviso; Compare groups: separa o ficheiro em grupos de modo a efectuar comparaes; Organize output by groups: qualquer procedimento produzir outputs separados para cada grupo; Groups Based on: aqui que se dever indicar quais as variveis que serviro para criar os grupos, caso sejam introduzidas mais do que uma o programa agrupar pela ordem de introduo. Sort the file by grouping variables: Ordena o ficheiro por grupos; File is already sorted: d-nos a indicao se o ficheiro j se encontra ou no ordenado; Na parte inferior desta janela encontra-se uma indicao de como o ficheiro se encontra, Current Status. Exemplo 4:
ESTSP
Biomatemtica e Bioestatstica II
44
Suponha que pretende analisar as diferenas entre sexos dos empregados de uma determinada firma, cuja informao se encontra guardada no ficheiro Employee Data3. Ento a varivel que ir criar grupos ser a varivel Gender, como se pode ver na figura seguinte.
Figura 42: Janela que exemplifica o Split file efectuado pela varivel sexo (gender).
partir de um critrio que pode incluir variveis e expresses mais complexas. possvel atravs deste menu seleccionar uma amostra aleatria. Este procedimento possibilita a opo de apagar os casos que no satisfaam as condies (unselected cases are: deleted) ou apenas no os incluir na anlise (unselected cases are: filtered).
ESTSP
Biomatemtica e Bioestatstica II
45
No caso da seleco de uma amostra aleatria ento o utilizador tem a opo de indicar qual a percentagem de casos a incluir na amostra ou a possibilidade de indicar o nmero exacto de casos a escolher dos primeiros x (nmero tambm a indicar pelo utilizador).
Sempre que este procedimento for efectuado criada uma nova varivel filter constituda apenas de 0 (zeros) e 1 (uns), conforme o caso no pertena ou pertena amostra. Atravs do menu Data Weight Cases possvel criar uma ponderao cujos valores
ESTSP
Biomatemtica e Bioestatstica II
46
Exemplo 5: Suponha que possui um ficheiro de dados contendo a seguinte informao relativa s altas verificadas num determinado Hospital.
Figura 45: Janela de dados onde se mostra uma base de dados contendo a informao de altas verificadas num determinado hospital.
Se proceder ponderao da varivel dia da semana atravs da varivel altas, ento esta ltima passa a ser a frequncia da primeira, como visvel se procedermos execuo de uma tabela de frequncias.
Note que se no procedermos ponderao teramos que introduzir o Domingo 20 vezes, a Segunda 175, a Tera 655, procedendo de igual forma para os restantes dias da semana.
ESTSP
Biomatemtica e Bioestatstica II
47
3. Estatstica Descritiva
A anlise estatstica univariada inicia o tratamento estatstico e deve ter em conta a tabela de frequncias, a representao grfica da distribuio da varivel e as estatsticas apropriadas ao resumo dos dados em questo.
ou escala racional
ESTSP
Biomatemtica e Bioestatstica II
48
3.2. Frequncias
O procedimento Analyze/Descriptive Statistics/Frequencies permite obter informao sobre a distribuio dos valores da varivel atravs de tabelas de frequncias, de estatsticas descritivas e grficos. Este procedimento til para uma primeira anlise de qualquer tipo de varivel. A informao aqui obtida pode ajudar a determinar os valores tpicos das variveis (Que valores so mais frequentes? Qual a gama de valores que uma varivel toma?), a verificar o cumprimento de determinadas assumpes necessrias para
procedimentos estatsticos (Existe um nmero suficiente de observaes? A distribuio da varivel adequada?) e a avaliar a qualidade dos dados (Existem valores omissos ou mal introduzidos? Existem valores que necessitam de ser recodificados?).
Tabela de Frequncias
A tabela de frequncias distribui os valores da varivel em frequncias simples e acumuladas, que podem ser absolutas ou relativas. Para criar uma tabela de frequncias no SPSS: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.
2. Na janela que surge, seleccionar a(s) varivel(is) que se pretende(m) analisar da lista de variveis que aparece no lado esquerdo e atravs da seta, coloca-la no lado direito.
ESTSP
Biomatemtica e Bioestatstica II
49
3. Seleccione a caixa de seleco Display frequency table. Por omisso, esta caixa encontra-se seleccionada. 4. Clicar em OK. Na janela de sada sero apresentadas duas tabelas.
ESTSP
Biomatemtica e Bioestatstica II
50
A primeira (Statistics), apresenta o nmero de casos vlidos e casos omissos (missing). A segunda tabela a tabela de frequncias propriamente dita. Para os vrios valores que a varivel toma, so apresentados as seguintes frequncias:
Frequency (frequncia simples e absoluta) nmero de casos para um
determinado valor (ou conjunto de valores) da varivel. Por exemplo, no caso apresentado, 1390 pessoas no completaram o ensino secundrio.
Percent (frequncia simples e relativa) - percentagem do nmero de casos
em relao ao nmero total de casos (incluindo casos omissos). No caso apresentado, a % de pessoas que completou o ensino secundrio de 21,7%, valor que se obtm do quociente 1390/6400, sendo 6400 o nmero de casos total (vlidos + omissos).
Valid Percent (frequncia simples e relativa) percentagem do nmero de
casos em relao ao nmero de casos vlidos. No caso apresentado, o nmero de casos vlidos igual ao nmero de casos total, pelo que a percentagem vlida igual percentagem.
Cumulative Percent (frequncia acumulada e relativa) percentagem
acumulada at ao respectivo valor ou categoria, excluindo valores omissos. A ttulo de exemplo, apresenta-se de seguida uma tabela de frequncias para uma situao onde existem casos omissos. Verifique-se na diferena entre a percentagem e a percentagem vlida e numa nova linha no final da tabela para os casos omissos.
ESTSP
Biomatemtica e Bioestatstica II
51
Na janela de frequncias, na opo Format (ver figura 5), existem vrias opes que permitem ordenar segundo diferentes critrios a tabela de frequncias: Ascending Values organiza a tabela de acordo com os valores das variveis em ordem ascendente (do menor para o maior valor). Descending Values - organiza a tabela de acordo com os valores das variveis em ordem descendente. Ascending Counts - organiza a tabela de acordo com as frequncias de ocorrncia dos valores das variveis em ordem ascendente (do menos frequente para o mais frequente). Descending Counts - organiza a tabela de acordo com as frequncias de ocorrncia dos valores das variveis em ordem descendente.
ESTSP
Biomatemtica e Bioestatstica II
52
Estatsticas Descritivas
Atravs do procedimento
Analyze/Descriptive Statistics/Frequencies
tambm possvel calcular vrias estatsticas de tendncia central, de disperso e de forma da distribuio. Para o clculo destas estatsticas, fazer: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.
ESTSP
Biomatemtica e Bioestatstica II
53
3. Surge ento uma nova janela, onde se podero escolher as estatsticas pretendidas.
4. Quando estiverem seleccionadas todas as estatsticas pretendidas, deve-se clicar em Continue. 5. Na janela Frequencies, ento visvel, remover a seleco da opo Display
frequency table, para no ser apresentada a tabela de frequncias.
ESTSP
Biomatemtica e Bioestatstica II
54
percentil 75.
Cut Points for n equal groups (Pontos de corte para n grupos iguais)
apresenta os valores da varivel que divide a amostra em n grupos com o mesmo nmero de casos. Depois de seleccionar esta estatstica o utilizador dever inserir o nmero (entre 2 e 100) de grupos pretendido. Por omisso, a distribuio dividida em 10 grupos iguais.
Percentiles (Percentis) calcula os percentis inseridos pelo utilizador. Para
inserir um percentil o utilizador dever seleccionar a caixa de seleco associada estatstica, inserir o valor do percentil desejado e fazer Add.
Std. Deviation (Desvio padro) Apresenta uma medida da disperso em
redor da mdia.
Variance (Varincia) Calcula a soma do quadrado dos desvios em relao
ESTSP
Biomatemtica e Bioestatstica II
55
Minimum (Mnimo) Apresenta o menor valor. Maximum (Mximo) Apresenta o maior valor. S.E. mean (Erro padro mdio) Apresenta uma estimativa da variabilidade
amostral em relao mdia. O seu clculo obtm-se atravs do quociente entre o desvio padro amostral e a raiz quadrada da dimenso da amostra.
Mean (Mdia aritmtica) Devolve a soma de todos os valores dividido pelo
assimetria. Um sinal positivo indica um pico com uma cauda direita alongada e um sinal negativo uma cauda esquerda alongada. Se a distribuio for simtrica, esta medida tem o valor 0.
Kurtosis (Medida de curtose) apresenta uma medida que indica se a curva
achatada (valores negativos) ou alongada (valores positivos). Uma distribuio normal, tem uma medida de curtose igual a 0. Para mais esclarecimentos acerca de cada medida estatsticas, dever consultar a ajuda, clicando com o boto direito sobre o nome da medida estatstica em questo.
Grficos
Como j foi referido, o procedimento
Analyze/Descriptive
Statistics/Frequencies
o comportamento da(s)
varivel(is) graficamente, atravs de grficos de barras, grficos circulares e histogramas. Para criar um grfico utilizando este procedimento, fazer: 1. No menu Analyze escolher Descriptive Statistics > Frequencies.
ESTSP
Biomatemtica e Bioestatstica II
56
3. Na janela que surge, deve seleccionar-se o tipo de grfico pretendido. Nos grficos de barras e nos grficos circulares, existe a opo de elaborar o grfico com base nas frequncias absolutas (Frequencies) ou com base nas frequncias relativas (Percentages).
ESTSP
Biomatemtica e Bioestatstica II
57
4. Depois de seleccionado o grfico pretendido, clicar em Continue. 5. Na janela Frequencies, ento visvel, remover a seleco da opo Display frequency table, para no ser apresentada a tabela de frequncias. 6. Clicar em OK. De seguida apresentam-se exemplos dos vrios tipos de grficos.
ESTSP
Biomatemtica e Bioestatstica II
58
ESTSP
Biomatemtica e Bioestatstica II
59
Figura 62 Histograma
Para edio dos grficos gerados pelo SPSS, deve-se fazer um duplo-clique sobre o grfico, que provocar a abertura da janela de edio de grficos do SPSS:
ESTSP
Biomatemtica e Bioestatstica II
60
permite, tal
Statistics/Frequencies, obter
algumas estatsticas descritivas. As variveis podem ser ordenadas pelo valor da sua mdia (ordem ascendente ou descendente), alfabeticamente ou pela ordem pela qual se selecciona as variveis no procedimento (opo por omisso). Para alm destas estatsticas, permite tambm calcular valores padro (scores z). Quando os valores padro so guardados, so adicionados janela de edio de dados e ficam disponveis para qualquer procedimento estatstico. Este procedimento til para obter comparaes de variveis quantitativas (intervalares ou racionais) e para identificar casos anormais entre as variveis atravs do clculo dos valores padro. Para executar este procedimento:
ESTSP
Biomatemtica e Bioestatstica II
61
1.
2.
analisar. Se pretender guardar os valores padro das variveis, dever seleccionar a caixa Save standardized values as variables.
3.
poder tambm escolher a ordem pela qual pretende que sejam apresentados os resultados.
ESTSP
Biomatemtica e Bioestatstica II
62
4. Clique em Continue. Na janela que surge clicar em ok. Na janela de sada aparecer uma tabela com os valores de cada estatstica seleccionada para cada varivel.
standardized
values
as
variables sero criadas novas variveis, que aparecero nas ltimas colunas
da janela de edio de dados. Estas variveis tero o nome das variveis em anlise, antecedido pela letra z. No caso apresentado, as variveis em anlise chamam-se longmon e tollmon e as variveis criadas chamam-se zlongmon e
ztollmon.
ESTSP
Biomatemtica e Bioestatstica II
63
Figura 69 Scores z
ESTSP
Biomatemtica e Bioestatstica II
64
anlises separadas por grupos de casos, dever introduzir na caixa Factor List as variveis segundo as quais pretende fazer o agrupamento. Se introduzir mais do que uma varivel na caixa Factor List, sero apresentados resultados separados para cada varivel. Ainda nesta janela poder escolher o tipo de representao que pretende: estatsticas, grficos ou ambos.
ESTSP
Biomatemtica e Bioestatstica II
65
Estatsticas
Atravs do procedimento Explore possvel criar diversas estatsticas. Para tal, dever, a partir da janela Explore: 1. Seleccionar as variveis, seleccionar a opo Both ou Statistics em Display e clicar no boto Statistics.
2. Na janela que surge, poder escolher uma das seguintes opes: a. Descriptives para calcular as seguintes estatsticas: mdia, moda, trimdia a 5% (mdia calculada eliminando 5% das observaes mais baixas e 5% das observaes mais altas), erro padro, varincia, desvio padro, mnimo, mximo, intervalo absoluto, intervalo interquartil, coeficiente de assimetria, erro padro de assimetria, coeficiente de curtose, erro padro de curtose. b. M-estimators para calcular 4 alternativas de medidas de tendncia central (Huber's M-estimator, Andrews' wave estimator, Hampel's redescending Mestimator e Tukey's biweight estimator). Estas quatro medidas utilizam critrios distintos de ponderao dos casos, cujo peso vai diminuindo medida que os casos se afastam da mdia. Quando os dados provm de uma distribuio com longas caudas, ou quando existem outliers, estas medidas so mais precisas do que a mdia ou mediana. c. Outliers apresenta os casos com os 5 maiores valores e os casos com os 5 menores valores.
ESTSP
Biomatemtica e Bioestatstica II
66
d. Percentiles apresenta os seguintes percentis: 10, 25, 50, 75, 90, 95.
e. Depois de seleccionadas as estatsticas pretendidas, dever fazer Continue e depois OK na janela Explore. Sero ento apresentados os resultados na janela de sada do SPSS.
Figura 74 Estatsticas Descriptives do procedimento Explore para um grupo da categoria Primary Vehicle
ESTSP
Biomatemtica e Bioestatstica II
67
Figura 75 M-Estimators
Figura 76 - Outliers
Figura 77 Percentiles
ESTSP
Biomatemtica e Bioestatstica II
68
3 Quartil 50% das observaes centrais, isto , amplitude inter1 Quartil Mediana (2 Quartil)
Valor Mnimo
ESTSP
Biomatemtica e Bioestatstica II
69
Para criar um diagrama de caixa e fio no SPSS, a partir da janela Explore, dever: 3. Seleccionar as variveis, seleccionar a opo Both ou Plots em Display e clicar no boto Plots.
4. Na janela que surge, dever escolher uma das seguintes opes: a. Factor levels together para cada varivel dependente, os diagramas de caixa e fio de cada grupo so apresentados lado a lado. Desta forma, facilmente se compara como os valores da varivel dependente varia nos vrios grupos. Se no for introduzida nenhuma varivel na caixa Factor List ser apresentado apenas um nico diagrama de caixa e fio para a totalidade dos casos. b. Dependents together para cada grupo, so apresentados os diagramas de caixa e fio de cada varivel dependente lado a lado. Desta forma, facilmente se compara os valores das variveis dependentes num grupo especfico. Esta opo til quando as diferentes variveis dependentes representam uma nica caracterstica medida em diferentes instantes temporais.
ESTSP
Biomatemtica e Bioestatstica II
70
5. Se seleccionar a opo None, no ser criado nenhum diagrama de caixa e fio. Caso no pretenda a criao de um diagrama de tronco e folha, dever remover a seleco da opo Steam-and-Leaf. Depois dever clicar em Continue e na janela Explore em OK. 6. Na janela de sada, ser apresentado o diagrama de caixa e fio. O diagrama abaixo apresenta a relao entre o rendimento do agregado familiar e a categoria do principal veculo do agregado. Os outliers moderados so apresentados por um crculo e os outliers severos por um asterisco.
ESTSP
Biomatemtica e Bioestatstica II
71
1200
77 427 250 2980 1812 4929 150 2535 2001 1263 4277 3254 2844 5530 1706 4709 5840 4057 5363 4937 5237 4797 2364 5204 42 5542 3618 5370 539 2384 1147 506 5845 6017 1557 4386 6046 97 992 1760 3600 5066 5434 6196 4365 2096 4719 3221 4533 4575 4327 3565 5323 1194 5385 5871 4641 3452 1425 5805 4965 2432 5606 278 1953 3008 2415 4466 79 5376 525 4793 185 6147 991 2898 3261 934 6197 6176 1183 2136 5481 189 3726 155 4767 2271 325 4014 6153 319 393 3436 886 1074 4653 5947 255 2389 944 2442 5245 4468 1205 2290 6095 732 2702 5184 5784 69 883 2218 4031 4207 5303 4055 5415 4260 306 1016 1848 2922 2108 3576 4570 214 1433 1199 3444 2785 4129 6382 202 876 5495 3161 4899 2076 5968 909 4939 5470 3042 3758 4925 4005 1143 2049 241 2308 212 1870 864 4415 6338 2333 803 3844 276 2215 3212 4887 5780 672 2030 3015 4485 4499 4941 5210 988 5146 1465 2902 2949 3081 3509 4735 1769 3635 29 807 3729 1668 2033 3766 5331 1276 3629 3721
1000
800
600
400
200
0 -200
N= 1841 2275 2284
Economy
Standard
Luxury
ESTSP
Biomatemtica e Bioestatstica II
72
8. Na janela que surge, dever seleccionar a opo Steam-and-leaf. Caso no pretenda a criao de um diagrama caixa e fio, dever seleccionar a opo None, em Boxplots. Se tambm pretender a criao de um histograma, dever seleccionar a opo Histogram. Dever ento fazer Continue e depois OK na janela Explore.
9. Na janela de sada, ser apresentado o diagrama de tronco e folha. O diagrama abaixo relativo varivel que contm o rendimento do agregado familiar.
ESTSP
Biomatemtica e Bioestatstica II
73
esquerda do diagrama apresenta-se a frequncia associada a cada intervalo. Cada caso representado dentro da linha com o valor observado. Para tal, divide-se o valor observado em duas componentes: dgito(s) inicial(is) (tronco) e dgitos finais (folha). O diagrama variar em funo das unidades em que est medida a varivel e do intervalo de valores. Na parte inferior do diagrama explicado o modo como deve ser interpretado cada valor. O Stem width indica o valor pelo qual deveremos multiplicar os valores para obter a unidade real e o Each Leaf indica o nmero de casos que cada elemento na folha representa. No caso apresentado, o tronco corresponde parte inteira das dezenas de milhares do rendimento (a unidade inicial era milhares e o stem width 10) do agregado familiar e a folha parte decimal. Na 1 linha do diagrama, podemos verificar que existem 25 casos com rendimento familiar igual a 0,9 dezenas de milhar. No 2 caso,
ESTSP
Biomatemtica e Bioestatstica II
74
podemos verificar que existem 30 casos (Each Leaf = 30 casos), com rendimento de 1,0; 30 casos com rendimento 1,1; 30 casos com rendimento 1,2; etc.
3.5. Tabelas
As tabelas produzidas pelo SPSS so apresentadas como tabelas pivot na janela de sada. Este tipo de tabelas tem uma grande flexibilidade na estruturao e formatao das tabelas.
Modificao de estrutura
Para modificar a estrutura de uma tabela, dever: 1. Activar a tabela, fazendo um duplo clique em cima da tabela.
ESTSP
Biomatemtica e Bioestatstica II
75
2. Clicar com o boto direito em cima da tabela e escolher a opo Pivoting Trays.
Aparecer ento a seguinte janela, onde cada conjunto de informao representada por . Para saber a que se refere cada um destes smbolos, basta situar o rato por
cima do smbolo durante um breve instante. Depois poder alterar a localizao de cada bloco de informao entre as linhas (Row ), colunas (Column ) ou entre uma nova camada de informao (Layer). Para alterar a localizao, basta arrastar o smbolo para a localizao pretendida.
ESTSP
Biomatemtica e Bioestatstica II
76
poderei escolher atravs de uma caixa de seleco qual o valor desta varivel para o qual pretendo consultar as estatsticas.
ESTSP
Biomatemtica e Bioestatstica II
77
ESTSP
Biomatemtica e Bioestatstica II
78
Como se pode verificar pelos exemplos apresentados, a estruturao de tabelas no SPSS tem bastante potencial e possibilidades.
Modificao de formatao
Para modificar a formatao associada a uma tabela, dever: 1. Activar a tabela, fazendo um duplo clique em cima da tabela. 2. Clicar com o boto direito em cima da tabela e escolher a opo Toolbar.
3. Ficar visvel a barra de formatao, com o que poder formatar todo o aspecto visual da tabela. Para seleccionar a totalidade de uma coluna ou linha, dever fazer Ctrl + Alt em cima do nome da coluna ou linha.
ESTSP
Biomatemtica e Bioestatstica II
79
4. Outra opo possibilidade de formatao o acesso a modelos predefinidos. Para tal dever clicar com o boto direito em cima da tabela e seleccionar a opo tableLooks.
5. Surgir ento uma janela, onde poder escolher um dos modelos pr-definidos.
ESTSP
Biomatemtica e Bioestatstica II
80
Teste de Kolmogorov-Smirnov
Neste teste pretende-se testar se a distribuio da varivel normal, com parmetros e quaisquer: H0 : X ~ N ( , ) Vs H1 : X ~ N ( , )
/ Rejeita-se H0 se o valor prova (p_value) for inferior ou igual ao nvel de significncia ( ), em que o p_value um valor produzido pelo SPSS usando a correco de Lilliefors s tabelas com os valores crticos da distribuio de Kolmogorov-Smirnov.
Teste de Shapiro-Wilk
Este teste apresentado, adicionalmente, pelo SPSS. uma alternativa ao Teste de Kolmogorov-Smirnov no teste normalidade da varivel em estudo.
ESTSP
Biomatemtica e Bioestatstica II
81
Teste de Normalidade
ESTSP
Biomatemtica e Bioestatstica II
82
Figura 95: Janela de dilogo no teste normalidade onde se colocam as variveis a testar e as que vo criar grupos.
ESTSP
Biomatemtica e Bioestatstica II
83
Figura 96: Janela onde se selecciona a opo para efectuar o teste normalidade.
m d a e r T i
O R G e h i d
N 8 0 1 % , 0 1 % 0
N 0 0 % 0 , % 0 ,
N 8 0 1 % 0 % , 0 1
Figura 97: Tabela de resultado do teste normalidade, que apresenta o nmero de casos vlidos, missings e totais.
Neste primeiro quadro output apresentado um pequeno resumo acerca da varivel em estudo, para cada grupo.
ESTSP
Biomatemtica e Bioestatstica II
84
y t i
lf a m r o N t s e T o
a
m d a e r T i t l i . i * s h T . o a n il tL c e r C f a g S s
P U O R G h t l a e i d e
f d 5 6 2 , 0 6 2 , 8 0 1 3 0 1 , 4 5 0 , 4 2 9 , 5 3 7 ,
k l i W r o p a h S f d 8 0 1 2 6 4 , * 1 0 ,
Figura 98: Tabela resultante do teste normalidade, com os dois testes KolmogorovSmirnov e Shapiro-Wilk.
O segundo quadro apresenta o Teste de Kolmogorov-Smirnov com a correco de Lilliefors para as duas amostras da varivel group, com p_value de 0.103 e 0.054 respectivamente. Como o nvel de significncia 0.05, no se rejeita a hiptese nula. Pode, por isso, aplicar-se o Teste de t- Student. Adicionalmente tambm apresentado o Teste de Shapiro-Wilk. Como foi referido nas aulas tericas a anlise normalidade ser sempre efectuada a partir do Teste de Kolmogorov-Smirnov.
4.3. Mdias
A mdia uma Medida de Tendncia Central muito usada na investigao, em reas como as cincias biolgicas. Por este motivo, torna-se fundamental o estudo de mtodos para analisar dados quantitativos (intervalares e racionais) cuja Medida de Tendncia Central adequada seja a mdia. No menu >ANALYZE >COMPARE MEANS >MEANS
possvel calcular uma srie de medidas estatsticas sumrias como mdia, desvio padro, varincia, etc., para um conjunto de variveis em grupos, categorias ou variveis distintas. No ficheiro Coronary artery data,
ESTSP
Biomatemtica e Bioestatstica II
85
Figura 100: Janela de dilogo do procedimento Compare Means-> Means onde visvel onde se devero colocar as variveis dependentes e independentes.
ESTSP
Biomatemtica e Bioestatstica II
86
Seleccionar treadmil time in seconds para a Dependent List e a group para a Independent List.
Na janela OPTIONS podem seleccionar-se as estatsticas que se pretendem calcular. Como output obtm-se dois quadros:
m u S e s a C d e u l c x E t n c r e P 8 1 % N 0 t n c r e P % 0 , N 8 1 s e c o r n i
d e u l c n I N m d a e r T d n o c e s *
l a t o T t n c r e P % 0
Figura 102: Tabela resultante o procedimento Compare Means-> Means onde se mostram nmero de casos includos, excludos e total.
ESTSP
Biomatemtica e Bioestatstica II
87
r o p e R r T O R G e h i d t o T N 0 5 , 8 2 9 0 6 8 0 1 8 1 2 1 l
Figura 103: Tabela resultante do procedimento Compare Means-> Means onde se apresentam as estatsticas pedidas.
O segundo quadro diz respeito aos valores das estatsticas pretendidas de cada varivel treadmill time in seconds em cada group.
ESTSP
Biomatemtica e Bioestatstica II
88
Figura 104: Menu para a execuo do procedimento Teste t para uma amostra.
Figura 105: Janela de dilogo resultante da seleco do teste t para uma mostra onde possvel escolher qual a varivel e o valor a testar.
Janela ONE-SAMPLE T TEST: Test Variable(s) variveis que se pretendem analisar; Test Value valor numrico contra o qual se vai testar a mdia das variveis seleccionadas.
ESTSP
Biomatemtica e Bioestatstica II
89
Figura 106: Janela de dilogo onde se pode indicar o nvel de confiana para o intervalo.
Janela OPTIONS: Confidence interval intervalo de confiana para a diferena das mdias 4; Missing values Exclude cases analysis by analysis so excludos os casos com valores desconhecidos para a varivel seleccionada; Exclude cases listwise so excludos todos os valores desconhecidos da base de dados. Mais uma vez surgem dois quadros.
referncia introduzido no teste. Note que diferente do intervalo de confiana para a mdia da populao apresentado na terica.
ESTSP
Biomatemtica e Bioestatstica II
90
N t a s u 0 6
n a e M 7 4 , 6 2
d n a e M
. 2 4 , 3
Figura 107: Tabela resultante do teste t para uma amostra onde se apresentam algumas estatsticas da varivel a testar.
Este primeiro quadro apresenta o nmero de casos vlidos (N), a mdia amostral (Mean), o desvio padro (Std. Deviation) e o erro padro da mdia (Std. Error Mean).
n a e M t t a su 9 f d 9 5 2 6 , 0 5 , 1 -
c n r e r e w o L 4 3 , 8 r e p U
D i 4 3 , 5
Figura 108: Tabela resultante do teste t para uma amostra onde se apresenta entre outras informaes o valor p, do respectivo teste.
No segundo quadro so apresentados o valor testado (Test value), o valor da estatstica t, o nmero de graus de liberdade (df), o p_value (Sig.(2-tailed)), a diferena entre as mdias (Mean Difference) e o intervalo de 95% de confiana para a diferena das mdias. Neste caso, como o p_value (=0.662) superior ao nvel de significncia (=0.05), no se rejeita H0, pelo que no se conclui, com uma confiana de 95%, que a mdia do estudo seja significativamente diferente de 87.3.
Testes-t simultneos para a mdia de uma varivel agrupada por outra varivel
Considere-se o mesmo ficheiro, saturaoex1. Suponha que se pretende avaliar se a mdia do nvel de saturao da blis ou no igual a 87.3% em cada sexo. Para isso, era necessrio comear por separar os dados de acordo com o sexo. > DATA > SPLIT FILE
ESTSP
Biomatemtica e Bioestatstica II
91
Figura 109: Janela onde se efectuar uma partio de todos os procedimentos em funo da varivel sexo.
De seguida, fazer como se descreveu anteriormente: > ANALYZE >COMPARE MEANS >ONE SAMPLE T-TEST
ESTSP
Biomatemtica e Bioestatstica II
92
Figura 110: Exemplo de um teste t para uma amostra, mostra a varivel e o valor a testar assim como o nvel de significncia.
e n O S e a l p m
i d o x e S M n i m e F
v i a i t a s t a s u u
N 1 3 9 2
n a e M 6 , 0 9 3 8 , 6 2 3 6 , 5 2
n a e M 2 8 , 4 6 7 , 4
Figura 111: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam algumas estatsticas para os dois grupos (neste caso masculino e feminino).
3 . 7
V t s e T f De c n r
d o x e S M n o i m e F
t a t a s r u t a s o u 1 6 2 1 7 ,
f d 0 3 8 2 7 1 2 , 2 8 4 , 7 0 , 6 9 , 3
r e w o L 9 , 5 1 3 , 6 -
r e p U 7 , 3 4 , 3 1
Figura 112: Tabela resultante de teste t simultneos para uma varivel agrupada por outra, onde se apresentam entre outras informaes o valor p para os dois testes.
ESTSP
Biomatemtica e Bioestatstica II
93
No primeiro quadro so apresentados, para a varivel pretendida, tantos grupos de estatsticas quantas as categorias criadas. Neste caso, uma para o sexo feminino e outra para o masculino. O p_value superior ao nvel de significncia (=0.05) em ambos os casos, pelo que, no se rejeita H0 e, com uma confiana de 95%, no se pode concluir que a mdia do estudo em cada sexo, seja significativamente diferente de 87.3.
ESTSP
Biomatemtica e Bioestatstica II
94
Janela INDEPENDENT-SAMPLES T TEST: Test variable variveis escolhidas para a anlise; Grouping variable variveis que dividem os casos pelos dois grupos teste. Define groups Use specified values se os grupos esto j codificados; Cut point seleccionar um ponto de corte para criar dois grupos: um abaixo e outro acima desse ponto.
s iS t p u o r G a
m d a e r T o c n e s i
P U O R G y h t l a e e s a i d
N 8 0 1
n a e M 0 0 , 4 6 7
n o 2 , 8 3 1 5 7 , 3 1 2
n a e M 3 , 8 4 9 5 , 7 6
Figura 115: Tabela resultante da realizao do teste t para duas amostras independentes na qual so visveis algumas estatsticas.
ESTSP
Biomatemtica e Bioestatstica II
95
t s
t s e h f o l a v r e t n I o r E . d t S
i l a u q E r
F m d a e r T i li a u q E n r v s a r v l a u q E s a t o n e m u 7 3 1 ,
. g i S 6 1 7 ,
t 3 7 8 , 1 6 9 , 1
f d 6 1 9 3 4 , 5 1
e l) d a t 2 ( . g i S 8 0 , 8 6 0 , 0 9 , 3 6 1 0 9 , 3 6 1 2 5 , 7 8 9 , 3 8
r e w o L 4 6 , 1 2 0 4 , 3 1 -
r e p U , 9 4 3 0 2 , 1 4 3
Figura 116: Tabela resultante da realizao do teste t para duas amostras independentes na qual so mostrados os valores p assim como o intervalo de confiana para a diferena de mdias.
Na primeira tabela aparecem algumas estatsticas descritivas. Na segunda tabela, apresentado um conjunto de informao acerca da varivel pretendida. Comea com o Teste de Levene para a homogeneidade de varincias (F representa o valor da estatstica de Levene e o respectivo Sig. ou p_value). Depois apresentado o valor da estatstica t (t), o nmero de graus de liberdade (df), o p_value (Sig.(2tailed)), a diferena de mdias (Mean Difference), o erro amostral da diferena de mdias (Std. Error Difference) e os limites inferior e superior do Intervalo de Confiana da diferena. Neste caso, como o p_value para o Teste de Levene superior ao nvel de significncia, no se rejeita H0 e assume-se a igualdade das varincias, dever ento ler-se o valor p, relativamente ao teste de igualdade das mdias na 1 linha (Equal variances assumed), como o p_value superior a 0.05 (0.080) no se rejeita a hiptese nula e no se rejeita a igualdade das mdias nos dois grupos ao nvel de significncia estabelecido.
ESTSP
Biomatemtica e Bioestatstica II
96
Para aplicar este teste necessrio que as variveis dependentes sigam uma distribuio normal. Considere-se o exemplo seguinte: Para testar a eficcia de um novo tratamento de emagrecimento, foram usados os dados relativos a 20 pacientes. Na tabela da pgina seguinte, apresentam-se os valores do peso de cada indivduo antes e aps o tratamento. Para analisar o efeito do tratamento efectua-se um teste para duas amostras com dados emparelhados. Sujeito 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Idade 20 45 33 51 29 18 35 44 57 61 24 36 38 46 54 49 27 21 32 41 Sexo Masculino Feminino Feminino Masculino Feminino Feminino Feminino Masculino Feminino Feminino Masculino Feminino Masculino Masculino Masculino Feminino Masculino Feminino Feminino Masculino Altura 1,77 1,60 1,65 1,72 1,69 1,70 1,59 1,77 1,62 1,71 1,76 1,68 1,81 1,57 1,86 1,66 1,69 1,71 1,72 1,64 Peso inicial 99,8 90,0 100,7 99,1 92,4 101,2 79,1 110,6 85,3 114,3 101,2 100,3 99,5 80,5 116,9 90,8 100,5 98,9 103,5 98,4 Peso final 85,3 73,2 68,0 75,5 74,2 80,4 60,1 82,1 62,4 81,1 74,2 78,4 85,3 54,1 90,8 70,0 68,1 79,3 83,4 67,7
Tabela 2: Tabela contendo informao acerca de 20 indivduos, relativa a avariveis como idade, sexo, altura, peso inicial e peso final.
ESTSP
Biomatemtica e Bioestatstica II
97
Neste caso queremos comparar a mdia das diferenas com o valor zero, para analisar se o tratamento teve ou no efeitos. Para isso fazer, ANALYZE >COMPARE MEANS >PAIRED - SAMPLES T-TEST
Figura 117: Janelas de Dilogo para a realizao do teste t para amostras emparelhadas.
Ao seleccionar a primeira varivel - peso_i esta assumida como variable 1; ao seleccionar a segunda varivel peso_f esta aparece como variable 2. S depois de seleccionadas estas duas variveis que o par colocado na lista. Em OPTIONS seleccionado o nvel para o Intervalo de Confiana. Neste caso 95%.
ESTSP
Biomatemtica e Bioestatstica II
98
lS p m d e r i a
N r i a P 1 e P e d s e P o t n e m a r a t 0 5 0 8 6 , 4 7 0 2 0 2
n o 5 1 8 , 9 8 3 , 9
n a e M 5 9 1 , 2 9 0 , 2
Figura 118: Tabela resultante da realizao do teste t para amostras emparelhadas, onde so visveis algumas estatsticas.
Num primeiro quadro apresentado um conjunto de mediadas estatsticas (mdia, nmero de casos vlidos, desvio padro e erro amostral da mdia) para as variveis seleccionadas.
s e lS p m a d r i P N r i a P 1 e P d s e P o t n e m a r 0 2 . g i S
Figura 119: Tabela resultante da realizao do teste t para amostras emparelhadas, onde visvel o coeficiente de correlao.
Numa segunda tabela aparece informao que permite inferir acerca da correlao entre o par seleccionado (nmero de casos vlidos para ambas as variveis, coeficiente de correlao e nvel de significncia). Convm destacar que o coeficiente de correlao varia entre -1 e 1. Quanto mais prximo de -1 ou +1 estiver, mais linearmente relacionadas se encontram as variveis. Se o valor prova (p_value) for inferior ao nvel de significncia as variveis esto relacionadas.
n a e M r i a P 1 e P d s e P a r t o n e m 0 7
n o
n a e M 5 2 3 , 1
r e w o L 7 9 6 , 0 2
r e p U 3 4 , 6 2
t 3 , 7 1
f d 9 1
t 0 ,
Figura 120: resultante da realizao do teste t para amostras emparelhadas, onde visvel o valor p, assim como o intervalo de confiana para a mdia das diferenas.
ESTSP
Biomatemtica e Bioestatstica II
99
O ltimo quadro contm informao acerca das variveis seleccionadas: mdia, desvio padro, erro amostral da mdia, os limites do Intervalo de Confiana, o valor da estatstica t para o teste, o nmero de graus de liberdade e o nvel de significncia. Neste caso, o p-value (Sig. (2-tailled)) tem o valor de 0.000 que inferior ao nvel de significncia (0.05), pelo que se rejeita a hiptese nula. Por este motivo pode concluirse que as mdias so significativamente diferentes, isto , a mdia no grupo mudou como resultado do tratamento.
ESTSP
Biomatemtica e Bioestatstica II
100
desenvolvidos exclusivamente para variveis ordinais, e que estes testes no so uma alternativa a utilizar numa m recolha de dados. Assim necessrio, como em qualquer inferncia, assegurar a representatividade da amostra. Os teste no paramtricos so requeridos no SPSS no menu Analyze, em Nonparametrics Tests.
ESTSP
Biomatemtica e Bioestatstica II
101
ESTSP
Biomatemtica e Bioestatstica II
102
Figura 122: Janela de Dilogo para a realizao do teste do qui-quadrado onde se devem indicar as variveis assim como os valores a testar.
Na janela surge a localizao da varivel ou variveis em estudo test variable list. As variveis que se pretendem analisar devem ser seleccionadas para esta lista. Surgem igualmente opes para definir as categorias em anlise Expected Range: definida na varivel Get from data, (atribui a mediante a codificao, e todas esto em anlise), definir as categorias mediante um intervalo Use specified range, (neste caso apenas as categorias codificados pelo intervalo esto em anlise). A opo Expected Values corresponde ao valor que se pretende testar, ou seja frequncia esperada para cada categoria. Pode-se assumir como todas as categorias apresentam igual proporo (All categories equal), ou especificar os valores de proporo tericos. Deve-se ter em ateno a introduo dos valores (values) pela ordem em que se encontram as categorias. A Janela do Chi-Square apresenta tambm dois botes, Exact e Options. Na janela Exact Tests existe a possibilidade de ajustar a exactido do teste a realizar.
ESTSP
Biomatemtica e Bioestatstica II
103
Figura 123: Janela de dilogo onde se pode optar por um teste exacto ou por uma aproximao normal.
As opes so as mesmas que surgem na Janela Exact Tests que surge no procedimento Analyze Descritives Statistics Crosstabs. Esta janela igual para
todos os testes no paramtricos. Asymptotic only apenas assimpttica o nvel de significncia baseado numa distribuio assimpttica da estatstica de teste geralmente de 5%. Baseia-se na hiptese de o conjunto de dados ser elevado. Caso a amostra apresente uma dimenso pequenas, ou pobremente distribuda, pode no ser uma boa indicao para a significncia do teste. Monte Carlo uma estimativa no enviesada do nvel de significncia exacto, calculado repetidamente por amostragens a partir de um conjunto de tabelas com as mesmas dimenses da tabela em estudo. Permite calcular significncias exactas. Confidence Level nvel de confiana introduzir um valor entre 0,1 e 99,9 para especificar a probabilidade com que o intervalo de confiana, baseado nos valores amostras, inclui a mdia da populao. Number of Samples nmero de amostras - introduzir um valor entre 1 e 1.000.000.000 para o nmero de amostras a utilizar no calculo da estatstica. Nmeros mais elevados aumentam a fiabilidade, mas demoram mais tempo a serem executados. Exact exacto a probabilidade do resultado observado ou um resultado mais extremo ser calculado com exactido. Tipicamente um valor menor que 0,05 considerado significativo.
ESTSP
Biomatemtica e Bioestatstica II
104
Time limit per Test limite de tempo por teste - introduzir um valor entre 1 e 9.999.999.999 como tempo mximo permitido para calcular cada teste. Na janela de opes tem-se a possibilidade de requerer as estatsticas descritivas (mdia, desvio padro, mnimo, mximo e dimenso da amostra) e os quartis.
Figura 124: Janela de Dilogo onde se pode optar por pedir algumas estatsticas, assim como o tratamento aos missings.
Surgem igualmente as opes de tratamento de missings. O caso com um missing numa determinada varivel pode ser excludo, apenas se a varivel estiver envolvida no teste em questo (Exclude cases test-by-test) (tal significa que os dados desse caso sero usados em todos os procedimentos nos quais a varivel no esteja envolvida) ou em todos os procedimentos mesmo que a varivel no esteja envolvida (Exclude cases listwise). Esta janela igual para todos os testes no paramtricos.
Exemplo Prtico
Num dado inqurito solicitava-se aos inquiridos que assinalassem a sua posio poltica, em termos de direita, centro e esquerda. Os resultados encontram-se na base de dados Inquerito1, na varivel politica. Nas ltimas eleies os eleitores votaram de acordo com a tabela seguinte: Direita Proporo(n) 0,29 Centro 0,40 Esquerda 0,31
ESTSP
Biomatemtica e Bioestatstica II
105
Teste a hiptese desta amostra ser representativa da populao em estudo para a varivel em causa. Esta primeira tabela contm os valores observados (Observed N) e os valores esperados (Expected N). Esta tabela foi ponderada pelos valores tericos. O resduos correspondem diferena entre os valores observados e os valores esperados.
a e v r s b O a d r e u q s E o r t n e C t r a e i D l a t o T 0 4 1 5 3 0 5 8 4 1 x 2 , 1 4 2 , 7 6 5 6 , 9 3 4 2 4 , 3 6
Resultados:
Figura 125: Tabela resultante do teste do qui-quadrado do ajuste onde se apresentam valores observados e esperados, assim como os resduos.
A tabela seguinte contm o valor da estatstica do teste (Chi-square), o nmero de graus de liberdade (df), e o nvel de significncia (Asymp. Sig.) neste caso assimttica. Adicionalmente fornece informao sobre o prprio rigor do teste e da sua aplicao.
s i
h C f d . p m y s A . c a 0 l e e h T .n 5 m u i
0 2 1 0 ,
Genericamente as hipteses em estudo so: Ho: a populao segue uma distribuio especfica H1: a populao no segue essa distribuio especfica Concluso:
ESTSP
Biomatemtica e Bioestatstica II
106
No presente exemplo verificam-se os pressupostos para a aplicao do Qui-quadrado (a no existncia de valores observados =0; apenas 20% dos valores esperados podem ser < 5; nenhum valor esperado poder ser <1) O valor de prova (p) = 0,001, pelo que se conclui pela rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no representatividade da amostra na varivel
ESTSP
Biomatemtica e Bioestatstica II
107
Figura 127: Janela de dilogo para proceder realizao do teste do qui-quadrado para a independncia de variveis, onde se devero indicar quais as variveis a testar. Os botes Statistics, Cells e Format, abrem as janelas correspondentes.
Figura 128: Janela de dilogo onde se podem pedir algumas estatsticas relativas s variveis a testar no teste do qui-quadrado para a independncia de variveis
ESTSP
Biomatemtica e Bioestatstica II
108
O qui-quadrado (Chi-square) testa apenas a hiptese de associao entre as variveis, no indicando a intensidade ou direco da associao. As correlaes (Correlations) apresentam o coeficiente de Pearson e o de Spearman, o primeiro para variveis intervalares/racionais e o segundo para variveis ordinais. Variam entre 1 e 1, o 0 corresponde a uma ausncia de relao, o sinal ou + corresponde direco da associao. possvel requerer outros coeficientes de correlao, tendo sempre em considerao o tipo de varivel. A interpretao do resultado idntica realizada para o coeficiente de Pearson ou de Spearman. As correlaes nominais so isentas de sinal, a ordem de codificao aleatria, no segue uma ordem, logo no existe uma direco de associao. Na janela cell display proporciona a opo de seleccionar os valores a visualizar na tabela de contingncia, para alm dos observados pode-se requerer os valores esperados, percentagem e resduos. Os resduos padronizados permitem uma comparao mais rpida dos desvios relativos aos valores esperados dos observados. Os resduos padronizados so significativos quando superiores a 2 em termos absolutos. Resduos padronizados superiores a 2 so suspeitos de existncia de associao entre as variveis.
Figura 129: Janela de dilogo onde se pode optar por quais as informaes a apresentar na clula da tabela de contingncia.
ESTSP
Biomatemtica e Bioestatstica II
109
Figura 130: Janela de dilogo onde se pode optar qual a forma de ordenao dos dados.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a sua intensidade com que vivem a religio e a frequncia de actos religiosos. Os resultados encontram-se na base de dados Inquerito1, na varivel freqreli e intenrel. Teste a hiptese destas variveis serem independentes. Na primeira tabela temos um resumo da anlise realizada em termos de nmero de casos vlidos e missings.
e s a C N u q e r F io v r e s e t n I 9 3 1 t n c r e P % , 6 7 N 7 4 3 , 3 2 % N
0 % 1 0
Figura 131: Tabela resultante do teste do qui-quadrado para independncia, onde se mostra o nmero de casos vlidos, missings e total.
A segunda tabela, tabela de dupla entrada, apresenta-nos os valores observados, os valores esperados e os resduos padronizados. Pela anlise desta tabela pode-se prever a dependncia entre as variveis. Os resduos padronizados elevados, e o facto de seguirem uma linearidade na oblqua leva-nos a pensar que tal se verifica.
ESTSP
Biomatemtica e Bioestatstica II
110
s o g i
c a r F r F v r s e d e r s o n e M v a m u d o p e v a m U n u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E R . d t S l a u i s e u o C t c e p x E 5 7 , 7 3 1 , 6 0 3 1 0 , 1 7 0 , 7 0 1 7 , 3 4 6 0 , 3 6 4
a r e d o M 9 , 1 6 , 9 1 9 , 0 2 4 , 5 2 0 , 1 3 1 0 , 4 2 0 , 2 2 1 , 8 , 1 0 3 0 , 1 3 2 , 4 8 , 4 1 8 , 2 6 3 1
e t r o F 9 2 , 4 3 , 5 6 2 1 , 3 8 3 , 6 5 4
l a t o T 3 9 0 , 3 9 5 7 1
a i r V
0 7 1
v a m U
2 3
9 0 1
u o 2
4 6 0 , 3 5 1 , 5 3 0 , 3 5 9 1 4 , 6 7 1 9 , 8 5 6 , 7 1 4 5
4 3 1
e s a u Q e s s a d o T m e
9 , 0 3 8 , 3 5 3 9 , 6 3 3 , 0 5 7 , 6 2 6 4
4 7 0 , 4 7 0 6 2
s d ie a M r o p z v m u n a m e s l a t o T
4 2 1
9 3 1
e o s r a e P i h C n h i k o l e L n r a e iL y b i c o s A f o N . l a s e c 0 m n t c p x e u id
f d 4 1 4 1 1
i s 2 ( 0 , 0 , 0 ,
9 3 1 (
Figura 133: Tabela resultante da execuo do teste do qui-quadrado onde se mostram os valores prova.
ESTSP
Biomatemtica e Bioestatstica II
111
Genericamente as hipteses em estudo so: Ho: as variveis so independentes H1: as variveis no so independentes Neste exemplo podem ser concretizadas da seguinte forma: Ho: Os actos religiosos e a intensidade com que se vive a religio so independentes. H1: Os actos religiosos e a intensidade com que se vive a religio no so independentes. Concluso: No presente exemplo o valor de prova (p) < 0,001. Pelo que se conclui pela rejeio da hiptese nula, para um =0,05. Ou seja conclui-se que os actos religiosos e a
5.2. Binomial
O procedimento binomial permite testar se a proporo de uma categoria de uma varivel dicotmica, ou tornada dicotmica, da amostra difere de uma determinada constante, por ex. a proporo do sexo na populao. Na janela surge a localizao da varivel em estudo test variable e o valor com que se vai proceder ao teste test Proportion, note que este valor a testar ficar associado ao 1 grupo, a proporo para o segundo grupo ser 1 menos o valor introduzido.
ESTSP
Biomatemtica e Bioestatstica II
112
Figura 134: Janela dilogo para a execuo do teste da binomial, onde se devem indicar as variveis assim como as propores a testar.
Surgem igualmente as opes para definir a dicotomia, pode ser a definida na varivel (atribui os casos com a categoria mais baixa a um grupo e os de categoria mais alta a outro), ou definir a dicotomia por um ponto de corte, o valor a inserir deve corresponder ao value da categoria a ficar no segundo grupo, as categorias com value inferior ficam no grupo 1, o grupo 2 constitudo pelo valor inserido e superiores. A varivel deve estar bem definida para no misturar diferentes itens. A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas anteriormente.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem a seu sexo. Os resultados encontram-se na base de dados Inquerito1, na varivel sexo. Nos ltimos censos realizados a proporo do sexo feminino era de 55%. Teste a hiptese desta amostra ser representativa da populao em estudo para a varivel em causa. Resultados: A tabela de resultados apresenta a dicotomia em anlise, a dimenso de cada categoria, a proporo observada. E o nvel de significncia do teste.
ESTSP
Biomatemtica e Bioestatstica II
113
a i p m y s A N d o x e S o r G o r G a t o T . a B m e F u c s a M o 3 4 8 3 4 6 6 8 4 1 . p o r P 7 5 , 3 4 , 0 , 1 t s e T 5 ,
a
4 9 0 ,
Figura 135: Tabela resultante do teste da binomial onde so visveis as propores observadas, a proporo a testar assim como o valor p.
As hipteses em estudo so: Ho: a populao apresenta uma proporo de femininos = 0,55 H1: a populao apresenta uma proporo de femininos 0,55
necessrio ter em ateno se os resultados gerados so para um teste bilateral ou unilateral. O SPSS quando testa uma proporo diferente de 0,5 apresenta um teste unilateral. O nvel de significncia do teste, cujas hipteses foram referidas anteriormente, obtm-se multiplicando o resultado Asymp. Sig. (1-tailed) por 2. Concluso: No presente exemplo o valor de prova (p) = 0.188. Pelo que se conclui pela no rejeio da hiptese nula, para um =0,05. Ou seja conclui-se pela no
ESTSP
Biomatemtica e Bioestatstica II
114
Figura 136: Janela de dilogo para a execuo de testes no paramtricos para amostras independentes, onde se deve indicar quais as variveis e grupos a testar.
Tipo de teste Mann-Whitney U o teste no paramtrico equivalente ao teste t, testa a hiptese de duas amostras serem provenientes da mesma populao. Requer que as variveis se encontrem pelo menos numa escala ordinal. mais potente que o teste de medianas por utilizar a ordem de casos. O valor de U o nmero de vezes que um valor do primeiro grupo precede um valor no segundo grupo, quando ordenados de forma crescente. Kolmogorov-sminorv Z testa a hiptese de duas amostras serem provenientes da mesma populao. sensvel a qualquer tipo de diferena entre as duas distribuies. O teste baseado na maior diferena entre as duas distribuies acumuladas. Moses extreme reactios concebido para testar hipteses nas quais se esperam que a varivel experimental afectar alguns casos numa direco e outros casos na direco oposta. Teste para respostas extremas comparadas com o grupo de controlo. Wald-Wolfowitz runs testa a hiptese de duas variveis serem provenientes da mesma populao. Os valores de ambas as amostras so combinados e ordenados de forma crescente. Se as variveis forem provenientes da mesma populao, os dois grupos devero estar distribudos aleatoriamente ao longa da ordenao.
ESTSP
Biomatemtica e Bioestatstica II
115
A Janela do Binomial apresenta tambm dois botes, Exact e Options, j tratadas anteriormente.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem o seu sexo e os anos de escolaridade completos. Os resultados encontram-se na base de dados Inquerito1, na varivel sexo e educ. Teste a hiptese de os anos completos de escolaridade no diferirem entre os dois sexos. Resultados
k s o n A m o c d o x e S M e F l a t o T N 9 3 6 0 4 8 k n a R e M 7 5 9 0 , 7 4
Figura 137: Tabela resultante do teste de Mann-Whitney onde se apresentam os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies.
d r i u q t y e i h W n a M W Z m y s A . r a G u o 0 0 4 0 9 ,
A primeira tabela apresenta os grupos em anlise, a dimenso, a posio mdia do grupo e o somatrio de posies. A segunda tabela apresenta os valores do teste estatstico, e a seu valor de prova. Genericamente as hipteses em estudo so: Ho: A distribuio da varivel nas duas populaes idntica.
ESTSP
Biomatemtica e Bioestatstica II
116
H1: A distribuio da varivel nas duas populaes no idntica. No exemplo podem ser concretizadas da seguinte forma: Ho: Os anos de escolaridade completos so idnticos nos dois sexos. H1: Os anos de escolaridade completos no so idnticos nos dois sexos.
Concluso: No presente exemplo o valor de prova (p) = 0,909. Pelo que se conclui pela no rejeio da hiptese nula. Ou seja no se pode concluir que os anos de escolaridade nos dois sexos no so idnticos, ao nvel de significncia 0.05.
Figura 139: Janela de dilogo para a execuo dos testes no paramtricos para amostras emparelhadas.
ESTSP
Biomatemtica e Bioestatstica II
117
Tipo de teste Wilcoxon testa a hiptese de duas variveis serem provenientes da mesma populao, sem postular qualquer hiptese sobre a forma de distribuio das duas variveis. A estatstica do teste baseia-se nas ordens dos valores absolutos das diferenas entre as duas variveis. Sign teste dos sinais testa a hiptese de duas variveis serem provenientes da mesma populao. As diferenas entre as duas variveis para todos os casos so calculados e classificados como positivos, negativos ou empate. Se duas variveis forem similarmente distribudas, as diferenas positivas e negativas no so estatisticamente significativas. McNemar Teste no paramtrico para duas variveis emparelhadas dicotmicas. Testa as modificaes nas respostas recorrendo a uma distribuio do Qui-Quadrado. um teste til para detectar as mudanas de opinio aps uma interveno (antesdepois). Marginal Homogeneity Teste semelhante ao McNemar, mas para variveis multinomiais.
Exemplo Prtico
Num inqurito solicitava-se aos inquiridos que assinalassem os anos de escolaridade completos do pai e da me. Os resultados encontram-se na base de dados Inquerito1, na varivel maeeduc e paieduc. Teste a hiptese de os anos completos de escolaridade no diferirem entre o pai e a me do inquirido. Resultados
ESTSP
Biomatemtica e Bioestatstica II
118
s k n a R N d s o n A e lt p m o c a d s e d s o n A e lt p m o c d s . a A i a p . b A i a p . c A i a p iv t a g e N t i s o P e s i T t o T
a
k R n a e M 6 0 , 1 3 0 0
8 1 3 b 0 1 3 c 2 5 3 0 8 9
Figura 140: Tabela resultante do teste de Wilcoxon onde se apresentam a mdia e soma das posies.
s i
b
e d e s t l p m o c i a p Z m y s A . a a B . b W
6 1 7 9 ,
A primeira tabela apresenta os resultados das diferenas, a dimenso, a posio mdia dos grupos positivo e negativo e o somatrio de posies para os mesmos. A segunda tabela apresenta os valores do teste estatstico, e o seu valor de prova. Genericamente as hipteses em estudo so: Ho: As distribuies das variveis so idnticas. H1: As distribuies das variveis no so idnticas. No exemplo podem ser concretizadas da seguinte forma: Ho: As distribuies das variveis anos de escolaridade completos da me e anos de escolaridade completos do pai so idnticas.
ESTSP
Biomatemtica e Bioestatstica II
119
H1: As distribuies das variveis anos de escolaridade completos da me e anos de escolaridade completos do pai no so idnticas.
Concluso: No presente exemplo o valor de prova (p) = 0,971. Pelo que se conclui pela no rejeio da hiptese nula. Ou seja no se pode concluir que distribuio das variveis anos escolaridade do pai e da me sejam idnticas na populao, ao nvel de significncia 0.05.
ESTSP
Biomatemtica e Bioestatstica II
120
6. Regresso
A anlise da regresso permite, atravs da relao entre variveis, prever a evoluo de uma em funo da outra. Esta previso em termos mdios ou de valores esperados. Por exemplo, podemos definir a nota mdia dos alunos disciplina de BBII em funo do nmero de horas de estudo que dedicaram cadeira, supondo que existe entre estas duas variveis uma relao neste sentido. Neste exemplo, estamos a considerar a nota de BBII como varivel dependente e o nmero de horas de estudo como varivel independente e Y= f(X). Esta relao funcional pode traduzir uma relao linear, exponencial, entre outras. Vamos considerar a regresso linear.
Y=a+bX
Y=a+bX
Figura 142: Representao das possveis relaes lineares entre duas variveis.
ESTSP
Biomatemtica e Bioestatstica II
121
O coeficiente a d-nos o valor mdio de Y quando X assume o valor zero. S faz sentido proceder sua anlise quando o valor zero para X pertence regio de validade do modelo. O coeficiente b d-nos a variao mdia de Y quando X varia uma unidade. Se for um valor positivo traduz uma relao positiva entre as duas variveis, ou seja, quando X aumenta, Y aumenta. Se for um valor negativo traduz uma relao inversa entre as duas variveis, ou seja, quando uma aumenta a outra diminui. No SPSS aps introduo dos dados amostrais, para obter a anlise da regresso linear entre duas variveis devemos seguir os seguintes passos: Analyse Regression Linear
ESTSP
Biomatemtica e Bioestatstica II
122
Figura 144:Janela de dilogo para a execuo da regresso linear onde se deve indicar quais as variveis dependente e independentes.
d o M 1 . e a D p
B ( e W y d o B r e p y c d t i o p n B e o 0 0 3 ,
t 4
Figura 145: Tabela resultante de uma regresso linear onde se apresentam os coeficientes.
Neste caso, em que a nossa varivel dependente era a Percepo Corporal (o SPSS indica qual a varivel dependente em baixo do quadro) e a independente o Peso, obtemos a seguinte equao: Y= 1,800 + 0,163X
ESTSP
Biomatemtica e Bioestatstica II
123
Quando o peso zero a percepo corporal em mdia 1,800. Neste caso, no faz sentido a anlise do coeficiente a porque zero no pertence regio de validade do modelo. Quando o peso varia uma unidade (1Kg) a percepo corporal aumenta em mdia 0,163.
d o M 1
B C ( u P a r e p y H t c y d o B . e a d t n p D 4 7 0 , 4 3 1 , 2 1 , 7 4 0 , 8 2 3 , 6 1 2 ,
t 4 6 , 1 7 , 8 2
. g i S 9 1 5 , 8 7 4 , 0 , 1 0 ,
9 5 6 , 8 9 3 ,
Figura 146: Tabela resultante de uma regresso linear mltipla onde se apresentam os coeficientes.
ESTSP
Biomatemtica e Bioestatstica II
124
e
2
so parmetros e
varincia
No SPSS podemos pedir a estimao da curva de duas formas. Se pretendemos um modelo linear podemos seguir o definido nos pontos acima. Se o nosso objectivo for construir um modelo linear ou no linear podemos optar em Analyse Regression Curve Estimation
onde temos diversos modelos para opo. Podemos igualmente optar por construir a anlise de regresso atravs de uma srie temporal escolhendo a opo Time na definio da varivel independente. A srie temporal permite-nos definir a evoluo ao longo do tempo de uma determinada varivel e prever o valor mdio esperado na varivel dependente para um determinado momento do tempo. A estimao dos coeficientes da equao baseada no mtodo dos mnimos quadrados que nos permite encontrar estimadores no tendenciosos e com varincia mnima. Este mtodo considera para cada observao o desvio entre o valor Yi e o valor esperado E(Yi), encontrando os estimadores a e b que minimizam o quadrado deste desvio.
ESTSP
Biomatemtica e Bioestatstica II
125
=0 0
O valor p obtido aproximadamente zero (ver quadro supra dos coeficientes), logo inferior ao nvel de significncia escolhido (0,05), pelo que rejeitamos H0 e conclumos que para o nvel de significncia de 0,05 temos evidncia estatstica para considerar que o valor de O teste para
1 0
ESTSP
Biomatemtica e Bioestatstica II
126
R e R2
Na anlise da regresso h duas medidas de associao entre a varivel dependente e a(s) variveis independentes: Coeficiente de Determinao (R2) indica-nos a proporo da variao total de Y que explicada por X Coeficiente de Correlao (R) indica-nos o nvel de associao entre as variveis. Apresenta um sinal positivo ou negativo consoante o coeficiente b for positivo ou negativo. O SPSS quando procede anlise da regresso sumaria o modelo utilizando o coeficiente de determinao e o coeficiente de correlao.
d o M 1 . r a P d e
9 0 , g h
6 8 0 ,
5 9 6 ,
Figura 148:Tabela resultante da regresso linear onde se apresentam os coeficientes de determinao e correlao.
Neste caso, R2= 0,090, ou seja, a varivel Peso explica apenas 9% da variao da Percepo Corporal e R=30% o que nos d indicao de uma relao fraca entre as variveis.
ESTSP