Escolar Documentos
Profissional Documentos
Cultura Documentos
ÍNDICE
1- INTRODUÇÃO .......................................................................................... 1
2- EDITOR DE DADOS .............................................................................. 3
2.1 - CRIAR UM FICHEIRO DE DADOS .................................................. 5
2.1.1 - DEFINIÇÃO DE VARIÁVEIS .................................................................... 5
2.1.2 - INTRODUÇÃO DOS VALORES ................................................................ 9
2.1.3 - GRAVAR O FICHEIRO DE DADOS ........................................................ 11
2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE .................................... 12
2.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS............... 13
2.1.6 - ACRESCENTAR NOVAS VARIÁVEIS ...................................................... 14
2.1.7 - DEFINIR UMA VARIÁVEL EM FUNÇÃO DE OUTRAS ......................... 15
2.1.8 - ELIMINAR LINHAS E VARIÁVEIS .......................................................... 16
2.2 - IMPORTAÇÃO DE FICHEIROS EXTERNOS .............................. 17
2.2.1 - IMPORTAÇÃO DE FICHEIROS LOTUS E EXCEL 4.0 ........................... 17
2.2.2 - IMPORTAÇÃO DE FICHEIROS DE DBASE ........................................... 18
2.2.3 - IMPORTAÇÃO DE FICHEIROS EXCEL ................................................. 19
2.2.4 - IMPORTAÇÃO DE FICHEIROS ACCESS ............................................... 22
2.2.5 - RECODIFICAÇÃO DE VALORES ........................................................... 22
2.2.6 - SELECÇÃO DE CASOS ........................................................................... 25
4- GRÁFICOS ................................................................................................. 44
4.1 - GRÁFICOS STANDARDIZADOS .................................................... 44
4.1.1 -GRÁFICO DE BARRAS ........................................................................... 45
4.1.2 -HISTOGRAMA ........................................................................................ 50
4.1.3 -GRÁFICO DE EXTREMOS-E-QUARTIS ................................................. 52
4.1.4 -GRÁFICO DE BARRA DE ERROS .......................................................... 54
4.1.5 -GRÁFICOS DE PROBABILIDADES........................................................ 56
4.1.6 -GRÁFICO DE DISPERSÃO ..................................................................... 59
4.2 - EDIÇÃO DOS GRÁFICOS STANDARDIZADOS........................ 62
4.3 - GRÁFICOS INTERACTIVOS ............................................................ 65
4.3.1 - GRÁFICO DE BARRAS ........................................................................... 66
4.3.2 - GRÁFICO DE DISPERSÃO ..................................................................... 70
4.4 - EDIÇÃO DE GRÁFICOS INTERACTIVOS ................................... 75
ESACB i
SPSS Índice
5- TESTES T ......................................................................................................... 79
5.1 - TESTE T PARA A MÉDIA DE UMA AMOSTRA...................................... 82
5.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES ......................... 83
5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS ......................... 86
6- ANÁLISE DE VARIÂNCIA ........................................................................... 90
6.1 - ENSAIOS UNI-FACTORIAIS ...................................................................... 90
6.1.1 - PROCEDIMENTO ONE-WAY ANOVA ................................................. 91
6.1.2 - PROCEDIMENTO MEANS.................................................................... 96
6.2 - ENSAIOS MULTI-FACTORIAIS................................................................. 99
7- REGRESSÃO LINEAR ................................................................................. 111
7.1 - INTRODUÇÃO............................................................................................ 111
7.2 - REGRESSÃO LINEAR SIMPLES.............................................................. 115
7.3 - REGRESSÃO LINEAR MÚLTIPLA .......................................................... 121
7.4 - AJUSTAMENTO DE MODELOS PRÉ-DEFINIDOS................................ 131
8- MANUSEAR OS RESULTADOS................................................................. 136
ESACB ii
SPSS 1 - Introdução
1- INTRODUÇÃO
Data Editor: Editor de Dados: uma versátil folha de cálculo, que permite definir,
introduzir, modificar, corrigir e visualizar a informação. O Data Editor abre
automaticamente quando se entra no SPSS.
ESACB 1
SPSS 1 - Introdução
Estas instruções foram geradas, no caso, pela selecção de opções nos menus
do programa; contudo, podem ser digitadas, como se de uma linguagem de
programação se tratasse2.
Pivot Tables: Tabelas Dinâmicas: O programa dispõe de uma potente rotina de geração de
tabelas dinâmicas (ou pivot tables), que permitem que o utilizador explore
os dados, com o re-arranjo de colunas e linhas.
Acesso a Bases de Dados: O SPSS permite o acesso às bases de dados mais usuais, em
formato SQL e ODBC, tais como ficheiros de dados criados em dBase,
Access, Excel, Lotus, etc. A importação de ficheiros de texto, Access,
Excel, é feita através de um assistente de importação (wizard).
1
O Log pode não estar visível; só aparece na janela Viewer se se tiver configurado o programa para
mostrar este item.
2
O utilizador pode escrever as suas próprias rotinas de análise; para tal, deve abrir o SPSS Syntax
Editor, janela de edição de comandos do SPSS.
ESACB 2
SPSS 2 - Edição de Dados
2- EDITOR DE DADOS
O Data Editor do SPSS é um programa do tipo de folha de cálculo que permite facilmente
criar ou editar ficheiros de dados. O Data Editor abre automaticamente quando se entra no
SPSS.
Muitas das características do data editor do SPSS são similares ás de qualquer folha de
cálculo em ambiente Windows, tal como o Excel.
ESACB 3
SPSS 2 - Edição de Dados
Se se introduzir um valor (por exemplo, 25) para esta célula, fora dos limites do ficheiro
rectangular, o SPSS cria duas novas variáveis numéricas atribuindo-lhes automaticamente
os nomes var00002 e var00003, e introduz valores em branco para as células, de modo a
ficar um ficheiro rectangular, com 4 variáveis e 7 casos (repare que estas células têm o
ponto decimal):
Estas células, aparentemente vazias, são assumidas pelo SPSS como “missing values”, isto
é, observações em falta para algumas variáveis. Contudo, e para já, estas células não
afectam os cálculos estatísticos, caso se se trate de variáveis numéricas. Por exemplo,
calculando a média da variável x obter-se-á o valor de 15, como é lógico, para os valores
apresentados.
ESACB 4
SPSS 2 - Edição de Dados
Vamos usar os seguintes dados a fim de ilustrar como se cria um ficheiro com o Data Editor
do SPSS. Trata-se dos resultados de um ensaio, em que se registaram as produções (kg/ha)
de arroz, em função da variedade (V1: IR8; V2: IR5; V3: C4-63) e de 5 níveis de adubação
azotada (N0: 0 kg/ha; N1: 60 kg/ha; N2: 90 kg/ha; N3: 120 kg/ha; N4: 150 kg/ha). Para
cada tratamento fizeram-se 4 repetições.
Na imagem seguinte, capturada do Excel, estes dados estão perceptíveis para o leitor, e
estão estruturados para algumas possíveis análises a executar na folha de cálculo; contudo,
ao serem introduzidos para um ficheiro SPSS, dever-se-ão respeitar as normas deste
programa, de modo a que os dados possam ser analisados.
Repetição
Variedade Azoto 1 2 3 4
N0 3852 2606 3144 2894
N1 4788 4936 4562 4608
V1 N2 4576 4454 4884 3924
N3 6034 5276 5906 5652
N4 5874 5916 5984 5518
N0 2846 3794 4108 3444
N1 4956 5128 4150 4990
V2 N2 5928 5698 5810 4308
N3 5664 5362 6458 5474
N4 5458 5546 5786 5932
N0 4192 3754 3738 3428
N1 5250 4582 4896 4286
V3 N2 5822 4848 5678 4932
N3 5888 5524 6042 4756
N4 5864 6264 6056 5362
Como se referiu atrás, os dados deverão ser introduzidos para uma matriz rectangular, em
que as colunas são as variáveis e as linhas os casos. Neste caso, as variáveis são a
Variedade, o Azoto, a Repetição e a Produção.
Vamos começar por definir estas variáveis no SPSS dando-lhes nomes válidos; as regras
para os nomes das variáveis são:
ESACB 5
SPSS 2 - Edição de Dados
Duplo click na célula do nome da variável (var) no topo da coluna, ou click em qualquer
sítio da coluna para a variável e seleccionar no menu a opção Data, seleccionando depois a
opção Define Variable...
Igualmente pode fazer click com o botão direito na célula do nome da variável (var) no
topo da coluna; aparece o menu:
ESACB 6
SPSS 2 - Edição de Dados
Seleccionar a opção
Seleccionar a opção
No campo Value escrever o valor 1; no campo Value Label: escever IR8; fazer :
ESACB 7
SPSS 2 - Edição de Dados
Repetir o processo de definição de Value e Value Label para os valores 2 (IR5) e 3 (C4-
63); para cada valor, fazer :
No final, fazer .
ESACB 8
SPSS 2 - Edição de Dados
De modo idêntico, definir as restantes variáveis; note-se que a opção Labels serve para
fazer as correspondências, de modo que neste exemplo só é usada para as variáveis
variedad e azoto; na definição da variável producao, não é necessário ir à opção Type
porque, por defeito, as variáveis são numéricas reais (com duas casa decimais).
Para apagar um valor, colocar o cursor na célula respectiva e carregar a tecla DEL. Para
alterar ou corrigir um valor errado numa das células, activa-se essa célula (levando o cursor
para lá, ou simplesmente fazendo click) e digita-se o valor correcto, fazendo-o entrar com
Enter ou deslocando para outra célula.
ESACB 9
SPSS 2 - Edição de Dados
Usou-se a codificação dos valores das variáveis variedad e azoto, por um lado para facilitar
a introdução dos valores, e por outro lado para ser menos propenso a erros. Contudo, podem
visualizar-se o nome da variedade e o valor da adubação; para tal, no menu principal
seleccionar a opção , e depois seleccionar a opção Value Labels:
O ficheiro de dados toma agora o aspecto mais elucidativo acerca dos dados a analisar:
ESACB 10
SPSS 2 - Edição de Dados
Tendo introduzido e corrigido os dados, grava-se o ficheiro com um nome válido (aplicam-
se as regras de nomes de ficheiros de MS-DOS). Para gravar, faz-se:
Caso se pretenda guardar o ficheiro num disco ou directório que não do directório activo,
ESACB 11
SPSS 2 - Edição de Dados
Se se pretende abrir um ficheiro de dados, para introduzir mais dados, para alterar ou
corrigir valores, ou para efectuar a análise desses dados, tem de se abrir o ficheiro. Para tal,
efectua-se o seguinte procedimento:
se .
Caso o nome do ficheiro não conste na listagem, é porque está guardado noutro directório
que não o especificado na janela. Nesta situação, ter-se-á de encaminhar para a
drive/directório onde se encontra.
Como o SPSS apenas admite um ficheiro de dados aberto, ao abrir um ficheiro o programa
encerra o ficheiro actual. Caso este não esteja gravado, após quaisquer alterações, o
programa apresenta uma mensagem de aviso:
ESACB 12
SPSS 2 - Edição de Dados
O utilizador deverá responder Sim ou Não, consoante queira guardar ou não as alterações
efectuadas no ficheiro aberto (no caso da imagem, tinha-se aberto o ficheiro lambs.sav, em
que se tinham efectuado alterações).
Para acrescentar um novo caso, após os dados já introduzidos, basta digitar o valor
pretendido para a variável a acrescentar; automaticamente é acrescentado um caso a todas
as variáveis.
Se interessa introduzir um caso, não no final dos dados, mas entre duas observações, então
ter-se-á de introduzir uma linha (caso) entre essas duas observações.
Admitamos que foi esquecido um caso referente a hora=Manhã; este caso deveria ser
introduzido imediatamente antes da primeira observação da Tarde; para tal, faz-se duplo
click sobre o indicador da linha 5, ou um click em qualquer parte da linha 5 e de seguida
selecciona-se a opção no menu. Aparece a janela:
Pode igualmente fazer click com o botão direito do rato sobre o indicador da linha,
aparecendo o menu:
ESACB 13
SPSS 2 - Edição de Dados
Para acrescentar uma nova variável ao ficheiro, basta colocar o cursor numa célula da
primeira coluna não usada, e executar o procedimento de definição de variáveis atrás
descrito. O programa cria a nova variável com tantas células (em branco ou missing values)
quantos os casos das restantes variáveis. Após isto, só há que proceder à introdução dos
valores.
Se, por algum motivo, há que introduzir uma nova variável, não no final do ficheiro, mas
entre duas variáveis já definidas, colocar o cursor na variável à direita da qual se pretende a
nova variável, seleccionar a opção e de seguida . Pode igualmente
fazer click com o botão direito do rato, aparecendo o menu:
e seleccionar a opção .
ESACB 14
SPSS 2 - Edição de Dados
O programa SPSS permite criar novas variáveis como resultado de funções ou operações
envolvendo as variáveis já existentes.
Vamos ilustrar a criação de uma nova variável no ficheiro arroz.sav, com o nome ln_prod,
definida como sendo o logaritmo neperiano dos valores da variável producao.
Para tal, coloca-se o cursor na primeira célula da primeira coluna não ocupada, e faz-se:
ESACB 15
SPSS 2 - Edição de Dados
A variável ln_prod é visualizada com 2 casas decimais (por defeito), muito embora seja
guardada com maior precisão. Caso haja interesse em visualizar mais casa decimais,
proceder como descrito na definição de variáveis.
As transformações de variáveis podem ser mais complexas que uma simples função; repare-
se que a caixa de definição das transformações apresenta o que se parece a uma máquina de
calcular científica, que permite definir transformações várias, incluindo selecção
condicional de casos (if), funções lógicas (e &; ou |; negação ~) comparações (<, <=, >, >=,
=, ~=), etc.
Para eliminar linhas de valores (casos) ou colunas (variáveis), fazer click sobre o número da
linha, à esquerda do ecran, ou sobre o nome da variável; a linha ou coluna, consoante o
caso, ficam seleccionadas (sombreadas). Para a eliminar, seleccionar e de seguida
(ou carregar na tecla DEL).
ESACB 16
SPSS 2 - Edição de Dados
Pode também fazer click com o botão direito do rato sobre a identificação da linha ou
coluna a eliminar, e fazer Cut ou Clear.
Vamos abordar a importação de ficheiros Excel e Access, por serem duas das aplicações
actualmente mais usadas na constituição de bases de dados, e ficheiros ASCII, pois não
havendo outra forma de transferir informação entre aplicações, todos os programas
permitem exportar e importar ficheiros ASCII, sendo esta forma uma ponte comum entre as
aplicações.
É pressuposto que, qualquer que tenha sido a aplicação utilizada para criar os ficheiros,
estes devem estar organizados de acordo com a estrutura dos ficheiros SPSS.
Se o ficheiro tiver sigo gravado em Excel 4, Lotus 123 (ou Quattro), o SPSS abre-o
automaticamente. Para tal, executar o seguinte procedimento:
File
Open...
Nesta janela deve especificar-se que o ficheiro é do tipo Excel (*.xls) [se se tratar de um
ficheiro Lotus, selecciona-se a opção Lotus(*.w*)]; para tal, abrir a caixa Ficheiro do tipo e
especificar Excel (*.xls):
ESACB 17
SPSS 2 - Edição de Dados
O SPSS cria um ficheiro, com tantas variáveis quantas as colunas e tantos casos quantas as
linhas do bloco especificado.
Dada a relevância da utilização do gestor de bases de dados dBase III, é natural que alguns
utilizadores disponham de bases de dados organizadas neste programa, e que pretendam
importá-las para o SPSS a fim de executar algumas análises estatísticas.
Os ficheiros gerados pelo dBase III (*.dbf) obedecem tipicamente à estrutura dos ficheiros
SPSS, de modo que a sua importação é extremamente fácil. Para tal, faz-se o seguinte
procedimento:
File
Open...
Na caixa de diálogo, deve definir-se o tipo de ficheiro [dBase (*.dbf)], o directório onde
está guardado e o nome do ficheiro a importar, tal como se mostra na figura:
ESACB 18
SPSS 2 - Edição de Dados
Os ficheiros Excel 5.0 e Excel 97 são constituídos por diversas folhas de cálculo; a rotina de
importação é ligeiramente diferente, e é assegurada pelo protocolo Open Database
Connectivity (ODBC), que é um método padrão de partilha de dados entre bases de dados e
outros programas. Os controladores ODBC utilizam a linguagem SQL (Structured Query
Language) padrão para aceder a dados de origens exteriores.
ESACB 19
SPSS 2 - Edição de Dados
File
Database Capture
New Query...
ESACB 20
SPSS 2 - Edição de Dados
Caso o ficheiro tenha diversas folhas de cálculo, será conveniente confirmar qual é que se
pretende importar; para visualizar as variáveis de cada folha, click sobre o sinal + à
esquerda da identificação:
Tendo confirmado qual a folha a importar (neste caso, Folha1$), click sobre o nome da
folha e arraste-o para campo Retrieve Fields :
ESACB 21
SPSS 2 - Edição de Dados
Os ficheiros de bases de dados criados em Microsoft Access são constituídos por diversas
folhas ou tabelas (base de dados, consultas, formulários); a rotina de pelo protocolo Open
Database Connectivity (ODBC), que é um método padrão de partilha de dados entre bases
de dados e outros programas. Os controladores ODBC utilizam a linguagem SQL
(Structured Query Language) padrão para aceder a dados de origens exteriores, e processa-
se em tudo de modo semelhante à importação de ficheiros Excel, sendo guiada pelo mesmo
assistente (wizard):
File
Database Capture
New Query...
ESACB 22
SPSS 2 - Edição de Dados
Para contornar esta questão, a fazer a importação destas variáveis, há que recodificá-las em
variáveis nominais, com códigos numéricos, por exemplo masculino=1, feminino=2, à
semelhança do que se fez na introdução das variáveis variedad e azoto.
Vamos ilustrar usando o ficheiro pulso.sav, que se criou pela importação do ficheiro
pulso.dbf do dBase. Neste ficheiro, as variáveis sexo (Homem, Mulher) e fuma (Fuma,
Não Fuma) são alfanuméricas, mas nitidamente com uma conotação de agrupamento em
classes.
Vamos recodificar a variável sexo (Homem=1, Mulher=2) e fuma (Fuma=1, Não Fuma=2).
Transform
Recode
Into Same Variable
ESACB 23
SPSS 2 - Edição de Dados
Repetir para o outro valor da variável (Mulher=2). No final, a caixa de diálogo mostra as
recodificações a efectuar:
ESACB 24
SPSS 2 - Edição de Dados
No final, aparentemente não houve alterações: a variável sexo contém os valor Homem e
Mulher, como anteriormente; só que, após esta transformação, estas variáveis têm a
conotação de agrupamento de casos, coisa que não acontecia tal como resultaram da
importação do ficheiro de dados externo ao SPSS.
Por vezes, há necessidade de proceder a análises sem a inclusão de todos os casos contidos
nas variáveis em jogo. Uma situação típica é ter-se verificado que há valores “outliers”, isto
é, valores extremos muito elevados ou muito baixos, que provavelmente são registos mal
efectuados, ou eventualmente observações anómalas que, incluídas nas análises estatísticas,
vão distorcer a validade das conclusões. Desta forma, poderá ser preferível excluí-las das
análises, mas sem as eliminar do ficheiro de dados.
Data
Select Cases...
ESACB 25
SPSS 2 - Edição de Dados
Pretende-se excluir o caso nº 6 da análise, isto é, incluir na análise todos os casos com
O Data Editor do SPSS criou automaticamente uma variável designada filter_$, em que
indica quais os casos seleccionados e os não incluídos. Repare-se que a linha 6 está traçada,
indicando que este caso está excluído de futuras análises:
ESACB 26
SPSS 2 - Edição de Dados
A variável filter_$ é uma variável numérica, cujos valores são 0=”Not Selected” e
1=”Selected”. No ecran, aparecem visualizados as labels dos valores, caso se tenha optado
por este modo de visualização.
Data
Select Cases...
Por exemplo, querendo seleccionar os casos referentes aos homens (sexo=1) que fumam
(fuma=1), dever-se-á fazer o seguinte procedimento:
Data
Select Cases...
ESACB 27
SPSS 2 - Edição de Dados
Para definir a condição atrás referida, seleccionar a variável sexo, defini-la como sendo
igual a 1; o operador lógico e (AND) é simbolizado pelo caracter &; seleccionar a variável
fuma e defini-la igual a 1:
ESACB 28
SPSS 3 - Análise de Dados
3- ANÁLISE DE DADOS
Vamos iniciar a utilização do SPSS a fim de efectuar diversas análises estatísticas. Antes de
iniciar um processo de análise, os dados a analisar devem estar carregados na memória do
computador.
Vamos ilustrar utilizando o ficheiro arroz.sav que deverá estar carregado na memória do
computador.
Esta rotina calcula as estatísticas elementares (média, moda, mediana, variância, etc) de
uma variável numérica. No exemplo, a única variável susceptível de ser analisada é a
variável producao.
ESACB 29
SPSS 3 - Análise de Dados
Para seleccionar as variáveis a analisar, click sobre o nome da variável na listagem que
aparece na caixa esquerda, e de seguida click no botão . Ficará com o seguinte aspecto:
ESACB 30
SPSS 3 - Análise de Dados
Repare que ficou no SPSS Viewer; para voltar ao Data Editor do SPSS, onde está aberto o
ficheiro arroz.sav, restaure a janela na barra Iniciar do Windows:
ESACB 31
SPSS 3 - Análise de Dados
muito a largura do quadro original. Para tal, a solução é obter menos parâmetros estatísticos,
de modo que o quadro de resultados seja menos largo.
Na caixa de diálogo que se segue, selecciona-se a variável a analisar (producao) tal como
descrito atrás. De seguida, seleccionar o botão
ESACB 32
SPSS 3 - Análise de Dados
ESACB 33
SPSS 3 - Análise de Dados
Note-se que os resultados vêm na sequência dos resultados obtidos anteriormente, de modo
que durante a sessão de trabalho, os resultados vão-se acumulando, podendo o utilizador em
qualquer momento seleccionar os que lhe interessam.
ESACB 34
SPSS 3 - Análise de Dados
Histogram
10
4
Frequency
2
Std. Dev = 952.52
Mean = 4956.5
0 N = 60.00
25
2 7 0.0
3 0 0.0
3 2 0.0
3 5 0.0
3 7 0.0
4 0 0.0
4 2 0.0
4 5 0.0
4 7 0.0
5 0 0.0
5 2 0.0
5 5 0.0
5 7 0.0
6 0 0.0
6 2 0.0
6 5 0.0
0
5
0
5
0
5
0
5
0
5
0
5
0
5
0
5
00
.0
Producao
3.00 2 . 688
3.00 3 . 144
5.00 3 . 77789
6.00 4 . 111234
13.00 4 . 5556778889999
7.00 5 . 1223344
18.00 5 . 555666678888899999
5.00 6 . 00024
ESACB 35
SPSS 3 - Análise de Dados
7000
6000
5000
4000
3000
2000
N= 60
Producao
Numa situação como a que estamos a analisar, teria igualmente interesse executar estas
análises, não para a globalidade das observações, mas sim repartidas por um ou mais dos
factores.
Vamos executar o procedimento EXPLORE, obtendo os resultados para cada uma das três
variedades (poderia ser para os cinco níveis de azoto, ou para os dois factores em
simultâneo).
ESACB 36
SPSS 3 - Análise de Dados
Na caixa de diálogo que se segue, selecciona-se a variável a analisar (producao) tal como
descrito atrás. Seleccionar a variável variedad para o campo Factor List:
ESACB 37
SPSS 3 - Análise de Dados
Descriptives
Variedade Statistic Std. Error
Producao IR8 Mean 4769.4000 235.8637
95% Confidence Interval for Mean Lower Bound 4275.7316
Upper Bound 5263.0684
5% Trimmed Mean 4819.3333
Median 4836.0000
Variance 1112633.726
Std. Deviation 1054.8145
Minimum 2606.00
Maximum 6034.00
Range 3428.00
Interquartile Range 1762.0000
Skewness -.651 .512
Kurtosis -.441 .992
IR5 Mean 5042.0000 214.0869
95% Confidence Interval for Mean Lower Bound 4593.9109
Upper Bound 5490.0891
5% Trimmed Mean 5085.3333
Median 5410.0000
Variance 916664.421
Std. Deviation 957.4259
Minimum 2846.00
Maximum 6458.00
Range 3612.00
Interquartile Range 1574.5000
Skewness -.839 .512
Kurtosis -.076 .992
C4-63 Mean 5058.1000 191.4035
95% Confidence Interval for Mean Lower Bound 4657.4878
Upper Bound 5458.7122
5% Trimmed Mean 5081.6667
Median 5091.0000
Variance 732706.305
Std. Deviation 855.9827
Minimum 3428.00
Maximum 6264.00
Range 2836.00
Interquartile Range 1493.5000
Skewness -.419 .512
Kurtosis -.921 .992
O diagrama de extremos-e-quartis é apresentado agora para cada uma das três variedades:
ESACB 38
SPSS 3 - Análise de Dados
7000
6000
5000
4000
3000
Producao
2000
N= 20 20 20
Variedade
Estes resultados podem começar a fornecer pistas para a análise dos dados, do género de
que a variedade C4-63 apresenta uma produção mais homogénea.
No caso de variáveis numéricas, em que se admite que seguem uma lei de distribuição
normal (pressuposto quase obrigatório para a maioria das metodologias estatísticas usuais
em ciências agrárias), a visualização do ajustamento do respectivo histograma à função de
distribuição normal pode ser uma valiosa ferramenta para análises subsequentes.
Seleccionar:
Statistics
Summarize
Frequencies...
ESACB 39
SPSS 3 - Análise de Dados
Statistics
Summarize
Frequencies...
ESACB 40
SPSS 3 - Análise de Dados
ESACB 41
SPSS 3 - Análise de Dados
O histograma com o ajustamento à f.d.p. normal tem o seguinte aspecto, onde sobressai o
enviezamento da amostra para a direita em relação à distribuição teórica, bem como um
achatamento um pouco maior que o que seria de esperar (isto é, cerca de 75% da amostra
está abaixo da curva, nomeadamente na zona central da distribuição):
Producao
10
4
Frequency
2
Std. Dev = 952.52
Mean = 4956.5
0 N = 60.00
25
2 7 0.0
3 0 0.0
3 2 0.0
3 5 0.0
3 7 0.0
4 0 0.0
4 2 0.0
4 5 0.0
4 7 0.0
5 0 0.0
5 2 0.0
5 5 0.0
5 7 0.0
6 0 0.0
6 2 0.0
6 5 0.0
0
5
0
5
0
5
0
5
0
5
0
5
0
5
0
5
00
.0
Producao
ESACB 42
SPSS 4 - Gráficos
4- GRÁFICOS
A representação gráfica dos dados é geralmente uma boa abordagem para as análises
estatísticas a efectuar: a representação de variáveis numéricas em histograma permite inferir
acerca da simetria, achatamento e normalidade da amostra em análise; o gráfico de barras
representando contagens ou percentagens de valores de variáveis permite comparar
visualmente diversas características amostrais; a representação gráfica de duas variáveis que
se julgam correlacionadas num gráfico de pontos ou de dispersão permite definir uma
abordagem prévia à metodologia de regressão; os gráficos de extremos-e-quartis facilitam a
detecção de outliers, além de permitirem analisar a simetria e sub-intervalos de maior
concentração da amostra; etc.
De seguida vão-se apresentar a definição de alguns tipos de gráficos, tendo como base de
trabalho os dados do ficheiro pulso.sav (listagem em anexo).
Vamos de seguida ilustrar a realização de alguns gráficos. Não se pretende fazer uma
apresentação exaustiva de todos os tipos de gráficos; contudo, os procedimentos para
qualquer outro tipo de gráfico são genericamente semelhantes, de modo que os gráficos
descritos de seguida fornecem bases suficientes para que o utilizador explore e crie qualquer
outro tipo de gráficos.
ESACB 44
SPSS 4 - Gráficos
Vamos ilustrar criando um gráfico com a contagem de casos de cada uma das idades do
ficheiro pulso.sav. Para tal:
Graphs
Bar ...
ESACB 45
SPSS 4 - Gráficos
ESACB 46
SPSS 4 - Gráficos
2
Count
0
19 21 23 25 27 29 31 33 35 38 42
IDADE
Fonte: Abcde, 1998.
Os gráficos de linhas (Line) e área (Area) dão a mesma informação; em vez de barras ou
colunas, é desenhada uma linha unindo os pontos à altura da contagem do número de casos
em cada categoria ou valor do eixo dos xx; no caso do gráfico de áreas, a área definida por
essa linha e o eixo dos xx é preenchida. A definição destes gráficos tem os mesmos passos
do gráfico de barras. A título de exemplo, apresenta-se de seguida o gráfico de área para a
variável idade (o gráfico de linhas seria exactamente o mesmo, sem a área sombreada):
2
Count
0
19 21 23 25 27 29 31 33 35 38 42
IDADE
Fonte: Abcde, 1998.
ESACB 47
SPSS 4 - Gráficos
Poderá ter interesse ver a distribuição de idades por sexo, isto é, fazer a separação das
idades por sexo; para tal, na janela Bars Chart selecciona-se a opção Clustered. Aparece a
seguinte janela, onde se seleccionam a variável a representar em barras (idade) e a variável
de agrupamento (sexo):
2
SEXO
1
Homem
Count
0 Mulher
19 21 23 25 27 29 31 33 35 38 42
IDADE
Fonte: Abcde, 1998
O gráfico de barras pode também usar-se para comparar visualmente a média (ou outro
parâmetro estatístico) de duas ou mais variáveis da mesma natureza. Para exemplificar,
vamos elaborar o gráfico de barras referente às médias das variáveis ritmoa e ritmod. Para
tal:
ESACB 48
SPSS 4 - Gráficos
Graphs
Bar ...
Na janela de diálogo seguinte, seleccionar o tipo Simple (só uma série de barras) e a opção
(isto é, cada barra representa um parâmetro estatístico de uma
variável):
Veja-se que, por defeito, será representada a média (mean) das variáveis. Pretendendo
representar outro parâmetro, fazer (seleccionando individualmente cada
uma das variáveis, ou seleccionando todas as variáveis em simultâneo – para tal, manter o
botão esquerdo pressionado e arrastar sobre o nome das variáveis a seleccionar). Aparece a
seguinte caixa de diálogo, onde se define o parâmetro a representar. Veja-se que pode
seleccionar-se um parâmetro estatístico (primeiro bloco da janela), ou então o número (ou
ESACB 49
SPSS 4 - Gráficos
percentagem) de casos acima ou abaixo de um valor a definir (bloco central), ou entre dois
valores a definir (último bloco)3:
Valores médios
160
140
120
100
80
Mean
60
RITMOA RITMOD
4.1.2 - HISTOGRAMA
3
Os campos Value, Low, High só são activados após seleccionar uma opção do respectivo bloco de
opções.
ESACB 50
SPSS 4 - Gráficos
Graphs
Histogram ...
ESACB 51
SPSS 4 - Gráficos
Ritmo cardíaco
14
12
10
4
Std. Dev = 9.54
2 Mean = 76.0
0 N = 40.00
60.0 65.0 70.0 75.0 80.0 85.0 90.0 95.0
RITMOA
Fonte: Abcde, 1998
O gráfico baseia-se na localização dos quartis (1º quartil, 2º quartil ou mediana, 3º quartil),
que definem assim 4 sub-intervalos, cada um com 25% das observações: 1º intervalo
quartílico, delimitado pelo xmin e quartil1; 2º intervalo quartílico, delimitado pelo quartil1 e
quartil2; 3º intervalo quartílico, definido pelo quartil2 e quartil3; 4º intervalo quartílico,
desde o quartil3 ao xmax.
São considerados outliers as observações que fiquem abaixo do limite definido pela
expressão q1 − 1.5 × (q3 − q1 ) ou acima do limite q3 + 1.5 × (q3 − q1 ) ; caso existam outliers,
o limite do “bigode” do diagrama passa a ser a observação extrema que se situe dentro dos
limites dos outliers atrás definidos.
Graphs
Boxplot ...
Na caixa de diálogo seguinte seleccionar a opção Simple, já que se trata de uma única
variável, e a opção para criar um diagrama de extremos-e-
quartis da variável ritmoa para cada categoria de uma outra variável (vamos usar a variável
sexo para definir as categorias). Seleccionar a opção se se
ESACB 52
SPSS 4 - Gráficos
pretender criar o gráfico com todos os dados da variável ritmoa, sem separar pelas
categorias da variável sexo:
O resultado é o seguinte:
Cases
Valid Missing Total
SEXO N Percent N Percent N Percent
RITMOA Homem 22 100.0% 0 .0% 22 100.0%
Mulher 18 100.0% 0 .0% 18 100.0%
ESACB 53
SPSS 4 - Gráficos
100
15
90 38
10
80
70
60
RITMOA
50
N= 22 18
Homem Mulher
SEXO
Repare-se que no caso dos homens, há duas observações outliers, que são assinaladas fora
dos “bigodes” do diagrama; o “bigode” chega, neste caso, até à observação mais alta, mas
que não seja outlier (valor 80). Repare-se que é indicado o número de observações para
cada uma das categorias (N=22 para os homens; N=18 para as mulheres).
s
• x ± t (α , N −1) .
, em que t ( a , N −1) é o quantil α da distribuição t-Student (opção
N
Confidence interval for mean);
s
• x ± k .s x , em que s x = é o erro padrão da média e k ∈ Ν (opção Standard
N
error of mean);
Vamos ilustrar a criação deste tipo de gráfico usando a variável ritmoa do ficheiro
pulso.sav, sub-dividida pelas duas categorias (Homem, Mulher) da variável sexo:
ESACB 54
SPSS 4 - Gráficos
Graphs
Error Bar ...
Na caixa de diálogo seguinte seleccionar a opção Simple, já que se trata de uma única
variável, e a opção para um gráfico da variável ritmoa para
cada categoria de uma outra variável (sexo). Seleccionar a opção
se se pretender criar o gráfico com todos os dados da variável ritmoa, sem separar pelas
categorias da variável sexo:
ESACB 55
SPSS 4 - Gráficos
80
95% CI RITMOA
70
60
N= 22 18
Homem Mulher
SEXO
Fonte: Abcde, 1998
O SPSS pode fazer o gráfico P-P de ajustamento às seguintes distribuições: beta, chi-
quadrado, exponencial, gamma, Laplace, Logistic, Log-normal, normal, semi-normal,
Pareto, t-Student, Weibull e uniforme.
ESACB 56
SPSS 4 - Gráficos
O resultado é o seguinte:
PPlot
MODEL: MOD_3.
ESACB 57
SPSS 4 - Gráficos
.75
.50
Expected Cum Prob
.25
0.00
0.00 .25 .50 .75 1.00
.08
.06
.04
.02
Deviation from Normal
0.00
-.02
-.04
-.06
0.0 .2 .4 .6 .8 1.0
ESACB 58
SPSS 4 - Gráficos
Este tipo de gráficos é muito útil como metodologia prévia de análise a problemas de
regressão, quando se tenta ajustar uma função y=f(x), que estabelece uma relação de
dependência entre as duas variáveis.
A fim de ilustrar, vamos usar as variáveis ritmoa (x) e ritmod (y), pensando a priori que o
ritmo cardíaco após exercício físico está relacionado com o ritmo cardíaco em repouso do
mesmo indivíduo.
Graphs
Scatter ...
Simple quando se pretende representar num plano xy uma série de observações bi-
variadas (x,y); se nessa série existem diferentes categorias, definidas por
uma terceira variável categórica, podem identificar-se os pontos
correspondentes a cada categoria com marcas diferentes;
Overlay quando se pretende representar num mesmo plano (x,y) duas ou mais séries
de observações bi-variadas (x,y) da mesma natureza;
Matrix quando se pretendem representar os gráficos xy de todas as combinações
possíveis de duas ou mais variáveis; isto é, dispondo de 3 variáveis
genericamente identificadas por x,y,z, esta opção representa os seguintes
gráficos: (x,y), (x,z), (y,z), bem como a imagem simétrica destes gráficos;
este gráfico é útil para uma análise exploratória das associações entre
diversas variáveis;
3-D representa o gráfico espacial a 3 dimensões definido pelos eixos (x,y,z).
O tipo de gráfico mais usual é o Simple. Tendo seleccionado a opção pretendida, fazer
para prosseguir. Na janela seguinte, definir as variáveis a usar em cada um dos
ESACB 59
SPSS 4 - Gráficos
eixos (x: ritmoa; y: ritmod), bem como a variável categórica (sexo) de agrupamento
(opcional):
Definir os títulos como previamente descrito. O gráfico resultante tem o seguinte aspecto:
Ritmo após exercício versus ritmo cardíaco em repouso
260
240
220
200
180
160
SEXO
140
RITMOD
Mulher
120
100 Homem
60 70 80 90 100
RITMOA
Fonte: Abcde, 1998
Nota-se que, aparte da observação no canto superior direito do gráfico, que é um outlier bi-
variado, todas as outras observações têm uma tendência mais ou menos linear ligeiramente
crescente.
Para ilustrar a matriz de gráficos, com as variáveis idade, ritmoa, ritmod, executar o
procedimento:
ESACB 60
SPSS 4 - Gráficos
Graphs
Scatter ...
Matrix
IDADE
RITMOA
SEXO
RITMOD
Mulher
Homem
ESACB 61
SPSS 4 - Gráficos
Quando o gráfico é criado e aparece na janela Viewer do SPSS pode não estar optimizado
em relação a algumas características, nomeadamente cores e padrões de preenchimento
(com particular ênfase se se pretende imprimir ou exportar para outras aplicações).
Para editar o gráfico, a fim de fazer estes pequenos ajustamentos, seleccionar o gráfico
(click sobre o gráfico) na janela Viewer do SPSS e abri-lo com um dos seguintes
procedimentos:
i) Edit
SPSS Chart Object
Open
Qualquer dos anteriores procedimentos abre o gráfico numa nova janela, com a designação
SPSS Chart Editor, sobreposta ao Viewer, tal como se ilustra; o gráfico está sombreado na
janela Viewer durante a edição; as alterações efectuadas são reflectidas automaticamente
neste gráfico:
ESACB 62
SPSS 4 - Gráficos
Para alterar um pormenor, por exemplo o padrão de preenchimento das barras, fazer click
sobre uma barra (no Chart Editor); repare-se que automaticamente todas as barras ficaram
seleccionadas (muito embora as marcas sejam colocadas em apenas algumas barras, todas
elas estão seleccionadas):
ESACB 63
SPSS 4 - Gráficos
Neste menu, seleccionar uma das seguintes opções, conforme o objectivo; cada opção abre
uma caixa de diálogo onde o utilizador selecciona a alteração a efectuar; para tomar efeito,
fazer :
Nota: A barra de ferramentas do SPSS Chart Editor tem os botões de atalho para
as respectivas entradas no menu Format, tal como de seguida se
apresentam:
ESACB 64
SPSS 4 - Gráficos
Para alterar os títulos ou notas de rodapé (ou defini-los, se não o foram durante o
procedimento do elaboração do gráfico), faz-se o seguinte procedimento:
Chart
Title... (ou Footnote... se se trata de editar as notas de rodapé)
Abre-se a seguinte janela de diálogo, onde o utilizador poderá alterar os títulos (se não
foram previamente definidos os títulos, os respectivos campos aparecem vazios), e o
respectivo alinhamento:
Após ter efectuado as alterações pretendidas, fechar o Chart Editor para regressar ao
Viewer; para tal, fazer File Close, ou click no botão .
ESACB 65
SPSS 4 - Gráficos
Como referido no início do capítulo, o SPSS dispõe de uma rotina interactiva de definição
de gráficos, em que a selecção e alteração do tipo de gráficos, variáveis a incluir, e
pormenores, são mais facilmente editados.
Graphs
Interactive
ESACB 66
SPSS 4 - Gráficos
Esta janela é típica dos gráficos interactivos, e representa o “esqueleto” do gráfico, com um
sistema de eixos ortogonais, cada um com um campo, para o qual se selecciona a variável a
usar nesse eixo; alguns campos podem já conter uma variável4 automaticamente assumida
pelo programa; é o que acontece no eixo dos yy, em que o programa propõe representar o
número de casos iguais, ou frequências absolutas (variável $count).
horizontal ( ).
4
Aparte das variáveis definidas no ficheiro, nesta rotina o programa automaticamente define outras
variáveis, nomeadamente a variável $count (contagem de casos), $pct (percentagem de casos), $case (número
de ordem dos casos). Se a variável é precedida pelo ícon , trata-se de uma variável categórica; se é
precedida pelo ícon , é uma variável numérica escalar do ficheiro; se o ícon é , trata-se de uma
variável escalar definida pelo programa, e não constante no ficheiro.
ESACB 67
SPSS 4 - Gráficos
ESACB 68
SPSS 4 - Gráficos
Se se pretende visualizar a distribuição, dentro de cada um dos sexos, pela variável fuma,
deve especificar-se esta divisão por categorias, no separador Assign Variables da janela
Create Bar Chart, incluindo a variável para definir as categorias no campo Legend
Variables – Color; o que se está a fazeer, é instruir o programa para usar cores diferentes
para cada uma das categorias da variável fuma:
ESACB 69
SPSS 4 - Gráficos
Vamos ilustrar com a criação do gráfico que relaciona o ritmo cardíaco antes de exercício
(ritmoa) com o ritmo cardíaco após exercício (ritmod). Para tal:
Graphs
Interactive
Scatterplot ...
Na janela de diálogo seguinte, definir as variáveis para os eixos dos xx e dos yy; para
identificar os casos por sexo, seleccionar a variável sexo para o campo Legend Variable –
Style (os casos de cada um dos sexos são identificados com uma marca distinta; se se
incluir a variável em Color, para cada um dos sexos é usada uma cor distinta):
ESACB 70
SPSS 4 - Gráficos
Para definir os títulos, seleccionar o separador Titles. O gráfico tem o seguinte aspecto:
ESACB 71
SPSS 4 - Gráficos
ESACB 72
SPSS 4 - Gráficos
No campo Method, seleccionar a opção Regression; no campo Fit lines for, seleccionar a
opção se se pretende uma equação para cada um dos casos da variável sexo (a
opção Total, que pode ser seleccionada isolada ou em conjunto com a opção Subgroups,
destina-se a ajustar uma equação a toda a amostra). O resultado é o seguinte:
ESACB 73
SPSS 4 - Gráficos
Para cada uma das sub-amostras definidas pela variável sexo, foi ajustada a equação de
regressão linear, cujas equações, e o respectivo coeficiente de determinação R2, são
apresentadas na figura.
Uma outra possibilidade é apresentar os gráficos por categorias isolados. Para tal, na janela
Create Scatterplot, a variável categórica é seleccionada para o campo Panel Variables (e
não para o campo Legend Variables):
ESACB 74
SPSS 4 - Gráficos
Para editar um gráfico criado com a rotina Interactive, seleccionar o gráfico a editar e fazer
um dos seguintes procedimentos:
i) Edit
SPSS Interactive Graphic Object
ESACB 75
SPSS 4 - Gráficos
A área do gráfico em edição, assinalada na margem esquerda por uma seta, está no interior
de uma bordadura tracejada. Não é permitido efectuar modificações em qualquer zona fora
desta bordadura.
Os ícons na borda do gráfico são botões de atalho para as tarefas de edição. Para editar um
elemento do gráfico, deve seleccionar-se previamente, fazendo click sobre esse elemento.
Seguidamente, utiliza-se o botão pretendido:
Espessura de linhas;
Estilo de linhas (contínuas, tracejadas);
Tamanho de marcas ou pontos;
Estilo (forma) de marcas ou pontos;
Padrão de preenchimento de áreas;
Estilo e cor das linhas de bordadura de áreas;
Cor de preenchimento de áreas;
Ferramenta para criar/editar uma caixa de texto;
ESACB 76
SPSS 4 - Gráficos
Além destes botões, que permitem efectuar a maior parte das modificações que o utilizador
normal pretende efectuar no gráfico, os menus Edit, View, Format possibilitam executar
ESACB 77
SPSS 4 - Gráficos
essas mesmas alterações através de menus, e outras modificações que não dispõem de botão
de atalho.
No final, para terminar a sessão de edição do gráfico, basta fazer click sobre uma área do
ecran não pertencente à janela do gráfico.
ESACB 78
SPSS 5 - Testes T
5- TESTES T
• Teste t para a média de uma amostra: compara a média de uma amostra com a
média hipotética conhecida de uma população. São apresentados os parâmetros
estatísticos da amostra em análise; igualmente é estabelecido um intervalo de
confiança para ( x − µ ) .
x−µ
e a estatística de testes é t =
σ
N
x1 − x 2
e a estatística de testes é t =
1 1
s 2 × −
N1 N 2
ESACB 79
SPSS 5 - Testes T
x1 − x 2
e a estatística de testes é t =
1 1
s 2 × −
N
1 N 2
A fim de ilustrar a realização destes testes vamos usar o ficheiro PULSO.SAV que foi
criado por importação de um ficheiro dBase. Em anexo é fornecida uma impressão do
ficheiro.
Antes de prosseguir para os testes t é aconselhado fazer uma análise exploratória dos
dados, tal como foi ilustrado no capítulo 3. A seguir apresentam-se dois estratos desta
análise, nomeadamente o diagrama de extremos-e-quartis e os valores extremos:
ESACB 80
SPSS 5 - Testes T
300
200
100
0
N= 40
RITMOD
Extreme Values
Case Value
Number
RITMOA Highest 1 6 96
2 4 96
3 15 92
4 10 90
5 38 90
Lowest 1 1 62
2 36 62
3 3 64
4 13 66
a
5 39
RITMOD Highest 1 6 265
2 9 160
3 17 158
4 26 158
5 19 156
Lowest 1 16 112
2 27 116
3 37 116
4 7 120
5 28 120
a Only a partial list of cases with the value 66 are shown in the table of lower
extremes.
ESACB 81
SPSS 5 - Testes T
Por esta análise pode concluir-se que o caso nº 6 constitui uma observação “outlier” no
referente à observação ritmod: provavelmente, o observador queria registar o valor 165
e, por erro, introduziu 265, valor virtualmente impossível para o ritmo cardíaco de
qualquer humano, mesmo que sujeito a condições in extremis. Contudo, como na
realidade o estatístico não sabe ou que se passou, a melhor estratégia será ignorar este
caso (indivíduo nº 6) sempre que tiver de utilizar a variável ritmod.
H0 :x = µ H1 : x ≠ µ
⇔
H0 : x − µ = 0 H1 : x − µ ≠ 0
ESACB 82
SPSS 5 - Testes T
Por defeito, está definido (1-α)=0.95; se o desejar, o utilizador poderá alterar este nível
de confiança. Fazer e depois OK:
Para um nível de significância de 5%, deve rejeitar-se a hipótese nula de que o ritmo
médio cardíaco da população, com base nesta amostra, possa ser de 80 (pois o p-value
ou significance level da amostra é de 0.011<α=0.05, ou porque |tcalc|=2.686 >
t(0.05,39)=2.021).
ESACB 83
SPSS 5 - Testes T
ESACB 84
SPSS 5 - Testes T
Group Statistics
No primeiro quadro são apresentados alguns parâmetros estatísticos de cada uma das
amostras. No segundo quadro apresentam-se os testes de homogeneidade de variâncias
(Levene) e o teste t-Student de comparação das médias das duas amostras.
2 2 2 2
H 0 : s ritmoa Fuma
= s ritmoa Não Fuma
H 1 : s ritmoa Fuma
≠ s ritmoa Não Fuma
5
O teste de Levene é uma anova. Os graus de liberdade totais são N-1=39; pretendem-se
comparar duas amostras, de modo que fica 1 grau de liberdade para as amostras, restando 38 graus de
liberdade para o erro experimental.
ESACB 85
SPSS 5 - Testes T
O valor da estatística de teste é t=0.394 < t(0.05; 23) = 2.069, ou p-value = 0.698 > α=5%,
concluindo-se assim que os ritmos cardíacos em repouso, destas duas amostras, são
estatisticamente iguais, para um nível de significância de 5%.
Como anteriormente se fez notar, este teste deverá ser efectuando, sem incluir o
indivíduo nº 6, por se suspeitar que o respectivo registo do ritmo cardíaco após
exercício está errado. Para tal, fazer:
Data
Select Cases...
ESACB 86
SPSS 5 - Testes T
Pretende-se excluir o caso nº 6 da análise, isto é, incluir na análise todos os casos com
O Data Editor do SPSS criou automaticamente uma variável designada filter_$, em que
indica quais os casos seleccionados e os não incluídos. Repare-se que a linha 6 está
traçada, indicando que este caso está excluído de futuras análises:
Note-se que este procedimento de seleccionar casos não é exclusivo nem obrigatório do
procedimento da comparação de médias de duas amostras emparelhadas. É um
procedimento geral a efectuar previamente a qualquer análise em que haja necessidade
de seleccionar ou excluir casos.
De seguida, passa-se então à comparação das médias das duas amostras emparelhadas.
Tal como o nome indica, deve haver pares de observações, de modo que ambas as
amostras têm o mesmo número de observações.
ESACB 87
SPSS 5 - Testes T
ESACB 88
SPSS 5 - Testes T
N Correlation Sig.
Pair 1 RITMOA & RITMOD 39 .544 .000
Paired Differences
95% Confidence
Interval of the
Std. Std. Error Difference Sig.
Mean Deviation Mean Lower Upper t df (2-tailed)
Pair 1 RITMOA - RITMOD -61.87 10.78 1.73 -65.36 -58.38 -35.858 38 .000
No primeiro quadro são apresentados alguns parâmetros estatísticos de cada uma das
amostras. Repare-se que foram só levados em conta 39 observações em cada amostra.
ESACB 89
SPSS 6 - Anova
6- ANÁLISE DE VARIÂNCIA
Isto é:
A estatística de teste é a estatística F, que é uma razão entre variâncias, que sob o
pressuposto de que as observações têm distribuição normal, segue uma distribuição F de
Snedecor:
ESACB 90
SPSS 6 - Anova
Densidade Repetições
25 5113 5398 5307 4678
50 5346 5952 4719 5264
75 5272 5713 5483 5049
100 5164 4831 4986 4410
125 4804 4848 4432 4748
150 4254 4542 4919 4098
A anova simples (ensaios uni-factoriais) pode ser executada no SPSS com dois
procedimentos:
Statistics
Compare Means...
One-Way ANOVA...
ESACB 91
SPSS 6 - Anova
ESACB 92
SPSS 6 - Anova
Oneway
Descriptives
Produção (kg/ha)
95% Confidence Interval
for Mean
Std. Lower Upper
N Mean Deviation Std. Error Bound Bound Minimum Maximum
25 kg/ha 4 5124.0000 320.2093 160.1047 4614.4755 5633.5245 4678.00 5398.00
50 kg/ha 4 5320.2500 504.7893 252.3947 4517.0176 6123.4824 4719.00 5952.00
75 kg/ha 4 5379.2500 284.4414 142.2207 4926.6402 5831.8598 5049.00 5713.00
100 kg/ha 4 4847.7500 321.9900 160.9950 4335.3920 5360.1080 4410.00 5164.00
125 kg/ha 4 4708.0000 188.4958 94.2479 4408.0611 5007.9389 4432.00 4848.00
150 kg/ha 4 4453.2500 360.8798 180.4399 3879.0097 5027.4903 4098.00 4919.00
Total 24 4972.0833 455.9256 93.0654 4779.5628 5164.6038 4098.00 5952.00
Produção (kg/ha)
Levene
Statistic df1 df2 Sig.
.418 5 18 .830
ANOVA
Produção (kg/ha)
Sum of Mean
Squares df Square F Sig.
Between Groups 2657880.8 5 531576.167 4.507 .008
Within Groups 2123087.0 18 117949.278
Total 4780967.8 23
ESACB 93
SPSS 6 - Anova
ESACB 94
SPSS 6 - Anova
Homogeneous Subsets
Produção (kg/ha)
Means Plots
5600
5400
5200
Mean of Produção (kg/ha)
5000
4800
4600
4400
25 kg/ha 50 kg/ha 75 kg/ha 100 kg/ha 125 kg/ha 150 kg/ha
Densidade de sementeira
O primeiro quadro de resultados contém a médias, desvio padrão e erro padrão da média
e intervalo de confiança da média, mínimo e máximo para cada tratamento.
Como F=0.418 < F(0.05;5;18) =2.77, ou p-value=0.83 > α=0.05, conclui-se que as
variâncias são homogéneas, isto é, dentro de cada um dos tratamentos a variabilidade é
apenas devida a causas aleatórias.
Contudo, este resultado não nos permite concluir qual ou quais densidades conduzem a
produções médias significativamente diferentes de outras. Para concluir tal, há que
proceder à comparação da média de cada um dos tratamentos com todas as restantes.
esta comparação é feita em termos do valor absoluto das diferenças entre médias: se esta
ESACB 95
SPSS 6 - Anova
diferença entre duas médias é pequena, então as médias não diferem; se a diferença é
grande, então as duas médias são estatisticamente distintas. Este é o princípio de
qualquer teste de comparações múltiplas.
Contudo, há que fixar um critério que defina a fronteira entre o que é uma diferença
grande e uma diferença pequena. Este critério é estabelecido por cada um dos testes
(LSD, Scheffé, Tukey, etc), com base em expressões que relacionam a média das somas
dos quadrados residual (calculada na tabela anova) e com base em funções de
distribuição de probabilidades.
No quadro dos resultados dos testes de comparações múltiplas são identificados com o
símbolo * quais os tratamentos cujas médias diferem significativamente. Repare-se que
ambos os testes acusam como conduzindo a produções médias diferentes densidades de
50 kg/ha e 150 kg/ha (diferença de 867 kg) e 75 kg/ha e 150 kg/ha (diferença de 926
kg). Contudo apenas o teste LSD acusa existirem diferenças entre as produções
alcançadas com 25 e 150 kg/ha (diferença de 670.75 kg), 50 e 125 kg/ha (diferença de
612.25 kg), 75 e 100 kg/ha (diferença de 531.5 kg).
Isto é, o teste LSD acusa como diferentes tratamentos cujas médias estão menos
afastadas do que o teste Tuckey, que dá, por assim dizer, maior margem de dúvida antes
de imputar essas diferenças aos efeitos dos tratamentos.
No final aparece um gráfico representado as médias dos tratamentos, que pode ser útil
explorar no sentido de compreender os resultados, e deles tirar o proveito no âmbito da
aplicabilidade da Estatística ao delineamento de ensaios agrícolas.
6
Deixa-se ao cuidado do leitor a explicação agronómica destas conclusões.
ESACB 96
SPSS 6 - Anova
Statistics
Compare Means...
Means...
ESACB 97
SPSS 6 - Anova
Means
Case Processing Summary
Cases
Included Excluded Total
N Percent N Percent N Percent
Produção (kg/ha) *
Densidade de 24 100.0% 0 .0% 24 100.0%
sementeira
Report
Produção (kg/ha)
Densidade de Std.
sementeira Mean N Deviation
25 kg/ha 5124.0000 4 320.2093
50 kg/ha 5320.2500 4 504.7893
75 kg/ha 5379.2500 4 284.4414
100 kg/ha 4847.7500 4 321.9900
125 kg/ha 4708.0000 4 188.4958
150 kg/ha 4453.2500 4 360.8798
Total 4972.0833 24 455.9256
ANOVA Table
Sum of Mean
Squares df Square F Sig.
Produção (kg/ha) * Between (Combined) 2657880.8 5 531576.167 4.507 .008
Densidade de G
Within Groups 2123087.0 18 117949.278
sementeira Total 4780967.8 23
Measures of Association
Eta
Eta Squared
Produção (kg/ha) *
Densidade de .746 .556
sementeira
ESACB 98
SPSS 6 - Anova
Neste sentido, quando se espera que a resposta a um factor de interesse varie sob
diferentes níveis de outros factores, devem evitar-se os delineamentos uni-factoriais, e
considerar um delineamento multi-factorial que permita estudar em simultâneo dois ou
mais factores.
Diz-se que existe interacção entre dois factores se a resposta a um dos factores varia
consoante os níveis do outro factor.
Statistics
General Linear Model
GLM – General Factorial ...
ESACB 99
SPSS 6 - Anova
Por defeito, está definido o método de cálculo da soma de quadrados (tipo III); para
delineamentos em que não haja “missing-values” deve definir-se esta metodologia de
cálculo.
ESACB 100
SPSS 6 - Anova
ESACB 101
SPSS 6 - Anova
ESACB 102
SPSS 6 - Anova
Between-Subjects Factors
Value
Label N
Variedade 1 IR8 20
2 IR5 20
3 C4-63 20
Adubação 0 0 kg/ha 12
1 60 kg/ha 12
2 90 kg/ha 12
3 120 kg/ha 12
4 150 kg/ha 12
Descriptive Statistics
a
Levene's Test of Equality of Error Variances
ESACB 103
SPSS 6 - Anova
Pairwise Comparisons
ESACB 104
SPSS 6 - Anova
Univariate Tests
2. Adubação
Estimates
ESACB 105
SPSS 6 - Anova
Pairwise Comparisons
Univariate Tests
ESACB 106
SPSS 6 - Anova
3. Variedade * Adubação
ESACB 107
SPSS 6 - Anova
Homogeneous Subsets
Produção
a,b
Tukey HSD
Subset
Variedade N 1
IR8 20 4769.4000
IR5 20 5042.0000
C4-63 20 5058.1000
Sig. .113
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 198946.956.
a. Uses Harmonic Mean Sample Size = 20.000.
b. Alpha = .05.
Adubação
Multiple Comparisons
ESACB 108
SPSS 6 - Anova
Homogeneous Subsets
Produção
a,b
Tukey HSD
Subset
Adubação N 1 2 3
0 kg/ha 12 3483.3333
60 kg/ha 12 4761.0000
90 kg/ha 12 5071.8333
120 kg/ha 12 5669.6667
150 kg/ha 12 5796.6667
Sig. 1.000 .440 .956
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 198946.956.
a. Uses Harmonic Mean Sample Size = 12.000.
b. Alpha = .05.
Profile Plots
5000
Estimated Marginal Means
4900
4800
4700
IR8 IR5 C4-63
Variedade
ESACB 109
SPSS 6 - Anova
5000
Estimated Marginal Means
4000
3000
0 kg/ha 60 kg/ha 90 kg/ha 120 kg/ha 150 kg/ha
Adubação
6000
5000
Estimated Marginal Means
4000
Variedade
IR8
3000
IR5
2000 C4-63
0 kg/ha 60 kg/ha 90 kg/ha 120 kg/ha 150 kg/ha
Adubação
ESACB 110
SPSS 7 - Regressão Linear
7- REGRESSÃO LINEAR
7.1 - INTRODUÇÃO
Muitos estudos estatísticos têm como objectivo estabelecer uma relação, traduzida por
uma equação, que permite estimar o valor de uma variável, em função de outra ou
outras variáveis.
O caso mais simples é traduzir esta relação pela equação de uma recta, quando o
acréscimo de uma variável, designada por dependente e usualmente representada por y,
varia linearmente com os acréscimos provocados noutra variável, designada por
independente, representada por x.
Como regra, previamente ao cálculo da regressão linear, deve fazer-se uma análise
gráfica aos dados (gráfico de dispersão ou scatterplot), a fim de ter uma percepção
visual da existência ou não de uma tendência de dependência entre as variáveis, e como
método de detectar possíveis observações outliers ou influentes, que distorçam os
resultados.
ESACB 111
SPSS 7 - Regressão Linear
Situação 1
50
0
10
Situação 2
60
0
10
ESACB 112
SPSS 7 - Regressão Linear
Situação 3
50
0
10
A situação 4 ilustra uma forte relação entre x e y, mas não de tipo linear, pelo que o
ajustamento de uma recta para traduzir esta função de dependência é errada e sem
significado.
Situação 4
12
0
0 16
Situação 5
20
0
0 10
ESACB 113
SPSS 7 - Regressão Linear
60
50
40
% sólidos no molho
30
20
10 11 12 13 14 15 16 17 18
% insolúveis em água
A equação de regressão linear é uma estatística, e como tal, tem inerente a componente
de erro estatístico. A fim de interpretar a equação estimada, são apresentados uma série
de coeficientes e estatísticas suplementares, que de um modo geral permitem analisar o
maior ou menor grau de rigor com que a equação de regressão traduz a relação entre as
variáveis em estudo.
ESACB 114
SPSS 7 - Regressão Linear
p(1 − R 2 )
Ra2 = R 2 −
N − p −1
Além disso, a tabela da análise de variância fornece a média da soma dos quadrados
dos resíduos, cuja raíz quadrada é o erro padrão da estimativa. A equação de regressão é
tão mais ajustada aos dados, quanto menor for o erro padrão da estimativa,
comparativamente com o desvio padrão da variável dependente.
Statistics
Regression
7
No exemplo usam-se os dados das características do molho de tomate, em que as variáveis são
insoluve (% de insolúveis em água) e solidos (% total de sólidos no molho).
ESACB 115
SPSS 7 - Regressão Linear
ESACB 116
SPSS 7 - Regressão Linear
ESACB 117
SPSS 7 - Regressão Linear
Regression
Descriptive Statistics
Std.
Mean Deviation N
% sólidos no molho 39.7292 5.1826 24
% insolúveis em água 13.7775 1.8995 24
Correlations
%
% sólidos insolúveis
no molho em água
Pearson Correlation % sólidos no molho 1.000 -.970
% insolúveis em água -.970 1.000
Sig. (1-tailed) % sólidos no molho . .000
% insolúveis em água .000 .
N % sólidos no molho 24 24
% insolúveis em água 24 24
Variables Entered/Removedb
Variables
Model Variables Entered Removed Method
1 % insolúveis em águaa . Enter
a. All requested variables entered.
b. Dependent Variable: % sólidos no molho
ESACB 118
SPSS 7 - Regressão Linear
Model Summaryb
Std. Error
Adjusted R of the
Model R R Square Square Estimate
1 .970a .941 .938 1.2880
a. Predictors: (Constant), % insolúveis em água
b. Dependent Variable: % sólidos no molho
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
1 Regression 581.272 1 581.272 350.378 .000a
Residual 36.498 22 1.659
Total 617.770 23
a. Predictors: (Constant), % insolúveis em água
b. Dependent Variable: % sólidos no molho
Coefficientsa
Standardi
zed
Unstandardized Coefficien 95% Confidence Interval
Coefficients ts for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 76.193 1.966 38.761 .000 72.117 80.270
% insolúveis em água -2.647 .141 -.970 -18.718 .000 -2.940 -2.353
a. Dependent Variable: % sólidos no molho
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value 27.9714 47.8478 39.7292 5.0272 24
Residual -1.5871 3.1522 -3.70E-15 1.2597 24
Std. Predicted Value -2.339 1.615 .000 1.000 24
Std. Residual -1.232 2.447 .000 .978 24
a. Dependent Variable: % sólidos no molho
ESACB 119
SPSS 7 - Regressão Linear
Charts
Histogram
Dependent Variable: % sólidos no molho
7
2
Frequency
0 N = 24.00
-1.00 -.50 0.00 .50 1.00 1.50 2.00 2.50
.75
Expected Cum Prob
.50
.25
0.00
0.00 .25 .50 .75 1.00
ESACB 120
SPSS 7 - Regressão Linear
Scatterplot
Dependent Variable: % sólidos no molho
3
Regression Standardized Residual
-1
-2
-3 -2 -1 0 1 2
Estas análise dos resíduos sugerem que o modelo linear ajustado (equação de uma recta)
não é o melhor modelo para traduzir a relação entre estas variáveis; a distribuição dos
resíduos indica que o ajustamento de um modelo linear polinomial de 2ª ordem, com
uma equação do tipo y = a + bx + cx 2 aumentará a precisão da estimativa (que é
traduzida pelo coeficiente de determinação R2=0.941).
ESACB 121
SPSS 7 - Regressão Linear
A metodologia que se vai abordar serve igualmente para estimar uma equação de
regressão linear polinomial, do tipo y = b0 + b1 x + b2 x 2 + b3 x 3 + ... + bn x n , em que y
depende, não de diversas variáveis independentes x1, x2, ..., xn, mas de um polinómio da
mesma variável independente x. Neste caso, previamente a efectuar o procedimento da
regressão linear, devem gerar-se as variáveis correspondentes às potências x2, x3, ..., xn a
incluir no modelo. No parágrafo seguinte será abordada uma metodologia diferente que
permite o ajustamento de equações de curvas polinomiais a uma amostra de dados (x,y).
Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para a
mesma amostra de valores, não sejam inteiramente coincidentes, nomeadamente quando
alguma ou algumas das variáveis independentes estão muito próximas do limite que
define a significância da sua inclusão ou não inclusão no modelo.
ESACB 122
SPSS 7 - Regressão Linear
pouco funcional e muito fictício ou artificial, isto é, muito bem ajustado à amostra
particular de valores usados para o cálculo da equação, mas pouco adaptável à
população.
Para ilustrar o ajustamento de uma equação de regressão linear múltipla, vamos usar o
seguinte conjunto de dados (adaptado de DRAPPER & SMITH, 1981), em que as
variáveis independentes são a temperatura média mensal (graus Fahrenheit), a produção
mensal (toneladas), o número de dias úteis de trabalho por mês e o número de
empregados, e a variável dependente é o consumo de água (m3), observados numa
determinada empresa fabril:
Statistics
Regression
ESACB 123
SPSS 7 - Regressão Linear
A fim de comparar diversos modelos de regressão, vamos começar por incluir todas as
variáveis independentes, optando pelo método Enter; seguidamente, deve repetir-se a
metodologia, e optar por outros métodos de cálculo, nomeadamente Stepwise e
Backward.
ESACB 124
SPSS 7 - Regressão Linear
Regression
Descriptive Statistics
Std.
Mean Deviation N
Consumo mensal de
3268.3889 218.9502 18
água (m3)
Temperatura média
65.0500 13.1334 18
mensal (ºF)
Produção mensal (Ton) 13091.89 2716.3310 18
Dias úteis no mês 21.5000 1.0432 18
Número de operários 182.0000 21.3514 18
Correlations
Variables Entered/Removedb
Variables
Model Variables Entered Removed Method
1 Número de operários,
Temperatura média mensal (ºF),
. Enter
Dias úteis no amês, Produção
mensal (Ton)
a. All requested variables entered.
b. Dependent Variable: Consumo mensal de água (m3)
Model Summaryb
ESACB 125
SPSS 7 - Regressão Linear
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
1 Regression 727772.930 4 181943.232 27.127 .000a
Residual 87193.348 13 6707.181
Total 814966.278 17
a. Predictors: (Constant), Número de operários, Temperatura média mensal (ºF),
Dias úteis no mês, Produção mensal (Ton)
b. Dependent Variable: Consumo mensal de água (m3)
Coefficientsa
Standardi
zed
Unstandardized Coefficien 95% Confidence Interval
Coefficients ts for B Correlations
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound Zero-order Partial Part
1 (Constant) 531.302 619.067 .858 .406 -806.111 1868.714
Temperatura média
.232 1.550 .014 .150 .883 -3.117 3.581 .013 .041 .014
mensal (ºF)
Produção mensal (Ton) 5.027E-02 .023 .624 2.166 .049 .000 .100 .894 .515 .197
Dias úteis no mês 110.460 32.724 .526 3.376 .005 39.765 181.156 .901 .683 .306
Número de operários -1.709 2.801 -.167 -.610 .552 -7.759 4.342 .831 -.167 -.055
a. Dependent Variable: Consumo mensal de água (m3)
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value 2890.9719 3499.8154 3268.3889 206.9062 18
Residual -111.5868 131.9858 1.011E-13 71.6172 18
Std. Predicted Value -1.824 1.119 .000 1.000 18
Std. Residual -1.363 1.612 .000 .874 18
a. Dependent Variable: Consumo mensal de água (m3)
Charts
Histogram
Dependent Variable: Consumo mensal de água
5
2
Frequency
0 N = 18.00
-1.50 -1.00 -.50 0.00 .50 1.00 1.50
ESACB 126
SPSS 7 - Regressão Linear
.75
.50
Expected Cum Prob
.25
0.00
0.00 .25 .50 .75 1.00
Scatterplot
Dependent Variable: Consumo mensal de água (m3)
2.0
Regression Standardized Residual
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5
consumo=531.302+0.232temperat+0.05027producao+110.46dias-1.709operario
Repita-se o processo, optando pelo método de cálculo Stepwise. Neste caso, chegar-se-á
ao modelo:
ESACB 127
SPSS 7 - Regressão Linear
consumo=443.965+0.03842producao+107.976dias
e R2=0.889 e Rajustado
2
= 0.874 .
Repare-se que se simplificou o modelo, sem contudo prejudicar a precisão deste como
instrumento de estimativa da variável dependente.
Regression
Descriptive Statistics
Std.
Mean Deviation N
Consumo mensal de
3268.3889 218.9502 18
água (m3)
Temperatura média
65.0500 13.1334 18
mensal (ºF)
Produção mensal (Ton) 13091.89 2716.3310 18
Dias úteis no mês 21.5000 1.0432 18
Número de operários 182.0000 21.3514 18
Correlations
ESACB 128
SPSS 7 - Regressão Linear
Variables Entered/Removeda
Variables Variables
Model Entered Removed Method
1 Stepwise (Criteria:
Probability-of-F-to-e
Dias úteis no
. nter <= .050,
mês
Probability-of-F-to-re
move >= .100).
2 Stepwise (Criteria:
Probability-of-F-to-e
Produção
. nter <= .050,
mensal (Ton)
Probability-of-F-to-re
move >= .100).
a. Dependent Variable: Consumo mensal de água (m3)
Model Summaryc
ANOVAc
Sum of Mean
Model Squares df Square F Sig.
1 Regression 661216.554 1 661216.554 68.810 .000a
Residual 153749.724 16 9609.358
Total 814966.278 17
2 Regression 724715.124 2 362357.562 60.225 .000b
Residual 90251.154 15 6016.744
Total 814966.278 17
a. Predictors: (Constant), Dias úteis no mês
b. Predictors: (Constant), Dias úteis no mês, Produção mensal (Ton)
c. Dependent Variable: Consumo mensal de água (m3)
Coefficientsa
Standardi
zed
Unstandardized Coefficien 95% Confidence Interval
Coefficients ts for B Correlations
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound Zero-order Partial Part
1 (Constant) -796.273 490.549 -1.623 .124 -1836.190 243.643
Dias úteis no mês 189.054 22.791 .901 8.295 .000 140.740 237.369 .901 .901 .901
2 (Constant) 443.965 544.446 .815 .428 -716.494 1604.425
Dias úteis no mês 107.976 30.791 .514 3.507 .003 42.346 173.606 .901 .671 .301
Produção mensal (Ton) 3.842E-02 .012 .477 3.249 .005 .013 .064 .894 .643 .279
a. Dependent Variable: Consumo mensal de água (m3)
ESACB 129
SPSS 7 - Regressão Linear
Excluded Variablesc
Collinearit
y
Partial Statistics
Model Beta In t Sig. Correlation Tolerance
1 Temperatura média a
.032 .290 .776 .075 1.000
mensal (ºF)
Produção mensal (Ton) .477a 3.249 .005 .643 .343
Número de operários .323a 2.017 .062 .462 .385
2 Temperatura média b
.026 .296 .772 .079 .999
mensal (ºF)
Número de operários -.176b -.683 .506 -.179 .116
a. Predictors in the Model: (Constant), Dias úteis no mês
b. Predictors in the Model: (Constant), Dias úteis no mês, Produção mensal (Ton)
c. Dependent Variable: Consumo mensal de água (m3)
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value 2876.5112 3487.1743 3268.3889 206.4711 18
Residual -105.6879 130.9278 2.274E-13 72.8621 18
Std. Predicted Value -1.898 1.060 .000 1.000 18
Std. Residual -1.363 1.688 .000 .939 18
a. Dependent Variable: Consumo mensal de água (m3)
Charts
Histogram
Dependent Variable: Consumo mensal de água (m3)
5
2
Frequency
ESACB 130
SPSS 7 - Regressão Linear
.75
.50
Expected Cum Prob
.25
0.00
0.00 .25 .50 .75 1.00
Scatterplot
Dependent Variable: Consumo mensal de água (m3)
2.0
Regression Standardized Residual
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5
O SPSS dispõe de uma rotina que permite o ajustamento de vários modelos pré-
definidos a uma amostra de valores bi-variados (x,y). Tais modelos são:
ESACB 131
SPSS 7 - Regressão Linear
• Linear: y = b0 + b1 .x
• Quadrático: y = b0 + b1 .x + b2 .x 2
• Cúbico: y = b0 + b1 .x + b2 .x 2 + b3 .x 3
• Logarítmico: y = b0 + b1 . ln x
b1
• Inverso: y = b0 +
x
• Potência: y = b0 .x b1 ⇔ ln y = ln b0 + b1 . ln x
x
• Composto (compound): y = b0 .b 1 ⇔ ln y = ln b0 + x. ln b1
b
b0 + 1 b1
• Sigmoidal (S): y=e x
⇔ ln y = b0 +
x
1 1 1
• Logístico: y= ⇔ ln − = ln(b0 + x. ln b1 )
1 y u
+ b0 .b1x
u
(em que u é o limite assimptótico superior, u>0, u>ymax)
• Crescimento (growth): y = e b0 +b1 . x ⇔ ln y = b0 + b1 .x
• Exponencial: y = b0 .e b1 . x ⇔ ln y = ln b0 + b1 .x
Statistics
Regression
Neste menu, seleccionar a opção Curve Estimation... que dá acesso à seguinte caixa de
diálogo, onde se definem as variáveis dependente (solidos) e independente (insoluve) e
se seleccionam os modelos que se pretendem obter, e se define para apresentar a tabela
da anova para cada um dos modelos calculados:
ESACB 132
SPSS 7 - Regressão Linear
O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela análise dos
resultados, nomeadamente R2 e anova, seleccionar o modelo melhor ajustado. No
exemplo, foi solicitado para calcular os modelos linear, quadrático e cúbico. Os
resultados são os seguintes:
MODEL: MOD_1.
ESACB 133
SPSS 7 - Regressão Linear
Variable B SE B Beta
T Sig T
Variable B SE B Beta
T Sig T
ESACB 134
SPSS 7 - Regressão Linear
Variable B SE B Beta
T Sig T
Notes:
9 Tolerance limits reached; some dependent variables were
not entered.
% sólidos no molho
60
50
40
30
Obs erved
Linear
20 Quadratic
10 12 14 16 18 20
% insolúveis em água
ESACB 135
SPSS 7 - Regressão Linear
ESACB 136
SPSS 8 - Manusear os Resultados
8- MANUSEAR OS RESULTADOS
À medida que se vão executando tarefas com o SPSS, os resultados vão-se acumulando
sucessivamente no Viewer do programa.
pelo esquema .
ESACB 136
SPSS 8 - Manusear os Resultados
Note que cada rotina tem um conjunto de notas, mas que não estão visualizadas; para as
ver na janela de output, o utilizador só tem que fazer duplo click sobre , de
modo a “abrir o livro”, e aparecerem as notas na janela à direita.
Repare que as notas incluem a data e hora de obtenção dos resultados, a localização do
ficheiro de dados usado, o número de linhas ou casos do ficheiro de dados, indicações
sobre a existência e tratamento de “missing values”, e as instruções que originaram os
resultados (o utilizador gerou estas instruções, ou programa, seleccionando ícons e
janelas nos menus do programa; contudo, e para utilizações mais avançadas, o SPSS
tem um editor de programas, em que o utilizador constrói as rotinas de análise, como se
de uma linguagem de programação de tratasse). A última linha das notas indica o tempo
de processamento que a CPU do computador levou a executar esta rotina (neste caso,
0.99 segundos).
Para “fechar o livro” de notas, isto é, para que as notas não sejam visualizadas no
output, fazer duplo click sobre .
ESACB 137
SPSS 8 - Manusear os Resultados
Para visualizar resultados subsequentes, o utilizador pode usar a barra de scroll vertical
da janela de resultados, ou simplesmente fazer clik no item respectivo do organigrama.
Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores,
Além da visualização, o utilizador pode copiar este gráfico (ou qualquer outro conjunto
de resultados) para outra aplicação em Windows (por exemplo, processador de texto).
ESACB 138
SPSS 8 - Manusear os Resultados
Para tal, localizar o bloco de resultados pretendido (tal como descrito); Fazer Edit Copy
(ou CTRL-C), para capturar uma imagem do bloco seleccionado para o “clipboard”
(área de transferência) do Windows; colocar-se na aplicação pretendida (poor exemplo,
num documento do Word) e fazer a colagem da imagem (Edit Past, ou CTRL-V).
Se se efectuou uma análise e se chegou à conclusão que está repetida, ou que pura e
simplesmente não interessa, pode eliminar-se do Viewer. No exemplo seguinte, repetiu-
se a rotina Descriptives, de modo que os resultados estão em duplicado.
Podem acrescentar-se caixas de texto com comentários aos resultados, por exemplo
algumas análises que se considerem pertinentes.
e fazer Insert New Text ou fazer click no botão . Na janela de resultados é aberta
uma caixa de texto, onde se esccrevem os comentários pretendidos:
ESACB 139
SPSS 8 - Manusear os Resultados
Para eliminar um dos conjunto de resultados da rotina Descriptives, fazer click sobre o
item respectivo no organigrama:
File
Save
ESACB 140
SPSS 8 - Manusear os Resultados
Para imprimir os resultados do Viewer, faz-se File Print; na caixa de diálogo seguinte,
confirmar a impressora, e fazer OK:
Se interessar imprimir não todo o conjunto de resultados, mas apenas alguns dos blocos,
devem seleccionar-se previamente. Para tal, se os blocos são contíguos, manter a tecla
SHIFT carregada e fazer click sobre os items a seleccionar; se os blocos não são
adjacentes, manter a tecla CTRL carregada e fazer click sobre os items a seleccionar:
ESACB 141
SPSS 8 - Manusear os Resultados
ESACB 142
SPSS Anexos
ANEXOS
ESACB 143
plasma.sav