Escolar Documentos
Profissional Documentos
Cultura Documentos
o
, em que
) 1 , ( N a
t o quantil o da distribuio t-Student (opo
Confidence interval for mean);
-
x
s k x . , em que
N
s
s
x
= o erro padro da mdia e e k (opo Standard
error of mean);
- s z x .
o
, em que
o
z o quantil o da distribuio normal reduzida N(0,1) (opo
Standard deviation).
Vamos ilustrar a criao deste tipo de grfico usando a varivel ritmoa do ficheiro
pulso.sav, sub-dividida pelas duas categorias (Homem, Mulher) da varivel sexo:
SPSS 4 - Grficos
ESACB 55
Graphs
Error Bar ...
Na caixa de dilogo seguinte seleccionar a opo Simple, j que se trata de uma nica
varivel, e a opo para um grfico da varivel ritmoa para
cada categoria de uma outra varivel (sexo). Seleccionar a opo
se se pretender criar o grfico com todos os dados da varivel ritmoa, sem separar pelas
categorias da varivel sexo:
Fazer para continuar. Na seguinte caixa de dilogo, seleccionar a varivel
numrica a representar no grfico (ritmoa), e a varivel para definir as categorias (sexo):
Na caixa Bars Represent deve seleccionar-se o tipo de intervalo de confiana que se
pretende (definidos anteriormente). Para pequenas amostras, o mais usual o intervalo de
confiana para a mdia (Confidence interval for mean). O nvel de confiana de 95% (o
utilizador pode definir outro nvel de confiana).
SPSS 4 - Grficos
ESACB 56
Para definir os ttulos do grfico, seleccionar .
O grfico tem o seguinte aspecto:
18 22 N =
Intervalo de confiana a 95% para a mdia do ritmo cardaco
(por categoria sexo)
Fonte: Abcde, 1998
SEXO
Mulher Homem
9
5
%
C
I
R
I
T
M
O
A
90
80
70
60
4.1.5 - GRFICOS DE PROBABILIDADES
Os grficos de probabilidades (P-P: Probability Plots) visualizam graficamente o
ajustamento de uma varivel a uma funo de distribuio de probabilidades.
Este tipo de grficos representa no eixo dos xx as frequncias relativas acumuladas
observadas na amostra (observed cummulative probability) e no eixo dos yy a funo de
distribuio de probabilidades esperada (expected cummulative probability). A diagonal
do grfico (x=y) representa um ajustamento perfeito da amostra funo de distribuio de
probabilidades. Quanto mais os pontos se afastam da diagonal, ou se se distribuem segundo
um determinado padro, menor o ajustamento da amostra distribuio terica.
O SPSS pode fazer o grfico P-P de ajustamento s seguintes distribuies: beta, chi-
quadrado, exponencial, gamma, Laplace, Logistic, Log-normal, normal, semi-normal,
Pareto, t-Student, Weibull e uniforme.
Vamos ilustrar ajustando a varivel ritmoa distribuio de probabilidades normal, com
mdia x (parmetro de localizao) e varincia
2
s (parmetro de escala), estimados a partir
da amostra:
Graphs
P-P ...
SPSS 4 - Grficos
ESACB 57
O campo permite seleccionar a distribuio terica de probabilidades. As
frequncias acumuladas tericas ou esperadas so calculadas por expresses
matematicamente definidas, e todas relacionadas com o ranking das observaes (isto ,
com a ordem desde 0 correspondente a x
min
- a n correspondente a x
max
), sendo o mtodo
Blom o mais usual. Quando h observaes repetidas (ties), a sua ordem pode ser definida
pela ordem da observao mdia ( ), ou pela ordem mais elevada (High) ou da
observao mais baixa (Low) da observao repetida.
O resultado o seguinte:
PPlot
MODEL: MOD_3.
Expected Normal quantiles calculated using Blom's
proportional
estimation formula and assigning the mean to ties.
For variable RITMOA...
Normal distribution parameters estimated: location=75.95
scale=9.5379135
SPSS 4 - Grficos
ESACB 58
Normal P-P Plot of RITMOA
Observed Cum Prob
1.00 .75 .50 .25 0.00
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
1.00
.75
.50
.25
0.00
Detrended Normal P-P Plot of RITMOA
Observed Cum Prob
1.0 .8 .6 .4 .2 0.0
D
e
v
i
a
t
i
o
n
f
r
o
m
N
o
r
m
a
l
.10
.08
.06
.04
.02
0.00
-.02
-.04
-.06
O output inclui, alm do grfico de ajustamento normal (onde se observa um afastamento
com comportamento cclico em relao diagonal), um grfico do ajustamento dos resduos
(y
obs
-y
est
); se a amostra perfeitamente normal, os resduos distribuir-se-o segundo uma
faixa horizontal em torno do zero, sem denotar qualquer padro de distribuio; no
exemplo, ntido um comportamento cclico em torno do zero, denotando algum
afastamento em relao normal.
SPSS 4 - Grficos
ESACB 59
4.1.6 - GRFICO DE DISPERSO
O grfico de disperso (scatterplot) um grfico de pontos, representando num plano (x,y)
N pares de valores numricos escalares, que permite analisar a distribuio conjunta das
duas variveis.
Este tipo de grficos muito til como metodologia prvia de anlise a problemas de
regresso, quando se tenta ajustar uma funo y=f(x), que estabelece uma relao de
dependncia entre as duas variveis.
Permite igualmente detectar observaes outliers bi-variadas, isto , observaes que se
afastam do contexto das restantes observaes, mesmo que, analisadas isoladamente em
relao a cada varivel, no se suspeite desses outliers.
No eixo dos xx representa-se a varivel independente ou causal, e no eixo dos yy a varivel
dependente, resposta ou efeito.
A fim de ilustrar, vamos usar as variveis ritmoa (x) e ritmod (y), pensando a priori que o
ritmo cardaco aps exerccio fsico est relacionado com o ritmo cardaco em repouso do
mesmo indivduo.
Graphs
Scatter ...
Nesta janela, deve seleccionar-se o tipo de grfico de disperso a executar:
Simple quando se pretende representar num plano xy uma srie de observaes bi-
variadas (x,y); se nessa srie existem diferentes categorias, definidas por
uma terceira varivel categrica, podem identificar-se os pontos
correspondentes a cada categoria com marcas diferentes;
Overlay quando se pretende representar num mesmo plano (x,y) duas ou mais sries
de observaes bi-variadas (x,y) da mesma natureza;
Matrix quando se pretendem representar os grficos xy de todas as combinaes
possveis de duas ou mais variveis; isto , dispondo de 3 variveis
genericamente identificadas por x,y,z, esta opo representa os seguintes
grficos: (x,y), (x,z), (y,z), bem como a imagem simtrica destes grficos;
este grfico til para uma anlise exploratria das associaes entre
diversas variveis;
3-D representa o grfico espacial a 3 dimenses definido pelos eixos (x,y,z).
O tipo de grfico mais usual o Simple. Tendo seleccionado a opo pretendida, fazer
para prosseguir. Na janela seguinte, definir as variveis a usar em cada um dos
SPSS 4 - Grficos
ESACB 60
eixos (x: ritmoa; y: ritmod), bem como a varivel categrica (sexo) de agrupamento
(opcional):
Definir os ttulos como previamente descrito. O grfico resultante tem o seguinte aspecto:
Ritmo aps exerccio versus ritmo cardaco em repouso
Os casos so identificados por sexo
Fonte: Abcde, 1998
RITMOA
100 90 80 70 60
R
I
T
M
O
D
280
260
240
220
200
180
160
140
120
100
SEXO
Mulher
Homem
Nota-se que, aparte da observao no canto superior direito do grfico, que um outlier bi-
variado, todas as outras observaes tm uma tendncia mais ou menos linear ligeiramente
crescente.
Para ilustrar a matriz de grficos, com as variveis idade, ritmoa, ritmod, executar o
procedimento:
SPSS 4 - Grficos
ESACB 61
Graphs
Scatter ...
Matrix
O grfico resultante o seguinte:
IDADE
RITMOA
RITMOD
Relao entre i dade, ritmoa, ritmod
Casos identificados por sexo
Fonte: Abcde, 1998
SEXO
Mulher
Homem
SPSS 4 - Grficos
ESACB 62
4.2 - EDIO DOS GRFICOS STANDARDIZADOS
Quando o grfico criado e aparece na janela Viewer do SPSS pode no estar optimizado
em relao a algumas caractersticas, nomeadamente cores e padres de preenchimento
(com particular nfase se se pretende imprimir ou exportar para outras aplicaes).
Para editar o grfico, a fim de fazer estes pequenos ajustamentos, seleccionar o grfico
(click sobre o grfico) na janela Viewer do SPSS e abri-lo com um dos seguintes
procedimentos:
i) Edit
SPSS Chart Object
Open
ii) Click com o boto direito do rato
Aparece o seguinte menu:
Seleccionar SPSS Chart Object
Open
iii) Duplo click com o boto esquerdo do rato
Qualquer dos anteriores procedimentos abre o grfico numa nova janela, com a designao
SPSS Chart Editor, sobreposta ao Viewer, tal como se ilustra; o grfico est sombreado na
janela Viewer durante a edio; as alteraes efectuadas so reflectidas automaticamente
neste grfico:
SPSS 4 - Grficos
ESACB 63
Para alterar um pormenor, por exemplo o padro de preenchimento das barras, fazer click
sobre uma barra (no Chart Editor); repare-se que automaticamente todas as barras ficaram
seleccionadas (muito embora as marcas sejam colocadas em apenas algumas barras, todas
elas esto seleccionadas):
Para alterar o formato das barras, seleccionar o menu Format:
SPSS 4 - Grficos
ESACB 64
Neste menu, seleccionar uma das seguintes opes, conforme o objectivo; cada opo abre
uma caixa de dilogo onde o utilizador selecciona a alterao a efectuar; para tomar efeito,
fazer :
Nota: A barra de ferramentas do SPSS Chart Editor tem os botes de atalho para
as respectivas entradas no menu Format, tal como de seguida se
apresentam:
Fill Patern... ou Alterar o padro de preenchimento;
Color... ou Alterar a cor;
Marker... ou Alterar o tipo de marca ou ponto (no scatterplot);
Line Style... ou Alterar o tipo (contnua, pontuada) e espessura de linhas;
Bar Style ... ou Alterar o tipo de barras:
SPSS 4 - Grficos
ESACB 65
Text... ou Alterar as caractersticas (fonte e tamanho) do texto (s activo se se se
seleccionou previamente uma regio de texto, por exemplo os ttulos)
Cada uma das caixas de dilogo tem o boto ou , para fechar aps aplicar a
alterao.
Para alterar os ttulos ou notas de rodap (ou defini-los, se no o foram durante o
procedimento do elaborao do grfico), faz-se o seguinte procedimento:
Chart
Title... (ou Footnote... se se trata de editar as notas de rodap)
Abre-se a seguinte janela de dilogo, onde o utilizador poder alterar os ttulos (se no
foram previamente definidos os ttulos, os respectivos campos aparecem vazios), e o
respectivo alinhamento:
No caso da edio das notas de rodap, a janela de dilogo a seguinte:
Aps ter efectuado as alteraes pretendidas, fechar o Chart Editor para regressar ao
Viewer; para tal, fazer File Close, ou click no boto .
4.3 - GRFICOS INTERACTIVOS
SPSS 4 - Grficos
ESACB 66
Como referido no incio do captulo, o SPSS dispe de uma rotina interactiva de definio
de grficos, em que a seleco e alterao do tipo de grficos, variveis a incluir, e
pormenores, so mais facilmente editados.
Para criar um grfico interactivo, seleccionar:
Graphs
Interactive
No menu seguinte, selecciona-se o tipo de grfico a criar:
Vamos ilustrar a criao de um grfico de barras e de um grfico de disperso; para os
restantes tipos, os procedimentos so anlogos.
4.3.1 - GRFICO DE BARRAS
No menu Interactive selecciona-se a opo Bar... , aparecendo a seguinte janela de
dilogo:
SPSS 4 - Grficos
ESACB 67
Esta janela tpica dos grficos interactivos, e representa o esqueleto do grfico, com um
sistema de eixos ortogonais, cada um com um campo, para o qual se selecciona a varivel a
usar nesse eixo; alguns campos podem j conter uma varivel
4
automaticamente assumida
pelo programa; o que acontece no eixo dos yy, em que o programa prope representar o
nmero de casos iguais, ou frequncias absolutas (varivel $count).
O grfico pode ser bi-dimensional, ou tri-dimensional; a seleco faz-se com os botes:
grfico bi-dimensional (plano xy)
grfico tri-dimensional (espao xyz)
No caso de um grfico bi-dimensional, pode ser representado na vertical ( ) ou na
horizontal ( ).
Seleccionar para o eixo dos xx a varivel a representar (sexo):
4
Aparte das variveis definidas no ficheiro, nesta rotina o programa automaticamente define outras
variveis, nomeadamente a varivel $count (contagem de casos), $pct (percentagem de casos), $case (nmero
de ordem dos casos). Se a varivel precedida pelo con , trata-se de uma varivel categrica; se
precedida pelo con , uma varivel numrica escalar do ficheiro; se o con , trata-se de uma
varivel escalar definida pelo programa, e no constante no ficheiro.
SPSS 4 - Grficos
ESACB 68
Para definir os ttulos, seleccionar o separador Titles:
O grfico resultante tem o seguinte aspecto:
SPSS 4 - Grficos
ESACB 69
Se se pretende visualizar a distribuio, dentro de cada um dos sexos, pela varivel fuma,
deve especificar-se esta diviso por categorias, no separador Assign Variables da janela
Create Bar Chart, incluindo a varivel para definir as categorias no campo Legend
Variables Color; o que se est a fazeer, instruir o programa para usar cores diferentes
para cada uma das categorias da varivel fuma:
O grfico resultante o seguinte:
SPSS 4 - Grficos
ESACB 70
4.3.2 - GRFICO DE DISPERSO
Vamos ilustrar com a criao do grfico que relaciona o ritmo cardaco antes de exerccio
(ritmoa) com o ritmo cardaco aps exerccio (ritmod). Para tal:
Graphs
Interactive
Scatterplot ...
Na janela de dilogo seguinte, definir as variveis para os eixos dos xx e dos yy; para
identificar os casos por sexo, seleccionar a varivel sexo para o campo Legend Variable -
Style (os casos de cada um dos sexos so identificados com uma marca distinta; se se
incluir a varivel em Color, para cada um dos sexos usada uma cor distinta):
SPSS 4 - Grficos
ESACB 71
Para definir os ttulos, seleccionar o separador Titles. O grfico tem o seguinte aspecto:
SPSS 4 - Grficos
ESACB 72
O grfico de disperso interactivo tem a particularidade de poder ajustar uma equao de
regresso linear aos pontos, na totalidade, sem diferenciao por categorias, ou ento para
os pontos de cada uma das categorias definidas por uma varivel categrica. Para tal, na
janela de dilogo Create Scatterplot, aps identificar as variveis x e y e a varivel
categrica (se se pretender uma equao para cada categoria), seleccionar o separador Fit:
SPSS 4 - Grficos
ESACB 73
No campo Method, seleccionar a opo Regression; no campo Fit lines for, seleccionar a
opo se se pretende uma equao para cada um dos casos da varivel sexo (a
opo Total, que pode ser seleccionada isolada ou em conjunto com a opo Subgroups,
destina-se a ajustar uma equao a toda a amostra). O resultado o seguinte:
SPSS 4 - Grficos
ESACB 74
Para cada uma das sub-amostras definidas pela varivel sexo, foi ajustada a equao de
regresso linear, cujas equaes, e o respectivo coeficiente de determinao R
2
, so
apresentadas na figura.
Uma outra possibilidade apresentar os grficos por categorias isolados. Para tal, na janela
Create Scatterplot, a varivel categrica seleccionada para o campo Panel Variables (e
no para o campo Legend Variables):
SPSS 4 - Grficos
ESACB 75
Para ajustar, em cada um dos grficos, a respectiva equao de regresso, seleccionar no
separador Fit a opo (j que o ajustamento da equao feito para
cada um dos grficos isoladamente). O resultado o seguinte:
4.4 - EDIO DE GRFICOS INTERACTIVOS
Para editar um grfico criado com a rotina Interactive, seleccionar o grfico a editar e fazer
um dos seguintes procedimentos:
i) Edit
SPSS Interactive Graphic Object
ii) Click no boto direito do rato; no menu seguinte:
seleccionar SPSS Interactive Graphic Object
iii) Duplo click com o boto esquerdo do rato sobre o grfico
O grfico editado na janela Viewer do SPSS, tomando o seguinte aspecto:
SPSS 4 - Grficos
ESACB 76
A rea do grfico em edio, assinalada na margem esquerda por uma seta, est no interior
de uma bordadura tracejada. No permitido efectuar modificaes em qualquer zona fora
desta bordadura.
Os cons na borda do grfico so botes de atalho para as tarefas de edio. Para editar um
elemento do grfico, deve seleccionar-se previamente, fazendo click sobre esse elemento.
Seguidamente, utiliza-se o boto pretendido:
Espessura de linhas;
Estilo de linhas (contnuas, tracejadas);
Tamanho de marcas ou pontos;
Estilo (forma) de marcas ou pontos;
Padro de preenchimento de reas;
Estilo e cor das linhas de bordadura de reas;
Cor de preenchimento de reas;
Ferramenta para criar/editar uma caixa de texto;
Ponteiro do rato para selecco de elementos do grfico;
Abre a seguinte caixa de dilogo de seleco de variveis, onde se podem
mudar as variveis a representar no grfico:
SPSS 4 - Grficos
ESACB 77
Permite inserir elementos no grfico (os elementos que se podem
inserir dependem do tipo de grfico, e natureza das variveis em uso):
Boto que permite desfazer a ltima modificao efectuada no grfico;
Selecciona a orientao horizontal ou vertical do grfico;
Dispe automaticamente na rea os elementos do grfico;
Definio da fonte e tamanho do texto, bold
ou negrito, itlico (s est activo se previamente se tiver seleccionado um
elemento de texto do grfico).
Alm destes botes, que permitem efectuar a maior parte das modificaes que o utilizador
normal pretende efectuar no grfico, os menus Edit, View, Format possibilitam executar
SPSS 4 - Grficos
ESACB 78
essas mesmas alteraes atravs de menus, e outras modificaes que no dispem de boto
de atalho.
No final, para terminar a sesso de edio do grfico, basta fazer click sobre uma rea do
ecran no pertencente janela do grfico.
SPSS 5 - Testes T
ESACB 79
5 - TESTES T
As metodologias estatsticas que envolvem testes de hipteses acerca de mdias de
hiptese designam-se genericamente por testes t.
O SPSS dispe de trs tipos de testes t:
- Teste t para a mdia de uma amostra: compara a mdia de uma amostra com a
mdia hipottica conhecida de uma populao. So apresentados os parmetros
estatsticos da amostra em anlise; igualmente estabelecido um intervalo de
confiana para ) ( x .
O teste de hiptese subjacente :
0 : 0 :
: :
1 0
1 0
= =
= =
x H x H
x H x H
e a estatstica de testes
|
.
|
\
|
=
N
x
t
o
- Teste t para duas amostras independentes: Compara as mdias de uma mesma
varivel ou caracterstica observada sobre duas amostras independentes de
indivduos, com a condio de que os indivduos sejam aleatoriamente atribudos
aos dois conjuntos em comparao (por exemplo, produo obtida sob um
tratamento versus produo obtida sob outro tratamento diferente, ou de um
modo genrico, controlo versus tratamento). So apresentados os parmetros
estatsticos das amostras em anlise; efectuado o teste de LEVENE para a
homogeneidade das varincias das duas amostras; so apresentadas as
estatsticas de teste para as situaes de varincias homogneas e no
homogneas; estabelecido um intervalo de confiana para (
2 1
x x ).
O teste de hiptese subjacente :
0 : 0 :
: :
2 1 1 2 1 0
2 1 1 2 1 0
= =
= =
x x H x x H
x x H x x H
e a estatstica de testes
|
|
.
|
\
|
=
2 1
2
2 1
1 1
N N
s
x x
t
O teste de Levene para decidir
2
2
2
1 1
2
2
2
1 0
: : s s H s s H = = consiste numa anlise
de varincia aos valores absolutos das diferenas entre os valores observados e a
mdia de cada uma das amostras.
SPSS 5 - Testes T
ESACB 80
- Teste t para duas amostras emparelhadas: Compara as mdias de duas variveis
ou caractersticas para uma mesma amostra de indivduos (do gnero peso antes
versus peso depois de um determinado tratamento). So apresentados os
parmetros estatsticos para as duas amostras em anlise; calculada a
correlao entre as duas amostras; So apresentados os parmetros estatsticos
para as diferenas entre as duas amostras emparelhadas; estabelecido um
intervalo de confiana para (
2 1
x x ).
O teste de hiptese subjacente :
0 : 0 :
: :
2 1 1 2 1 0
2 1 1 2 1 0
= =
= =
x x H x x H
x x H x x H
e a estatstica de testes
|
|
.
|
\
|
=
2 1
2
2 1
1 1
N N
s
x x
t
A fim de ilustrar a realizao destes testes vamos usar o ficheiro PULSO.SAV que foi
criado por importao de um ficheiro dBase. Em anexo fornecida uma impresso do
ficheiro.
Os dados consistem em 40 casos de pacientes (seleccionados aleatoriamente entre os
alunos de uma universidade), homens e mulheres, alguns dos quais fumam e outros no
fumam. Para cada um dos indivduos foi medido o ritmo cardaco antes (ritmoa) e aps
uma corrida de 1500 m (ritmod). Pretende-se, entre outros objectivos, verificar se h
diferenas entre os ritmos cardacos antes e aps o exerccio fsico; se h diferenas de
ritmo cardaco entre homens e mulheres, entre fumadores e no fumadores. Pretende-se
igualmente saber qual o valor indicativo do ritmo cardaco mdio da populao dessa
universidade.
Antes de prosseguir para os testes t aconselhado fazer uma anlise exploratria dos
dados, tal como foi ilustrado no captulo 3. A seguir apresentam-se dois estratos desta
anlise, nomeadamente o diagrama de extremos-e-quartis e os valores extremos:
SPSS 5 - Testes T
ESACB 81
40 N =
RITMOD
300
200
100
0
6
Extreme Values
Case
Number
Value
RITMOA Highest 1 6 96
2 4 96
3 15 92
4 10 90
5 38 90
Lowest 1 1 62
2 36 62
3 3 64
4 13 66
5 39
a
RITMOD Highest 1 6 265
2 9 160
3 17 158
4 26 158
5 19 156
Lowest 1 16 112
2 27 116
3 37 116
4 7 120
5 28 120
a Only a partial list of cases with the value 66 are shown in the table of lower
extremes.
SPSS 5 - Testes T
ESACB 82
Por esta anlise pode concluir-se que o caso n 6 constitui uma observao outlier no
referente observao ritmod: provavelmente, o observador queria registar o valor 165
e, por erro, introduziu 265, valor virtualmente impossvel para o ritmo cardaco de
qualquer humano, mesmo que sujeito a condies in extremis. Contudo, como na
realidade o estatstico no sabe ou que se passou, a melhor estratgia ser ignorar este
caso (indivduo n 6) sempre que tiver de utilizar a varivel ritmod.
5.1 - TESTE T PARA A MDIA DE UMA AMOSTRA
Pretende-se verificar se se pode considerar que a mdia da varivel ritmoa da populao
universitria em anlise pode ser de 80 pulsaes por minuto. Isto , trata-se de dar
resposta ao seguinte teste de hipteses:
0 : 0 :
: :
1 0
1 0
= =
= =
x H x H
x H x H
Para tal, fazer Statistics Compare Means One-Sample T Test...
Aparece a seguinte caixa de dilogo, onde se selecciona a varivel a analisar (ritmoa), e
o valor hipottico da mdia da populao :
SPSS 5 - Testes T
ESACB 83
De seguida, seleccionar a fim de difinir o nvel de confiana para ) ( x :
Por defeito, est definido (1-o)=0.95; se o desejar, o utilizador poder alterar este nvel
de confiana. Fazer e depois OK:
Para um nvel de significncia de 5%, deve rejeitar-se a hiptese nula de que o ritmo
mdio cardaco da populao, com base nesta amostra, possa ser de 80 (pois o p-value
ou significance level da amostra de 0.011<o=0.05, ou porque |t
calc
|=2.686 >
t
(0.05,39)
=2.021).
O intervalo de confiana para | | 00 . 1 , 01 . 7 ) ( e x
5.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES
Pretende-se verificar se, em relao ao ritmo cardaco antes do exerccio fsico, h ou
no diferenas entre os fumadores e os no fumadores, isto :
fumadres no Fumadores fumadres no Fumadores
ritmoa ritmoa ritmoa ritmoa
x x H x x H = = : :
1 0
SPSS 5 - Testes T
ESACB 84
Para tal, fazer Statistics Compare Means Independent Samples T
Test...:
Na caixa de dilogo seguinte, seleccionar a varivel resposta a analisar (ritmoa); as
duas amostras a comparar so dois sub-grupos desta varivel, definidos pela varivel
fuma; para tal, seleccionar esta varivel para o campo :
Para definir os sub-grupos ou amostras, seleccionar ; usar os valores
codificados da varivel fuma (1=Fuma; 2=No Fuma) para definir os grupos:
SPSS 5 - Testes T
ESACB 85
No final, fazer . De seguida, seleccionar a fim de difinir o nvel de
confiana para a diferena entre mdias:
Fazer e depois OK:
Group Statistics
16 76.75 12.00 3.00
24 75.42 7.72 1.58
FUMA
Fuma
No Fuma
RITMOA
N Mean
Std.
Deviation
Std. Error
Mean
Independent Samples Test
8.665 .006 .429 38 .671 1.33 3.11 -4.96 7.63
.394 23.274 .698 1.33 3.39 -5.67 8.34
Equal variances
assumed
Equal variances not
assumed
RITMOA
F Sig.
Levene's Test for
Equality of Variances
t df
Sig.
(2-tailed)
Mean
Difference
Std. Error
Difference Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means
No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma das
amostras. No segundo quadro apresentam-se os testes de homogeneidade de varincias
(Levene) e o teste t-Student de comparao das mdias das duas amostras.
Comea por analisar-se a homogeneidade das varincias, isto , verificar se se devem
considerar homogneas ou diferentea as varincias dos dois sub-grupos:
2 2
1
2 2
0
: :
Fuma No Fuma Fuma No Fuma
ritmoa ritmoa ritmoa ritmoa
s s H s s H = =
concluindo-se que se devem considerar as varincias no homogneas, pois p-value
deste teste (0.006) inferior a um valor o=5% ou mesmo o=1% (isto , podemos fazer
esta deciso com 99% de probabilidade de acertar). Tambm se pode decidir este teste,
comparando o valor F
calc
=8.665 com um valor crtico da distribuio F de Snedecor (por
exemplo, para o=5%, F
(0.05; 1, 38)
=4.10
5
).
5
O teste de Levene uma anova. Os graus de liberdade totais so N-1=39; pretendem-se
comparar duas amostras, de modo que fica 1 grau de liberdade para as amostras, restando 38 graus de
liberdade para o erro experimental.
SPSS 5 - Testes T
ESACB 86
De seguida, faz-se a deciso do teste t-Student, para a situao de varincias no
homogneas, isto :
fumadres no Fumadores fumadres no Fumadores
ritmoa ritmoa ritmoa ritmoa
x x H x x H = = : :
1 0
O valor da estatstica de teste t=0.394 < t
(0.05; 23)
= 2.069, ou p-value = 0.698 > o=5%,
concluindo-se assim que os ritmos cardacos em repouso, destas duas amostras, so
estatisticamente iguais, para um nvel de significncia de 5%.
O intervalo de confiana a 95% para a diferena entre as mdias [-5.67 , 8.34],
podendo teoricamente a diferena ser nula.
5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS
Pretende-se verificar se existem ou no diferenas significativas entre os ritmos
cardacos antes e depois de realizao do exerccio fsico, isto :
0 : 0 :
: :
mod 1 mod 0
mod 1 mod 0
= =
= =
rit ritmoa rit ritmoa
rit ritmoa rit ritmoa
x x H x x H
x x H x x H
Como anteriormente se fez notar, este teste dever ser efectuando, sem incluir o
indivduo n 6, por se suspeitar que o respectivo registo do ritmo cardaco aps
exerccio est errado. Para tal, fazer:
Data
Select Cases...
SPSS 5 - Testes T
ESACB 87
Pretende-se excluir o caso n 6 da anlise, isto , incluir na anlise todos os casos com
excepo do caso n 6. Para tal, na caixa de dilogo seleccionar , e
definir que se seleccionam para anlise todos os cados diferenntes do caso n 6:
A indicao caso ~= 6 significa todos os casos excepto o caso 6.
O Data Editor do SPSS criou automaticamente uma varivel designada filter_$, em que
indica quais os casos seleccionados e os no includos. Repare-se que a linha 6 est
traada, indicando que este caso est excludo de futuras anlises:
Note-se que este procedimento de seleccionar casos no exclusivo nem obrigatrio do
procedimento da comparao de mdias de duas amostras emparelhadas. um
procedimento geral a efectuar previamente a qualquer anlise em que haja necessidade
de seleccionar ou excluir casos.
De seguida, passa-se ento comparao das mdias das duas amostras emparelhadas.
Tal como o nome indica, deve haver pares de observaes, de modo que ambas as
amostras tm o mesmo nmero de observaes.
Para tal, fazer Statistics Compare Means Paired Samples T Test...:
SPSS 5 - Testes T
ESACB 88
Na caixa de dilogo seguinte, seleccionar as duas variveis emparelhadas cujas mdias
se pretendem comparar:
O boto serve para definir o intervalo de confiana para a diferena entre as
duas mdias (por defeito, (1-o)=0.95).
Os resultados so os seguintes:
Paired Samples Statistics
75.44 39 9.08 1.45
137.31 39 12.56 2.01
RITMOA
RITMOD
Pair
1
Mean N
Std.
Deviation
Std. Error
Mean
SPSS 5 - Testes T
ESACB 89
Paired Samples Correlations
39 .544 .000 RITMOA & RITMOD Pair 1
N Correlation Sig.
Paired Samples Test
-61.87 10.78 1.73 -65.36 -58.38 -35.858 38 .000 RITMOA - RITMOD Pair 1
Mean
Std.
Deviation
Std. Error
Mean Lower Upper
95% Confidence
Interval of the
Difference
Paired Differences
t df
Sig.
(2-tailed)
No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma das
amostras. Repare-se que foram s levados em conta 39 observaes em cada amostra.
O quadro seguinte apresenta o valor do coeficiente de correlao de Pearson entre as
duas variveis (r=0.544).
No ltimo quadro apresentado o valor de 87 . 61
mod
=
rit ritmoa
x x , o intervalo de
confiana para a diferena entre mdias ([-65.36 , -58.38]) e o valor da estatstica de
teste t-Student t= -35.858, bem como os graus de liberdade do teste e o valor p-value ou
verdaddeiro nvel de significncia (0.000). Como |t
calc
| = 35.858 > t
(0.05,38)
=2.025 (ou p-
value=0.000 < o=5%) conclui-se que as mdias so significativamente diferentes.
SPSS 6 - Anova
ESACB 90
6 - ANLISE DE VARINCIA
6.1 - ENSAIOS UNI-FACTORIAIS
A anlise de varincia uma metodologia estatstica cujo objectivo decidir se existem
ou no diferenas significativas entre as mdias de vrias amostras de uma varivel
numrica, definidas por diferentes tratamentos ou nveis de influncia de um factor. Esta
metodologia uma extenso do teste t-Student para duas amostras independentes.
Isto :
mdias as entre ivas significat diferenas Existem : ...
1 3 2 1 : 0
H x x x x H
T
= = = = =
De um modo muito resumido, a metodologia anova calcula a variabilidade total
existente na caracterstica ou varivel em anlise, e particiona esta variabilidade como
sendo devida fundamentalmente a duas causas: uma causa determinista, que o facto de
as amostras serem sujeitas a tratamentos distintos (variabilidade entre tratamentos);
causas aleatrias ou erro experimental, que engloba todas as restantes fontes de
variabilidade, com excepo dos diferentes tratamentos (variabilidade residual ou erro
experimental). Estas variabilidades so estimativas de varincia (entre tratamentos, e
residual, respectivamente). Isto :
Variabilidade Total = Variabilidade entre Tratamentos + Erro Experimental
A estatstica de teste a estatstica F, que uma razo entre varincias, que sob o
pressuposto de que as observaes tm distribuio normal, segue uma distribuio F de
Snedecor:
) ; ; (
~
Re
den num
gl gl
F
sidual Varincia
s Tratamento entre Varincia
F
o
=
Se a estatstica F demasiado grande, ento porque a varincia entre tratamentos
preponderante em relao varincia residual, isto , os diferentes tratamentos a que a
amostra foi sujeita conduz a resultados estatisticamente diferentes.
Na sequncia de uma anlise de varincia em que se conclua que existem diferenas
significativas entre as mdias dos diversos tratamentos em anlise, faz-se um teste
suplementar a fim de identificar quais so as mdias estatisticamente diferentes. Os
mais usuais so os testes LSD (Least Significant Difference, Diferena Mnima
Significativa), HSD-Tuckey (Honnestly Significant Difference), Scheff, Duncan.
Vamos ilustrar a metodologia de anlise de varincia, usando os valores apresentados
no quadro seguinte, referentes s produes obtidas num ensaio em que se pretende
SPSS 6 - Anova
ESACB 91
estudar o efeito da densidade de sementeira, na cultura de arroz (variedade IR8).
Definiram-se 6 densidades de sementeira (kg/ha de semente). Para cada densidade de
fizeram-se 4 repeties. Todos os restantes factores de produo foram mantidos
constantes no ensaio (adaptado de GOMEZ & GOMEZ, 1984).
Densidade Repeties
25 5113 5398 5307 4678
50 5346 5952 4719 5264
75 5272 5713 5483 5049
100 5164 4831 4986 4410
125 4804 4848 4432 4748
150 4254 4542 4919 4098
A anova simples (ensaios uni-factoriais) pode ser executada no SPSS com dois
procedimentos:
6.1.1 - PROCEDIMENTO ONE-WAY ANOVA
Este o procedimento que conduz elaborao tpica da anlise de varincia, e no qual
possvel definir a obteno de mais resultados no mbito desta metodologia estatstica.
A partir do menu principal do SPSS, seleccionar:
Statistics
Compare Means...
One-Way ANOVA...
Seleccionar para o campo o nome da varivel que contm os valores da
varivel que contm os resultados a analisar (no exemplo, producao); no campo
selecciona-se a varivel que identifica os diferentes tratamentos (densidad).
Seleccionar a opo para definir qual ou quais os testes de comparao de
mdias a efectuar na sequncia da anova. Pode seleccionar-se apenas um ou mais testes.
SPSS 6 - Anova
ESACB 92
No exemplo, pediram-se os testes LSD e Tuckey. O nvel de significncia , por defeito,
o=5%, podendo este valor ser definido pelo utilizador:
Fazer , voltando janela One-Way ANOVA, onde se pode seleccionar o boto
a fim de definir clculos adicionais; no caso, pediram-se o clculo dos
parmetros estatsticos, a realizao do teste de Levene para verificar se as varincias
dos diferentes tratamentos so homogneas e representar graficamente as mdias dos
diferentes tratamentos:
Os resultados so os seguintes:
SPSS 6 - Anova
ESACB 93
Oneway
Descriptives
Produo (kg/ha)
4 5124.0000 320.2093 160.1047 4614.4755 5633.5245 4678.00 5398.00
4 5320.2500 504.7893 252.3947 4517.0176 6123.4824 4719.00 5952.00
4 5379.2500 284.4414 142.2207 4926.6402 5831.8598 5049.00 5713.00
4 4847.7500 321.9900 160.9950 4335.3920 5360.1080 4410.00 5164.00
4 4708.0000 188.4958 94.2479 4408.0611 5007.9389 4432.00 4848.00
4 4453.2500 360.8798 180.4399 3879.0097 5027.4903 4098.00 4919.00
24 4972.0833 455.9256 93.0654 4779.5628 5164.6038 4098.00 5952.00
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
Total
N Mean
Std.
Deviation Std. Error
Lower
Bound
Upper
Bound
95% Confidence Interval
for Mean
Minimum Maximum
Test of Homogeneity of Variances
Produo (kg/ha)
.418 5 18 .830
Levene
Statistic df1 df2 Sig.
ANOVA
Produo (kg/ha)
2657880.8 5 531576.167 4.507 .008
2123087.0 18 117949.278
4780967.8 23
Between Groups
Within Groups
Total
Sum of
Squares df
Mean
Square F Sig.
SPSS 6 - Anova
ESACB 94
Post Hoc Tests
Multiple Comparisons
Dependent Variable: Produo (kg/ha)
-196.2500 242.8469 .962 -968.0352 575.5352
-255.2500 242.8469 .894 -1027.0352 516.5352
276.2500 242.8469 .859 -495.5352 1048.0352
416.0000 242.8469 .541 -355.7852 1187.7852
670.7500 242.8469 .111 -101.0352 1442.5352
196.2500 242.8469 .962 -575.5352 968.0352
-59.0000 242.8469 1.000 -830.7852 712.7852
472.5000 242.8469 .408 -299.2852 1244.2852
612.2500 242.8469 .170 -159.5352 1384.0352
867.0000* 242.8469 .023 95.2148 1638.7852
255.2500 242.8469 .894 -516.5352 1027.0352
59.0000 242.8469 1.000 -712.7852 830.7852
531.5000 242.8469 .290 -240.2852 1303.2852
671.2500 242.8469 .110 -100.5352 1443.0352
926.0000* 242.8469 .014 154.2148 1697.7852
-276.2500 242.8469 .859 -1048.0352 495.5352
-472.5000 242.8469 .408 -1244.2852 299.2852
-531.5000 242.8469 .290 -1303.2852 240.2852
139.7500 242.8469 .991 -632.0352 911.5352
394.5000 242.8469 .594 -377.2852 1166.2852
-416.0000 242.8469 .541 -1187.7852 355.7852
-612.2500 242.8469 .170 -1384.0352 159.5352
-671.2500 242.8469 .110 -1443.0352 100.5352
-139.7500 242.8469 .991 -911.5352 632.0352
254.7500 242.8469 .895 -517.0352 1026.5352
-670.7500 242.8469 .111 -1442.5352 101.0352
-867.0000* 242.8469 .023 -1638.7852 -95.2148
-926.0000* 242.8469 .014 -1697.7852 -154.2148
-394.5000 242.8469 .594 -1166.2852 377.2852
-254.7500 242.8469 .895 -1026.5352 517.0352
-196.2500 242.8469 .430 -706.4525 313.9525
-255.2500 242.8469 .307 -765.4525 254.9525
276.2500 242.8469 .270 -233.9525 786.4525
416.0000 242.8469 .104 -94.2025 926.2025
670.7500* 242.8469 .013 160.5475 1180.9525
196.2500 242.8469 .430 -313.9525 706.4525
-59.0000 242.8469 .811 -569.2025 451.2025
472.5000 242.8469 .067 -37.7025 982.7025
612.2500* 242.8469 .021 102.0475 1122.4525
867.0000* 242.8469 .002 356.7975 1377.2025
255.2500 242.8469 .307 -254.9525 765.4525
59.0000 242.8469 .811 -451.2025 569.2025
531.5000* 242.8469 .042 21.2975 1041.7025
671.2500* 242.8469 .013 161.0475 1181.4525
926.0000* 242.8469 .001 415.7975 1436.2025
-276.2500 242.8469 .270 -786.4525 233.9525
-472.5000 242.8469 .067 -982.7025 37.7025
-531.5000* 242.8469 .042 -1041.7025 -21.2975
139.7500 242.8469 .572 -370.4525 649.9525
394.5000 242.8469 .122 -115.7025 904.7025
-416.0000 242.8469 .104 -926.2025 94.2025
-612.2500* 242.8469 .021 -1122.4525 -102.0475
-671.2500* 242.8469 .013 -1181.4525 -161.0475
-139.7500 242.8469 .572 -649.9525 370.4525
254.7500 242.8469 .308 -255.4525 764.9525
-670.7500* 242.8469 .013 -1180.9525 -160.5475
-867.0000* 242.8469 .002 -1377.2025 -356.7975
-926.0000* 242.8469 .001 -1436.2025 -415.7975
-394.5000 242.8469 .122 -904.7025 115.7025
-254.7500 242.8469 .308 -764.9525 255.4525
(J) Densidade de
sementeira
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
(I) Densidade de
sementeira
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
Tukey HSD
LSD
Mean
Difference
(I-J) Std. Error Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
The mean difference is significant at the .05 level.
*.
SPSS 6 - Anova
ESACB 95
Homogeneous Subsets
Produo (kg/ha)
4 4453.2500
4 4708.0000 4708.0000
4 4847.7500 4847.7500
4 5124.0000 5124.0000
4 5320.2500
4 5379.2500
.111 .110
Densidade de
sementeira
150 kg/ha
125 kg/ha
100 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
Sig.
Tukey HSD
a
N 1 2
Subset for alpha = .05
Means for groups in homogeneous subsets are displayed.
Uses Harmonic Mean Sample Size = 4.000.
a.
Means Plots
Densidade de sementeira
150 kg/ha 125 kg/ha 100 kg/ha 75 kg/ha 50 kg/ha 25 kg/ha
M
e
a
n
o
f
P
r
o
d
u
o
(
k
g
/
h
a
)
5600
5400
5200
5000
4800
4600
4400
O primeiro quadro de resultados contm a mdias, desvio padro e erro padro da mdia
e intervalo de confiana da mdia, mnimo e mximo para cada tratamento.
De seguida apresentado o teste de homogeneidade de varincias de Levene:
homogneas so no varincias As : :
1
2
4
2
3
2
2
2
1 0
H s s s s H = = =
Como F=0.418 < F
(0.05;5;18)
=2.77, ou p-value=0.83 > o=0.05, conclui-se que as
varincias so homogneas, isto , dentro de cada um dos tratamentos a variabilidade
apenas devida a causas aleatrias.
O quadro que se segue a tabela da anlise de varincia, apresentando a variabilidade
particionada entre os tratamentos (betwen groups) e residual (within groups). Como
F=4.507 > F
(0.05;5;18)
=2.77, ou p-value=0.008 < o=0.05, conclui-se que existem
diferenas significativas entre as produes mdias das 6 densidades de sementeira, com
um nvel de significncia de 5%.
Contudo, este resultado no nos permite concluir qual ou quais densidades conduzem a
produes mdias significativamente diferentes de outras. Para concluir tal, h que
proceder comparao da mdia de cada um dos tratamentos com todas as restantes.
esta comparao feita em termos do valor absoluto das diferenas entre mdias: se esta
SPSS 6 - Anova
ESACB 96
diferena entre duas mdias pequena, ento as mdias no diferem; se a diferena
grande, ento as duas mdias so estatisticamente distintas. Este o princpio de
qualquer teste de comparaes mltiplas.
Contudo, h que fixar um critrio que defina a fronteira entre o que uma diferena
grande e uma diferena pequena. Este critrio estabelecido por cada um dos testes
(LSD, Scheff, Tukey, etc), com base em expresses que relacionam a mdia das somas
dos quadrados residual (calculada na tabela anova) e com base em funes de
distribuio de probabilidades.
No quadro dos resultados dos testes de comparaes mltiplas so identificados com o
smbolo * quais os tratamentos cujas mdias diferem significativamente. Repare-se que
ambos os testes acusam como conduzindo a produes mdias diferentes densidades de
50 kg/ha e 150 kg/ha (diferena de 867 kg) e 75 kg/ha e 150 kg/ha (diferena de 926
kg). Contudo apenas o teste LSD acusa existirem diferenas entre as produes
alcanadas com 25 e 150 kg/ha (diferena de 670.75 kg), 50 e 125 kg/ha (diferena de
612.25 kg), 75 e 100 kg/ha (diferena de 531.5 kg).
Isto , o teste LSD acusa como diferentes tratamentos cujas mdias esto menos
afastadas do que o teste Tuckey, que d, por assim dizer, maior margem de dvida antes
de imputar essas diferenas aos efeitos dos tratamentos.
De seguida aparece um quadro complementar do teste Tukey em que agrupa os
tratamentos em grupos homogneos, sendo o critrio de agrupamento o facto de no
existirem diferenas significativas entre os mdias dos tratamentos includos no mesmo
grupo. O mesmo tratamento pode pertencer a mais do que um grupo, desde que no
difira dos restantes tratamentos desse grupo. Assim, as densidades de sementeira de
150, 125, 100, 25 constituem um grupo de tratamentos, cujas produes mdias so as
mais baixas; as densidades de 125, 100, 25, 50, 75 constituem outro grupo, cujas
produes so as mais altas. claro que alguns dos tratamentos densidades de 125, 100,
25) pertencem aos dois grupos
6
.
Em termos absolutos, a densidade de sementeira que conduz a maior produo a
densidade de 75 kg/ha; contudo, a produo obtida com a densidade de 50 kg/ha no
difere significativamente da anterior, e pode haver vantagens econmicas em usar esta
densidade. Contudo, estas so algumas reflexes de ndole tcnica que competem ao
analista desenvolver, no cabendo propriamente no mbito deste manual.
No final aparece um grfico representado as mdias dos tratamentos, que pode ser til
explorar no sentido de compreender os resultados, e deles tirar o proveito no mbito da
aplicabilidade da Estatstica ao delineamento de ensaios agrcolas.
6.1.2 - PROCEDIMENTO MEANS
A partir do menu principal do SPSS, seleccionar:
6
Deixa-se ao cuidado do leitor a explicao agronmica destas concluses.
SPSS 6 - Anova
ESACB 97
Statistics
Compare Means...
Means...
Seleccionar para o campo o nome da varivel que contm os valores da
varivel a analisar (no exemplo, producao); no campo selecciona-se a
varivel que identifica os diferentes tratamentos (densidad).
Seleccionar o boto a fim de pedir a elaborao da tabela da anlise de
varincia. Por defeito, so calculados os parmetros mdia e desvio padro; o utilizador
pode seleccionar outras estatsticas a calcular:
Os resultados so os seguintes:
SPSS 6 - Anova
ESACB 98
Means
Case Processing Summary
24 100.0% 0 .0% 24 100.0%
Produo (kg/ha) *
Densidade de
sementeira
N Percent N Percent N Percent
Included Excluded Total
Cases
Report
Produo (kg/ha)
5124.0000 4 320.2093
5320.2500 4 504.7893
5379.2500 4 284.4414
4847.7500 4 321.9900
4708.0000 4 188.4958
4453.2500 4 360.8798
4972.0833 24 455.9256
Densidade de
sementeira
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
Total
Mean N
Std.
Deviation
ANOVA Table
2657880.8 5 531576.167 4.507 .008
2123087.0 18 117949.278
4780967.8 23
(Combined) Between
G
Within Groups
Total
Produo (kg/ha) *
Densidade de
sementeira
Sum of
Squares df
Mean
Square F Sig.
Measures of Association
.746 .556
Produo (kg/ha) *
Densidade de
sementeira
Eta
Eta
Squared
A tabela da anova idntica obtida no procedimento anterior. Contudo, este
procedimento no permite a obteno dos testes subsequentes que foram obtidos
previamente.
A estatstica Eta-Squared a proporo de varincia da varivel dependente que
explicada pelas diferenas entre os tratamentos; dado pela expresso
T
H
SS
SS
(isto ,
razo entre Soma dos Quadrados entre tratamentos (SS
H
) e a Soma dos Quadrados total
(SS
T
). A designao de Eta adoptada pelo SPSS no contexto da anova destina-se a no
fazer confuso com o coeficiente de determinao, R
2
, usado no contexto da regresso
linear, e que pode ser obtido a partir da tabela da anova da regresso pela expresso
anterior.
SPSS 6 - Anova
ESACB 99
6.2 - ENSAIOS MULTI-FACTORIAIS
Os organismos biolgicos esto simultaneamente expostos a muitos factores de
crescimento. A resposta de um organismo a um nico factor de crescimento pode variar
com o nvel de outros factores; assim, os delineamentos uni-factoriais so criticados
pelo seu pequeno leque de aplicabilidade. Na realidade, os resultados dos delineamentos
uni-factoriais so apenas vlidos para o caso particular (e extremamente difceis de
conseguir) de todos os restantes factores serem mantidos constantes.
Neste sentido, quando se espera que a resposta a um factor de interesse varie sob
diferentes nveis de outros factores, devem evitar-se os delineamentos uni-factoriais, e
considerar um delineamento multi-factorial que permita estudar em simultneo dois ou
mais factores.
Em ensaios factoriais, h a considerar os efeitos de cada um dos nveis de um dos
factores, mantendo os nveis dos outros factores constantes (efeitos simples), os efeitos
de cada um dos factores, abstraindo da presena dos outros factores (efeitos principais)
e interaco entre os nveis dos diversos factores (interaco entre factores).
Diz-se que existe interaco entre dois factores se a resposta a um dos factores varia
consoante os nveis do outro factor.
A fim de ilustrar o procedimento de clculo da anlise de varincia multi-factorial,
vamos usar o ficheiro arroz.sav, em que se pretende verificar a influncia de trs
variedades (IR8, IR5, CA-63) e 5 nveis de adubao azotada (0, 60, 90, 120, 150 kg/ha)
na produo de arroz.
Statistics
General Linear Model
GLM - General Factorial ...
Na caixa de dilogo seguinte, seleccionar a varivel dependente a analisar (producao) e
os factores de produo cuja influncia se pretende analisar (variedad e adubacao):
SPSS 6 - Anova
ESACB 100
De seguida, seleccionar a opo a fim de definir o modelo de anova a
calcular. Por defeito, est seleccionada a opo , que especifica que a tabela
da anova apresentar a os efeitos principais de cada factor, bem como as interaces
entre factores. a situao mais usual. Optando por o utilizador pode definir
que a anova apresente apenas os efeitos principais, ou apenas algumas das interaces a
definir.
Por defeito, est definido o mtodo de clculo da soma de quadrados (tipo III); para
delineamentos em que no haja missing-values deve definir-se esta metodologia de
clculo.
SPSS 6 - Anova
ESACB 101
A opo deve ser seleccionada (por defeito, est activada). Caso
se assuma que os dados passam pela origem dos eixos (isto , caso a ausncia dos
factores em anlise conduzam a valor zero da varivel dependente), pode omitir-se esta
opo. Da sua incluso no modelo resulta a apresentao de mais uma linha inusitada na
tabela da anova, que traduz a variabilidade associada varivel dependente para os
nveis zero dos factores. As restantes linhas da tabela so as usuais.
Fazer para regressar janela GLM - General factorial, onde se deve
seleccionar para representar graficamente as mdias de cada um dos
factores e das interaces de factores:
Para seleccionar o grfico das mdias de um factor, definir esse factor em
; fazer para adicionar esse grfico; para definir o grfico das
interaces, seleccionar um factor para Horizontal Axis e outro factor para Separate
Lines. Fazer para continuar.
Optar por para definir os testes de comparaes mltiplas:
SPSS 6 - Anova
ESACB 102
Fazer para continuar. Seleccionar para seleccionar o clculo de
parmetros estatsticos, teste de Levene de homogeneidade de varincias e os intervalos
de confiana para as mdias:
Os resultados deste procedimento so os seguintes:
Univariate Analysis of Variance
SPSS 6 - Anova
ESACB 103
Between-Subjects Factors
IR8 20
IR5 20
C4-63 20
0 kg/ha 12
60 kg/ha 12
90 kg/ha 12
120 kg/ha 12
150 kg/ha 12
1
2
3
Variedade
0
1
2
3
4
Adubao
Value
Label N
Descriptive Statistics
Dependent Variable: Produo
3124.0000 532.7939 4
4723.5000 171.9874 4
4459.5000 400.2345 4
5717.0000 334.1237 4
5823.0000 208.3235 4
4769.4000 1054.8145 20
3548.0000 540.9054 4
4806.0000 443.6124 4
5436.0000 757.8408 4
5739.5000 494.9542 4
5680.5000 217.5462 4
5042.0000 957.4259 20
3778.0000 314.1507 4
4753.5000 414.2411 4
5320.0000 501.1640 4
5552.5000 573.7000 4
5886.5000 385.9374 4
5058.1000 855.9827 20
3483.3333 513.9808 12
4761.0000 331.3680 12
5071.8333 689.7728 12
5669.6667 441.1381 12
5796.6667 271.0335 12
4956.5000 952.5245 60
Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
Variedade
IR8
IR5
C4-63
Total
Mean
Std.
Deviation N
Levene's Test of Equality of Error Variances
a
Dependent Variable: Produo
1.044 14 45 .430
F df1 df2 Sig.
Tests the null hypothesis that the error variance of the
dependent variable is equal across groups.
Design: Intercept+VARIEDAD+AZOTO+VARIEDAD *
AZOTO
a.
SPSS 6 - Anova
ESACB 104
Tests of Between-Subjects Effects
Dependent Variable: Produo
44578256
a
14 3184161.1 16.005 .000
1.47E+09 1 1.47E+09 7409.078 .000
1052784.4 2 526392.200 2.646 .082
41234745 4 10308686 51.816 .000
2290726.3 8 286340.783 1.439 .207
8952613.0 45 198946.956
1.53E+09 60
53530869 59
Source
Corrected Model
Intercept
VARIEDAD
AZOTO
VARIEDAD * AZOTO
Error
Total
Corrected Total
Type III
Sum of
Squares df
Mean
Square F Sig.
R Squared = .833 (Adjusted R Squared = .781)
a.
Estimated Marginal Means
1. Variedade
Estimates
Dependent Variable: Produo
4769.400 99.736 4568.521 4970.279
5042.000 99.736 4841.121 5242.879
5058.100 99.736 4857.221 5258.979
Variedade
IR8
IR5
C4-63
Mean Std. Error
Lower
Bound
Upper
Bound
95% Confidence Interval
Pairwise Comparisons
Dependent Variable: Produo
-272.600 141.049 .060 -556.686 11.486
-288.700* 141.049 .047 -572.786 -4.614
272.600 141.049 .060 -11.486 556.686
-16.100 141.049 .910 -300.186 267.986
288.700* 141.049 .047 4.614 572.786
16.100 141.049 .910 -267.986 300.186
(J) Variedade
IR5
C4-63
IR8
C4-63
IR8
IR5
(I) Variedade
IR8
IR5
C4-63
Mean
Difference
(I-J) Std. Error Sig.
a
Lower
Bound
Upper
Bound
95% Confidence Interval
for Difference
a
Based on estimated marginal means
The mean difference is significant at the .05 level.
*.
Adjustment for multiple comparisons: Least Significant Difference (equivalent to no
adjustments).
a.
SPSS 6 - Anova
ESACB 105
Univariate Tests
Dependent Variable: Produo
1052784.4 2 526392.200 2.646 .082
8952613.0 45 198946.956
Contrast
Error
Sum of
Squares df
Mean
Square F Sig.
The F tests the effect of Variedade. This test is based on the linearly
independent pairwise comparisons among the estimated marginal means.
2. Adubao
Estimates
Dependent Variable: Produo
3483.333 128.759 3223.999 3742.668
4761.000 128.759 4501.666 5020.334
5071.833 128.759 4812.499 5331.168
5669.667 128.759 5410.332 5929.001
5796.667 128.759 5537.332 6056.001
Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Mean Std. Error
Lower
Bound
Upper
Bound
95% Confidence Interval
SPSS 6 - Anova
ESACB 106
Pairwise Comparisons
Dependent Variable: Produo
-1277.667* 182.093 .000 -1644.421 -910.913
-1588.500* 182.093 .000 -1955.254 -1221.746
-2186.333* 182.093 .000 -2553.087 -1819.579
-2313.333* 182.093 .000 -2680.087 -1946.579
1277.667* 182.093 .000 910.913 1644.421
-310.833 182.093 .095 -677.587 55.921
-908.667* 182.093 .000 -1275.421 -541.913
-1035.667* 182.093 .000 -1402.421 -668.913
1588.500* 182.093 .000 1221.746 1955.254
310.833 182.093 .095 -55.921 677.587
-597.833* 182.093 .002 -964.587 -231.079
-724.833* 182.093 .000 -1091.587 -358.079
2186.333* 182.093 .000 1819.579 2553.087
908.667* 182.093 .000 541.913 1275.421
597.833* 182.093 .002 231.079 964.587
-127.000 182.093 .489 -493.754 239.754
2313.333* 182.093 .000 1946.579 2680.087
1035.667* 182.093 .000 668.913 1402.421
724.833* 182.093 .000 358.079 1091.587
127.000 182.093 .489 -239.754 493.754
(J) Adubao
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
(I) Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Mean
Difference
(I-J) Std. Error Sig.
a
Lower
Bound
Upper
Bound
95% Confidence Interval
for Difference
a
Based on estimated marginal means
The mean difference is significant at the .05 level.
*.
Adjustment for multiple comparisons: Least Significant Difference (equivalent to no
adjustments).
a.
Univariate Tests
Dependent Variable: Produo
41234745 4 10308686 51.816 .000
8952613.0 45 198946.956
Contrast
Error
Sum of
Squares df
Mean
Square F Sig.
The F tests the effect of Adubao. This test is based on the linearly
independent pairwise comparisons among the estimated marginal means.
SPSS 6 - Anova
ESACB 107
3. Variedade * Adubao
Dependent Variable: Produo
3124.000 223.017 2674.820 3573.180
4723.500 223.017 4274.320 5172.680
4459.500 223.017 4010.320 4908.680
5717.000 223.017 5267.820 6166.180
5823.000 223.017 5373.820 6272.180
3548.000 223.017 3098.820 3997.180
4806.000 223.017 4356.820 5255.180
5436.000 223.017 4986.820 5885.180
5739.500 223.017 5290.320 6188.680
5680.500 223.017 5231.320 6129.680
3778.000 223.017 3328.820 4227.180
4753.500 223.017 4304.320 5202.680
5320.000 223.017 4870.820 5769.180
5552.500 223.017 5103.320 6001.680
5886.500 223.017 5437.320 6335.680
Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Variedade
IR8
IR5
C4-63
Mean Std. Error
Lower
Bound
Upper
Bound
95% Confidence Interval
Post Hoc Tests
Variedade
Multiple Comparisons
Dependent Variable: Produo
Tukey HSD
-272.6000 141.0486 .141 -614.4488 69.2488
-288.7000 141.0486 .113 -630.5488 53.1488
272.6000 141.0486 .141 -69.2488 614.4488
-16.1000 141.0486 .993 -357.9488 325.7488
288.7000 141.0486 .113 -53.1488 630.5488
16.1000 141.0486 .993 -325.7488 357.9488
(J) Variedade
IR5
C4-63
IR8
C4-63
IR8
IR5
(I) Variedade
IR8
IR5
C4-63
Mean
Difference
(I-J) Std. Error Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
Based on observed means.
SPSS 6 - Anova
ESACB 108
Homogeneous Subsets
Produo
Tukey HSD
a,b
20 4769.4000
20 5042.0000
20 5058.1000
.113
Variedade
IR8
IR5
C4-63
Sig.
N 1
Subset
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 198946.956.
Uses Harmonic Mean Sample Size = 20.000.
a.
Alpha = .05.
b.
Adubao
Multiple Comparisons
Dependent Variable: Produo
Tukey HSD
-1277.6667* 182.0929 .000 -1795.0797 -760.2536
-1588.5000* 182.0929 .000 -2105.9131 -1071.0869
-2186.3333* 182.0929 .000 -2703.7464 -1668.9203
-2313.3333* 182.0929 .000 -2830.7464 -1795.9203
1277.6667* 182.0929 .000 760.2536 1795.0797
-310.8333 182.0929 .440 -828.2464 206.5797
-908.6667* 182.0929 .000 -1426.0797 -391.2536
-1035.6667* 182.0929 .000 -1553.0797 -518.2536
1588.5000* 182.0929 .000 1071.0869 2105.9131
310.8333 182.0929 .440 -206.5797 828.2464
-597.8333* 182.0929 .016 -1115.2464 -80.4203
-724.8333* 182.0929 .002 -1242.2464 -207.4203
2186.3333* 182.0929 .000 1668.9203 2703.7464
908.6667* 182.0929 .000 391.2536 1426.0797
597.8333* 182.0929 .016 80.4203 1115.2464
-127.0000 182.0929 .956 -644.4131 390.4131
2313.3333* 182.0929 .000 1795.9203 2830.7464
1035.6667* 182.0929 .000 518.2536 1553.0797
724.8333* 182.0929 .002 207.4203 1242.2464
127.0000 182.0929 .956 -390.4131 644.4131
(J) Adubao
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
(I) Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Mean
Difference
(I-J) Std. Error Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
Based on observed means.
The mean difference is significant at the .05 level.
*.
SPSS 6 - Anova
ESACB 109
Homogeneous Subsets
Produo
Tukey HSD
a,b
12 3483.3333
12 4761.0000
12 5071.8333
12 5669.6667
12 5796.6667
1.000 .440 .956
Adubao
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Sig.
N 1 2 3
Subset
Means for groups in homogeneous subsets are displayed.
Based on Type III Sum of Squares
The error term is Mean Square(Error) = 198946.956.
Uses Harmonic Mean Sample Size = 12.000.
a.
Alpha = .05.
b.
Profile Plots
Estimated Marginal Means of Produo
Variedade
C4-63 IR5 IR8
E
s
t
i
m
a
t
e
d
M
a
r
g
i
n
a
l
M
e
a
n
s
5100
5000
4900
4800
4700
SPSS 6 - Anova
ESACB 110
Estimated Marginal Means of Produo
Adubao
150 kg/ha 120 kg/ha 90 kg/ha 60 kg/ha 0 kg/ha
E
s
t
i
m
a
t
e
d
M
a
r
g
i
n
a
l
M
e
a
n
s
6000
5000
4000
3000
Estimated Marginal Means of Produo
Adubao
150 kg/ha 120 kg/ha 90 kg/ha 60 kg/ha 0 kg/ha
E
s
t
i
m
a
t
e
d
M
a
r
g
i
n
a
l
M
e
a
n
s
7000
6000
5000
4000
3000
2000
Variedade
IR8
IR5
C4-63
SPSS 7 - Regresso Linear
ESACB 111
7 - REGRESSO LINEAR
7.1 - INTRODUO
Muitos estudos estatsticos tm como objectivo estabelecer uma relao, traduzida por
uma equao, que permite estimar o valor de uma varivel, em funo de outra ou
outras variveis.
O caso mais simples traduzir esta relao pela equao de uma recta, quando o
acrscimo de uma varivel, designada por dependente e usualmente representada por y,
varia linearmente com os acrscimos provocados noutra varivel, designada por
independente, representada por x.
A equao que traduz esta relao bx a y + = ou x b b y
1 0
+ = , em que os parmetros
ou coeficientes so a ordenada na origem, a (ou b
o
), e o declive, b (ou b
1
).
Como regra, previamente ao clculo da regresso linear, deve fazer-se uma anlise
grfica aos dados (grfico de disperso ou scatterplot), a fim de ter uma percepo
visual da existncia ou no de uma tendncia de dependncia entre as variveis, e como
mtodo de detectar possveis observaes outliers ou influentes, que distoram os
resultados.
A representao grfica dos dados, num grfico de pontos (scatterplot) ajuda a
identificar algumas situaes em que a equao de regresso linear simples no tem um
ajustamento perfeito. De seguida, ilustram-se algumas destas situaes.
Na situao 1, a observao assinalada um outlier bi-variado, muito embora no o seja
em relao a cada uma das variveis, j que no observao extrema. Contudo, o par
(x,y) est deslocado do contexto geral das restantes observaes. Em relao s
restantes observaes, o grfico evidencia uma tendncia segundo uma recta crescente.
O utilizador dever verificar os dados e corrigir eventuais registos errneos, ou
simplesmente desprezar esta observao e efectuar a regresso com os dados restantes.
Note-se que a incluso desta observao ir provocar uma acentuada variao no
declive da recta.
SPSS 7 - Regresso Linear
ESACB 112
Situao 1
0
50
10
Na situao 2 existe uma observao igualmente muito influente em termos do declive
da recta ajustada. Neste caso, a observao assinalada tem tendncia a ser outlier, quer
bi-variado, quer em relao a cada uma das variveis. Alm disso, eliminando esta
observao, resta uma nuvem de pontos, em que no ntida qualquer tendncia de
relao entre as variveis.
Situao 2
0
60
10
Na situao 3, a varincia da varivel y no uniforme, ao longo dos valores em x, isto
, tomando fatias verticais ao longo do eixo dos xx, a disperso dos valores y vai
aumentando para valores mais elevados de y. Muito embora a normalidade dos dados
no seja um pressuposto obrigatrio para a estimativa da regresso linear, contudo
necessrio que os resduos (y
obs
y
est
) tenham distribuio normal e varincia constante.
Nesta situao, estes pressupostos so violados, invalidando as inferncias que se faam
a partir da equao estimada.
SPSS 7 - Regresso Linear
ESACB 113
Situao 3
0
50
10
A situao 4 ilustra uma forte relao entre x e y, mas no de tipo linear, pelo que o
ajustamento de uma recta para traduzir esta funo de dependncia errada e sem
significado.
Situao 4
0
12
0 16
Na situao 5 recolheram-se observaes apenas nas zonas extremas do intervalo de
variao de x, no existindo dados para valores intermdios da varivel x. A funo de
regresso linear nesta situao fortemente influenciada pelos valores extremos, mas
no traduz a relao que existe para todo o intervalo de x. Na recolha de dados, deve
haver a preocupao de que a amostragem cubra todo o intervalo de variao de x, de
modo a evidenciar o comportamento da relao no interior desse intervalo.
Situao 5
0
20
0 10
SPSS 7 - Regresso Linear
ESACB 114
O objectivo da regresso linear estabelecer a funo bx a y + = desta recta, que de um
modo muito aproximado permite estimar o valor de y para dado valor de x. O clculo
dos coeficientes de regresso faz-se pelo mtodo dos mnimos quadrados, que minimiza
a soma dos quadrados dos resduos, isto , minimiza a funo ( )
2
y y
obs
, em que
y representa o valor estimado pela equao para dado valor x.
No grfico seguinte representam-se os valores de 24 pares de valores do tipo (x,y), em
que no eixo dos xx est representada a varivel % de slidos insolveis em gua e nos
yy se representa a % total de slidos, duas caractersticas importantes em molho de
tomate (adaptado de DERECK PIKE, 19??; os dados so apresentados em anexo):
% insolveis em gua
18 17 16 15 14 13 12 11 10
%
s
l
i
d
o
s
n
o
m
o
l
h
o
60
50
40
30
20
evidente a tendncia do decrscimo da % de slidos no molho com o aumento da %
de insolveis em gua, segundo uma relao aproximadamente linear. Pretende-se
estabelecer esta relao entre as duas variveis, com os objectivos de (i) descrever a
relao entre as caractersticas para este tipo de molho, e (ii) poder estimar ou prever a
% de slidos do molho (caracterstica bastante difcil de quantificar) mediante a % de
insolveis em gua que o molho contm (caracterstica relativamente fcil de
determinar).
A equao de regresso linear uma estatstica, e como tal, tem inerente a componente
de erro estatstico. A fim de interpretar a equao estimada, so apresentados uma srie
de coeficientes e estatsticas suplementares, que de um modo geral permitem analisar o
maior ou menor grau de rigor com que a equao de regresso traduz a relao entre as
variveis em estudo.
Um dos coeficientes associados equao o coeficiente de correlao linear,
representado por r, que representa, na escala ]-1, 1[, a correlao ou associao entre as
SPSS 7 - Regresso Linear
ESACB 115
duas variveis; o quadrado deste coeficiente constitui o coeficiente de correlao total,
ou coeficiente de determinao, representado por R
2
, que traduz, a % de variabilidade
da varivel dependente (y) que explicada pela varivel independente (x).
apresentado o coeficiente de determinao ajustado, que um estimador no
enviezado de R
2
(que tende a ser um estimador sobre-avaliado) definido a partir de R
2
pela expresso:
1
) 1 (
2
2 2
=
p N
R p
R R
a
em que p o nmero de variveis independentes; no caso da equao de regresso
linear simples bx a y + = , p=1.
So apresentados os intervalos de confiana para os coeficientes a e b, bem como os
erros-padro e as estatsticas dos seguintes testes de hipteses:
teste referente ao coeficiente a: 0 : 0 :
1 0
= = a H a H
teste referente ao coeficiente b: 0 : 0 :
1 0
= = b H b H
O output do procedimento do clculo da equao de regresso apresenta a tabela da
anova, que constitui um teste de hipteses existncia ou no de uma relao de
dependncia:
0 : 0 :
: :
1 0
1 0
= =
b H b H
x de depende y H x de depende no y H
A estatstica F tem um valor alto quando a varivel independente ajuda a explicar a
variabilidade da varivel dependente.
Alm disso, a tabela da anlise de varincia fornece a mdia da soma dos quadrados
dos resduos, cuja raz quadrada o erro padro da estimativa. A equao de regresso
to mais ajustada aos dados, quanto menor for o erro padro da estimativa,
comparativamente com o desvio padro da varivel dependente.
7.2 - REGRESSO LINEAR SIMPLES
Para proceder ao clculo da equao de regresso linear, executar o seguinte
procedimento
7
:
Statistics
Regression
7
No exemplo usam-se os dados das caractersticas do molho de tomate, em que as variveis so
insoluve (% de insolveis em gua) e solidos (% total de slidos no molho).
SPSS 7 - Regresso Linear
ESACB 116
No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,
onde se define a varivel dependente (solidos) e a varivel independente (insoluve) para
os respectivos campos:
Seleccionar o boto , que abre a seguinte caixa de dilogo, onde se
seleccionam as opes Confidence intervals e Descriptives; as opes Estimates e
Model fit esto activadas por defeito:
SPSS 7 - Regresso Linear
ESACB 117
Fazer a fim de regressar janela Linear Regression, onde se selecciona
:
Nesta caixa de dilogo, deve seleccionar e para obter
o histograma e o grfico do ajustamento normal dos resduos, a fim de verificar se os
resduos seguem distribuio normal (pressuposto para a validade da regresso linear)
para verificar a linearidade e a igualdade de varincia dos resduos, efectuar o grfico
dos resduos, com os valores estimados standardizados (ZPRED) no eixo dos xx, e os
resduos standardizados (ZRESID) no eixo dos yy. No final, fazer a fim de
regressar janela Linear Regression.
O boto d acesso seguinte caixa de dilogo, onde se podem definir critrios
de selecco ou remoo de variveis independentes (s tm efeito em regresso
mltipla):
SPSS 7 - Regresso Linear
ESACB 118
Os resultados do procedimento so os seguintes:
Regression
Descriptive Statistics
39.7292 5.1826 24
13.7775 1.8995 24
% slidos no molho
% insolveis em gua
Mean
Std.
Deviation N
Correlations
1.000 -.970
-.970 1.000
. .000
.000 .
24 24
24 24
% slidos no molho
% insolveis em gua
% slidos no molho
% insolveis em gua
% slidos no molho
% insolveis em gua
Pearson Correlation
Sig. (1-tailed)
N
% slidos
no molho
%
insolveis
em gua
Variables Entered/Removed
b
% insolveis em gua
a
. Enter
Model
1
Variables Entered
Variables
Removed Method
All requested variables entered.
a.
Dependent Variable: % slidos no molho
b.
SPSS 7 - Regresso Linear
ESACB 119
Model Summary
b
.970
a
.941 .938 1.2880
Model
1
R R Square
Adjusted R
Square
Std. Error
of the
Estimate
Predictors: (Constant), % insolveis em gua
a.
Dependent Variable: % slidos no molho
b.
ANOVA
b
581.272 1 581.272 350.378 .000
a
36.498 22 1.659
617.770 23
Regression
Residual
Total
Model
1
Sum of
Squares df
Mean
Square F Sig.
Predictors: (Constant), % insolveis em gua
a.
Dependent Variable: % slidos no molho
b.
Coefficients
a
76.193 1.966 38.761 .000 72.117 80.270
-2.647 .141 -.970 -18.718 .000 -2.940 -2.353
(Constant)
% insolveis em gua
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardi
zed
Coefficien
ts
t Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
for B
Dependent Variable: % slidos no molho
a.
Residuals Statistics
a
27.9714 47.8478 39.7292 5.0272 24
-1.5871 3.1522 -3.70E-15 1.2597 24
-2.339 1.615 .000 1.000 24
-1.232 2.447 .000 .978 24
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum Mean
Std.
Deviation N
Dependent Variable: % slidos no molho
a.
SPSS 7 - Regresso Linear
ESACB 120
Charts
Regression Standardized Residual
2.50 2.00 1.50 1.00 .50 0.00 -.50 -1.00
Histogram
Dependent Variable: % slidos no molho
F
r
e
q
u
e
n
c
y
7
6
5
4
3
2
1
0
Std. Dev = .98
Mean = 0.00
N = 24.00
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: % slidos no molho
Observed Cum Prob
1.00 .75 .50 .25 0.00
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
1.00
.75
.50
.25
0.00
SPSS 7 - Regresso Linear
ESACB 121
Scatterplot
Dependent Variable: % slidos no molho
Regression Standardized Predicted Value
2 1 0 -1 -2 -3
R
e
g
r
e
s
s
i
o
n
S
t
a
n
d
a
r
d
i
z
e
d
R
e
s
i
d
u
a
l
3
2
1
0
-1
-2
A equao da recta estimada x y 647 . 2 193 . 76 = , em que x a % de insolveis em
gua e y a % de slidos no molho.
A anlise e interpretao pormenorizadas dos resultados deixam-se a cargo do leitor.
Chama-se apenas a ateno para o facto de os resduos estarem ligeiramente
desajustados da distribuio normal, como est evidenciado no histograma (nota-se um
acentuado enviezamento esquerda, bem como a falta de resduos numa das classes
centrais) e no grfico de ajustamento normal (um perfeito ajustamento traduzido
pela diagonal do grfico; neste caso, os resduos situam-se sistematicamente acima ou
abaixo desta linha, em diferentes zonas do grfico). No grfico dos resduos
standardizados versus valores previstos standardizados nota-se uma tendncia para que
os resduos se distribuam segundo uma curva ligeiramente cncava.
Estas anlise dos resduos sugerem que o modelo linear ajustado (equao de uma recta)
no o melhor modelo para traduzir a relao entre estas variveis; a distribuio dos
resduos indica que o ajustamento de um modelo linear polinomial de 2 ordem, com
uma equao do tipo
2
cx bx a y + + = aumentar a preciso da estimativa (que
traduzida pelo coeficiente de determinao R
2
=0.941).
O ajustamento a uma equao de segundo grau ser abordado no pargrafo seguinte.
7.3 - REGRESSO LINEAR MLTIPLA
Neste pargrafo ser abordada a metodologia de clculo da equao de regresso linear
mltipla, do tipo
x n
x b x b x b x b b y + + + + + = ...
3 3 2 2 1 1 0
, em que a varivel resposta ou
dependente funo de vrias variveis independentes.
SPSS 7 - Regresso Linear
ESACB 122
Os coeficientes de regresso b
1
, b
2
, ..., b
n
traduzem o declive ou acrscimo na varivel
dependente provocado pelo acrscimo unitrio de cada uma das variveis
independentes, x
1
, x
2
, ..., x
n
, respectivamente.
A metodologia que se vai abordar serve igualmente para estimar uma equao de
regresso linear polinomial, do tipo
n
n
x b x b x b x b b y + + + + + = ...
3
3
2
2 1 0
, em que y
depende, no de diversas variveis independentes x
1
, x
2
, ..., x
n
, mas de um polinmio da
mesma varivel independente x. Neste caso, previamente a efectuar o procedimento da
regresso linear, devem gerar-se as variveis correspondentes s potncias x
2
, x
3
, ..., x
n
a
incluir no modelo. No pargrafo seguinte ser abordada uma metodologia diferente que
permite o ajustamento de equaes de curvas polinomiais a uma amostra de dados (x,y).
Quando se ajusta um modelo de regresso mltipla, pode acontecer que se justifique
estatisticamente incluir na equao de regresso todas as variveis independentes, ou
que se incluam apenas algumas destas variveis explanatrias. Esta deciso tomada
em funo da significncia do parmetro de regresso de cada uma das variveis, ou
pelo acrscimo do coeficiente de determinao, R
2
, provocado pela incluso dessas
variveis.
De um modo geral, existem duas estratgias a seguir:
(i) comear por incluir todas as variveis, e analisar a contribuio ou
significncia dos coeficientes de regresso de cada uma das variveis
independentes no modelo; eliminar a varivel independente menos
significativa, desde que a sua contribuio seja inferior a determinado limite
(normalmente analisado em termos da estatstica F associada a essa varivel
na tabela da anova); recalcular de novo o modelo sem esta varivel e, se for
caso disso, eliminar nova varivel, e assim sucessivamente, at que todas as
restantes variveis independentes sejam significativas para a preciso do
modelo. Este tipo de estratgia designa-se por processo backward ou
stepback.
(ii) comear por calcular um modelo de regresso simples, x b b y
1 0
+ = ,
incluindo, se for caso disso, apenas a varivel independente cujo coeficiente
de regresso mais significativo em termos de preciso; analisar a
significncia da prxima varivel independente mais significativa, e inclu-
la, se for caso disso; recalcular de novo o modelo; analisar a significncia da
prxima varivel independente mais significativa, e inclu-la, se for caso
disso, e assim sucessivamente at que mais nenhuma das variveis
independentes seja significativa. Este tipo de metodologia designa-se por
processo stepwise ou forward.
Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para a
mesma amostra de valores, no sejam inteiramente coincidentes, nomeadamente quando
alguma ou algumas das variveis independentes esto muito prximas do limite que
define a significncia da sua incluso ou no incluso no modelo.
Chama-se a ateno que, por vezes, a incluso de muitas variveis explanatrias no
modelo pouco acrscimo trazem em termos de preciso do modelo, e este fica muito
SPSS 7 - Regresso Linear
ESACB 123
pouco funcional e muito fictcio ou artificial, isto , muito bem ajustado amostra
particular de valores usados para o clculo da equao, mas pouco adaptvel
populao.
Para ilustrar o ajustamento de uma equao de regresso linear mltipla, vamos usar o
seguinte conjunto de dados (adaptado de DRAPPER & SMITH, 1981), em que as
variveis independentes so a temperatura mdia mensal (graus Fahrenheit), a produo
mensal (toneladas), o nmero de dias teis de trabalho por ms e o nmero de
empregados, e a varivel dependente o consumo de gua (m
3
), observados numa
determinada empresa fabril:
Temperatura
(F)
Produo
mensal
Dias teis do
ms
Nmero de
operrios
Consumo de
gua (m3)
58.80 7107.00 20.00 129.00 2967.00
65.20 8373.00 20.00 141.00 2828.00
70.90 9796.00 20.00 153.00 2891.00
77.40 9208.00 20.00 166.00 2994.00
79.30 14792.00 22.00 193.00 3282.00
81.00 14564.00 23.00 189.00 3498.00
71.90 11964.00 21.00 175.00 3302.00
63.90 13526.00 22.00 186.00 3260.00
54.50 12656.00 21.00 190.00 3211.00
39.50 14119.00 21.00 187.00 3286.00
44.50 15691.00 22.00 195.00 3432.00
43.60 14571.00 23.00 206.00 3425.00
56.00 13619.00 22.00 198.00 3256.00
64.70 14575.00 22.00 192.00 3422.00
73.00 14556.00 21.00 191.00 3250.00
78.90 16573.00 22.00 200.00 3464.00
79.40 15618.00 22.00 200.00 3495.00
68.40 14346.00 23.00 185.00 3568.00
Pretende-se ajustar uma equao do tipo
4 4 3 3 2 2 1 1 0
x b x b x b x b b y + + + + = que permita
estimar o consumo mensal de gua nesta empresa, em funo das variveis
independentes observadas.
Para estimar uma equao de regresso mltipla executar o seguinte procedimento:
Statistics
Regression
SPSS 7 - Regresso Linear
ESACB 124
No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,
onde se definem a varivel dependente e as todas as variveis independentes:
No campo das variveis independentes esto includas todas as variveis explanatrias.
O mtodo de clculo seleccionado Enter, que obriga incluso de todas as variveis
independentes no modelo, sejam ou no significativas. Os outros mtodos de clculo
so Stepwise e Forward (mtodos de incluso progressiva de variveis independentes),
Backward (mtodo de eliminao progressiva de variveis independentes) e Remove
(mtodo que calcula o modelo sem incluso de qualquer varivel independente, isto , o
modelo resume-se a y y = ):
A fim de comparar diversos modelos de regresso, vamos comear por incluir todas as
variveis independentes, optando pelo mtodo Enter; seguidamente, deve repetir-se a
metodologia, e optar por outros mtodos de clculo, nomeadamente Stepwise e
Backward.
Seleccionar o boto , e tal como descrito para a regresso
linear simples.
Os resultados so os seguintes:
SPSS 7 - Regresso Linear
ESACB 125
Regression
Descriptive Statistics
3268.3889 218.9502 18
65.0500 13.1334 18
13091.89 2716.3310 18
21.5000 1.0432 18
182.0000 21.3514 18
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Mean
Std.
Deviation N
Correlations
1.000 .013 .894 .901 .831
.013 1.000 -.005 -.022 -.080
.894 -.005 1.000 .811 .939
.901 -.022 .811 1.000 .784
.831 -.080 .939 .784 1.000
. .480 .000 .000 .000
.480 . .493 .466 .377
.000 .493 . .000 .000
.000 .466 .000 . .000
.000 .377 .000 .000 .
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Pearson Correlation
Sig. (1-tailed)
N
Consumo
mensal de
gua (m3)
Temperatura
mdia
mensal (F)
Produo
mensal
(Ton)
Dias teis
no ms
Nmero de
operrios
Variables Entered/Removed
b
Nmero de operrios,
Temperatura mdia mensal (F),
Dias teis no ms, Produo
mensal (Ton)
a
. Enter
Model
1
Variables Entered
Variables
Removed Method
All requested variables entered.
a.
Dependent Variable: Consumo mensal de gua (m3)
b.
Model Summary
b
.945
a
.893 .860 81.8974 .893 27.127 4 13 .000
Model
1
R R Square
Adjusted R
Square
Std. Error
of the
Estimate
R Square
Change F Change df1 df2
Sig. F
Change
Change Statistics
Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F), Dias teis no ms, Produo mensal (Ton)
a.
Dependent Variable: Consumo mensal de gua (m3)
b.
SPSS 7 - Regresso Linear
ESACB 126
ANOVA
b
727772.930 4 181943.232 27.127 .000
a
87193.348 13 6707.181
814966.278 17
Regression
Residual
Total
Model
1
Sum of
Squares df
Mean
Square F Sig.
Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F),
Dias teis no ms, Produo mensal (Ton)
a.
Dependent Variable: Consumo mensal de gua (m3)
b.
Coefficients
a
531.302 619.067 .858 .406 -806.111 1868.714
.232 1.550 .014 .150 .883 -3.117 3.581 .013 .041 .014
5.027E-02 .023 .624 2.166 .049 .000 .100 .894 .515 .197
110.460 32.724 .526 3.376 .005 39.765 181.156 .901 .683 .306
-1.709 2.801 -.167 -.610 .552 -7.759 4.342 .831 -.167 -.055
(Constant)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardi
zed
Coefficien
ts
t Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
for B
Zero-order Partial Part
Correlations
Dependent Variable: Consumo mensal de gua (m3)
a.
Residuals Statistics
a
2890.9719 3499.8154 3268.3889 206.9062 18
-111.5868 131.9858 1.011E-13 71.6172 18
-1.824 1.119 .000 1.000 18
-1.363 1.612 .000 .874 18
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum Mean
Std.
Deviation N
Dependent Variable: Consumo mensal de gua (m3)
a.
Charts
Regression Standardized Residual
1.50 1.00 .50 0.00 -.50 -1.00 -1.50
Histogram
Dependent Variable: Consumo mensal de gua
F
r
e
q
u
e
n
c
y
5
4
3
2
1
0
Std. Dev = .87
Mean = 0.00
N = 18.00
SPSS 7 - Regresso Linear
ESACB 127
Normal P-P Plot of Regression Standardized Resi dual
Dependent Variable: Consumo mensal de gua (m3)
Observed Cum Prob
1.00 .75 .50 .25 0.00
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
1.00
.75
.50
.25
0.00
Scatterplot
Dependent Variable: Consumo mensal de gua (m3)
Regression Standardized Predicted Value
1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0
R
e
g
r
e
s
s
i
o
n
S
t
a
n
d
a
r
d
i
z
e
d
R
e
s
i
d
u
a
l
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
A equao do modelo ajustado :
consumo=531.302+0.232temperat+0.05027producao+110.46dias-1.709operario
sendo R
2
=0.893 e 86 . 0
2
=
ajustado
R .
Repita-se o processo, optando pelo mtodo de clculo Stepwise. Neste caso, chegar-se-
ao modelo:
SPSS 7 - Regresso Linear
ESACB 128
consumo=443.965+0.03842producao+107.976dias
e R
2
=0.889 e 874 . 0
2
=
ajustado
R .
Repare-se que se simplificou o modelo, sem contudo prejudicar a preciso deste como
instrumento de estimativa da varivel dependente.
De seguida apresentam-se os resultados completos obtidos com o mtodo stepwise, de
modo a possibilitar a comparao com o modelo que inclui todas as variveis
independentes:
Regression
Descriptive Statistics
3268.3889 218.9502 18
65.0500 13.1334 18
13091.89 2716.3310 18
21.5000 1.0432 18
182.0000 21.3514 18
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Mean
Std.
Deviation N
Correlations
1.000 .013 .894 .901 .831
.013 1.000 -.005 -.022 -.080
.894 -.005 1.000 .811 .939
.901 -.022 .811 1.000 .784
.831 -.080 .939 .784 1.000
. .480 .000 .000 .000
.480 . .493 .466 .377
.000 .493 . .000 .000
.000 .466 .000 . .000
.000 .377 .000 .000 .
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal de
gua (m3)
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Pearson Correlation
Sig. (1-tailed)
N
Consumo
mensal de
gua (m3)
Temperatura
mdia
mensal (F)
Produo
mensal
(Ton)
Dias teis
no ms
Nmero de
operrios
SPSS 7 - Regresso Linear
ESACB 129
Variables Entered/Removed
a
Dias teis no
ms
.
Stepwise (Criteria:
Probability-of-F-to-e
nter <= .050,
Probability-of-F-to-re
move >= .100).
Produo
mensal (Ton)
.
Stepwise (Criteria:
Probability-of-F-to-e
nter <= .050,
Probability-of-F-to-re
move >= .100).
Model
1
2
Variables
Entered
Variables
Removed Method
Dependent Variable: Consumo mensal de gua (m3)
a.
Model Summary
c
.901
a
.811 .800 98.0273 .811 68.810 1 16 .000
.943
b
.889 .874 77.5677 .078 10.554 1 15 .005
Model
1
2
R R Square
Adjusted R
Square
Std. Error
of the
Estimate
R Square
Change F Change df1 df2
Sig. F
Change
Change Statistics
Predictors: (Constant), Dias teis no ms
a.
Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)
b.
Dependent Variable: Consumo mensal de gua (m3)
c.
ANOVA
c
661216.554 1 661216.554 68.810 .000
a
153749.724 16 9609.358
814966.278 17
724715.124 2 362357.562 60.225 .000
b
90251.154 15 6016.744
814966.278 17
Regression
Residual
Total
Regression
Residual
Total
Model
1
2
Sum of
Squares df
Mean
Square F Sig.
Predictors: (Constant), Dias teis no ms
a.
Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)
b.
Dependent Variable: Consumo mensal de gua (m3)
c.
Coefficients
a
-796.273 490.549 -1.623 .124 -1836.190 243.643
189.054 22.791 .901 8.295 .000 140.740 237.369 .901 .901 .901
443.965 544.446 .815 .428 -716.494 1604.425
107.976 30.791 .514 3.507 .003 42.346 173.606 .901 .671 .301
3.842E-02 .012 .477 3.249 .005 .013 .064 .894 .643 .279
(Constant)
Dias teis no ms
(Constant)
Dias teis no ms
Produo mensal (Ton)
Model
1
2
B Std. Error
Unstandardized
Coefficients
Beta
Standardi
zed
Coefficien
ts
t Sig.
Lower
Bound
Upper
Bound
95% Confidence Interval
for B
Zero-order Partial Part
Correlations
Dependent Variable: Consumo mensal de gua (m3)
a.
SPSS 7 - Regresso Linear
ESACB 130
Excluded Variables
c
.032
a
.290 .776 .075 1.000
.477
a
3.249 .005 .643 .343
.323
a
2.017 .062 .462 .385
.026
b
.296 .772 .079 .999
-.176
b
-.683 .506 -.179 .116
Temperatura mdia
mensal (F)
Produo mensal (Ton)
Nmero de operrios
Temperatura mdia
mensal (F)
Nmero de operrios
Model
1
2
Beta In t Sig.
Partial
Correlation Tolerance
Collinearit
y
Statistics
Predictors in the Model: (Constant), Dias teis no ms
a.
Predictors in the Model: (Constant), Dias teis no ms, Produo mensal (Ton)
b.
Dependent Variable: Consumo mensal de gua (m3)
c.
Residuals Statistics
a
2876.5112 3487.1743 3268.3889 206.4711 18
-105.6879 130.9278 2.274E-13 72.8621 18
-1.898 1.060 .000 1.000 18
-1.363 1.688 .000 .939 18
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum Mean
Std.
Deviation N
Dependent Variable: Consumo mensal de gua (m3)
a.
Charts
Regression Standardized Residual
1.50 1.00 .50 0.00 -.50 -1.00 -1.50
Histogram
Dependent Variable: Consumo mensal de gua (m3)
F
r
e
q
u
e
n
c
y
5
4
3
2
1
0
Std. Dev = .94
Mean = 0.00
N = 18.00
SPSS 7 - Regresso Linear
ESACB 131
Normal P-P Plot of Regression Standardized Resi dual
Dependent Variable: Consumo mensal de gua (m3)
Observed Cum Prob
1.00 .75 .50 .25 0.00
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
1.00
.75
.50
.25
0.00
Scatterplot
Dependent Variable: Consumo mensal de gua (m3)
Regression Standardized Predicted Value
1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0
R
e
g
r
e
s
s
i
o
n
S
t
a
n
d
a
r
d
i
z
e
d
R
e
s
i
d
u
a
l
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
7.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS
O SPSS dispe de uma rotina que permite o ajustamento de vrios modelos pr-
definidos a uma amostra de valores bi-variados (x,y). Tais modelos so:
SPSS 7 - Regresso Linear
ESACB 132
- Linear: x b b y .
1 0
+ =
- Quadrtico:
2
2 1 0
. . x b x b b y + + =
- Cbico:
3
3
2
2 1 0
. . . x b x b x b b y + + + =
- Logartmico: x b b y ln .
1 0
+ =
- Inverso:
x
b
b y
1
0
+ =
- Potncia:
1
.
0
b
x b y = x b b y ln . ln ln
1 0
+ =
- Composto (compound):
x
b b y
1 0
. =
1 0
ln . ln ln b x b y + =
- Sigmoidal (S):
x
b
b
e y
1
0
+
=
x
b
b y
1
0
ln + =
- Logstico:
x
b b
u
y
1 0
.
1
1
+
= ( )
1 0
ln . ln
1 1
ln b x b
u y
+ =
|
|
.
|
\
|
(em que u o limite assimpttico superior, u>0, u>y
max
)
- Crescimento (growth):
x b b
e y
.
1 0
+
= x b b y . ln
1 0
+ =
- Exponencial:
x b
e b y
.
0
1
. = x b b y . ln ln
1 0
+ =
Muitos destes modelos so frequentemente usados em modelos economtricos, em que
a varivel independente ou causal o decurso do tempo. Se for este o caso, no menu
apropriado o utilizador pode definir que x o tempo (ver caixa de dilogo seguinte).
Para exemplificar esta metodologia, vamos usar os dados referentes s caractersticas do
molho de tomate (em anexo). Como anteriormente se viu, o grfico denota uma ligeira
curvatura na zona superior dos valores xx, que faz suspeitar que um modelo polinomial
talvez seja melhor ajustado que o modelo linear simples.
Para tal, fazer:
Statistics
Regression
Neste menu, seleccionar a opo Curve Estimation... que d acesso seguinte caixa de
dilogo, onde se definem as variveis dependente (solidos) e independente (insoluve) e
se seleccionam os modelos que se pretendem obter, e se define para apresentar a tabela
da anova para cada um dos modelos calculados:
SPSS 7 - Regresso Linear
ESACB 133
Por defeito, os modelos ajustados incluem a constante (coeficiente b
0
)
, e apresentado o grfico com os modelos calculados
.
O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela anlise dos
resultados, nomeadamente R
2
e anova, seleccionar o modelo melhor ajustado. No
exemplo, foi solicitado para calcular os modelos linear, quadrtico e cbico. Os
resultados so os seguintes:
MODEL: MOD_1.
Dependent variable.. SOLIDOS Method.. LINEAR
Listwise Deletion of Missing Data
Multiple R .97001
R Square .94092
Adjusted R Square .93823
Standard Error 1.28802
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 581.27190 581.27190
Residuals 22 36.49768 1.65899
F = 350.37794 Signif F = .0000
-------------------- Variables in the Equation ------------
--------
SPSS 7 - Regresso Linear
ESACB 134
Variable B SE B Beta
T Sig T
INSOLUVE -2.646653 .141393 -.970010 -
18.718 .0000
(Constant) 76.193433 1.965707
38.761 .0000
Dependent variable.. SOLIDOS Method.. QUADRATI
Listwise Deletion of Missing Data
Multiple R .98637
R Square .97293
Adjusted R Square .97035
Standard Error .89243
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 2 601.04440 300.52220
Residuals 21 16.72518 .79644
F = 377.33322 Signif F = .0000
-------------------- Variables in the Equation ------------
--------
Variable B SE B Beta
T Sig T
INSOLUVE -8.288178 1.136478 -3.037655 -
7.293 .0000
INSOLUVE**2 .200730 .040286 2.075370
4.983 .0001
(Constant) 115.123024 7.930949
14.516 .0000
Dependent variable.. SOLIDOS Method.. CUBIC
Listwise Deletion of Missing Data
Multiple R .98637
R Square .97293
Adjusted R Square .97035
Standard Error .89243
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 2 601.04440 300.52220
Residuals 21 16.72518 .79644
SPSS 7 - Regresso Linear
ESACB 135
F = 377.33322 Signif F = .0000
-------------------- Variables in the Equation ------------
--------
Variable B SE B Beta
T Sig T
INSOLUVE -8.288178 1.136478 -3.037655 -
7.293 .0000
INSOLUVE**2 .200730 .040286 2.075370
4.983 .0001
(Constant) 115.123024 7.930949
14.516 .0000
--------------- Variables not in the Equation -------------
--
Variable Beta In Partial Min Toler T Sig
T
INSOLUVE**3 -4.796852 -.214795 1.368E-05 -.984
.3371
Notes:
9 Tolerance limits reached; some dependent variables were
not entered.
% slidos no molho
% insolveis em gua
20 18 16 14 12 10
60
50
40
30
20
Observed
Linear
Quadratic
SPSS 7 - Regresso Linear
ESACB 136
Note-se que ao passar do modelo linear y = 76.1934 2.6467x, R
2
=0.9409 para o
modelo quadrtico y = 115.1230 8.2882x + 0.2007x
2
, R
2
=0.9729, h um acrscimo
significativo do ajustamento (T
b2
=4.983, significativo; F=377.33 significativo);
contudo, ao passar para o modelo cbico, a estatstica T
b3
=-0.984 no significativa, e
nem sequer calculado este modelo, sendo apresentados os resultados do modelo
quadrtico, o que significa que o melhor modelo (dos pedidos) o modelo quadrtico.
SPSS 8 - Manusear os Resultados
ESACB 136
8 - MANUSEAR OS RESULTADOS
medida que se vo executando tarefas com o SPSS, os resultados vo-se acumulando
sucessivamente no Viewer do programa.
A janela do organigrama apresenta a sequncia de resultados, que comeam na
identificao ; cada rotina ou tarefa aparece identificada com uma marca
identificativa dos resultados, e respectivo contedo; por exemplo, os resultados
correspondentes obteno das estatsticas descritivas identificado no organigrama
pelo esquema .
Cada conjunto de resultados comea pela identificao da rotina ou tarefa
( ) e com o respectivo contedo; esta rotina apresenta um ttulo
visvel (repare que o livro est aberto), e que corresponde linha
Descriptives na janela direita, um conjunto de notas que no esto visveis
no output (o livro est fechado), e as estatsticas descritivas visveis na janela de
output (o livro est aberto). Esta organizao mantm-se para
os resultados das tarefas seguintes.
SPSS 8 - Manusear os Resultados
ESACB 137
Note que cada rotina tem um conjunto de notas, mas que no esto visualizadas; para as
ver na janela de output, o utilizador s tem que fazer duplo click sobre , de
modo a abrir o livro, e aparecerem as notas na janela direita.
Repare que as notas incluem a data e hora de obteno dos resultados, a localizao do
ficheiro de dados usado, o nmero de linhas ou casos do ficheiro de dados, indicaes
sobre a existncia e tratamento de missing values, e as instrues que originaram os
resultados (o utilizador gerou estas instrues, ou programa, seleccionando cons e
janelas nos menus do programa; contudo, e para utilizaes mais avanadas, o SPSS
tem um editor de programas, em que o utilizador constri as rotinas de anlise, como se
de uma linguagem de programao de tratasse). A ltima linha das notas indica o tempo
de processamento que a CPU do computador levou a executar esta rotina (neste caso,
0.99 segundos).
Para fechar o livro de notas, isto , para que as notas no sejam visualizadas no
output, fazer duplo click sobre .
Para condensar a parte de organigrama correspondente a uma rotina de anlise, fazer
click sobre o boto - esquerda da sua identificao; por exemplo, para condensar o
organigrama das estatsticas descritivas, fazer click sobre
O organigrama fica com o seguinte aspecto:
SPSS 8 - Manusear os Resultados
ESACB 138
Esta condensao do organigrama tem a vantagem de permitir maior rapidez na
localizao de determinados conjuntos de resultados, pois o utilizador pode condensar
as partes no relevantes do organigrama, ficando apenas aberta a parte relevante do
organigrama.
Para expandir, fazer duplo click sobre o boto + correspondente
Para visualizar resultados subsequentes, o utilizador pode usar a barra de scroll vertical
da janela de resultados, ou simplesmente fazer clik no item respectivo do organigrama.
Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores,
fazer click sobre o item
Alm da visualizao, o utilizador pode copiar este grfico (ou qualquer outro conjunto
de resultados) para outra aplicao em Windows (por exemplo, processador de texto).
SPSS 8 - Manusear os Resultados
ESACB 139
Para tal, localizar o bloco de resultados pretendido (tal como descrito); Fazer Edit Copy
(ou CTRL-C), para capturar uma imagem do bloco seleccionado para o clipboard
(rea de transferncia) do Windows; colocar-se na aplicao pretendida (poor exemplo,
num documento do Word) e fazer a colagem da imagem (Edit Past, ou CTRL-V).
Se se efectuou uma anlise e se chegou concluso que est repetida, ou que pura e
simplesmente no interessa, pode eliminar-se do Viewer. No exemplo seguinte, repetiu-
se a rotina Descriptives, de modo que os resultados esto em duplicado.
Podem acrescentar-se caixas de texto com comentrios aos resultados, por exemplo
algumas anlises que se considerem pertinentes.
Para incluir o comentrio O histograma evidencia uma tendncia assimtrica aps o
histograma, seleccionar o item Histogram:
e fazer Insert New Text ou fazer click no boto . Na janela de resultados aberta
uma caixa de texto, onde se esccrevem os comentrios pretendidos:
SPSS 8 - Manusear os Resultados
ESACB 140
Para eliminar um dos conjunto de resultados da rotina Descriptives, fazer click sobre o
item respectivo no organigrama:
e de seguida fazer Edit Cut, ou CTRL-X, ou simplesmente carregar na tecla DEL.
Podem guardar-se os resultados em ficheiro, de modo que posteriormente o utilizador
possa recuper-los sem ter de os recalcular. Para gravar os resultados contidos no
Viewer do SPSS, estando colocado nesta janela, fazer:
File
Save
Aparece a seguinte caixa de dilogo, onde se selecciona o disco/directrio onde se
pretende gravar; na caixa escreve-se
o nome a dar ao ficheiro (sem extenso); o programa automaticamente acrescenta a
extenso .spo tpica dos ficheiros Viewer do SPSS.
SPSS 8 - Manusear os Resultados
ESACB 141
Posteriormente, se se pretender apenas consultar os resultados, basta abrir este ficheiro
no SPSS. Caso se pretenda continuar a executar anlises e acrescent-las a este ficheiro,
ento deve abrir-se tambm o ficheiro de dados para a partir da proceder s anlises.
Para imprimir os resultados do Viewer, faz-se File Print; na caixa de dilogo seguinte,
confirmar a impressora, e fazer OK:
Se interessar imprimir no todo o conjunto de resultados, mas apenas alguns dos blocos,
devem seleccionar-se previamente. Para tal, se os blocos so contguos, manter a tecla
SHIFT carregada e fazer click sobre os items a seleccionar; se os blocos no so
adjacentes, manter a tecla CTRL carregada e fazer click sobre os items a seleccionar:
SPSS 8 - Manusear os Resultados
ESACB 142
Neste exemplo, apenas o bloco Descriptives e o bloco Producao esto seleccionados; se
se mandar imprimir, s sero impressos estes resultados.
Repare que agora, no aparece activada a opo , a indicar
que imprimir apenas os blocos seleccionados.
SPSS Anexos
ESACB 143
ANEXOS
Listagem dos ficheiros SPSS referenciados no texto
plasma.sav
hora estrogen fosfo
1 Manh Controle 8,53
2 Manh Controle 20,53
3 Manh Controle 12,53
4 Manh Controle 14
5 Manh Controle 10,8
6 Manh Presente 17,53
7 Manh Presente 21,07
8 Manh Presente 20,8
9 Manh Presente 17,33
10 Manh Presente 20,07
11 Tarde Controle 39,14
12 Tarde Controle 26,2
13 Tarde Controle 31,33
14 Tarde Controle 45,8
15 Tarde Controle 40,2
16 Tarde Presente 32
17 Tarde Presente 23,8
18 Tarde Presente 28,87
19 Tarde Presente 25,06
20 Tarde Presente 29,3
pulso.sav
caso sexo fuma idade ritmoa ritmod
1 Homem Fuma 31 62 126
2 Mulher Fuma 20 78 154
3 Homem No Fuma 28 64 128
4 Mulher No Fuma 29 96 155
5 Homem Fuma 21 66 128
6 Mulher Fuma 27 96 265
7 Homem No Fuma 21 68 120
8 Mulher No Fuma 42 72 138
9 Mulher Fuma 22 88 160
10 Homem Fuma 28 90 144
11 Mulher No Fuma 21 82 140
12 Homem No Fuma 22 74 134
13 Mulher Fuma 43 66 148
14 Mulher No Fuma 19 68 142
15 Homem Fuma 23 92 134
16 Homem No Fuma 41 68 112
17 Homem No Fuma 24 76 158
18 Mulher No Fuma 21 86 146
19 Mulher Fuma 21 88 156
20 Homem Fuma 20 66 132
21 Homem Fuma 38 70 122
22 Homem No Fuma 20 80 136
23 Mulher Fuma 33 76 148
24 Mulher No Fuma 25 78 148
25 Mulher No Fuma 37 76 136
26 Mulher No Fuma 22 80 158
27 Homem No Fuma 32 68 116
28 Homem No Fuma 22 70 120
29 Homem Fuma 22 68 126
30 Homem Fuma 19 70 144
31 Mulher No Fuma 21 86 144
32 Homem No Fuma 26 72 126
33 Mulher No Fuma 32 84 136
34 Mulher No Fuma 24 72 142
35 Mulher No Fuma 28 80 138
36 Homem Fuma 34 62 132
37 Homem No Fuma 35 74 116
38 Homem Fuma 21 90 138
39 Homem No Fuma 21 66 142
40 Homem No Fuma 30 70 132
arroz.sav
caso variedad azoto repete producao
1 IR8 0 kg/ha 1 3852
2 IR8 0 kg/ha 2 2606
3 IR8 0 kg/ha 3 3144
4 IR8 0 kg/ha 4 2894
5 IR8 60 kg/ha 1 4788
6 IR8 60 kg/ha 2 4936
7 IR8 60 kg/ha 3 4562
8 IR8 60 kg/ha 4 4608
9 IR8 90 kg/ha 1 4576
10 IR8 90 kg/ha 2 4454
11 IR8 90 kg/ha 3 4884
12 IR8 90 kg/ha 4 3924
13 IR8 120 kg/ha 1 6034
14 IR8 120 kg/ha 2 5276
15 IR8 120 kg/ha 3 5906
16 IR8 120 kg/ha 4 5652
17 IR8 150 kg/ha 1 5874
18 IR8 150 kg/ha 2 5916
19 IR8 150 kg/ha 3 5984
20 IR8 150 kg/ha 4 5518
21 IR5 0 kg/ha 1 2846
22 IR5 0 kg/ha 2 3794
23 IR5 0 kg/ha 3 4108
24 IR5 0 kg/ha 4 3444
25 IR5 60 kg/ha 1 4956
26 IR5 60 kg/ha 2 5128
27 IR5 60 kg/ha 3 4150
28 IR5 60 kg/ha 4 4990
29 IR5 90 kg/ha 1 5928
30 IR5 90 kg/ha 2 5698
31 IR5 90 kg/ha 3 5810
32 IR5 90 kg/ha 4 4308
33 IR5 120 kg/ha 1 5664
34 IR5 120 kg/ha 2 5362
35 IR5 120 kg/ha 3 6458
36 IR5 120 kg/ha 4 5474
37 IR5 150 kg/ha 1 5458
38 IR5 150 kg/ha 2 5546
39 IR5 150 kg/ha 3 5786
40 IR5 150 kg/ha 4 5932
41 C4-63 0 kg/ha 1 4192
42 C4-63 0 kg/ha 2 3754
43 C4-63 0 kg/ha 3 3738
44 C4-63 0 kg/ha 4 3428
45 C4-63 60 kg/ha 1 5250
46 C4-63 60 kg/ha 2 4582
47 C4-63 60 kg/ha 3 4896
arroz.sav
48 C4-63 60 kg/ha 4 4286
49 C4-63 90 kg/ha 1 5822
50 C4-63 90 kg/ha 2 4848
51 C4-63 90 kg/ha 3 5678
52 C4-63 90 kg/ha 4 4932
53 C4-63 120 kg/ha 1 5888
54 C4-63 120 kg/ha 2 5524
55 C4-63 120 kg/ha 3 6042
56 C4-63 120 kg/ha 4 4756
57 C4-63 150 kg/ha 1 5864
58 C4-63 150 kg/ha 2 6264
59 C4-63 150 kg/ha 3 6056
60 C4-63 150 kg/ha 4 5362
catsup.sav
caso insoluve solidos
1 10,71 51
2 11,76 45,2
3 11,36 44,8
4 11,27 47,4
5 15,3 35,5
6 12,07 44,5
7 15,98 35,3
8 13,34 39,3
9 13,34 40,8
10 14,29 38,4
11 13,66 39,3
12 14,79 36
13 14,5 37,9
14 14,8 36,2
15 14,88 35,3
16 10,86 48,5
17 13,34 40
18 13,01 43
19 12,87 41,5
20 14,4 36,7
21 15,12 35,3
22 17,06 32,5
23 18,22 30,2
24 13,73 38,9