Você está na página 1de 3

EXEMPLO DE UMA REGRESSO LINEAR MLTIPLA, RECORRENDO AO SPSS

Vamos efetuar uma anlise de regresso linear mltipla, com a base de dados seguinte:

Foram recolhidos dados sobre a acidez de 28 solos, a quantidade de qumicos que era usada
em cada um e o volume de chuva. Os solos foram classificados em humosos ou arenosos.
Iremos considerar como varivel resposta a acidez do solo e como predictores os qumicos
usados para adubar o solo, a chuva (em metros cbicos) e o tipo de solo (humoso ou
arenoso).

que

pretendemos

descobrir

se

estas

trs

variveis

predictoras

explicam/influenciam o nvel de acidez do solo.


Antes de avanar com a anlise, devemos verificar se os pressupostos so respeitados. Quanto
ao tipo de variveis no h qualquer impedimento, porque a varivel resposta quantitativa e as
variveis explicativas tanto podem ser quantitativas como qualitativas. Falta-nos verificar se a
varivel resposta segue uma distribuio normal. Para isso, iremos recorrer ao teste de
Kolmogorov-Smirnov e aos comandos >>Analyse>>DescriptiveStatistics>>Explore

Tests of Normality
a

Kolmogorov-Smirnov
Statistic
Acidez do solo

,094

df

Sig.
28

*. This is a lower bound of the true significance.


a. Lilliefors Significance Correction

Shapiro-Wilk

,200

Statistic
*

,976

df

Sig.
28

,742

O teste de Kolmogorov devolveu uma significncia de .200. Como este valor foi superior a .05
podemos afirmar que a acidez do solo segue uma distribuio normal. H autores que
defendem que, perante uma amostra pequena, como esta, devemos basear-nos no teste de
Shapiro-Wilk, mas, se repararmos no valor da sua significncia chegaremos mesma
concluso.
Posto isto, falta-nos verificar que os erros so independentes, mas aproveitaremos para aplicar o
teste de Durbin-Watson j no decorrer da anlise.
Recorrendo ao comando >>Analyse>>Regression>>Linear e s suas opes, obtivemos os
seguintes resultados:
b

Model Summary
Model

,896

R Square

Adjusted R

Std. Error of the

Square

Estimate

,803

,778

Durbin-Watson

1,38223

2,024

a. Predictors: (Constant), Tipo, Chuva em m3, Quimicos


b. Dependent Variable: Acidez do solo

Este software no nos apresenta o nvel de significncia do teste de Durbin-Watson, mas sim um
valor que est sempre situado entre 1 e 3. Quando o valor do teste est perto de 2 significa que
o teste no significativo e que os erros so independentes. Podemos, ento, prosseguir com o
estudo, pois todos os pressupostos esto garantidos.
A tabela anterior devolve, ainda, o valor R2=0.803, o que nos permite constatar que estes trs
predictores influenciam 80,3% do nvel de acidez do solo.
a

ANOVA
Model

Sum of Squares
Regression

Residual
Total

df

Mean Square

186,936

62,312

45,853

24

1,911

232,790

27

F
32,615

Sig.
,000

a. Dependent Variable: Acidez do solo


b. Predictors: (Constant), Tipo, Chuva em m3, Quimicos

Obtivemos, ainda, uma tabela com o teste ANOVA, com uma estatstica F=32.615 e uma
significncia inferior a .001. isto significa que o modelo estudado, em todas as variveis,
bastante significativo.

Coefficients

Model

Unstandardized Coefficients

Standardized

Sig.

Coefficients
B

Std. Error

(Constant)

1,919

2,522

Quimicos

,652

,103

Chuva em m3

,010
1,609

Beta
,761

,454

,707

6,333

,000

,097

,010

,104

,918

,685

,279

2,349

,027

1
Tipo

a. Dependent Variable: Acidez do solo

Esta tabela d-nos os valores dos coeficientes estimados e a sua respetiva significncia. Daqui
podemos retirar as seguintes concluses:
- Por cada unidade de qumicos adicionada ao solo, a sua acidez aumenta 0.652 unidades.
Este aumento bastante significativo, porque p<.05.
- Por cada m3 de chuva que cai, a acidez do solo aumenta 0.01. No entanto, este valor no
significativo, porque a sua significncia de .918.
- Se o solo for arenoso, estima-se que a acidez seja 1.609 vezes mais elevada,
comparativamente ao solo humoso. Este aumento estatisticamente significativo, porque p<.05.
A equao da reta de regresso destes dados :
acidez = 1.919 + 0.652qumi cos + 0.010chuva + 1.609tipo

A forma como se deve apresentar os resultados desta anlise no consensual. No entanto,


apenas se devem apresentar os resultados dos coeficientes que so significativos. Uma das
formas apresentar os resultados numa tabela, como a que se segue:
Beta

SE

Constante

1.92

2.52

Qumicos

.652

.103

<.001

Tipo

1.61

.69

<.05

R2 = .80 . (p<.001)

p-value