Você está na página 1de 16

7-22, 2011

Anlise das pressuposies e adequao


dos resduos em modelo de regresso
linear para valores individuais, ponderados e no ponderados, utilizando procedimentos do SAS
Janete Pereira Amador1, Sidinei Jos Lopes2, Joo Eduardo Pereira1,
Adriano Mendona Souza1, Marcos Toebe3
1

Departamento de Estatstica/CCNE - UFSM; Santa Maria, RS


Departamento de Fitotecnia/CCR - UFSM; Santa Maria, RS
3
PPGAGRO/CCR - UFSM; Santa Maria, RS
e-mail: janeteamador@hotmail.com
2

Resumo
Quando se quer estabelecer relaes que possibilitem predizer uma ou
mais variveis em funo de outras, a anlise de regresso a tcnica
apropriada. Existindo medidas repetidas da varivel independente X, para
diferentes medidas da varivel dependente Y, o modelo de regresso pode
ser ajustado de trs maneiras diferentes: utilizando os valores individuais de X e Y (considerando todos os dados); com as mdias de Y para os
nveis de X (tratamento); e, ainda, utilizando as mdias ponderadas de Y
pelo nmero de repeties de cada nvel de X. O objetivo deste trabalho
ajustar um modelo de regresso linear simples, atravs de valores individuais, com as mdias ponderadas e no ponderadas dos tratamentos, a fim de testar os pressupostos para adequao do modelo, bem
como, realizar a anlise de varincia, decompondo a soma de quadrados
do erro em seus componentes, avaliando-se a falta de ajuste. Todas as
tcnicas foram realizadas atravs do suporte computacional SAS. Ob-

UFSM, 33(2)

serva-se que os modelos ajustados para dados individuais e mdias ponderadas apresentam os mesmos coeficientes. O teste para falta de ajuste
s possvel de ser realizado com os dados individuais. A escolha da
melhor estratgia adotada para analisar os dados deve ser decidida pelo
pesquisador, mas sugere-se que, na disponibilidade dos dados individuais, a melhor estratgia seria estimar o modelo com estes, visto que apresentam informaes mais precisas em relao variabilidade do conjunto de dados, em relao ao uso das mdias das variveis.
Palavras-chave: ajuste de modelos de regresso, decomposio dos resduos, teste de pressupostos.

Abstract
It is appropriate to use regression analysis establish relations that allow
to predict tone or more variables in terms of others. When there are
repeated measurements for independent variable X for different
measurements for dependent variable Y, the regression model may be
adjusted in three different ways: using individual values of X and Y
(considering all data); with means of Y for levels of X (treatments) and,
using weighted means of Y by the number of repetitions of each level of
X (treatment). The objective of this study is to adjust a linear regression
model by individual values with weighted and not weighted means of
the treatments in order to test the presuppositions for the adequacy of
the model and to analyze the variance decomposing the sum of squares
of error in its components, thus evaluating the Lack of Fit. The
adjustments of the models and its presuppositions were done in SAS.
Thus, it was observed that the adjusted models for individual data and
weighted means present the same coefficients. The test for Lack of Fit is
only possible with individual data. The choice of best strategy to analyze
the data should be decided by the researcher but it is suggested that,
when all data of the research are accessible, the best strategy would be
to estimate the model using individualized data since it presents more
precise information regarding the variability of the data set which does
not happen when working with means of variables.
Keywords: regression models adjustment, decomposition of residue, test
of presuppositions.

7-22, 2011

Introduo
Nos diversos ramos da cincia, surge a necessidade de se estabelecer
relaes quantitativas entre o fenmeno observado e algumas variveis
independentes. Ou seja, ajustar um modelo matemtico que seja capaz
de explicar o fenmeno observado e que tambm seja capaz de proporcionar previses dentro e, se possvel, fora dos limites investigados. Para
tanto, utiliza-se a tcnica de anlise de regresso.
Ao estabelecer um modelo de regresso, necessrio seguir alguns
pressupostos que, de acordo com LEVINE et al. (2005), destacam-se os
seguintes: homocedasticidade, normalidade dos resduos, independncia dos erros e linearidade. Depois de estabelecido o modelo de regresso, torna-se necessrio verificar a qualidade do ajuste. Conforme COSTA et al. (2006), o mtodo empregado para se avaliar quantitativamente
a qualidade do ajuste de um modelo a anlise de varincia (ANOVA).
Os principais objetivos da anlise de varincia so: verificar se h
falta de ajuste no modelo (lack of fit); obter a estimativa correta para a
varincia do modelo de regresso ( s 2 ); e estimar o grau de ajuste e
significncia do modelo (GAUDIO & ZONDONADE, 2001). Quando o
modelo proposto correto, a mdia dos quadrados dos resduos ( s 2 )
um estimador sem vis da verdadeira varincia ( 2 ) . Entretanto, quando o modelo no adequado, ( s 2 )estar estimando algo maior do que

( 2 ), pois na soma dos quadrados estaro includos os vieses, devido

inadequao do modelo.
Nesse sentido, GAUDIO & ZONDONADE (2001) e SOUZA (1998)
argumentam que o desvio padro do modelo um critrio de ajuste do
modelo ( s 2 ). No entanto, s possvel saber se ( s 2 ) a estimativa correta de se no houver falta de ajuste no modelo. Sendo assim, para romper este ciclo, verifica-se, em primeiro lugar, a falta de ajuste do modelo
proposto, atravs dos resduos da regresso. Ainda, conforme os autores acima, os resduos de um modelo de regresso contm toda a informao necessria compreenso dos motivos que fazem com que ele
no consiga explicar 100% da variabilidade dos dados observados de Y.
Existem basicamente dois motivos para que isso ocorra, sendo estes:
presena de erros aleatrios relativos determinao dos valores de Y e
a especificao imprpria do modelo (falta de ajuste).
A anlise de um modelo de regresso linear tem uma relao muito

UFSM, 33(2)

forte com a qualidade de ajuste obtida, bem como, com a confiabilidade


dos testes estatsticos sobre os parmetros do modelo (CHARNET et al.,
1999). Assim, a anlise dos resduos tem uma importncia fundamental na verificao da qualidade dos ajustes. Basicamente, essa anlise
fornece evidncias sobre possveis violaes nas suposies do modelo
e, quando for o caso, ainda fornece indcios da falta de ajuste do modelo.
LEVINE et al. (2005) define o resduo como sendo o valor observado
de Yi menos o valor previsto de Yi , isto , ei = (Yi - Yi ) . Existem duas

situaes que devem ser bem caracterizadas em relao verificao da


falta de ajuste do modelo. A primeira quando cada valor Yi presente
no conjunto de dados foi determinado uma nica vez, ou seja, quando
cada valor de Yi for o resultado de uma medida de ponto nico.
Nesse caso, a verificao da falta de ajuste pode ser feita qualitativamente, atravs da anlise da distribuio dos resduos do modelo. Se o
modelo ajustado for apropriado para os dados, no haver padro aparente de resduos em relao a Xi. No entanto, se o modelo ajustado no
for apropriado, existir uma relao entre os valores de Xi e ei (GAUDIO
& ZANDONADE, 2001; SUBRAMANIAN et al., 2007). A segunda situao quando os valores de Yi , presentes no conjunto de dados, forem determinados em rplica (duplicata, triplicata, entre outras). Nesse
caso, as repeties das medidas de Yi podem ser utilizadas para obter a
estimativa da varincia do modelo. Tal estimativa representa o chamado
erro puro, pois, se o conjunto de valores Xi1 , Xi 2 ,.... Xik , o mesmo para
duas ou mais observaes, somente erros aleatrios podem influenciar nos
valores de Yi e gerar diferenas entre eles (DRAPER & SMITH, 1981).
Para estimar o erro puro e a falta de ajuste, deve-se fazer uma decomposio algbrica dos desvios das respostas observadas em relao
resposta mdia global. O desvio de uma resposta em relao mdia
de todas as respostas observadas Yi - Y pode ser dividido em duas parcelas (SEARLE, 1971; DRAPER & SMITH, 1981 e CHARNET et al. 1999):

Yi - Y = (Yi - Y ) + (Yi - Yi )

(1)

A primeira parcela ( Y - Y ) representa o desvio da previso feita


i
pelo modelo para o ponto em questo,(Y em relao mdia global Y .
i

10

7-22, 2011

A segunda parcela a diferena entre o valor observado e o valor


predito. Elevando-se a expresso 1 ao quadrado e, fazendo-se o somatrio
de todos os pontos, teremos do lado esquerdo a soma quadrtica total,
SQt ,

(Y - Y ) = ( Y - Y )+ ( Y - Y )
i

(2)

(Y - Y ) = ( Y - Y ) + 2 ( Y - Y )( Y - Y )+ ( Y - Y )
i

(3)

Do lado direto, obtm-se as somas quadrticas da regresso e dos


resduos, pois o somatrio dos termos cruzados se anula. Pode-se escrever, ento:

(Y - Y ) = ( Y - Y ) + ( Y - Y )
i

(4)

Os resduos, por sua vez, so decompostos em dois componentes, a


falta de ajuste e o erro puro.
O teste para falta de ajuste baseia-se na suposio de que, para um
conjunto de dados em que h medidas repetidas da varivel independente X, para diferentes medidas da varivel dependente Y, possvel
particionar a soma de quadrados do resduo em dois termos: um o
chamado Erro Puro e o outro, Lack of Fit do modelo (SEARLE, 1971).
obrigatrio se trabalhar com rplicas autnticas dos tratamentos para
permitir o clculo dos termos resultantes do desdobramento dos resduos, considerando-se que para cada valor de Xi tenham sido determinados ni respostas obtidas em repeties autnticas. Utiliza-se um segundo ndice, j, para identificar a repetio Yij. Para cada nvel i, teremos ni
resduos deixados pelo modelo, um para cada resposta repetida. Somando-se os quadrados de todos eles, em todas as repeties e em todos os
nveis, obtemos a soma quadrtica residual. Admitindo-se que hajam
nveis diferentes da varivel X, podem-se escrever as expresses: Soma
quadrtica dos resduos no nvel i ( SQr )i :
ni

( SQr )i = (Yij - Yi )2 (ni = nmero de medies no nvel i).

(5)

11

UFSM, 33(2)

Soma quadrtica residual:


m

ni

SQr = ( SQr )i = (Yij - Yi )2

(6)

(m=nmero de nveis distintos da varivel independente).


Cada resduo individual pode ser decomposto na diferena de dois
termos:

(Yij - Yi ) = (Yij - Yi ) - (Yi - Yi )

(7)

em que: Yi a mdia das respostas observadas no nvel i. Elevando-se ao


quadrado a equao (7) e, somando todas as observaes, teremos do
lado esquerdo a soma quadrtica residual, SQr. Do lado direto, obtm-se
as somas quadrticas das duas parcelas, pois o somatrio dos termos
cruzados se anula. Pode-se escrever, ento:
m

ni

(Y
i

ij

ni

ni

- Yi )2 = (Yij - Yi )2 + (Yi - Yi )2

(8)

O primeiro somatrio do lado direito reflete a disperso do sinal (resposta) Yij, em torno de suas mdias, Yi oferecendo uma medida do erro
aleatrio e, sendo, portanto, denominado de soma quadrtica devida ao
erro puro, SQep.
O segundo somatrio decorre do modelo e sua magnitude depende
do afastamento da estimativa Yi da respectiva mdia Yi . Esse termo fornece uma medida da falta de ajuste do modelo s respostas observadas,
sendo chamado, por isso, de soma quadrtica, devido falta de ajuste,
SQfaj. Assim, com a decomposio da soma quadrtica, obtm-se a tabela de anlise de varincia. A mdia quadrtica obtida pela diviso da
soma quadrtica pelo respectivo nmero de graus de liberdade.
Quando existirem medidas repetidas da varivel independente X para
diferentes medidas da varivel dependente Y, o modelo de regresso pode
ser ajustado de trs maneiras diferentes: utilizando os valores individuais de X e Y (considera todos os dados); com as mdias de Y para os
nveis de X (tratamentos) e, ainda, utilizando as mdias ponderadas de
Y pelo nmero de repeties de cada nvel de X (tratamento).

12

7-22, 2011

Nesse sentido, conforme Draper & Smith (1981), quando houver o


mesmo nmero de repeties para os nveis de X, os trs ajustes fornecem igual estimativa para os parmetros do modelo. Quando o nmero
de repeties diferente, a regresso realizada com todos os dados e a
regresso com as mdias ponderadas continuam fornecendo estimativas iguais dos parmetros, no entanto, a regresso com as mdias no
ponderadas apresenta estimativa diferente.
Em vista do exposto, este trabalho tem como objetivo ajustar um
modelo de regresso linear simples, atravs de trs estratgias: valores
individuais, com as mdias ponderadas e no ponderadas dos tratamentos, testar os pressupostos para adequao do modelo, bem como realizar a anlise de varincia decompondo a soma de quadrados do erro em
seus componentes. Alm disso, apresentar todos os procedimentos para
realizar as anlises, atravs do sistema computacional SAS v. 8.0
(Statististical Analysis System).

Material e mtodos
Os dados utilizados para o ajuste do modelo foram oriundos de um
experimento realizado em rea experimental do Departamento de
Fitotecnia da Universidade Federal de Santa Maria - RS. Neste experimento, foi estudado o efeito de trs densidades de plantas (tratamentos,
X) sobre a produo de fitomassa seca da parte area (MS, Y) de mamona
(kg). As densidades foram de 1,0, 1,2 e 1,4 m entre plantas, mantendo-se
constante o espaamento entre linhas, de 1,0 m. As programaes, realizadas no SAS v. 8.0, para aplicao da tcnica proposta, encontram-se
no Apndice 1.
Ajustaram-se os modelos de regresso, utilizando-se trs estratgias: os valores individuais de X e Y, as mdias ponderadas de Y pelo nmero de repeties dos nveis X e as mdias no ponderadas. Depois de
estabelecido o modelo de regresso, verificou-se a qualidade do ajuste.
O mtodo empregado para se avaliar numericamente a qualidade do
ajuste de um modelo foi a anlise de varincia (ANOVA) (Costa et al.,
2006). Para realizar a validao dos modelos, utilizaram-se procedimentos do SAS. As hipteses testadas, em termos gerais, para a validao dos modelos foram: H0: o modelo segue determinado pressuposto,

13

UFSM, 33(2)

contra H1: o modelo no segue determinado pressuposto. Uma forma


de testar a normalidade atravs de testes de aderncia, como o teste de
Shapiro-Wilk; pelo teste de White, verificou-se o pressuposto de
homogeneidade de varincias; a independncia dos resduos, atravs da
estatstica Durbin Watson; e a linearidade foi verificada atravs do teste
de F da anlise de varincia, todos fornecidos pelo programa
computacional SAS.

Resultados
Observa-se na, Tabela 1, que na anlise dos dados individuais e das mdias ponderadas, as estimativas dos parmetros do modelo so as mesmas. Porm, na anlise das mdias no ponderadas, h estimativas diferentes dos outros dois critrios, pelo fato de apresentar nmeros desiguais de repeties para os tratamentos (nveis de X). Quanto aos coeficientes de determinao, verifica-se que estes so sensivelmente melhores para os modelos obtidos atravs dos valores mdios. Uma regresso
com valores mdios sugere maior capacidade preditiva do que uma regresso sobre os dados individuais, uma vez que os valores mdios apresentam menor variabilidade que os valores individuais. Outro fato que
indica um melhor ajuste para os modelos com valores mdios o desvio
padro ( s) , que aparece com valores menores do que com os dados
individuais.
O desvio padro do modelo uma medida de variabilidade da distribuio condicional de Y para valores fixos de X. Utilizam-se todos os
resduos da reta ajustada de regresso para calcular o desvio padro do
modelo, pois se supe que todas as distribuies condicionais tenham a
mesma varincia. Dessa forma, o desvio padro do modelo serve como
referncia para a escolha do melhor modelo, isto , aquele que tem o
menor desvio padro (Hill et al., 1999).
As programaes para os ajustes dos modelos podem ser verificadas
no Apndice 1.
A falta de ajuste testada, com 1 e 18 graus de liberdade, no foi significativa, sendo o nvel de significncia alfa de 0,772 (Tabela 2). Isso mostra
que o modelo adequado para descrever o comportamento da produo
de fitomassa seca de mamona, em relao s diferentes densidades de

14

7-22, 2011

plantas. Alm disso, sendo o modelo adequado, o QM= 1099,32 pode


ser usado como estimador, no-tendencioso, da varincia do modelo
assim como do desvio padro. O pressuposto de linearidade, verificado
atravs do teste de F na anlise de varincia, indicou, para os modelos
ajustados, conforme os trs critrios, a aceitao da hiptese de
linearidade. Ou seja, a relao entre X e Y (diferentes densidades de
plantas e produo de fitomassa seca) pode ser descrita atravs de um
modelo linear.
Quando o pressuposto da linearidade violado, o pesquisador deve
verificar a necessidade de utilizar mais variveis para descrever o fenmeno em questo, ou estar ciente de que o modelo de regresso linear
no o melhor modelo explicativo para o estudo das variveis envolvidas.
Os testes aplicados para validao dos modelos encontram-se na Tabela 3 e, no Apndice 1, as programaes para realizao destes.
Verifica-se que, para os trs critrios adotados, no houve rejeio da
hiptese de normalidade dos resduos em nvel de 1% de erro. Usando o
proc model e atravs do comando fit, possvel realizar os trs testes
para validao do modelo. O proc model foi aplicado para os dados individuais e mdias no ponderadas. No entanto, para utiliz-lo, necessrio definir os parmetros do modelo atravs do subcomando parms,
sendo novamente estimados os parmetros e realizada a ANOVA. Para
as mdias ponderadas, foi utilizado o proc univariate. Primeiramente,
cria-se a varivel resduo com o subcomando var, sendo testada a varivel resduo pela opo normal. Mais detalhes dessa opo encontramse no Apndice 1.

Tabela 1. Modelos de regresso ajustados para a relao densidade de plantas (X) de


mamona e produo de massa seca da parte area (Y), conforme os valores individuais de
X e Y, as mdias ponderadas de Y pelo nmero de repeties dos nveis de X e as mdias
no ponderadas.
Pa r m etros
Mod elo

R2
b0

Pr>t

Da d os i n d i vi d ua i s

996,84

Md i a s pon d era d a s

996,84

Md i a s n o pon d era d a s

998,21

R2ajustado

b1

Pr>t

< 0 ,0 0 0

5 7 0 ,1

< 0 ,0 0 0 1

0,8958

0,8953

33,15

0,0106

5 7 0 ,1

0,015

0,9994

0,9989

9,99

0,0103

568,98

0,015

0,9994

0,9989

3 ,7 9

15

UFSM, 33(2)

Tabela 2. Anlise de varincia para os modelos de regresso ajustados para a relao


densidade de plantas (X) de mamona e produo de massa seca da parte area (Y),
conforme os valores individuais de X e Y, as mdias ponderadas de Y pelo nmero de
repeties dos nveis de X e as mdias no ponderadas.
Mod elos d e Regress o
Dado s Indi vi duai s
Fon tes d e Va ri a o

GL

SQ

QM

P r >F

Regress o

179535

179535

163,31

0 ,0 0 0 1

Res d uos

19

20887,22

1099,32

99,85

99,85

0,086461

0,7720

Erro puro

18

20787,37

1154,854

Tota l

20

200422

1797,88

0,0150

1803,00

0,0150

Fa lta d e a juste

Md i a s Pon d era d a s
Regress o

179535

179535

Res d uos

99,85

99,85

Tota l

179634

Md i a s n o Pon d era d a s
Regress o

25899

25899

Res d uos

14,365

14,365

Tota l

25914

GL=graus de liberdade, SQ= Soma de Quadrados, QM= Quadrado Mdio, F= F de


Snedecor, Pr>F= nvel de significncia.

Tabela 3 . Testes para validao dos modelos de regresso ajustados para a relao
densidade de plantas (X) de mamona e produo de massa seca da parte area (Y),
conforme os valores individuais de X e Y, as mdias ponderadas de Y pelo nmero de
repeties dos nveis de X e as mdias no ponderadas.
Testes
Cri tri os

Sha pi ro-Wi lk
Va lor

Whi te

Durb i n Wa tson

Va lor

Va lor

P<WD

P>DW

Da d os i n d i vi d ua i s

0 ,8 2

0,11

0,95

0,62

1,71

0,1788

0,8212

Md i a s pon d era d a s

0 ,8 1

0,15

2,00

0 ,5 7

2,99

Md i a s n o pon d era d a s

0 ,7 5

0,10

3 ,0 0

0,22

3 ,0 0

* no apresenta valor de P= probabilidade.

16

7-22, 2011

Com o teste de White, testou-se a igualdade de varincia dos erros


aleatrios. No houve a rejeio desse pressuposto para nenhum dos
modelos. Para test-lo, usa-se a opo fit, seguido do nome do teste,
no caso, White. Para o modelo com as mdias ponderadas, utilizou-se
o proc reg. Aps, definiu-se o modelo com a opo model.../SPEC. O
comando SPEC gera a estatstica do valor terico da distribuio Quiquadrado para o teste de White. Essa opo s vlida quando for definido o modelo no model.
Utilizando a estatstica de Durbin-Watson, observou-se que os resduos para os dados individualizados no so autocorrelacionados. Com
a opo DW, acrescido de /DWPROB, gerada a estatstica do teste
com as probabilidades para avaliar a existncia de correlaes negativas
e positivas dos resduos. Quando o valor de p < DW, indica que os resduos so correlacionados positivamente e, quando p >DW, ocorre uma
correlao negativa.
O SAS mostrou-se uma ferramenta estatstica extremamente verstil para a realizao dos procedimentos de anlise, os quais podem ser
realizados de duas formas diferentes. A primeira, atravs do proc model,
usando as opes parms e fit. A segunda forma por intermdio do
proc reg. Neste, os testes para validao so chamados separadamente,
ou seja, para cada teste, preciso usar um proc reg. Quanto escolha da
forma com que se queira montar a programao, fica a critrio do pesquisador, j que as duas se mostraram eficazes.
Conforme LEVINE et al. (2005), quando os resduos sucessivos so
positivamente autocorrelacionados, o valor da estatstica D ir se aproximar de zero. Se os resduos no forem autocorrelacionados, o valor de D
estar prximo de dois. Se existir autocorrelao negativa, o que raro,
D ser maior que dois e poderia se aproximar do seu valor mximo,
sendo igual a quatro. O valor obtido no teste D comparado na tabela
Durbin-Watson, o primeiro valor dl representa o valor crtico inferior,
quando no existe autocorrelao. Se D estiver abaixo de dl, existem
evidncias de autocorrelao entre os resduos. O segundo valor du
representa o valor crtico superior de D, acima do qual conclui-se que
no h evidncia de autocorrelao entre os resduos. No entanto, se D
estiver entre dl e du, no se pode tirar uma concluso definitiva. Baseado nessas informaes e de acordo com os resultados do teste DurbinWatson, para os modelos com as mdias ponderadas e no-ponderadas,

17

UFSM, 33(2)

no se tem um estudo conclusivo sobre a evidncia de autocorrelao


dos resduos para esses dois modelos. Quando se tem acesso a todos os
dados da pesquisa, a melhor estratgia seria estimar o modelo atravs
dos dados individualizados, j que este apresenta informaes mais precisas em relao variabilidade do conjunto original, o que no acontece quando se trabalha com as mdias. A escolha final do tipo de modelagem depende entre outros fatores da finalidade a que se destina o estudo e do tipo de resposta que o pesquisador busca.

Concluso
Por meio das trs estratgias utilizadas para modelagem em anlise de
regresso, usando dados individuais, mdias ponderadas e mdias no
ponderadas, as duas primeiras apresentaram os mesmos valores para
os parmetros do modelo ajustado. Na anlise de varincia para o modelo com os dados individuais, foi possvel verificar a decomposio da
soma de quadrados do resduo em seus componentes, erro puro e falta
de ajuste. Verificou-se que o teste s possvel se existirem repeties
nos nveis ou tratamentos. Pelas anlises dos pressupostos, o modelo
ajustado com os dados individuais apresentou resultados mais conclusivos em relao aos outros dois modelos. O SAS apresenta-se como
ferramenta verstil para a realizao dos procedimentos de anlises dos
modelos de regresso.

Referncias
CHARNET, R. et al. Anlise de modelos de regresso linear com
aplicaes. Campinas, SP: Unicamp, 1999.
COSTA, T. M. et al. Utilizao de planilha eletrnica para calibrao
instrumental, anlise da varincia e testes de significncia de um
mtodo espectromtrico. Revista Analytica, n. 21, p. 46-51, 2006.
DRAPER, N. R.; SMITH, H. Applied Regression Analysis.
JohnWiley&Sons:New York, 1981.

18

7-22, 2011

GAUDIO, A. C. ZANDONADE, E. Proposio, validao e anlise dos


modelos que correlacionam estrutura qumica e atividade biolgica.
Quim. Nova, v. 24, n.5, 658-671, 2001.
HILL, C. et al. Econometria. So Paulo: Saraiva, 1999.
LEVINE, D. M. et al. Statstica - teoria e aplicaes usando o
microsoft Excel em portugus, Rio de Janeiro: LTC, 2005. 3 ed.
SAS Institute Inc. SAS Software: Reference, Version 8, Cary, NC: SAS
Institute Inc., 1999.
SEARLE, S. R. Linear models. New York: John Wiley, 1971.
SOUZA, G. S. Introduo aos modelos de regresso linear e nolinear. Braslia: EMBRAPA SPI, 1998.
SUBRAMANIAN, A.; COUTINHO, A. S.; da SILVA, L. B. Aplicao
de mtodo e tcnica multivariados para previso de variveis
termoambientais e perceptivas. Produo, v. 17, n. 1, p. 052-070, 2007.

Submetido em: 04/04/2010


Aceito em: 08/07/2011

19

UFSM, 33(2)

APNDICE 1
Programao do SAS para execuo das anlises
dm output; clear; log; clear;;
options formdlim=* pageno=001 ls=80;
DATA reg;
INPUT X Y;
CARDS;

1 1572.08
1 1650.25
1.2
1638.34
1.2
1668.75

1.4
1775.38
1.4
1875.38;
;
PROC REG DATA=reg;
MODEL y= x; /*SQr*/
TITLE Anlise de regresso com as
observaes individulisadas;
run;
PROC ANOVA
DATA=reg;
CLASS X; MODEL Y = X ; /* SQep */
TITLE Obtendo a soma de quadrados
relacionada ao erro puro;
run;
PROC MEANS N MEAN NWAY;
CLASS X; VAR Y; OUTPUT OUT=MEANS N=NUM
MEAN=MY;
run;
PROC REG DATA=MEANS; WEIGHT NUM; /*
Residual = falta de ajuste */
TITLERegresso com as mdias ponderadas
dos tratamentos;
MODEL MY = X;
run;
PROC REG DATA=MEANS;

20

7-22, 2011

TITLE3 Regresso com as mdias no


ponderadas;
MODEL MY =X;
proc model data=reg;/*testando os
pressupostos para a anlise de regresso*/
title testando os pressupostos para os
dados individualisados;
parms A B;
y=A + B*X;
fit y/White normal DW DWPROB;/*DWPROB da a
probabilidade de Durbin Watson */
run;
proc model data=MEANS;/*testando os
pressupostos para a anlise de regresso*/
title testando os pressupostos para o
modelo com as mdias no ponderadas;
parms A B;
MY=A + B*X;
fit MY/White normal DW DWPROB;/*DWPROB da
a probabilidade de Durbin Watson */
run;
proc reg data=MEANS;WEIGHT NUM;/*outra
forma de testar os pressupostos para a anlise de
regresso*/
title testando os pressupostos de
homocedasticidade com modelo das mdias
ponderadas;
model MY=x/SPEC;
run;
proc reg data=MEANS;WEIGHT NUM;/*outra
forma de testar os pressupostos para a anlise de
regresso*/
title testando os pressupostos de
independncia dos resduos com modelo das mdias
ponderadas; model MY=x/DW DWPROB;
run;
proc reg; WEIGHT NUM;/*criando a varivel
resduo, que ser guardada no arquivo virtual B
com o nome de resduo */
model MY=x; /*para ser testado a sua
normalidade*/
output out=B R= resduo;

21

UFSM, 33(2)

title testando os pressupostos de


normalidade dos resduos com modelo das mdias
ponderadas;
proc univariate data=B normal; var
resduo;
run;
quit;

22

Você também pode gostar