Você está na página 1de 6

Estatstica Inferencial Prof.

Weber Campos
ANLISE DE VARINCIA DA REGRESSO Temos que o modelo de regresso linear dado por y i = + xi + ei , e a reta de

regresso estimada dada por y i = a + bxi , em que a e b so estimativas de e . O erro (ei) a diferena entre o valor verdadeiro de y e seu valor estimado ( yi ), ou seja: ei = y i y i
Isolando y i , teremos:

y i = y i + ei
Subtraindo os dois membros da equao acima pela mdia de y ( y ), teremos:

( y i y ) = ( y i y ) + ei
Aplicando o somatrio e elevando os dois membros ao quadrado, e aps algumas simplificaes, obteremos:

(y
Onde:

y ) = ( y i y ) + ei2
2 2

- y i so os valores observados da varivel Y, que fazem o par com os valores Xi.

- y i so os valores da varivel Y calculados a partir da reta de regresso.


- y a mdia da varivel Y.

- ei so os erros (resduos) da regresso, ou seja, ei = y i y i .


O termo

(y

y ) da expresso acima denominado de Soma de Quadrados Total


2

(SQTot) e mede a variabilidade dos valores de y i em torno de sua mdia y . O termo

(y

y ) denominado Soma de Quadrados da Regresso (SQReg) e


2

mede a variabilidade dos y i em torno de y , ou seja, representa a parte da SQTot que explicada
pela regresso Y contra X. O termo

2 i

a Soma de Quadrados dos Resduos (SQRes), e representa a parte

da SQTot que no explicada pela regresso de Y contra X. A relao entre as trs somas definidas acima , portanto, igual a: Soma de Quad. Total = Soma de Quad. da Regresso + Soma de Quad. dos Resduos

Vimos que a soma de quadrados da regresso dada por: SQRegresso =

(y

y)

Mas normalmente esta soma obtida atravs da seguinte frmula:

100 http://www.euvoupassar.com.br

Estatstica Inferencial Prof. Weber Campos


2 x 2 ( xi ) SQRegresso = b i n 2

ou SQRegresso =

b 2 ( xi x ) 2

A proporo da soma de quadrados total que explicada pela regresso linear denominada Coeficiente de Determinao (ou Explicao) e dada por:

r2 =

SQ Re g SQTot

O valor do Coeficiente de Determinao est entre 0 e 1, ou seja: 0 r2 1. Importante: O ajustamento da reta aos pontos observados tanto melhor quanto mais perto de 1 estiver o valor do coeficiente de determinao!!! Se r2 prximo de 1, isso significa que a variao explicada responde por uma grande percentagem da variao total. Se r2=0,81, por exemplo, indica que aproximadamente 81% da variao em y est relacionada com a variao de x e que 19% no explicado por x. Vejamos o que ocorre com a Soma dos Quadrados em duas situaes particulares: 1) Correlao Perfeita (r=1 ou r= -1): Nesta situao a reta ajustada passa exatamente sobre os pontos observados, assim todos os erros so iguais a zero: SQRes = 0 Da: SQTot = SQReg Coef. de Determinao (r2) = 1 2) Correlao Nula (r=0): Nesse caso a reta de regresso paralela ao eixo x (coeficiente angular (b) igual a zero) e coeficiente linear igual a y , logo: SQReg = 0 Da: SQTot = SQRes Coef. de Determinao (r2) = 0 Por definio, um Quadrado Mdio dado pelo quociente da diviso de uma soma de quadrados pelo respectivo nmero de graus de liberdade. O quadrado mdio do resduo QMRes

( ) =
2 e

SQRes n-2

O quadrado mdio da regresso QMReg = SQReg. = SQReg 1

101 http://www.euvoupassar.com.br

Estatstica Inferencial Prof. Weber Campos


A razo entre o QMReg e o QMRes tem distribuio de F com 1 e n-2 graus de liberdade. F= QMReg__ QMRes

Este valor pode ser usado para testar, ao nvel de significncia dado, a hiptese H0 : = 0. Na regresso linear simples, pode-se tambm calcular a estatstica F por meio do coeficiente de determinao (R2). Veja a demonstrao: F= F= QMReg__ = SQReg / 1__ = QMRes SQRes / n-2 SQReg x (n-2)__ = (n-2)_______ SQRes SQRes / SQReg

(n-2)_______ = (n-2) = (n-2) = (SQTot SQReg) / SQReg SQTot / SQReg SQReg / SQReg SQTot / SQReg 1 (n-2) 1 / R2 1 .

F=

Voc pode acrescentar ao seu formulrio esta ltima expresso. comum apresentar a decomposio da soma dos quadrados total, os valores dos quadrados mdios e o valor de F em uma tabela, conforme o seguinte esquema: Tabela de Anlise de Varincia da Regresso (ANOVA) Fonte Graus de Liberdade Soma de Quadrados Quadrado Mdio (ou Varincia)

b 2 ( xi x ) 2
Regresso 1 ou

( xi ) 2 b 2 xi n

SQ Re g 1
(varincia da regresso)

QM Re g QM Re s
com 1 e n-2 graus de liberdade

Erro (ou Resduo) n-2

e = ( y
2 i

y) 2 =

e2 =

= SQTotal SQRegressao.

SQ Re s (varinci n2
i

a do resduo)

Total

n-1

(y

y)

(y

y)

n 1

(varincia de y)

102 http://www.euvoupassar.com.br

Estatstica Inferencial Prof. Weber Campos

EXEMPLO: Construir a tabela de anlise da Varincia para uma amostra de 13 pares das variveis x e y, e sabendose que:

(x (x
Soluo:

x ) 2 = 192 y ) 2 = 1728 x )( y i y ) = 528

(y

O valor de b (coeficiente angular da reta de regresso) pode ser calculado pela frmula:

b=

( x x )( y y ) (x x)
i i 2 i

Substituindo os dados fornecidos no enunciado nesta expresso, teremos:

b=

528 = 2,75 192

Vamos encontrar o valor da Soma de Quadrados da Regresso:


2 SQReg = b

(x

x ) 2 = (2,75) 2 192 = 1452

A Soma de Quadrados Total SQTot =

(y

y ) , e este valor foi fornecido no enunciado:


2

(y

y ) = 1728
2

Passemos a Soma de Quadrados dos Resduos: SQRes = SQTot SQReg = 1728 1452 = 276

Vamos construir a tabela ANOVA:


Fonte Graus de Liberdade Regresso 1 Soma de Quadrados 1452 Quadrado Mdio (ou Varincia) 1452 (varincia da regresso) Erro (ou resduo) n-2= 13 - 2 = 11

1452 = 57,9 25,1


com 1 e 11 graus de liberdade

276

e2 =

276 = 25,1 11 1728 = 144 12

(varincia do resduo)

Total

n1= 13 - 1 = 12

1728

(varincia de y)

103 http://www.euvoupassar.com.br

Estatstica Inferencial Prof. Weber Campos

A estatstica teste para testar a hiptese H0 : = 0 o valor do F, o qual igual a 57,9. O coeficiente de determinao da regresso

r2 =

SQ Re g 1452 = = 0,84 = 84% SQTot 1728

Esse resultado significa que 84% da variao de y explicada pela varivel x.

# Varincias das Estimativas dos Parmentros Admitindo que os valores de xi so fixos e considerando que os ei so erros aleatrios, no correlacionados, com mdia nula e varincia constante 2. Ento, temos:

V (b) =

Quad . Mdio Re sduos ( xi x ) 2

1 V (a) = + n

X xi2

Para o exemplo anterior, teremos:

V (b) =

Q.M . Re s. 25,1 = = 0,13 2 ( xi x ) 192

104 http://www.euvoupassar.com.br

Estatstica Inferencial Prof. Weber Campos

EXERCCIOS 01. (IBGE 99 ESAF) Suponha que, numa regresso linear simples, observemos a seguinte tabela de anlise da varincia:

fonte total(corr.) regresso(b1) resduo

graus de lib. 18 1

SS 62,83 42,43

MS

O valor calculado da estatstica F que completa a tabela ento, aproximadamente, igual a: (A) 21,08 (B) 28,17 (C) 35,36 (D) 42,43 (E) 57,18 02. (Gestor Fazendrio MG 2005 ESAF) Suponha que no exista associao linear entre duas variveis X e Y e que um nmero de observaes suficientemente grande de pares (X,Y) esteja disponvel para o estudo da regresso linear de Y em X. Assinale a opo que corresponde, nesse caso, aproximadamente, ao quadrado mdio do erro. a) 0. b) Quadrado do coeficiente de correlao amostral entre X e Y. c) Quadrado mdio da regresso. d) 1. e) Varincia das observaes do atributo Y. 03. (Estatistico CEASA MG 2004) Uma medida da proporo da varincia em Y explicada por X conhecida como: a) coeficiente de no-determinao b) coeficiente de determinao c) regresso mltipla d) inclinao

Gabarito: 01. C 02. E 03.B

105 http://www.euvoupassar.com.br