Você está na página 1de 15

CAPTULO 9

PPGEP

REGRESSO LINEAR
SIMPLES

PPGEP
UFRGS

PPGEP/UFRGS

PPGEP

Regresso Linear Simples

Regresso Linear Simples

PPGEP

PPGEP

Assim, possvel construir um modelo relacionando


resistncia abraso com quantidade de leo, e ento
pode-se usar esse modelo para fins de otimizao e
controle de processo.

REGRESSO LINEAR SIMPLES


Algumas vezes a relao funcional entre Y e X1, ..., Xk

relacionadas ao valor gasto em marketing com esse


produto. Assim, possvel construir um modelo
relacionando vendas gastos com marketing, e ento
pode-se usar esse modelo para fins previso de vendas.

Regresso Linear Simples

Regresso Linear Simples

Outro exemplo, as vendas de um produto podem estar

Em geral vamos supor que h uma varivel dependente


(ou varivel de resposta) Y que depende de k variveis
independentes (ou variveis regressoras) X1, ..., Xk.

A relao entre essas variveis ser descrita por um


modelo matemtico, chamado modelo de regresso, o
qual definido (ajustado) a um conjunto de dados.
PPGEP/UFRGS

Em muitos problemas h duas ou mais variveis que


so relacionadas, e pode ser importante modelar essa
relao.
Por exemplo, a resistncia abraso de um composto
de borracha pode depender da quantidade de leo
adicionada mistura.

PPGEP/UFRGS

REGRESSO LINEAR SIMPLES

REGRESSO LINEAR SIMPLES

conhecida exatamente. Outras vezes o pesquisador dever


buscar o modelo apropriado testando diferentes funes.

Modelos polinomiais so largamente utilizados como uma


funo aproximada da verdadeira relao entre Y e X, e
por isso sero descritos no captulo 10.

PPGEP/UFRGS

PPGEP

REGRESSO LINEAR SIMPLES

PPGEP

Para uma amostra de n pares de valores (x,y) o


coeficiente de correlao r fornece uma medida da relao
linear que existe entre duas variveis aleatrias X e Y.

PPGEP

Mas a anlise de regresso tambm muito til no caso


de experimentos planejados que incluem fatores a nveis
contnuos. Nesse caso a anlise de varincia usada para
identificar os fatores significativos, e a seguir a anlise de
regresso usada para construir um modelo que incorpore
esses fatores.

S xx =

2
xi

PPGEP

( xi )
n

S xy =

yi2 ( yi ) 2

Covarincia de X,Y:

xi yi ( xi )( yi )
n

Coeficiente de correlao
Para uma interpretao adequada do coeficiente de

Desvio-padro de Y:
S yy =

PPGEP/UFRGS

Clculo do coeficiente de correlao


Desvio-padro de X:

Regresso Linear Simples

Regresso Linear Simples

anlise de dados provenientes de experimentos no


planejados (observaes de um fenmeno no controlado
ou dados histricos).

Regresso Linear Simples

Regresso Linear Simples

Modelos de regresso so usados com freqncia na

PPGEP/UFRGS

Correlao

r ( x, y ) =

PPGEP/UFRGS

S xy
S xx S yy

correlao, X e Y deveriam ser variveis aleatrias, ao


contrrio do que acontece nos problemas de regresso,
onde Y aleatria, mas X considerada uma varivel fixa.

Mesmo assim, prtica comum calcular r em quase


todos os casos, isto , com X aleatria ou no. O
coeficiente de correlao linear r mede a intensidade da
relao linear entre duas variveis

PPGEP/UFRGS

Coeficiente de correlao linear

PPGEP

Deve-se ter em conta que r uma medida da relao

intensidade da relao linear entre duas variveis

linear entre as duas variveis e no tem sentido quando a


relao no linear.

O coeficiente de correlao varia de -1 r +1:


Valores de r prximos de +1 indicam uma forte
correlao positiva entre x e y
Valores de r prximos de -1 indicam uma forte
correlao negativa entre x e y
Valores de r prximos de 0 indicam uma fraca
correlao entre x e y

PPGEP/UFRGS

PPGEP

Coeficiente de correlao linear

O coeficiente de correlao linear r mede a


Regresso Linear Simples

Regresso Linear Simples

PPGEP

Alm disso, o pesquisador deve ter em mente que a


existncia de uma correlao entre duas variveis no
implica necessariamente na existncia de um
relacionamento de causa e efeito entre elas.

PPGEP/UFRGS

Por exemplo.

PPGEP

10

Rendimento de combustvel

Exemplo 9.1: Aps uma regulagem eletrnica um veculo


apresenta um rendimento ideal no que tange a consumo

12

rendimento vai se degradando.

Os dados a seguir

Regresso Linear Simples

Regresso Linear Simples

de combustvel. Contudo, com o passar do tempo esse


representam o rendimento medido ms a ms aps a
regulagem. Ajuste um modelo linear a esses dados.

X:meses aps a regulagem


Y : rendimento
X:meses aps a regulagem
Y : rendimento

1
10,7
7
9,0

2
10,9
8
9,3

PPGEP/UFRGS

3
10,8
9
7,6

4
9,3
10
7,6

5
9,5
11
7,9

6
10,4
12
7,7

11

Co

11
10
9
8
7
0

10 12

Tempo aps a regulagem


PPGEP/UFRGS

12

Clculos iniciais

PPGEP

xi = 78,00 ;
yi = 110,70 ;

X^2
1
4
9
16
25
36
49
64
81
100
121
144
650

Y^2
114,49
118,81
116,64
86,49
90,25
108,16
81
86,49
57,76
57,76
62,41
59,29
1039,55

X*Y
10,7
21,8
32,4
37,2
47,5
62,4
63
74,4
68,4
76
86,9
92,4
673,1

xi2 = 650,00;
yi2 = 1039,55;

PPGEP/UFRGS

PPGEP

PPGEP

46,45

xy
Coeficiente de correlao: r = S S = 143,00 x 18,34 = 0,907
xx
yy

Interpretao: Existe uma correlao linear inversa na amostra


entre meses aps a regulagem e rendimento. A intensidade
desta correlao forte.

14

Teste de hiptese para coeficiente de


correlao
Assim a hiptese da existncia de uma relao entre X e

pode ser formulada usando-se:


H0 : = 0

Regresso Linear Simples

Regresso Linear Simples

Covarincia de X,Y: SXY = xi yi (xi )( yi ) n = 673,1 (78110,70) /12 = 46,45

PPGEP/UFRGS

A hiptese da existncia de uma relao entre X e Y,

H1 : 0

onde a letra usada para representar o valor


populacional do coeficiente de correlao. Pode ser
demonstrado que o valor de t pode ser calculado usando:

r n2
1 r2
PPGEP/UFRGS

2
Desvio-padro de X: S XX = xi2 ( xi ) n = 650 (78)2 / 12 = 143,00

13

Teste de hiptese para coeficiente de


correlao

t=

Clculos

Desvio-padro de Y: SYY = yi2 ( yi )2 n = 1039,55 (110,70)2 / 12 = 18,34

Regresso Linear Simples

Meses(X) Rendimento(Y)
1
10,7
2
10,9
3
10,8
4
9,3
5
9,5
6
10,4
7
9
8
9,3
9
7,6
10
7,6
11
7,9
12
7,7
78
110,7
6,5
9,225

Regresso Linear Simples

PPGEP

15

Y pode ser verificada diretamente a partir do valor amostral


do coeficiente de correlao. Como sempre a hiptese nula
ser rejeitada se o valor calculado for maior que o tabelado:

t > t / 2,n 2

Para o exemplo em estudo tem-se:


t=

0,907 12 2
1 ( 0,907)2

= 6,82 > t0,025;10 = 2,228 rejeita - se H 0,

ou seja, descarta-se a hiptese nula e conclui-se que


existe correlao entre as variveis estudadas.
PPGEP/UFRGS

16

PPGEP

Regresso Linear Simples

PPGEP

E suponha que a relao entre Y e X seja

A regresso linear simples estima uma equao

aproximadamente linear. Ento o valor esperado de Y para


cada valor de X vir dado por:

independente), prev o valor de Y (varivel dependente).

Regresso Linear Simples

Regresso Linear Simples

matemtica (ou modelo) que dado o valor de X (varivel

dito relao linear simples, pois supe-se tendncia


linear entre as variveis e simples por ser uma nica
varivel independente

Seja que existam dados coletados (pares de valores)


associando uma varivel de resposta Y com uma
varivel regressora X.

PPGEP/UFRGS

enquanto que 1 a inclinao da reta, que pode ser


positiva, negativa ou nula.

PPGEP

Regresso Linear Simples

Regresso Linear Simples

Y = 0 + 1 X + (1)

onde o erro aleatrio, com mdia 0 e varincia 2.


A eq. (1) chamada de modelo de regresso linear
simples.

Clculos iniciais
xi = 78,00 ; xi2 = 650,00
yi = 110,70 ; yi2 = 1039,55

18

; X = 6,50
; Y = 9 ,225

L = (yi - b0 - b1 xi)2

onde b0 e b1 so estimativas amostrais de 0 e 1. O


uso do mtodo conduz s seguintes estimativas:
Humm...
Mas, como
estimar bo e b1 ?

PPGEP/UFRGS

desconhecidos. Vamos supor que cada observao Y


possa ser descrita pelo modelo:

S XX = xi2 ( xi ) n = 143

estimar os parmetros 0 e 1 usando o mtodo dos


Mnimos Quadrados e tendo como objetivo minimizar:

bo = Y b1 X

onde os parmetros da relao linear, 0 e 1, so

PPGEP/UFRGS

Se h n pares de dados (y1, x1), ..., (yn, xn) possvel

b1 = SXY / SXX

E (Y/X) = 0 + 1 X

17

O coeficiente 0 a interseo (valor de Y para X = 0)

PPGEP

Regresso Linear Simples

19

DE NOVO

SYY = yi2 ( yi ) n = 18,34


2

SXY = xi yi ( xi )( yi ) n = 46,45
Estimativa dos parmetros:
b1 = SXY / SXX = -46,45 / 143,00 = -0,325
b0 = = 9,225 - (-0,325) 6,50 = 11,34
Equao de regresso
Y = 11,34 - 0,325 X
PPGEP/UFRGS

20

PPGEP

Relao entre o Coeficiente de


Correlao e a Regresso

PPGEP

O valor de r um valor sem dimenso, que apenas

Decomposio dos resduos


Yi

fornece uma idia da relao linear entre duas variveis.

Regresso Linear Simples

Regresso Linear Simples

Pode ser demonstrado que existe a seguinte relao:


S2 =

n 1
(1 r 2 ) S y2
n2

onde S2 a varincia dos desvios em relao ao


modelo, e a varincia dos valores de Y.

Se n grande, temos:
S

1 r S 2y
PPGEP/UFRGS

PPGEP

(Yi Y )

relao entre as duas variveis, tambm se encontra uma


equao que pode ser usada para fornecer estimativas.

(Y$i Y )

Para o exemplo analisado resultou r =(-0,907)2 = 0,82,

Xi

Nessa forma observamos que r2 equivale a proporo da


varincia dos valores de Y que pode ser atribuda
regresso com a varivel X.

r2 conhecido como coeficiente de Determinao.


PPGEP/UFRGS

21

PPGEP

Para verificar a preciso das estimativas, determinar

18% da variabilidade total devido a outros fatores que

Pode ser demonstrado que uma estimativa da varincia

no foram investigados

Tambm pode ser demonstrado que:


r = b1 SX / SY

Assim, dado um conjunto de pares (x,y), conhecida a


inclinao b1, possvel calcular o coeficiente de
correlao r, ou vice-versa.
PPGEP/UFRGS

23

22

Varincia dos Estimadores

ou seja, 82% da variabilidade nos resultados de rendimento


de combustvel pode ser devida ao tempo decorrido aps a
regulagem.

intervalos de confiana e testar hipteses importante


conhecer a varincia dos estimadores.

Regresso Linear Simples

Regresso Linear Simples

No caso de regresso, alm de se ter uma idia da

Y= bo+b1 X

(Yi Y$i )

residual, 2, vem dada por


S2 = SQR / (n-2)
SQR = SYY b1SXY

E a partir de 2 obtm-se as estimativas das varincias


de b1 e b0 :
Sb2 1 = S 2 S XX
1 X 2
Sb2 0 = S 2 +

n S XX
PPGEP/UFRGS

24

Intervalos de Confiana e Testes de Hiptese


PPGEP

PPGEP

Como os resduos de Y supostamente seguem a

Isto , testa-se se a inclinao igual a zero, o que

distribuio Normal, e como os valores de a e b so


funes lineares de Y, possvel demonstrar que:

equivale a testar se existe uma relao entre Y e X.


Usando a eq. (2) tem-se:

(
)
b1 N (1 ,b2 1 )

Regresso Linear Simples

Regresso Linear Simples

b0 N 0 ,b2 0

Esses resultados podem ser usados em testes de


hiptese. Por exemplo, se a hiptese :
H 0 : 1 = 10
H 1 : 1 10

ento calcula-se:
Z = (b1 - 10) / b1
PPGEP/UFRGS

PPGEP/UFRGS

e nesse caso H0 rejeitada se t > t / 2 ,n2 .

Regresso Linear Simples

Regresso Linear Simples

PPGEP

(2)

O intervalo de confiana para 1 vir dado por


b1 t / 2 Sb 1 < 1 < b1 + t / 2 Sb 1

Uma hiptese testada com freqncia :


H 0 : 1 = 0
H 1 : 1 0

PPGEP/UFRGS

Como sempre, H0 ser rejeitado se t > t / 2 ,n 2 .

26

Exemplo 9.3: Usando os dados do problema do consumo

se resultar Z > Z / 2 . Como em geral a varincia S2 no


conhecida, usa-se:
t = (b1 - 10) / Sb1

que deve ser comparado com o valor tabelado t / 2 ,n 2 .

25

e, para um nvel de probabilidade , H0 ser rejeitada


PPGEP

t = b1 / Sb1

27

de combustvel, obtenha as estimativas para a varincia


residual e para a varincia dos parmetros b0 e b1.
Construa um intervalo de confiana para a inclinao b1
e verifique a hiptese .

Estimativa das varincias


SQR = SYY b1S XY = 3,24

S 2 = SQR /( n 2 ) = 0 ,324 ;
Sb21 = S 2 / S XX = 0 ,00227
1 X2
Sb20 = S 2 +
n S XX

S = 0 ,569
;

= 0 ,123 ;

PPGEP/UFRGS

Sb 1 = 0 ,0476
Sb 0 = 0,351

28

PPGEP

PPGEP

Intervalo de confiana para b1

A anlise de regresso produz uma relao entre as


variveis consideradas, a qual pode ser usada para prever
valores de Y.

-0,325 - 2,228 (0,0476) < 1 < -0,325 + 2,228 (0,0476)

Regresso Linear Simples

Regresso Linear Simples

t0,025;10 = 2,228

-0,431 < 1 <-0,219

Como esse intervalo no inclui o zero, a hiptese 1 =


0 rejeitada, ou seja, existe uma relao entre o
consumo de combustvel e o tempo decorrido aps a
regulagem.

PPGEP/UFRGS

PPGEP

PPGEP

valor mdio de Y vem dada por:

= S

( x 0 X ) 2
S XX

PPGEP/UFRGS

Nos dois casos a estimativa pontual de Y a mesma,


mas a amplitude do intervalo de confiana diferente.
O intervalo de confiana mais amplo para o caso de
previses de valores individuais.
30

Previso de um valor mdio de Y


quando x0 = X e aumenta quando x0 afasta-se de X .

Pode ser demonstrado que a varincia da previso de um

2 1

previso: previso de um valor mdio de Y e previso de


um valor individual de Y.

Como pode ser visto, a varincia da previso mnima

Regresso Linear Simples

Regresso Linear Simples

A varincia dos valores preditos ir depender no somente


de S2, mas tambm do valor de x0. Isso acontece porque
as previses so mais precisas quando x0 X e menos
precisas quando x0 aproxima-se dos extremos
investigados.

Dado um certo valor de X = x0, h dois tipos de

PPGEP/UFRGS

29

Previso de um valor mdio de Y

S Y2 p

Previso de valores de Y

31

Assim, o intervalo de confiana para a previso de um


valor mdio vir dado por:

( )

Y = (b0 + b1 X0) t/2 ; n-2 SY

PPGEP/UFRGS

32

Previso de um valor individual de Y


PPGEP

PPGEP

A varincia da previso de valores individuais de Y segue

Pode ser demonstrado que a varincia da previso de um

Regresso Linear Simples

Regresso Linear Simples

o mesmo comportamento observado para os valores


mdios. Contudo, a varincia maior no caso de valores
individuais.
valor individual de Y vem dada por:
1 (x X )2
2
= S 2 1 + + 0
SYp

S XX
n

De modo que o intervalo de confiana para a previso de


um valor individual de Y :

( )

Y = (b0 + b1 X0) t/2 ; n-2 SY p

PPGEP/UFRGS

PPGEP

9
8
7
4

8 10 12

Tempo aps a regulagem


PPGEP/UFRGS

SY2 p = 0 ,324 + 0 ,0157 = 0 ,0321 ;


12

SY2 p = 0 ,324 1 + + 0 ,0157 = 0 ,356 ;


12

SY

= 0 ,179

SY

= 0 ,597

34

Anlise da Validade do Modelo


podem ser verificadas atravs de uma anlise dos
resduos. Os resduos padronizados so calculados como:

11
10

S XX

A adequao do ajuste e as suposies do modelo

12

( x0 X ) 2 = 0,0157

PPGEP/UFRGS

Regresso Linear Simples

Regresso Linear Simples

Y = 8,74 2,228 . (0,179)


Y = 8,74 0,399
Valor individual para x0 = 8
Y = 8,74 2,228 . (0,597)
Y = 8,74 1,33

Co

(b0 + b1 x0) = 8,74 ;

33

Valor mdio para x0 = 8


PPGEP

Usando os dados do problema do consumo de


combustvel, obtenha os intervalos de confiana de 95%
para a previso de um valor mdio e um valor individual
de Y para um tempo x0 = 8 meses.

35

Ri = yi ( b0 + b1xi )
S

SQR = SYY b1SXY

S2 = SQR / n 2

Adequao do ajuste
A adequao do ajuste testada plotando os resduos em
funo de X. Se o ajuste for bom, os resduos seguiro um
padro aleatrio. Caso contrrio, alguma tendncia
curvilnea ser observada.

PPGEP/UFRGS

36

Na figura a seguir, (a) representa uma situao onde o


ajuste adequado, enquanto (b) representa uma situao
onde o modelo linear no se ajusta bem aos dados.
2

Re 0

Re 0

-1

-1

(a)

12

16

20

12

16

20

(b)

Se o modelo linear no fornece um bom ajuste, s vezes o


problema pode ser contornado trabalhando-se com valores
transformados de X ou Y, por exemplo,
Y = b0 + b1 X
Y = b0 + b1 X

onde X =

PPGEP

Se a suposio de homogeneidade da varincia

3
2

Re 0

Re 0

-1

-1
-2

-2
0

(a)

12

16

20

-3
0

12

16

20

(b)
38

Normalidade dos Resduos


O teste da normalidade da distribuio dos resduos pode

rejeitada, pode-se usar o mtodo da regresso linear


ponderada, onde se busca os valores de 0 e 1 que
minimizam

Regresso Linear Simples

Regresso Linear Simples

se a suposio de homogeneidade, enquanto que em (b) essa


suposio violada.

PPGEP/UFRGS

37

Homogeneidade da varincia

L = wi (yi - (b0 + b1 xi))2

Nesse caso, os pesos wi so inversamente


proporcionais varincia.

PPGEP/UFRGS

A suposio de homogeneidade da varincia 2 ao longo


de todo o intervalo de X tambm pode ser verificada
analisando o grfico de Resduos X.

-2

-2

Homogeneidade da varincia

A figura a seguir apresenta uma situao (a) onde verifica-

PPGEP/UFRGS

PPGEP

PPGEP

Regresso Linear Simples

Regresso Linear Simples

PPGEP

39

ser feito plotando-se os resduos em papel de probabilidade


ou utilizando testes analticos de normalidade, como o teste
do Chi-quadrado ou o teste de Kolmorov-Smirnov.

Se a suposio de normalidade rejeitada, muitas vezes


uma transformao matemtica nos valores de X e Y
(logaritmo, inverso, raiz quadrada) ir gerar valores
transformados com resduos normalmente distribudos.

Ento o problema analisado no espao das variveis


transformadas e ao final retorna-se ao espao original.

PPGEP/UFRGS

40

PPGEP

A Anlise de Varincia e a Regresso

Intervalo de Variao para X

PPGEP

A anlise de varincia tambm aplicvel aos


problemas de regresso. Na regresso simples, podemos
decompor os resduos da seguinte maneira:

o intervalo de variao de X. Se o intervalo pequeno,


Sb1 ser grande e nesse caso ser difcil rejeitar a
hiptese H0 : b1 = 0.

Regresso Linear Simples

Regresso Linear Simples

A varincia da inclinao b1 aumenta quando se reduz

Em outras palavras, se a relao entre X e Y medida


em um intervalo reduzido de X, os parmetros estimados
no tero muito significado estatstico.

Se o objetivo construir um modelo de regresso, devese coletar dados nos extremos do intervalo de X, ou
seja, nos limites de interesse e viabilidade prticos ou
nos limites em que se supe vlida a relao linear.

PPGEP/UFRGS

(Yi Y ) 2 = [ yi (b0 + b1 X i )] + [ ( b0 + b1 X i ) Y ]
2

Uma vez que o produto cruzado resulta nulo. Essa


equao tambm pode ser escrita como:
SYY = SQR + SQReg

Cujos graus de liberdade valem respectivamente:


(n - 1) = (n - 2) + 1
PPGEP/UFRGS

A Anlise de Varincia e a Regresso


PPGEP

Assim, a mdia quadrada associada com o modelo de

42

Tabela ANOVA
A tabela ANOVA, contendo o formulrio prtico para o

regresso e a mdia quadrada dos resduos resultam:

clculo das Somas Quadradas e os demais


desenvolvimentos at o teste F

MQReg = SQReg / 1
MQR = SQR / (n - 2)

Regresso Linear Simples

Regresso Linear Simples

Elevando ao quadrado e somando, obtm-se:

41

PPGEP

E o teste F feito comparando MQReg, com MQR,


ou seja,
F = MQReg / MQR

A hiptese nula, H0 : 1 = 0, ser rejeitada sempre que


F > F, 1, n-2

A seguir apresenta-se a tabela ANOVA, contendo o


formulrio prtico para o clculo das Somas Quadradas
e os demais desenvolvimentos at o teste F.
PPGEP/UFRGS

(Yi Y ) = [ yi (b0 + b1 X i )] + [ ( b0 + b1 X i ) Y ]

43

Fonte de
Variao
Regresso
Residual
Total

SQ

GDL

MQ

SQReg = b1 SXY
SQR=SYY - b1SXY
SYY

1
n-2
n-1

MQReg
MQR

MQReg/MQR

PPGEP/UFRGS

44

Exemplo 9.5: Faa a anlise de varincia para o problema


PPGEP

do consumo de combustvel e confirme a significncia do


modelo de regresso linear.

PPGEP

Soluo:

SYY = 18,34

SXY = - 46,45

b1 = - 0,325

SQR = 3,24
Assim
SQReg = b1 SXY = - 0,325 (- 46,45) = 15,10

De modo que a ANOVA resulta:

PPGEP/UFRGS

PPGEP

Regresso Linear Simples

Regresso Linear Simples

J tnhamos calculado as Somas Quadradas SYY e SQR


como:

GDL

MQ

15,10
3,24
18,34

1
10
11

15,10
0,324

46,6

O valor de F calculado (46,6) muito maior que o


tabelado (4,96) e assim confirma-se a significncia do
modelo.

Nota: o coeficiente de determinao r2 tambm pode


ser calculado usando:
r2 =

SQ Re g 15,10
=
= 0,82 ou 82%
18,34
SYY
46

PPGEP

Se o conjunto pode estar contaminado por vrios

Algumas vezes, o conjunto de dados pode estar


contaminado com alguns dados atpicos. Esses dados
atpicos podem ser o resultado do efeito de algum fator
externo ao estudo, ou podem ser simplesmente um erro
de leitura e registro.

Regresso Linear Simples

Regresso Linear Simples

SQ

PPGEP/UFRGS

45

Dados Atpicos

Fonte de
Variao
Regresso
Residual
Total

Existe um procedimento para testar a significncia de


um dado atpico. Este procedimento est baseado na
determinao de uma nova equao, com o dado atpico
eliminado, seguido de um teste de hiptese comparando
os valores preditos pela equao original com aqueles
preditos pela nova equao.
PPGEP/UFRGS

47

dados atpicos, a soluo ser usar tcnicas de


regresso robusta. Neste tipo de anlise, dado um
peso menor queles dados que se afastam do conjunto.
Por exemplo, uma alternativa minimizar
L = wi [yi - (b0 + b1 xi)]2

onde os pesos wi so proporcionais ao inverso do

resduo Ri. A soluo obtida aps algumas iteraes.

PPGEP/UFRGS

48

PPGEP

Regresso No Linear Simples

PPGEP

Se o ajuste linear deficiente, muitas vezes possvel

Note-se que o mtodo dos mnimos quadrados aplicado

encontrar uma soluo aproximada, e em geral satisfatria,


utilizando uma transformao em X e/ou em Y.

aos valores transformados, isto , minimizando

f(y) = b0 + b1 g(X) +
Y* = b0 + b1 X* +

Os possveis valores de
etc. Igualmente, para
ln x, etc.

X*

y2 ,

= f(y) seriam y, 1/y,


ln y,
= g(x) poderamos usar x, 1/x, x2,

Uma vez definida a transformao, e confirmada em um


grfico de disperso a relao aproximadamente linear
entre Y* e X*, poderia-se usar o mtodo apresentado
anteriormente para obter as estimativas de 0 e 1.
PPGEP/UFRGS

PPGEP

Regresso Linear Simples

Regresso Linear Simples

Em forma genrica, teramos:

Y*

L = [ f (yi) - (b0 + bi g (xi))]2,

no vai fornecer os mesmos resultados que seriam obtidos


minimizando
L = [ yi - h (xi)]2,
onde h (x) uma funo no linear de x.

Contudo, as diferenas em geral so pequenas e no


comprometem a anlise.

PPGEP/UFRGS

49

50

9.3 Calcule os resduos padronizados Ri = [Yi - (b0 + b1

Exerccios

PPGEP

9.1 Em um processo qumico, a quantidade de slidos


depositada pode depender da concentrao de um
componente A que adicionado mistura. Ajuste um
modelo de regresso linear aos dados que aparecem a
seguir. Depois plote a reta de regresso e os valores
observados.
Conc. 0
0
0
2
2
2
4
4
4
6
6
6
8
8
8
Depos. 13,3 11,5 12,9 14,1 13,3 16,1 14,9 15,9 18,1 17,5 16,5 18,9 20,3 18,5 20,2

9.2 Para os dados do exerccio 9.1, calcule a varincia


residual e a varincia dos parmetros b0 e b1. Depois
construa um intervalo de confiana de 95% para a
inclinao b1 e verifique a hiptese H0 : 1 = 0.
PPGEP/UFRGS

Xi)] / S para os dados do exerccio 9.1. Em seguida, plote


um grfico de Resduos X e verifique se h evidncias
de falta de ajuste do modelo linear ou falta de
homogeneidade da varincia.

9.4 Ainda em relao aos dados do exerccio 9.1, calcule


Regresso Linear Simples

Regresso Linear Simples

Regresso No Linear Simples

51

os intervalos de confiana para um valor mdio e para um


valor individual de Y usando x0 = 0 e x0 = 8.

9.5 Um torno mecnico pode ser operado a diversas

velocidades. Contudo, a qualidade do acabamento, ou seja,


a rugosidade superficial, pode piorar com o aumento da
velocidade de operao. Ajuste um modelo de regresso
linear aos dados que aparecem a seguir e depois plote a
reta de regresso e os valores observados.
Velocidade
Rugosidade

3
3
3
6
6
6
9
9
9
12 12 12
26,0 21,5 33,5 36,0 27,5 37,0 41,5 28,0 39,5 43,0 37,0 50,5

PPGEP/UFRGS

52

PPGEP

PPGEP

tropical suspeita que h uma correlao entre a temperatura


do dia e produtividade. Dados coletados aleatoriamente ao
longo de um perodo de seis meses revelaram o seguinte:

9.7 Faa a anlise de varincia para os dados do exerccio


9.5 e confirme a significncia do modelo de regresso linear.
Em seguida calcule o valor do coeficiente de determinao e
indique qual o significado tcnico desse coeficiente para o
problema em questo.

PPGEP/UFRGS

Regresso Linear Simples

Regresso Linear Simples

9.6 Para os dados do exerccio 9.5, calcule a varincia


residual e a varincia dos parmetros b0 e b1. Depois,
construa um intervalo de confiana de 95% para a inclinao
b1 e verifique a hiptese da existncia de uma relao entre
velocidade e rugosidade superficial.

9.8 O gerente de uma indstria localizada em um pas

Temperatura
Produtividade

21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8

Temperatura
Produtividade

27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7

142

132

148

131

137

132

124

117

145

122

138

131

144 136 141 124

124

111

119

133

129

123

128

116

9.9 Calcule o valor do coeficiente de correlao entre a


Temperatura e a produtividade e verifique a hiptese H0 :=0.
Depois plote um grfico de disperso e visualize a natureza
da correlao entre Temperatura e Produtividade.

PPGEP/UFRGS

53

54

9.9 A anlise de 20 pares de valores indicou que a


PPGEP

resistncia trao (Y) de uma fibra sinttica usada na


indstria txtil guarda uma relao linear com a
percentagem de algodo (X) presente na fibra. A equao
obtida foi Y = 35,7 + 0,85X (X fornecido em percentagem,
equao vlida para o intervalo de X entre 20 e 35%).
Conhecidos os valores das Somas Quadradas SXY=43,68
e SYY=79,43 pede-se:

9.10 Um sofisticado simulador estocstico de trfego


fornece a velocidade mdia em avenidas de uma
metrpole em funo do volume de automveis. O
resultado de 14 simulaes revelou o seguinte:

Regresso Linear Simples

Regresso Linear Simples

PPGEP

a) Faa a anlise de Varincia e conclua a respeito da


significncia do modelo.
b) Calcule o valor do coeficiente de determinao r2 e
indique qual o seu significado tcnico.

PPGEP/UFRGS

55

V o l. d e
T r fe g o
V e lo c id .
M d ia

10

10

15

15

20

20

25

25

30

30

9 5 ,6

9 3 ,8

7 4 ,4

7 4 ,8

5 0 ,5

5 1 ,5

4 4 ,6

4 2 ,4

3 5 ,8

3 8 ,7

3 2 ,0

3 ,2

3 0 ,1

2 9 ,1

Ajuste um modelo linear a esses dados e ache a equao


de regresso Y = b0+ b1 X

PPGEP/UFRGS

56

PPGEP

Regresso Linear Simples

9.11 Calcule os resduos padronizados para os dados do


exerccio 9.10. Aps, plote um grfico de Resduos X e
verifique se h evidncias de falta de ajuste do modelo
linear.

9.12 Utilize o seguinte modelo para ajustar os dados do

exerccio 9.10: Y=b0 + b1 (1 / X). Estime o valor dos


coeficientes b0 e b1 para esse modelo no linear e depois
repita a anlise de resduos pedida em 9.11, verificando se
para o presente modelo h evidncias de falta de ajuste.

PPGEP/UFRGS

57