Escolar Documentos
Profissional Documentos
Cultura Documentos
Lor Prof. Lor Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ ://www.mat.ufrgs.br http://www.mat .ufrgs.br/~viali/
UFRGS
A anlise de regresso uma tcnica estatstica para modelar e investigar o relacionamento entre duas ou mais variveis.
De fato a regresso pode ser dividida em dois problemas: (i) o da especificao e ii) ( ii) o da determinao.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
O problema da especificao descobrir dentre os possveis modelos (linear, quadrtico, exponencial, etc.) qual o mais adequado.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
O problema da determinao uma vez definido o modelo (linear, quadrtico, exponencial, etc.) estimar os parmetros da equao.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
A varivel resposta Y aleatria, Normalmente suposto que exista uma varivel Y (dependente ou resposta), que est relacionada a k variveis (independentes ou regressoras) Xi (i = 1, 2, ..., k).
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
enquanto que as variveis regressoras Xi so normalmente controladas O controladas. relacionamento caracterizado entre por uma elas equao
Quando
existir
apenas
uma
varivel regressora (X) tem-se a simples, regresso simples se Y depender de duas ou mais variveis regressoras, ento tem-se a regresso mltipla regresso mltipla.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Vamos supor que a regresso do tipo simples e que o o modelo seja linear, linear isto , vamos supor que a equao de regresso seja do tipo: Y = + X + U
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Y = + X + U;
x1
Prof. Lor Viali, Dr.
x2
UFRGS
xn
O termo U o termo erro, isto , U representa outras influncias sobre a varivel Y, alm da exercida pela varivel X. A variao residual (termo U) suposto de mdia zero e desvio constante e igual a .
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Ou ainda pode-se admitir que o modelo fornece o valor mdio de Y, para um dado x, isto , E(Y/x) = + X
Y = + X + U; E(Y/x) = + X, isto , E(U) = 0 V(Y/x) = 2; Cov(Ui, Uj) = 0, para i j; A varivel X permanece fixa em observaes sucessivas e os erros U so normalmente distribudos.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
O modelo suposto E(Y/x) = + X populacional. Vamos supor que se tenha n pares de observaes, digamos: (x1, y1), (x2, y2), ...,
Y = a + bX ou Y = a + bX + E
(xn, yn)
Existem diversos mtodos para a determinao da reta desejada. Um deles, denominado de MMQ (Mtodos dos M Mnimos Q uadrados), consiste em minimizar a soma dos quadrados das soma pontos distncias da reta aos pontos .
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
Deve-se minimizar:
= E 2 = ( Y i Y i ) = i
i =1 n i =1
Y i = a + b X i + Ei
yi yi
Ei
= ( Y i a b X i ) 2
i =1
xi
Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS
Igualando
n
as
derivadas
( Y i a b X i ) = 0 x i( Y i a b X i ) = 0
UFRGS Instituto de Matemtica - Departamento de Estatstica
i =1
n X
S XY S XX
a = Y bX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Lembrando que:
S XY = X i Y i nX Y S XX = X 2 n X 2 i S YY = Y 2 n Y 2 i
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Fazendo:
Um engenheiro qumico est investigando o efeito da temperatura opera de operao do processo no produto. rendimento do produto O estudo resultou nos dados da tabela, ao lado. Determinar a linha de regresso.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Temperatura, C0 (X)
100 110 120 130 140 150 160 170 180 190
Prof. Lor Viali, Dr. UFRGS
Rendimento (Y)
45 51 54 61 66 70 74 78 85 89
Y
45 51 54 61 66 70 74 78 85 89 673
XY
4500 5610 6480 7930 9240 10500 11840 13260 15300 16910 101570
X
10000 12100 14400 16900 19600 22500 25600 28900 32400 36100 218500
Y
2025 2601 2916 3721 4356 4900 5476 6084 7225 7921 47225
Da mesma forma que para calcular o coeficiente de correlao necessrio a construo de trs novas colunas. Uma para X2, uma para Y2 e outra para XY.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
100 110 120 130 140 150 160 170 180 190 1450
Tem-se:
Ento:
UFRGS
b=
A pergunta que cabe agora : este modelo representa bem os pontos dados? A resposta dada atravs do erro padro da regresso.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Y = 2 ,74 + 0 ,48 x
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
O objetivo do MMQ minimizar a variao residual em torno da reta de regresso. Uma avaliao desta variao dada por:
S2
2 E 2 ( Y a bX ) = n 2 n 2
UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
O clculo da varincia residual, por esta expresso, muito trabalhoso, pois necessrio primeiro determinar os valores previstos. Entretanto possvel obter uma expresso que no requeira o clculo dos valores previstos, isto , de Y = a + bX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
= [ Y Y +bX bX ]2 = [ Y Y b( X X )] = = ( Y Y ) 2b ( X X )( Y Y ) + b2 ( X X ) 2 = = SYY 2b S XY + b2 S XX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Mas:
b =
Ento:
S XY S S XX
XY
=bS
XX
( Y Y ) = Y 2 n Y 2 = S YY i
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
( Y a bX ) 2 = SYY 2b S XY + b2 S XX = = S YY 2 b2 S XX + b2 S XX = SYY b2 S XX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Finalmente:
E2 s= = n 2 =
2 ( Y a bX ) = n 2
S YY b 2 S XX = n 2
UFRGS
S YY b S XY n 2
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Ento:
s= S YY b S XY = n 2 1932 ,10 = 3985 .3985 8250 = 10 2
TemTem-se:
= 0 ,9503 0 ,95
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
Os valores de a e b so a b estimadores de e . As propriedades estatsticas destes estimadores so teis para testar a adequao do modelo. Eles so variveis aleatrias uma vez que so combinaes lineares dos Yi que so, por sua vez, variveis aleatrias.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Comportamento de a
(i) Expectncia
E ( a ) = E Y b X = ... =
(ii) Varincia
V ( a ) = V Y bX
Prof. Lor Viali, Dr. UFRGS
1 = ... = 2
2 X + n S XX
Comportamento de b
(i) Expectncia
S E ( b ) = E XY S XX = ... =
Como o valor no conhecido e precisa ser estimado por s, ento, de fato, utiliza-se a distribuio tn-2.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
(ii) Varincia
S V ( b ) = V XY S XX
Prof. Lor Viali, Dr. UFRGS
2 = ... = S XX
Como o valor no conhecido e precisa ser estimado por s, ento, de fato, utiliza-se a distribuio tn-2.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Da mesma forma que foram obtidos IC para a mdia, a proporo e a varincia de uma populao, pode-se determinar intervalos para os parmetros e da regresso.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
" "
2 1 X2 1 + a +t n 2 S + X ) = n S XX n S XX
" "
b +tn2
S SXX
) =1
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Determinar
intervalos
de
S YY = 1932 ,10 S XX = 8250
S XY = 3985 X = 145
confiana de 95% para os parmetros da equao de regresso, utilizando os dados do exerccio anterior.
Y = 2 ,74 + 0 ,48 x
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
a = 2 ,7394 b = 0 ,4830
s = 0 ,9503
n = 10 1 = 95%
Y = 67 ,30
Prof. Lor Viali, Dr. UFRGS
a tn 2 S
1 X2 + n S XX
- 2,7394 2,306.0,95 03
1 + 10 8250
145 2
Ento:
0 ,9503 8250
UFRGS
10
Da mesma forma que foram obtidos IC para os parmetros da regresso, pode-se obter IC para os valores estimados de Y para um dado x. Vamos considerar dois casos: (a) Considerando somente a incerteza da linha de regresso; (b) Considerando a incerteza da linha mais a variao da varivel Y.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Para construir o IC de 1 para o valor mdio de Y, dado x, necessrio conhecer sua distribuio. Tem-se:
1 ( X X ) Y ~ N ( +x ; + ) n S XX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
Ento IC de 1 de confiana para Uma estimativa do valor individual de Y dado por a + bx e a distribuio desta estimativa ser dada por:
1 ( X X ) Y ~ N ( 0; 1 + + ) n S XX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
UFRGS
11
Determinar
intervalos
de
UFRGS
UFRGS
a = 2 ,7394
b = 0 ,4830
Ento:
93,8606 2 ,306.0,9503 93,8606 1 ,4970 [92,36; 95,36]
Prof. Lor Viali, Dr. UFRGS
S XX
s = 0 ,9503
n = 10
Y = 67 ,30
x = 200
Prof. Lor Viali, Dr. UFRGS
1 = 95%
Instituto de Matemtica - Departamento de Estatstica
Ento:
1 ( X X ) Y tn 2 S 1 + + n S XX
UFRGS
12
Da mesma forma que foram testados todos os parmetros at ento pode-se testar os parmetros e da regresso.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
" "
a 1 X2 + n S XX
" "
(a) Testar, a 1% de significncia, se possvel afirmar que a linha de regresso, do exemplo dado, no passa pela origem. (b) Testar se possvel, a 1% de significncia, afirmar que existe regresso positiva entre as duas variveis.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
1 = 1%
13
Dados: n = 10 a = -2,739 = 1%
Ento:
t8 = 2 ,739 0
= 1 ,771
O valor crtico tc tal que: P(|T| > tc) = cr Ento tc = -3,355. Assim RC = [-3,355; ) DECISO e CONCLUSO:
Como t8 = -1,771 RC ou -1,771 > -3,355. Aceito H0, isto , a 1% de significncia, no se pode afirmar que a linha de regresso no passe pela origem.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Dados: n = 10 b = 0,4830 = 1%
O valor crtico tc tal que: P(T > tc) = cr Ento tc = 2,896. Assim RC = [2,896; ) DECISO e CONCLUSO:
Ento:
t8 = 0 ,4830 0 = 46 ,165 0 ,9503 / 8250
UFRGS Instituto de Matemtica - Departamento de Estatstica
Como t8 = 46,165 RC ou 46,165 > 2,896. Rejeito H0, isto , a 1% de significncia, pode-se afirmar que podeexiste regresso entre as duas variveis. vari
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
14
Y Y Y
Y Y
Y Y
Y Y
2 2 2 ( Y Y ) = ( Y Y ) + ( Y Y ) VT = VR + VE xi
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Y Y = Y Y +Y Y
Uma maneira de medir o grau de aderncia (adequao) de um modelo verificar o quanto da variao total de Y explicada pela reta de regresso.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
= S YY
)2 = S YY b 2 S XX = VT VE ( )
(c ) Variao Explicada: VE c
2 VE = Y Y = b 2 S XX
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Para isto, toma-se o quociente entre a variao explicada, VE, pela variao total ,VT:
R2
S2 VE b 2 S XX b S XY XY = = = = VT S XX S YY S YY S YY
R2 = VE / VT
Este resultado denominado de Coeficiente de Determinao Coeficiente Determinao.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
Este resultado mede o quanto as variaes de uma das variveis so explicadas pelas variaes da outra varivel.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
15
Ou ainda, ele mede a parcela da variao total que explicada pela reta de regresso, isto : 2 VE = b 2 S XX = R S YY A variao residual corresponde a: VR =( 1 R 2 ) S YY Assim 1 R2 o Coeficiente de Indeterminao.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
O % de impurezas no gs oxignio produzido por um processo de destilao supem-se que esteja relacionado com o % de hidrocarbono no condensador principal do processador. Os dados de um ms de operao produziram a seguinte tabela
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
X 1,02 1,11 1,43 1,11 1,01 0,95 1,11 0,87 1,43 1,02
Prof. Lor Viali, Dr.
Y 86,91 89,85 90,28 86,34 92,58 87,33 86,29 91,86 95,61 89,86
UFRGS
X 1,46 1,55 1,55 1,55 1,40 1,15 1,01 0,99 0,95 0,98
Y 96,73 99,42 98,66 96,07 93,65 87,31 95,00 96,85 85,20 90,56
(a) Ajuste um modelo linear aos dados; (b) Teste a existncia da regresso; (c) Determine o valor de R2 para este modelo; (d) Determine um IC, de 95%, para o valor da pureza, na hiptese do % de hidrocarbono ser 1,20% .
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica
16