Escolar Documentos
Profissional Documentos
Cultura Documentos
Regressao Lenear Com Anova Ufrgs
Regressao Lenear Com Anova Ufrgs
PPGEP
CAPÍTULO 9 PPGEP
PPGEP/UFRGS 1 PPGEP/UFRGS 2
PPGEP
REGRESSÃO LINEAR SIMPLES PPGEP
REGRESSÃO LINEAR SIMPLES
PPGEP/UFRGS 3 PPGEP/UFRGS 4
PPGEP
REGRESSÃO LINEAR SIMPLES PPGEP
Correlação
• Para uma amostra de n pares de valores (x,y) o
• Modelos de regressão são usados com freqüência na coeficiente de correlação r fornece uma medida da relação
análise de dados provenientes de experimentos não linear que existe entre duas variáveis aleatórias X e Y.
planejados (observações de um fenômeno não controlado
ou dados históricos).
Regressão Linear Simples
PPGEP/UFRGS 5 PPGEP/UFRGS 6
Coeficiente de correlação
PPGEP
Cálculo do coeficiente de correlação PPGEP
• Desvio-padrão de Y:
1 • Mesmo assim, é prática comum calcular r em quase
S yy = ∑ yi2 − ( ∑ yi ) 2 todos os casos, isto é, com X aleatória ou não. O
n
coeficiente de correlação linear “r” mede a intensidade da
• Covariância de X,Y: relação linear entre duas variáveis
1
S xy
S xy = ∑ xi yi − ( ∑ xi )( ∑ yi ) r ( x, y ) =
n S xx × S yy
PPGEP/UFRGS 7 PPGEP/UFRGS 8
PPGEP Coeficiente de correlação linear PPGEP
Coeficiente de correlação linear
• O coeficiente de correlação linear “r” mede a • Deve-se ter em conta que r é uma medida da relação
intensidade da relação linear entre duas variáveis linear entre as duas variáveis e não tem sentido quando a
relação é não linear.
Regressão Linear Simples
PPGEP/UFRGS 9 PPGEP/UFRGS 10
PPGEP
Por exemplo…. PPGEP
Rendimento de combustível
PPGEP/UFRGS 11 PPGEP/UFRGS 12
PPGEP
Cálculos iniciais PPGEP
Cálculos
Desvio-padrão de X: S XX = ∑ xi2 − (∑ xi ) n = 650 − (78)2 / 12 = 143,00
2
Meses(X) Rendimento(Y) X^2 Y^2 X*Y
1 10,7 1 114,49 10,7
2 10,9 4 118,81 21,8
3 10,8 9 116,64 32,4 Desvio-padrão de Y: SYY = ∑ yi2 − (∑ yi )2 n = 1039,55 − (110,70)2 / 12 = 18,34
4 9,3 16 86,49 37,2
Covariância de X,Y: SXY = ∑xi yi − (∑xi )(∑ yi ) n = 673,1− (78×110,70) /12 = −46,45
5 9,5 25 90,25 47,5
Regressão Linear Simples
H1 : ρ ≠ 0 t > tα / 2,n − 2
• onde a letra ρ é usada para representar o valor • Para o exemplo em estudo tem-se:
populacional do coeficiente de correlação. Pode ser − 0,907 12 − 2
demonstrado que o valor de t pode ser calculado usando: t= = − 6,82 > t0,025;10 = 2,228 ⇒ rejeita - se H 0,
1 − ( −0,907)2
r n−2
t= • ou seja, descarta-se a hipótese nula e conclui-se que
1 − r2 existe correlação entre as variáveis estudadas.
PPGEP/UFRGS 15 PPGEP/UFRGS 16
PPGEP
Regressão Linear Simples PPGEP
Regressão Linear Simples
• A regressão linear simples estima uma equação • E suponha que a relação entre Y e X seja
aproximadamente linear. Então o valor esperado de Y para
matemática (ou modelo) que dado o valor de X (variável
cada valor de X virá dado por:
independente), prevê o valor de Y (variável dependente).
Regressão Linear Simples
PPGEP
• Para o exemplo analisado resultou r =(-0,907)2 = 0,82, PPGEP
Variância dos Estimadores
ou seja, 82% da variabilidade nos resultados de rendimento • Para verificar a precisão das estimativas, determinar
de combustível pode ser devida ao tempo decorrido após a intervalos de confiança e testar hipóteses é importante
regulagem. conhecer a variância dos estimadores.
• 18% da variabilidade total é devido a outros fatores que • Pode ser demonstrado que uma estimativa da variância
Regressão Linear Simples
• Como os resíduos de Y supostamente seguem a • Isto é, testa-se se a inclinação é igual a zero, o que
distribuição Normal, e como os valores de a e b são equivale a testar se existe uma relação entre Y e X.
funções lineares de Y, é possível demonstrar que: Usando a eq. (2) tem-se:
(
b0 → N β0 ,σb2 0 )
b1 → N (β1 ,σb2 1 ) t = b1 / Sb1
Regressão Linear Simples
• então calcula-se:
Z = (b1 - β10) / σb1
PPGEP/UFRGS 25 PPGEP/UFRGS 26
• e, para um nível de probabilidade α, H0 será rejeitada • Exemplo 9.3: Usando os dados do problema do consumo
PPGEP se resultar Z > Z α / 2 . Como em geral a variância S2 não PPGEP de combustível, obtenha as estimativas para a variância
é conhecida, usa-se: residual e para a variância dos parâmetros b0 e b1.
Construa um intervalo de confiança para a inclinação b1
t = (b1 - β10) / Sb1 (2) e verifique a hipótese .
• O intervalo de confiança para β1 virá dado por SQR = SYY − b1S XY = 3,24
b1 − tα / 2 Sb 1 < β1 < b1 + tα / 2 Sb 1
S 2 = SQR /( n − 2 ) = 0 ,324 ; S = 0 ,569
• Uma hipótese testada com freqüência é: Sb21 = S 2 / S XX = 0 ,00227 ; Sb 1 = 0 ,0476
H 0 : β1 = 0 1 X2
H 1 : β1 ≠ 0 Sb20 = S 2 + = 0 ,123 ;
Sb 0 = 0,351
n S XX
PPGEP/UFRGS 27 PPGEP/UFRGS 28
PPGEP PPGEP
Previsão de valores de Y
• Intervalo de confiança para b1
• A análise de regressão produz uma relação entre as
t0,025;10 = 2,228 variáveis consideradas, a qual pode ser usada para prever
valores de Y.
-0,325 - 2,228 (0,0476) < β1 < -0,325 + 2,228 (0,0476)
Regressão Linear Simples
PPGEP/UFRGS 29 PPGEP/UFRGS 30
PPGEP
Previsão de um valor médio de Y PPGEP
Previsão de um valor médio de Y
• A variância dos valores preditos irá depender não somente
de S2, mas também do valor de x0. Isso acontece porque • Como pode ser visto, a variância da previsão é mínima
as previsões são mais precisas quando x0 ∼ X e menos quando x0 = X e aumenta quando x0 afasta-se de X .
precisas quando x0 aproxima-se dos extremos
investigados.
• Assim, o intervalo de confiança para a previsão de um
Regressão Linear Simples
2 1 ( x 0 − X ) 2
S Y2 p = S +
n S XX
PPGEP/UFRGS 31 PPGEP/UFRGS 32
Previsão de um valor individual de Y
PPGEP PPGEP Usando os dados do problema do consumo de
combustível, obtenha os intervalos de confiança de 95%
• A variância da previsão de valores individuais de Y segue
para a previsão de um valor médio e um valor individual
o mesmo comportamento observado para os valores
de Y para um tempo x0 = 8 meses.
médios. Contudo, a variância é maior no caso de valores
individuais.
• Pode ser demonstrado que a variância da previsão de um (b0 + b1 x0) = 8,74 ; ( x0 − X ) 2 = 0,0157
Regressão Linear Simples
2
1 (x − X )2
SYp = S 2 1 + + 0 1
n S XX SY2 p = 0 ,324 + 0 ,0157 = 0 ,0321 ; SY p
= 0 ,179
• De modo que o intervalo de confiança para a previsão de 12
um valor individual de Y é: 1
SY2 p = 0 ,324 1 + + 0 ,0157 = 0 ,356 ; SY p = 0 ,597
12
Y = (b0 + b1 X0) ± tα/2 ; n-2 SY p ( )
PPGEP/UFRGS 33 PPGEP/UFRGS 34
PPGEP/UFRGS 39 PPGEP/UFRGS 40
A Análise de Variância e a Regressão
PPGEP
Intervalo de Variação para X PPGEP
PPGEP/UFRGS 43 PPGEP/UFRGS 44
•Exemplo 9.5: Faça a análise de variância para o problema
PPGEP do consumo de combustível e confirme a significância do PPGEP Fonte de SQ GDL MQ F
modelo de regressão linear. Variação
Regressão 15,10 1 15,10 46,6
•Solução: Residual 3,24 10 0,324
Já tínhamos calculado as Somas Quadradas SYY e SQR Total 18,34 11
como:
Regressão Linear Simples
PPGEP/UFRGS 45 PPGEP/UFRGS 46
PPGEP
Dados Atípicos PPGEP
• Algumas vezes, o conjunto de dados pode estar • Se o conjunto pode estar contaminado por vários
dados atípicos, a solução será usar técnicas de
contaminado com alguns dados atípicos. Esses dados regressão robusta. Neste tipo de análise, é dado um
atípicos podem ser o resultado do efeito de algum fator peso menor àqueles dados que se afastam do conjunto.
Regressão Linear Simples
PPGEP/UFRGS 47 PPGEP/UFRGS 48
PPGEP
Regressão Não Linear Simples PPGEP
Regressão Não Linear Simples
•Se o ajuste linear é deficiente, muitas vezes é possível
encontrar uma solução aproximada, e em geral satisfatória, •Note-se que o método dos mínimos quadrados aplicado
utilizando uma transformação em X e/ou em Y. aos valores transformados, isto é, minimizando
•Em forma genérica, teríamos:
L = Σ [ f (yi) - (b0 + bi g (xi))]2,
f(y) = b0 + b1 g(X) + ε
Regressão Linear Simples
PPGEP/UFRGS 49 PPGEP/UFRGS 50
Conc. 0 0 0 2 2 2 4 4 4 6 6 6 8 8 8
• 9.5 Um torno mecânico pode ser operado a diversas
Depos. 13,3 11,5 12,9 14,1 13,3 16,1 14,9 15,9 18,1 17,5 16,5 18,9 20,3 18,5 20,2 velocidades. Contudo, a qualidade do acabamento, ou seja,
a rugosidade superficial, pode piorar com o aumento da
velocidade de operação. Ajuste um modelo de regressão
• 9.2 Para os dados do exercício 9.1, calcule a variância linear aos dados que aparecem a seguir e depois plote a
residual e a variância dos parâmetros b0 e b1. Depois reta de regressão e os valores observados.
construa um intervalo de confiança de 95% para a
Velocidade 3 3 3 6 6 6 9 9 9 12 12 12
inclinação b1 e verifique a hipótese H0 : β1 = 0. Rugosidade 26,0 21,5 33,5 36,0 27,5 37,0 41,5 28,0 39,5 43,0 37,0 50,5
PPGEP/UFRGS 51 PPGEP/UFRGS 52
PPGEP PPGEP
• 9.8 O gerente de uma indústria localizada em um país
tropical suspeita que há uma correlação entre a temperatura
• 9.6 Para os dados do exercício 9.5, calcule a variância do dia e produtividade. Dados coletados aleatoriamente ao
residual e a variância dos parâmetros b0 e b1. Depois, longo de um período de seis meses revelaram o seguinte:
construa um intervalo de confiança de 95% para a inclinação
b1 e verifique a hipótese da existência de uma relação entre Temperatura 21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8
velocidade e rugosidade superficial.
Regressão Linear Simples
Temperatura 27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7
Produtividade 132 137 124 117 122 131 124 111 119 129 123 116
PPGEP/UFRGS 53 PPGEP/UFRGS 54
T rá fe g o
e SYY=79,43 pede-se: V e lo c id . 9 5 ,6 9 3 ,8 7 4 ,4 7 4 ,8 5 0 ,5 5 1 ,5 4 4 ,6 4 2 ,4 3 5 ,8 3 8 ,7 3 2 ,0 3 ,2 3 0 ,1 2 9 ,1
M é d ia
a) Faça a análise de Variância e conclua a respeito da
significância do modelo.
•Ajuste um modelo linear a esses dados e ache a equação
b) Calcule o valor do coeficiente de determinação r2 e de regressão Y = b0+ b1 X
indique qual o seu significado técnico.
PPGEP/UFRGS 55 PPGEP/UFRGS 56
PPGEP
linear.
PPGEP/UFRGS 57