Você está na página 1de 6

ANÁLISE DE REGRESSÃO

• Coeficiente de correlação linear produto momento, segundo Pearson (r)


Σ(x − x )( y − y)
i i
cov(x, y) n−1
r= =
var(x ) var( y) Σ ( x − x ) 2 Σ ( y − y) 2
i . i
n−1 n−1
SPXY
r=
SQX.SQY
SPXY = Σxy -(Σx Σy) / n; SQX = Σx2 - (Σx)2 / n; SQY = Σy2 - (Σy)22 / n

• r: -1 à +1; r: 0, não há correlação linear entre x e y.

• r2*100%: fração da variância total de x e y explicada pela relação linear:


ajuste da distribuição dos pontos em relação à reta.
• teste usado para verificar se a correlação é ou não significativa

n− 2
t =r , com (n-2)g.l.
1−r 2

• Coeficiente de correlação não paramétrico, segundo Spearman (rS)


• variáveis não possuem distribuição normal
• xi e yi ordenados por postos (rank), segundo os seus valores (x*i e y*i)
• di = x*i - y*i ; di2 ; ∑di2
6Σdi2
r = 1− 3 n = número de pares de valores x*i , y*i
s n −n
• caso ocorram muitos casos com valores de posto empatados:

Σx ,e + Σy,e − Σdi2
r =
s , Σ y,
2 Σx e e

onde

, n3 − n , n3 − n
Σx e = − ΣTx Σy e = − ΣTy
12 12
t3 − t
T=
12
t = número de observações repetidas em um determinado posto.
• coeficiente de correlação linear é influenciado pela presença de valores
anômalos.
• grande diferença entre o coeficiente de correlação linear e o coeficiente
de correlação por postos reflete tanto uma relação não-linear como
presença de pares de valores extremos.
Regressão linear
• Verificado pelo valor de r que ocorre uma significante correlação linear
entre duas variáveis (x , y ) há necessidade de quantificar tal relação, o
i i
que é feito pela análise de regressão.
• Equação de uma reta que, disposta num sistema de eixos cartesianos,
com valores de yi (variável dependente) na ordenada e xi (variável
independente) na abcissa, a soma dos quadrados dos desvios verticais
dos pontos em relação a ela seja mínima.
y = a + bx ,
onde y é o valor estimado para um específico valor xi; b revela a
inclinação da reta, ou seja o acréscimo ou decréscimo do valor de y em
relação à x; a localiza o ponto de interseção da reta em relação ao
sistema de coordenada retangulares.
• Utilizando o método dos mínimos quadrados, os valores da equação da
reta são determinados por:

SPXY
b = a = y − bx
SQX

Σyi Σ xi
y = ; x =
n n

Eixo maior reduzido


• desconhecimento de uma variável independente ou sem erro
• no lugar de desvios verticais dos pontos em relação à reta, áreas dos
triângulos compreendidos entre os pontos e a reta
y= a + bx,

b = ± (Sy / Sx ) , sendo o sinal de “b” o do correspondente r

SQY Σy2 − (Σy)2 / n 1/ 2


b= = [ ] ; a = y + bx
SQX Σx 2 − (Σx )2 / n
Regressão curvilínea

Y * = a + a X + a X 2 + a X 3 + ...
0 1 2 3
• potências crescentes de xi, variável independente e coeficientes
• xi e xi2: parábola com um único ponto de inflexão
• com potências crescentes de xi, curva mais complexa para ajuste
• processo por etapas (stepwise)
• O modelo para a regressão polinomial de grau k é

Y = α + α X + α X 2 + ... + α Xk + ε
o 1 i 2 i k i
• cálculo dos coeficientes de regressão α
 n Σx ∑ x2 L Σ xk 
 i i i 
 Σx Σx 2 Σx 3 L Σx + 1 
k
[X] =  i i i i 
 M M M M 
 k 
Σxi Σ xk + 1 Σ xk + 2 L Σ x k + k 
i i i 

 ∑ yi 
 ∑y x  â 
 i i  o

[Y] = ∑ y x 2 
 [ â ] =  1 
 i i  M
 M   
 k  âk 
 ∑ yixi 

[ â ] = [ X ]− 1[ Y ]
Regressão polinomial
• superfícies contínuas podem ser encontradas, por critérios de regressão
polinomial, onde Zi é a variável dependente em função linear das
coordenadas X-Y dos pontos amostrados e irregularmente distribuídos
• o modelo para a representação da superfície pelo método dos
polinômios não ortogonais é:
z i (X, Y ) = [ a 0 + a1x i + a 2 yi + a 3 x i2 + a 4 x i yi + a 5 yi2 + ... ] + ei (x i , yi ) ,

onde z i (X, Y ) é a variável mapeada em função das coordenadas xi e yi e


ei (x i , yi ) representa os resíduos, ou seja, a fonte não-sistemática de
variação.
• a representação de uma superfície linear é dada por:
z(X, Y ) = a 0 + a1x i + a 2 yi + ei

• para o cálculo dos coeficientes ai, dispõe-se os dados num sistema de


equações normais :

 n ∑ xi ∑ yi   a0   ∑ zi 
∑ x  
 i ∑x 2
i ∑ x i yi   
 a1  =  ∑ z i x i 
 ∑ yi ∑ x i yi ∑ yi2  a   ∑ zi yi 
 2

[XY] [A] = [Z]


multiplicando ambos os termos pelo inverso de [XY],

[ XY ]−1[ XY ][ A ] = [ XY ]−1[ Z ]

como [ XY ]−1[ XY ] = [l] = matriz de identidade e [I][ A ] = [ A ]

[ A ] = [ XY ]−1[ Z ]
para o cálculo do vetor de coeficientes [A], inverter a matriz [XY] e
multiplicar esse resultado pelo vetor [Z].
• A superfície quadrática é representada por:
z (X, Y ) = b 0 + b1x i + b 2 yi + b 3 x i2 + b 4 x y + b 5 yi2 + e ,
i i i i
e a determinação dos coeficientes b0, b1, b2, b3 ,b4 e b5 para a
superfície de grau 2 torna-se:
−1
b 0   n ∑ xi ∑ yi ∑ x i2 ∑ x i yi ∑ yi2   ∑ zi 
b     
 ∑ xi ∑x ∑ xi y ∑x ∑ x yi ∑ x i yi2 
2 3 2
  1 i
i i i  ∑ xi zi 
b 2   ∑y ∑ x i yi ∑ yi2 ∑ x i2 yi ∑ x i yi2 ∑ yi3   ∑ yi z i 
  =  
i
 
b
 3  ∑ x 2
∑ x i3 ∑ x i2 y ∑ x i4 ∑ x i3 yi ∑ x i2 yi2   ∑ xi zi 
2
i
i
b 4    ∑ x y z 
   ∑ x i yi ∑ x i2 y
i
∑ x i yi2 ∑ x i3 yi ∑ x i2 yi2 ∑ x i yi3 
 i i i

b 5   ∑ yi2 ∑ x i yi
2
∑ yi
3 2
∑ x i yi
2
∑ x i yi
3
∑ yi 
4 2
 ∑ yi z i 

As superfícies de grau superior a dois seguem o mesmo processo de
desenvolvimento polinomial.

Análise de regressão/PMBLandim

Você também pode gostar