Você está na página 1de 11

Escuela de Post Grado:

MAESTRIA EN ECOLOGIA APLICADA

Tpicos en Estadstica
Tema 1: Anlisis de Regresin Mltiple

PhD. Frida Coaquira

Modelo de Regresin Lineal Mltiple

El modelo de regresin lineal mltiple es


Yi 0 1 X i1 2 X i 2

k X ik i

i 1, 2,

,n

En trminos matriciales: Y X

1 X 11
Y1

Y
1 X 21
2

Y
X


Yn
1 X n1

X 12
X 22
X n2

X 1k
0
1



X 2k
1 2



X nk
k
n

Mtodo de Mnimos Cuadrados


El mtodo de mnimos cuadrados permite

encontrar la estimacin del vector de parmetros


tal que se minimice
la suma de cuadrados de los
n
/
2
/
errores Q i Y X Y X
i 1

Las ecuaciones normales:


X / X X / Y

Resolviendo se obtiene el estimador mnimo

cuadrtico

X / X 1 X / Y

Error estndar de estimacin

El residual describe el error de estimacin en el


ajuste del modelo en la i-sima observacin.
ei Yi Yi

Una medida general de la diferencia entre cada


valor observado y el valor estimado es el error
estndar de estimacin
n

Se

e
i 1

2
i

n k 1

i 1

Yi Yi

n k 1

Y / Y / X/ Y
n k 1

Propiedades de los estimadores

El vector de coeficientes obtenido por el mtodo de


mnimos cuadrados tiene las siguientes propiedades:

2 X/ X
Var

E Se2 2

Estimadores ptimos (insesgados y de mnima


variancia)

Anlisis de variancia
El anlisis de variancia es una tcnica estadstica que
consiste en particionar la suma de cuadrados de la
variable dependiente en sus fuentes de variacin.
Fuentes de
variacin

Grados de
libertad

Suma de
cuadrados

Regresin

SCReg

Error

nk1

SCError

Total

n1

SCTotal

Cuadrado
medio

F calculado

CMReg (1) F0 = (1)/(2)


Se2 (2)

Anlisis de variancia
2

~
N
0
,

I
Supuesto:

Hiptesis: H0 : 1 2

k 0

Ha : al menos un i 0
CM Reg
F0
~ Fk , n k 1
CM Error

Estadstico de prueba:

Criterio de rechazo: F0 F1 , k , nk 1

Hiptesis e intervalos de confianza


2

~
N
0
,

I
Supuesto:

Hiptesis: H 0 : i i*
i i

Estadstico de prueba: T0

Criterio de rechazo: T0 t1 2, nk 1

Intervalo de confianza:

SE i

H a : i i*

~ t nk 1

i t1 2, nk 1 SE i i i t1 2, nk 1 SE i

Coeficiente de determinacin

El coeficiente de determinacin R2 se define por


SC Regresin
R
SC Total
2

es decir, mide la proporcin de la variacin total de la


variable dependiente que es explicada por el modelo
de regresin (o por X1 , X2 , , Xk ).

Colinealidad
Dos predictores X1 y X2 son exactamente colineales si
existe una relacin lineal tal que c1X1+c2X2=c0 para
algunas constantes c1, c2 y c0.
Un conjunto de predictoras X1, X2,.Xp son colineales

si para constantes co,c1,..cp, la ecuacin


X k (co c j X j ) / ck
j k

Factor de inflacin de la varianza


La cantidad

1
1 - R 2j

es llamado el j-simo Factor de inflacin


de la varianza, or VIFj (Marquardt, 1970). Si R 2j es cercano
a 1 entonces la varianza de j aumentar grandemente.
Una variable predictora con un VIF mayor de 10 puede
causar multicolinealidad.
Los VIF son los elementos que estn en la diagonal de la
matriz C-1.

Você também pode gostar