Você está na página 1de 10

Mínimos Cuadrados y sus

Supuestos del Modelo de


Regresión Lineal.
Es una metodología
observemos
particular para estimar de
la mejor manera posible los
coeficientes del modelo. Lo
que se busca es poder FRP: Yi=β1 + β2Xi + ui
estimar los parámetros de no hay manera de
la población que le hemos hacer alguna
llamado βˆ 1 y βˆ 2 Muestra inferencia
estadística sobre
Yi Mientras no se Yi
depende especifica la
forma como se
Xi crean o se
generan Xi y ui
y ni tampoco, como
veremos, sobre β1
ui
y β2.

Los supuestos sobre las variables Xi y el término de error son relevantes para
lograr una interpretación válida de los valores estimados de la regresión.
Los supuestos del modelo de
regresión lineal.
• SUPUESTO 1
Tenemos supuestos cruciales:
1er supuesto es que la suma de los errores es igual a 0
E(u)=0
Quiere decir que nuestra línea de regresión en promedio castiga y promedia a todos
por igual, nuestra línea de regresión es una aproximación de cómo una variable x
afecta a una variable “Y", no está a favor de unos datos ni a favor del otro
Ejm:
La estatura promedio de una población en función de la edad de las personas, esa
relación entre esas dos variables. Esa relación no pasaría por cada uno de los puntos
de una persona que mide 2.10 quedaría por arriba de la estimación y una persona
que mide 1.25 quedaría por debajo de la estimación, que en promedio todos los
errores de estimación tienen que ser igual a 0
• SUPUESTO 2
• Errores de estimación lo que no explicamos, aquello que escapa de explicación
dada la naturaleza incierta de los fenómenos económicos, no está relacionado con
las observaciones X es decir en promedio nosotros tenemos un error, una
perturbación una parte que no explicamos que ya no guarda relación alguna con
cada una de las variables, las X ya no tienen más información que podamos sacarle
para explicar el fenómeno que tratamos de explicar.
E(ulx)=0=E(U)

• En términos de información ya le hemos sacado el poder predictivo respecto a Y, o


decimos que la correlación entre X tienen que ser 0, si no lo fueran sería posible
todavía extraer más información de las X respecto al fenómeno que estamos
haciendo.
Supuesto 3

El valor medio de la perturbación ui es igual a cero:

Dado el valor de Xi, la media o el valor esperado del término de perturbación aleatoria
ui es cero. Simbólicamente, tenemos que E(ui/Xi)= 0
O, si X no es estocástica, e E (ui) =0
Lo que sostiene el supuesto 3 es que los factores no incluidos explícitamente en el
modelo y, por consiguiente, incorporados en ui, no afectan sistemáticamente el valor de
la media de Y; es decir, los valores positivos de ui se cancelan con los valores negativos
de ui, de manera que el efecto medio o promedio sobre Y es cero.
Supuesto 4

Homocedasticidad o varianza constante de ui:

La varianza del término de error, o de perturbación, es la misma sin importar el valor


de X. Simbólicamente, tenemos que:
var (ui)= E[ui − E(ui/Xi)]2
= E(u2 i / Xi), por el supuesto 3
= E(u2 i), si Xi son variables no estocásticas
= σ2
Supuesto 5

No hay auto correlación entre las perturbaciones: Dados dos valores


cualesquiera de X, Xi y Xj (i j ), la correlación entre dos ui y uj cualesquiera (i
diferente a j) es cero. En pocas palabras, estas observaciones se muestrean de
manera independiente. Simbólicamente:
cov(ui, uj/Xi, Xj)= 0
cov(ui, uj)= 0, si X no es estocástica
donde i y j son dos observaciones diferentes y con significa covarianza.

• Si las perturbaciones (desviaciones) siguen patrones sistemáticos hay correlación


serial o autocorrelación, y lo que requiere el supuesto 5 es que dichas
correlaciones estén ausentes.
• No obstante, debe añadirse aquí que la justificación de este supuesto depende del
tipo de datos para el análisis. Si los datos son transversales y se obtienen como
muestra aleatoria de la población pertinente, a menudo es posible justificar este
supuesto. Sin embargo, si los datos corresponden a una serie de tiempo, es difícil
mantener el supuesto de independencia, porque las observaciones sucesivas de
una serie de tiempo, como el PIB, están muy correlacionadas.
Supuesto 6

El número de observaciones n debe ser mayor que el número de


parámetros por estimar: Sucesivamente, el número de observaciones n
debe ser mayor que el número de variables explicativas.
Supuesto 7

La naturaleza de las variables X: No todos los valores X en una muestra


determinada deben ser iguales. Técnicamente, var(X) debe ser un número
positivo. Además, no puede haber valores atípicos de la variable X, es decir,
valores muy grandes en relación con el resto de las observaciones.

Você também pode gostar