Você está na página 1de 16

LA REGRESIÓN.

A menudo estamos interesados en una posible relación entre dos o más variables.
Podemos sospechar que cuando una de las variables cambia, la otra también cambia
de manera previsible. Es importante expresar tal relación mediante una ecuación
matemática que relacione las variables. Esta ecuación nos servirá para predecir el valor
de una variable partiendo del valor de la(s) otra(s)variable(s).

Regresión Lineal Simple.


Si la relación que existe entre la variable x y la variable y es una línea recta, las variables
están relacionadas por :
y = αx + β
En una situación no determinística es razonable postular que esta relación está
afectada por errores experimentales o perturbaciones aleatorias. De acuerdo a lo
anterior podemos formular el siguiente modelo estadístico :

Modelo estadístico :

Se asume que Yi está relacionado con Xi por :

en que :
(a).- x1, x2,....,xn son los valores de la variable x que han sido tomados para el estudio.
(b).- e1, e2,...., e3 son los errores aleatorios de la relación lineal. Estos errores son
desconocidos y se asume que son variables aleatorias independientes, gaussianas, con
esperanza nula y varianza desconocida σ2.
(c).- Los parámetros α y β son desconocidos.
El Método de los Mínimos Cuadrados :

Si asumimos en forma tentativa que la formulación del modelo es correcta, se puede


proceder a la estimación de los parámetros α y β. El método de los mínimos cuadrados
constituye un método eficiente para estimar los parámetros de la regresión.
Supongamos que se ha graficado la recta y = a + bx. En el punto xi, el valor que predice la
recta para y es a + bxi, mientras que el valor observado es yi.
La discrepancia es di = yi –a –bxi. Al considerar todas las discrepancias, se toma :

como medida de la discrepancia global. Si el ajuste es bueno, D debería ser pequeño. El


principio del método de los mínimos cuadrados es entonces : determinar los parámetros
desconocidos de manera de minimizar D. Los valores encontrados se denotan αˆ y βˆ .
Antes de encontrar las expresiones para αˆ y βˆ veamos las notaciones que utilizaremos :
Ejemplo : en una empresa minera se dispone de los datos siguientes :
x = Producción en toneladas , y = Costo de producción. Hallar la recta de regresión :
Tanto la producción como el costo han sido multiplicados por constantes.

La primera etapa lógica es dibujar los datos.


Este gráfico nos indicara si el modelo lineal es adecuado.
Al hacer los cálculos, se tiene :

y utilizando la expresión para βˆ :


Se llama suma de cuadrados debida al error a :

Del ejemplo anterior :


SSE = 6.85 − (0.77)² ⋅10.23 = 0.785

Você também pode gostar