Você está na página 1de 36

MODELOS MATEMATICOS

PARA LA PRODUCCION

MAESTRIA EN INGENIERIA
ADMINISTRATIVA

M. B. A. GERARDO AARÓN RAMÍREZ BAUTISTA


Correo: gekagi63@gmail.com

Noviembre 2018
REGRESIÓN LINEAL
En Estadística:

La regresión lineal
modela, en la forma
de una ecuación
matemática, la
relación entre dos
variables X e Y.
Un ejemplo:
Altura (cm) Peso (kg)

Supongamos que se 135


145
26
33
mide la altura de 17 141 32

niños de 11 años de 143


133
30
31
edad y se registra el 140 33

peso. En la tabla de la 152


149
36
32
derecha se presentan 164 47

los datos. 137


149
29
35
164 43
141 29
143 32
133 23
140 37
152 45
Analizando esta relación

50

45 En el gráfico los puntos


40 (x;y) están dispersos en el
35 plano definido por las dos
Peso

30
variables: Altura y Peso.
25

20

15 Ambas variables son


10
120 130 140 150 160 170 180
numéricas.
Altura
¿Qué necesitamos recordar para hallar la
regresión entre esos datos?

Concepto de función
lineal

Gráfico de la recta
Recordemos cómo es el gráfico de la recta.

y1  y0 y
m 
x1  x0 x
Recordemos cómo se escribe la función de
la recta

Y = mX+ b

Donde m y b son parámetros de la recta.


m es la pendiente de la recta.
b es la ordenada al origen.
Pendiente de la recta

Es la inclinación de la recta respecto del eje horizontal x

m>0

m<0
¿Cómo ajustar la recta a nuestros
datos?
De las infinitas rectas
50
que pueden pasar 45

por la nube de 40

puntos. ¿Cuál 35

Peso
30

estimará mejor los 25

parámetros de la 20

15
recta?. 10
120 130 140 150 160 170 180
Altura
Método de Mínimos cuadrados

Es la recta cuya distancia


entre el valor observado
y la recta de regresión
estimada sea
mínima.
COEF. DE CORRELACIÓN LINEAL
DE PEARSON

• La coeficiente de correlación lineal de Pearson de


dos variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente (excluyendo
rectas horizontales y verticales).

• tiene el mismo signo que Sxy por tanto de su signo


obtenemos el que la posible relación sea directa o
inversa.

• r es útil para determinar si hay relación lineal entre Sxy


dos variables, pero no servirá para otro tipo de r
relaciones (cuadrática, logarítmica,...) Sx S y
PROPIEDADES DE R

• Es adimensional
• Sólo toma valores en [-1,1]
• Las variables son incorreladas  r=0
• Relación lineal perfecta entre dos variables  r=+1 o r=-1
– Excluimos los casos de puntos alineados horiz. o verticalmente.
• Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación
lineal.
Relación
inversa Relación
perfecta directa
Variables
casi
incorreladas
perfecta

-1 0 +1
CORRELACIONES POSITIVAS

330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
CORRELACIONES NEGATIVAS

90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
PREGUNTAS FRECUENTES

• ¿Si r=0 eso quiere decir que las variables son independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.

• Me ha salido r=1.2 ¿la relación es “superlineal”[sic]?


– ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor
entre -1 y +1.

• ¿A partir de qué valores se considera que hay “buena relación lineal”?


– Imposible dar un valor concreto (mirad los gráficos anteriores). Para este
curso digamos que si |r|>0,7 hay buena relación lineal y que si |r|>0,4
hay cierta relación (por decir algo... la cosa es un poco más complicada…
observaciones atípicas, homogeneidad de varianzas...)
Pasos para graficar los datos
¿Cómo graficar y ajustar la recta utilizando
una hoja Excel?
Escribir los datos (x;y) en columnas, y
1º Paso
seleccionarlos.
Ir al Menú – Insertar – Gráfico
y seleccionar, XY (Dispersión).
Posicionarse en un punto
y tocar el botón de la
derecha del Mouse y
seleccionar: Agregar
línea de tendencia.

No olvidar escribir el título,


nombre de variables y elegir una
escala correcta para los ejes.
En Opciones, marcar:
4ºPresentar
Paso la ecuación en el gráfico
Presentar el valor R2 en el gráfico
La recta obtenida

50
45

40
35
Peso

30
25

20 y = 0,5289x - 42,833
2
15 R = 0,716

10
120 130 140 150 160 170 180
Altura
¿Cómo interpretamos la recta?

Ŷ = 0,5289 X - 42,833

La pendiente positiva 0,5289 nos indica que


a medida que aumenta la altura aumenta el
peso.

La relación entre ambas variables es directa.


COEFICIENTE DE DETERMINACIÓN 𝑹𝟐

El 𝑹𝟐 se define como la proporción de la varianza total de la


variable explicada por la regresión. El 𝑹𝟐 , también llamado
coeficiente de determinación, refleja la bondad del ajuste de
un modelo a la variable que pretender explicar.

Es importante saber que el resultado del 𝑹𝟐 oscila entre 0 y 1.


Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste
del modelo a la variable que estamos intentando explicar. De
forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será.
¿Cómo interpretamos el
coeficiente de determinación?

R2 = 0,716

Indica que el modelo explica


a los datos en
aproximadamente
un 71,6%.
REGRESIÓN

• El análisis de regresión sirve para predecir una medida


en función de otra medida (o varias).
– Y = Variable dependiente
• predicha
• explicada
– X = Variable independiente
• predictora
• explicativa
– ¿Es posible descubrir una relación?
• Y = f(X) + error
– f es una función de un tipo determinado
– el error es aleatorio, pequeño, y no depende de X
MODELO DE REGRESIÓN
LINEAL SIMPLE
• En el modelo de regresión lineal simple, dado dos
variables
– Y (dependiente)
– X (independiente, explicativa, predictora)
• buscamos encontrar una función de X muy simple (lineal)
que nos permita aproximar Y mediante
– Ŷ = b0 + b1X
• b0 (ordenada en el origen, constante)
• b1 (pendiente de la recta)
• Y e Ŷ rara vez coincidirán por muy bueno que sea el
modelo de regresión. A la cantidad
– e=Y-Ŷ se le denomina residuo o error residual.
• El modelo lineal de regresión se construye utilizando la técnica de
estimación mínimo cuadrática:
– Buscar b0, b1 de tal manera que se minimice la cantidad
• Σi e i 2

• Se obtiene además unas ventajas “de regalo”


– El error residual medio es nulo
– La varianza del error residual es mínima para dicha estimación.

• Traducido: En término medio no nos equivocamos. Cualquier otra


estimación que no cometa error en término medio, si es de tipo lineal,
será peor por presentar mayor variabilidad con respecto al error medio
(que es cero).
Cometió un
error de -30
• Que el error medio de las predicciones en su última
sea nulo no quiere decir que las predicción

predicciones sean buenas.

• Hay que encontrar un medio de


expresar la bondad del ajuste (bondad
de la predicción)
No importa. Con los dos
últimos clientes me
equivoqué en +10 y +20. En
término medio el error es
cero.
¿CÓMO MEDIR LA BONDAD
DE UNA REGRESIÓN?

Imaginemos un diagrama de dispersión, y vamos


a tratar de comprender en primer lugar qué es
el error residual, su relación con la varianza de Y,
y de ahí, cómo medir la bondad de un ajuste.
INTERPRETACIÓN DE LA
VARIABILIDAD EN Y
En primer lugar olvidemos que existe Y
la variable X. Veamos cuál es la
variabilidad en el eje Y.

La franja sombreada indica la zona


donde varían los valores de Y.

Proyección sobre el eje Y = olvidar X


INTERPRETACIÓN DEL
RESIDUO

Fijémonos ahora en los errores de predicción


Y
(líneas verticales). Los proyectamos sobre el
eje Y.
Se observa que los errores de predicción,
residuos, están menos dispersos que la
variable Y original.

Cuanto menos dispersos sean los


residuos,
mejor será la bondad del ajuste.
BONDAD DE UN AJUSTE
Resumiendo:
Y
• La dispersión del error residual será una
fracción de la dispersión original de Y

•Cuanto menor sea la dispersión del error


residual
mejor será el ajuste de regresión.

Eso hace que definamos como medida de


bondad de un ajuste de regresión,
o coeficiente de determinación a:
2
S
R  1
2 e
2
S Y
RESUMEN SOBRE BONDAD DE UN
AJUSTE
• La bondad de un ajuste de un modelo de regresión se mide
usando el coeficiente de determinación R2

• R2 es una cantidad adimensional que sólo puede tomar valores


en [0, 1]

• Cuando un ajuste es bueno, R2 será cercano a uno.

• Cuando un ajuste es malo R2 será cercano a cero.

• R2 puede ser pesado de calcular en modelos de regresión


general, pero en el modelo lineal simple, la expresión es de lo
más sencilla: R2=r2
MODELOS DE ANÁLISIS DE
REGRESIÓN

1 variable explicativa Modelos de 2+ variables explicativas


regresión

Simple Múltiple

Lineal No lineal Lineal No lineal

Você também pode gostar