Você está na página 1de 11

TALLER FINAL

“ANALISIS DE REGRESIÓN LINEAL”

INTEGRANTES:

NARLIS ROBLEDO
DANNA MARTINEZ
OSCAR VELEZ
SARA RAMIREZ

FECHA: 16/11/2017

UNIVESIDAD PONTIFICIA BOLIVARIANA


UPB

MONTERIA- CÓRDOBA

2017
INTRODUCCION
El término regresión fue utilizado por primera vez como un concepto estadístico en 1877
por sir Francis Galton, quien llevó a cabo un estudio que mostró que la estatura de los
niños nacidos de padres altos tiende a retroceder o “regresar” hacia la estatura media de la
población. Escogió la palabra regresión como el nombre del proceso general de predecir
una variable (la estatura de los niños) a partir de otra (la estatura del padre o de la madre).
Más tarde, los estadísticos acuñaron el término regresión múltiple para describir el proceso
mediante el cual se utilizan varias variables para predecir otra.
El procedimiento estadístico que se utiliza para este fin se conoce como análisis de
regresión que permite establecer la relación funcional o ecuación matemática que relaciona
las variables, así como la fuerza de esa relación.
En el presente trabajo se da a conocer que es la Regresión Lineal Simple y cómo se aplica
en un problema de la Panadería “Panes del Sinú” teniendo en cuenta las demandas de los 7
meses y el precio en cada mes, se busca mediante el tipo de Regresión Lineal conocer la
demanda mensual de los próximos 5 meses conociendo el precio de cada mes.

Objetivos:
 Aprender acerca de uso del método de Análisis de regresión lineal.
 Saber cómo diseñar un experimento mediante el método de regresión lineal.
 Instruirse acerca de cómo estimar el valor promedio de una variable dependiente
con base a los valores de una variable independiente
Marco Teórico
Regresión Lineal Simple
El objetivo principal del análisis de regresión es determinar por medio de una ecuación
lineal una relación cuantitativa entre la variable X (independiente) y la variable dependiente
Y. Cuya finalidad principal es predecir el valor de la variable dependiente Y, a partir del o
los valores de la o las variables independientes X.
Representamos dichos valores en unos ejes cartesianos, dando lugar al diagrama conocido
como diagrama de dispersión o nube de puntos. Así, cada individuo vendrá representado
por un punto en el gráfico, de coordenadas, xi, yi.
En la dependencia estocástica, se distinguen dos tipos de técnicas:
1.- Análisis de Regresión
2.- Análisis de Correlación
De modo general, diremos que existe regresión de los valores de una variable con respecto
a los de otra, cuando hay alguna línea, llamada línea de regresión que se ajusta más o
menos claramente a la nube de puntos.
Ecuación de Regresión: Se le denomina a la ecuación que se usa si existe regresión que
describe la relación que hay entre dos variables
𝑌 = 𝑎 + 𝑏(𝑋)
Toda función de la forma 𝑌 = 𝑎 + 𝑏(𝑋) determina, al representarla en el plano una línea
recta, donde X e Y son variables y a y b son constantes.
a: Es la ordenada en el origen, es decir, es la altura a la que la recta corta al eje Y. Se
denomina también término independiente.
b: Se le denomina también “pendiente” es la inclinación de la recta, es decir, es el
incremento que se produce en la variable Y cuando la variable X aumenta una unidad

Diagramas de dispersión
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables,
muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en
el diseño de soluciones y mantenimiento de los resultados obtenidos.
Tipos de Diagramas de Dispersión

Resolución del sistema de ecuaciones


Dividiendo la primera ecuación normal se obtiene:

𝑌 = 𝑎 + 𝑏(𝑋)
Dónde:
∑ 𝒀−𝒃 ∑ 𝑿
𝒂 = 𝒏

𝒏 ∑ 𝐗𝐘 −∑ 𝑿.∑ 𝐘
𝐛= 𝒏 ∑ 𝐗 𝟐 −(∑ 𝑿)𝟐
Marco Conceptual

Analisis de
regresión Lineal

Método matemático que


modeliza la relación entre una
variable dependiente Y, las
variables independientes X, y
un termino aleatorio

Regresión lineal Regresión lineal


Recta de regresión
simple Multiple

Permite trabajar con Se ajustan a la nube de puntos


Permite trabajar con una variable una variable a nivel de o también se puede
a nivel de intervalo o razón así intervalo o razón así comprender la independiente
Solo se maneja una variable Se Solo se maneja una por lo que solo también
ajustan a la nube de puntos o variable llamados diagrama de relación
también se puede comprender la entre dos o mas variables
independiente por lo que solo cuenta con dos parámetro
también llamados diagrama de dispersión generada por una
relación entre dos o mas variables permitirá relacionar mediante
cuenta con dos parámetro distribución binomial
PROBLEMA
Si la Demanda de la Panadería “Panes del Sinú”, durante los últimos 7 meses son las
siguientes:
MES PRECIO DEMANDA
1 5 100
2 7 98
3 9 76
4 13 63
5 18 48
6 24 25
7 40 11
8 11
9 16
10 29
11 32
12 37

Entonces lo que se desea saber es cuanto serían las unidades demandadas de los próximos
cinco meses cuando el precio sea el dado en la tabla mediante regresión lineal simple.
Con base al método de análisis de regresión lineal simple:
Lo primero es estimar los parámetros (cuantificar), que nos permite identificar la variable
dependiente e independiente en este caso seria, Las demandas (Numero de unidades)
mensuales (Variable dependiente), y la variable independiente el precio (Miles$) mensual.
Entonces con base a ala siguiente fórmula para determinar a y b:

∑ 𝒀−𝒃 ∑ 𝑿
𝒂 = Ecu (1).
𝒏

𝒏 ∑ 𝐗𝐘 −∑ 𝑿.∑ 𝐘
𝐛= Ecu (2)
𝒏 ∑ 𝐗 𝟐 −(∑ 𝑿)𝟐

 La y “minúscula” es el valor y de cada punto de datos.


 La n es el número de punto de datos.

Lo que se pretende con estas ecuaciones es hallar la función ajuste para que obtener lo que
se desea en el problema. La función ajuste se define por medio de esta ecuación:

𝒚´´ = 𝒂 + 𝒃𝒙 Ecu (3)


Esta es la ecuación de la recta (Función de ajuste o Pronóstico). En ella:
 La b es la inclinación de la recta.
 La a es la secante o la altura en la que la recta corta al eje y.
 La X es nuestra variable independiente.
 La Y es nuestra variable dependiente, nuestro pronóstico calculado para un periodo.
Entonces se desea saber el valor de a y b para así poder aplicar la función de ajuste:

𝑀𝐸𝑆 𝑃𝑅𝐸𝐶𝐼𝑂 𝑿 𝐷𝐸𝑀𝐴𝑁𝐷𝐴 𝒀 𝑋𝑌 𝑋2


1 5 100 500 25 10000
2 7 98 686 49 9604
3 9 76 684 81 5776
4 13 63 819 169 3969
5 18 48 864 324 2304
6 24 25 600 576 625
SUMA 7 40 11 440 1600 121
∑ - 116 421 4593 2824 32399

Con los valores las sumatoria de la última fila de la tabla, podemos calcular a y b, con los
cuales logramos calcular los valores de la última columna (Y) que es la recta que más se
ajusta a la demanda y.

∑ 𝑋𝑌 = 4593 ; = 32399

∑ 𝑋 2 =2824 ; ∑ 𝑥 = 116

n =7 ; ∑ 𝑦 = 421
Por lo tanto, reemplazando en las ecuaciones 1 y 2 para hallar a y b:

7(4593) − (116). (421)


𝑏= 2 = −2.64
7(2824) − (116)

421+2.64𝑥116
𝑎 = 7

𝑎 = 104
Después de calcular los valores de a y b se reemplazan en la función ajuste (ecuación 3):

𝑦 ´´ = 𝑎 + 𝑏𝑥
𝑦 ´´ = 104 − 2.64X
Ya obtenida la función ajuste se puede calcular el pronóstico de la demanda con relación al
precio dado para los cinco meses:

 Para el mes 8:
𝑦 ´´ = 104 − 2.64(11) = 75

 Para el mes 9:
𝑦 ´´ = 104 − 2.64(16) = 62

 Para el mes 10:


𝑦 ´´ = 104 − 2.64(29) = 27

 Para el mes 11:


𝑦 ´´ = 104 − 2.64(32) = 20

 Para el mes 12:


𝑦 ´´ = 104 − 2.64(89) = 6

Precio X Demanda Y XY 𝑿𝟐 𝒀𝟐 Pronostico Y

5 100 500 25 10000 90,8


7 98 686 49 9604 85,52
9 76 684 81 5776 80,24
13 63 819 169 3969 69,68
18 48 864 324 2304 56,48
24 25 600 576 625 40,64
40 11 440 1600 121 -1,6
11 74,96
16 61,76
29 27,44
32 19,52
37 6,32
Demanda Pronosticada Con El metodo de
Regresión Lineal
120

100

80

60

40

20

0
0 5 10 15 20 25 30 35 40 45
-20

Demanda real Demanda pronosticada

Se necesita saber que tan exacto en el análisis una medida apropiada para medir el error en
regresión lineal es el error estándar de estimación (Sy, x) que permite determinar la
viabilidad en torno a la función de ajuste

∑ 𝑦 2 − 𝑎 ∑ 𝑦 − 𝑏 ∑ 𝑥𝑦
𝑆(𝑦, 𝑥) = √
𝑛−2

32399 − 104𝑥421 + 2.64𝑥4593


𝑆(𝑦, 𝑥) = √ = 12.16
7−2

Entonces el error estándar estimado es de 12.16


Después se necesita hacer el cálculo del coeficiente de correlación que dará una medida de
asociación entre las variables X y Y se calcula con la siguiente formula:

𝑛∑𝑥∑𝑦 − ∑𝑥∑𝑦
𝑅=
√𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 . √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

7𝑥116𝑥421 − 116𝑥421
𝑅= = 16.56
√7𝑥2824 − (116)2 . √7𝑥32399 − (421)2
CONCLUSIÓN
Bibliografía

 http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/18reglin.pdf

 Libro de Probabilidad y Estadística para ingeniería y ciencias de Walpole-Myers


(Novena edición) –Capitulo 11 regresión lineal página 389.

 Libro Estadística para ingenieros y científicos- William Navidi

Você também pode gostar