Você está na página 1de 6

Econometría I

3ro Economía CRD


Actividad-1
Conferencia-1
Título: El Modelo de Regresión Lineal General (Tema I)
Asunto: Introducción. Relaciones entre variables. Diagrama de dispersión. Coeficiente de
correlación de Pearson. Modelo de Regresión. Clasificación de modelos. Modelo de
regresión Lineal Simple. Estimación de los parámetros (MCO). Ecuación de regresión
estimada.
Objetivos:
a) Comprender la importancia y utilidad del estudio de las relaciones entre varias
variables correspondientes a un mismo fenómeno.
b) Conocer el carácter estocástico de los modelos de regresión.
c) Conocer el Modelo de Regresión Lineal Simple.
d) Comprender cómo confeccionar e interpretar el diagrama de dispersión.
e) Comprender el método de los mínimos cuadrados.
f) Conocer la ecuación de regresión estimada y su uso.

Bibliografía
Econometría. D.Gujarati – páginas 13-26; 28-42; 47-54

Medios de enseñanza: Pizarra, tizas.


Método de enseñanza: Expositivo
Valores a trabajar en la clase: El interés por el saber.

Introducción:

En las asignaturas precedentes se han estudiado métodos estadísticos para el análisis de


una sola característica o variable. Sin embargo, en la mayoría de los problemas de la
realidad intervienen conjuntamente varias variables, cuya interrelación es necesario estudiar.
Con este tema comenzaremos el estudio de tales relaciones.

Relaciones entre variables


Consideremos, por ejemplo, la relación entre el precio establecido a un producto y las ventas
logradas de este. Es claro que a un mayor precio deben venderse menos unidades del
producto. El estudio de esta relación podría servir para estimar las ventas para distintos
precios y en base a las ganancias esperadas a cada precio y la capacidad de producción
disponible establecer el precio al que se comercializará el producto.

Diagrama de dispersión
Una primera vía para comenzar a estudiar la relación entre las variables es la vía gráfica a
través del llamado diagrama de dispersión.
Si se fijan n valores de la variable X y se observan los valores de la variable Y se obtienen n
pares de valores ( X 1 , Y 1 ) ,..., ( X n , Y n ). Al representar dichos puntos en un sistema de
dos ejes perpendiculares con sus correspondientes escalas se obtiene un gráfico que puede
servir de guía acerca de la posible relación ó no entre las variables y las características de
esta.
Ejemplo:

Los siguientes datos corresponden a la empresa de Materiales de Construcción para la


Vivienda de la provincia de Matanzas mostrando en el sus asientos contables por un período
comprendido entre el año 2000-2010 la demanda (Y) cientos de sacos semanales por
empresas así como el precio de los mismos (X1),CUC por unidad.

Según la Microeconomía, la demanda de un producto de consumo depende del precio de


ese producto, de los precios de otros bienes sustitutivos y complementarios y del ingreso del
consumidor. Por ahora supondremos una función de demanda parcial ó ceteris paribus,
suponiendo todas las demás variables independientes de influencia en la demanda de arena
constantes.

X – Precio
Y – Demanda

Año Y X
2000 2.57 0.77
2001 2.50 0.74
2002 2.35 0.72
2003 2.30 0.73
2004 2.25 0.76
2005 2.20 0.75
2006 2.11 1.08
2007 1.94 1.81
2008 1.97 1.39
2009 2.06 1.20
2010 2.02 1.17

Diagrama de dispersión
2.7

2.5

2.3
Y

2.1

1.9
0.7 0.9 1.1 1.3 1.5 1.7 1.9
X
Se observa la relación ya analizada entre ambas variables (mayor precio-menor demanda),
en cuanto al tipo de relación pudiera asumirse una relación lineal o tal vez hiperbólica, de
acuerdo a la forma del conjunto de puntos, aunque la cantidad de estos es escasa.
El diagrama de dispersión puede ser útil en la detección de valores atípicos, es decir valores
de Y muy distantes de los restantes y que no se corresponden con la relación observada
entre las variables para el resto de los puntos. Su presencia puede estar dada por errores de
medición o tabulación de los datos o por la existencia de un cambio estructural es decir, un
cambio en la forma (o los parámetros) de la relación entre las variables a partir de un valor
dado de la variable independiente.

Coeficiente de correlación de Pearson (r).

 Estadísticamente el Coeficiente de correlación de Pearson (r) es un índice que


mide la relación lineal entre dos variables aleatorias cuantitativas. Es independiente de
la escala de medida de las variables.
 El valor del coeficiente de correlación oscila entre –1 y 1 (-1 ≤ r ≤ 1). En cada caso
concreto, el valor de r indica el tipo de relación entre las variables x e y.
 Cuando |r|es próximo a 1, la correlación es fuerte, lo que significa que las variaciones
de una de las variables repercuten fuertemente en la otra. Mientras que si |r|es
próximo a 0, la correlación es muy débil y las variables están muy poco relacionadas.

n XY   X  Y
r
n  X 2
  X 
2
 n  Y 2
 Y 
2

Para el ejemplo anterior:

Y X X2 XY Y2
2.57 0.77 0.5929 1.9789 6.6049
2.50 0.74 0.5476 1.85 6.25
2.35 0.72 0.5184 1.692 5.5225
2.30 0.73 0.5329 1.679 5.29
2.25 0.76 0.5776 1.71 5.0625
2.20 0.75 0.5625 1.65 4.84
2.11 1.08 1.1664 2.2788 4.4521
1.94 1.81 3.2761 3.5114 3.7636
1.97 1.39 1.9321 2.7383 3.8809
2.06 1.20 1.44 2.472 4.2436
2.02 1.17 1.3689 2.3634 4.0804
∑ XY =23,9238
∑Y=24,27 ∑X=11,12 ∑ X2=12,5154 ∑ Y2=539905

11 * 23.9238  11 .12 * 24.27


r
11 *12.5154  11.12  11 * 53.9905   24.27 
2 2
263.1618  269.8824
r
137.6694  123.6544 593.8955  589.0329

 6.7206  6.7206  6.7206


r r r r  0.81
14.015 * 4.8626 68.149339 8.2553

El coeficiente de correlación muestra una relación inversa y fuerte entre el precio y la


demanda de la arena.

Modelo de Regresión
Las relaciones entre variables aleatorias no tienen un carácter “determinístico”, es decir, no
puede esperarse que para un valor dado de una variable se obtenga exactamente el valor de
la otra establecido por el modelo. Están presentes siempre una serie de factores aleatorios
que conforman una variación o error aleatorio.
Así , se llama modelo de regresión a un modelo que expresa el valor esperado de una
variable aleatoria Y , llamada variable dependiente en función de una o más variables
independientes X 1 , X 2 , ..., X k.
E (Y / X 1 , X 2 , , X k )  f ( X 1 , X 2 , , X k )
Se supone que las variables independientes X 1, X2, …, Xk son variables controladas (no
aleatorias, con valores fijados), mientras que la variable dependiente Y es una variable
aleatoria cuyos valores se observan para los valores de las variables independientes fijados,
aunque realmente, sobre todo en fenómenos económicos, tal supuesto no se cumple,
teniendo las variables independientes carácter aleatorio también.

Clasificación de modelos
Según el número de variables independientes se clasifican los modelos en modelos de
regresión simple, doble o múltiple.
Según la expresión funcional f el modelo se denomina lineal o no lineal.
Esta linealidad se refiere a linealidad en los parámetros, es decir, la función f debe ser tal
que:
f 1  2 ( X 1 , X 2 , , X k )  f 1 ( X 1 , X 2 ,, X k )  f  2 ( X 1 , X 2 , , X k )
Modelo de Regresión Lineal Simple
Así, se llama Modelo de Regresión Lineal Simple al modelo
E (Y / X )   1   2 X  Y   1   2 X    Yi  1   2 X i  u i

Estimación de los parámetros


El modelo establecido es un modelo teórico que contiene parámetros desconocidos
 1 y  2 que sería necesario estimar, para que dicho modelo pudiera traducirse en una
aplicación práctica (estimar el valor medio de Y para un valor dado de X).
El método que se verá de estimación de los parámetros es el de mínimos cuadrados.
La idea fundamental consiste en tomar cómo valores estimados de los parámetros a los
valores b1  ̂ 1 y b2  ˆ 2 tales que hagan mínima la suma de cuadrados de las
desviaciones de los valores reales de los estimados (residuos):
ei  Yi  Yˆi ; min  ei2  min  Yi  Yˆi   min   Yi  b1  b2 X i  . ei  uˆ i
2 2

Gráficamente ello significa elegir aquella recta a la cual los puntos estén más “cercanos”,
tomando como criterio de esta “cercanía” la suma de cuadrados de las distancias
perpendiculares de los puntos a la recta. Es necesaria la presencia del cuadrado, puesto que
unas diferencias podrían ser negativas y otras positivas, ambas con valores altos,
provocando un valor bajo (incluso nulo) de la suma de las diferencias Yi  Yˆi .
Como resultado de la aplicación del método al modelo de regresión lineal simple se obtienen
las siguientes expresiones de cálculo para b 1 y b 2.

n XY   X  Y
b2  ; b1  Y  b2 X
n X 2    X 
2

*** Notemos que dichas fórmulas son aplicables a cualquier modelo del tipo
E (Y / X )   1   2 f ( X ) . Bastaría el cambio de variable Z = f (X) para obtener un modelo
como el original en la variable Z; E ( Z / X )   1   2 Z . Por tanto bastaría en las fórmulas
anteriores sustituir X por f (X)

Ejemplo (Suponiendo relación lineal)

11  23,9238  24,27  11,12


b2  = -0,4795
11  12,5154  11 .12
2

24,27 11 .12
b1   ( 0,4795) = 2,6911
11 11

Yˆ  2,6911  0,4795 X
Por ejemplo, al fijar un precio de 80 el saco se espera una demanda media de alrededor de:
YˆX 0,80  2,6911  0,4795  0,80  2,3075 cientos de sacos semanales por empresas.

Ecuación de regresión estimada


Se llama ecuación de regresión estimada a:
Yˆ  b1  b2 X . La interpretación de Ŷ sería la de un estimado del valor medio o esperado de
Y para el valor dado de X.
El coeficiente b2 cuanto cambia el valor medio de Y por cada unidad de cambio en X
En el ejemplo analizado b2  4.93 expresa un decrecimiento de la demanda al aumentar el
precio.
Por su parte b 1 sería el valor estimado del valor esperado de Y para X =0; en ocasiones
puede no tener una interpretación realista; en el ejemplo correspondería a la demanda de
arena si supuestamente esta fuera ofrecida gratuitamente. No obstante ello, sería razonable
suponer que las empresas no emplearían cantidades desproporcionadas de arena, teniendo
en cuenta las especificidades de la construcción, por lo que podría interpretarse este valor
como la demanda máxima que existe del producto.

Conclusiones
Se resumen los aspectos tratados, se orienta el estudio de los contenidos tratados a través
de las notas de clase y la bibliografía.
- ¿Cómo se determina en un problema de este tipo cuál es la variable independiente y
cuál la dependiente?
- ¿Cuáles son otros términos con los que se designa a las variables independientes?
- Explicar relaciones entre precios de productos sustitutivos y complementarios y la
demanda de un producto dado ¿Qué signos se esperarían de los coeficientes b 2 en
las ecuaciones de regresión estimadas correspondientes?

Estudio Independiente:

La tienda de recaudación de divisas “La Ilusión “demostró durante los primeros 8 meses del
2010 una mejor venta de sus productos (miles de pesos), así como se muestra en los
siguientes valores observados.
a) Realice el diagrama de dispersión y diga qué observa.
b) Halle la ecuación de regresión estimada.

Costo del producto (mp) X Ganancia en ventas (mp) Y


4 1
2 1
4 1
2 1
3 2
3 1
5 2
4 2

Você também pode gostar