Você está na página 1de 16

ANÁLISIS DE

REGRESIÓN
CON DOS
VARIABLES.
INTEGRANTES:

• Bautista Ortega Paola Teresita.


• Flores Chico Héctor.
• Hernández Rodríguez Arnulfo Manuel.
• Gonzalez Montañez Jaquelin Anai.
• Molina Caamal Luis Enrique.
• Nahuat Montero Christian Alejandro.
• Pech Varguez Edwin Leandro.
EJEMPLO HIPOTÉTICO.

• El análisis de regresión se relaciona en gran medida con la


estimación o predicción de la población o valor promedio
de la variable dependiente, con base en los valores
conocidos o fijos de las variables explicativas.
Para entender esto, consideremos los datos de la tabla que se
indica a continuación. Estos datos se refieren a la población total
de 60 familias de una comunidad hipotética, así como a su ingreso
semanal (X) y su gasto de consumo semanal (Y), en dólares. Las
60 familias se dividen en 10 grupos de ingresos (de 80 dólares a
260); asimismo, aparecen los gastos semanales de cada familia de
los diversos grupos. Por consiguiente, hay 10 valores fijos de X y
los correspondientes valores Y para cada valor X; así, hay 10
subpoblaciones Y.
Para verificar lo anterior, a continuación se proporciona la media, o
promedio, del consumo semanal que corresponde a cada uno de los
10 niveles de ingresos. Así, al nivel de ingreso de 80 dólares le
corresponde una media de consumo igual a 65 dólares, pero para el
nivel de 200, la media es de 137. En total hay 10 valores medios para
las 10 subpoblaciones de Y. A estos valores medios se les llama
valores esperados condicionales, en virtud de que dependen de
los valores de la variable (condicional) X. En forma simbólica, se
denotan con E(Y/X), lo cual se lee como el valor esperado de Y, dado
el valor de X.

Probabilidades
condicionales
p(Y /Xi)
CONCEPTO DE FUNCIÓN DE
REGRESIÓN POBLACIONAL
(FRP).
La media condicional E(Y/Xi) es función de Xi, donde Xi es un valor dado
de X. Simbólicamente,

E(Y /Xi ) = f (Xi )

donde ƒ(Xi) denota alguna función de la variable explicativa X

Dicha función sólo denota que el valor esperado de la distribución de Y


dada Xi se relaciona funcionalmente con Xi. En otras palabras, dice cómo
la media o respuesta promedio de Y varía con X.
SIGNIFICADO DEL TÉRMINO
LINEAL.
La esperanza condicional de Y es una función lineal de Xi
(ejemplo última ecuación). Geométricamente, la curva de
regresión en este caso es una recta. En esta interpretación, una
función de regresión como 𝐸 𝑌/𝑋𝑖 = 𝛽1 + 𝛽2 𝑋𝑖2 , no es una
función lineal porque la variable X aparece elevada a una
potencia o índice de 2.

La segunda interpretación de linealidad se presenta


cuando la esperanza condicional de Y, E(Y/Xi), es una
función lineal de los parámetros, los β; puede ser o no
lineal en la variable X. De acuerdo con esta
interpretación, 𝐸 𝑌/𝑋𝑖 = 𝛽1 + 𝛽2 𝑋𝑖2 , es un modelo de
regresión lineal.
Esquemáticamente tenemos la siguiente tabla.
Así, E(Y /Xi ) = β1 + β2Xi, lineal en los parámetros
igual que en las variables, es un modelo de
regresión lineal (MRL), lo mismo que 𝐸 𝑌/𝑋𝑖 =
𝛽1 + 𝛽2 𝑋𝑖2 , lineal en los parámetros pero no
lineal en la variable X.
ESPECIFICACIÓN
ESTOCÁSTICA DE LA FRP.
En la gráfica (Distribución condicional del gasto en varios niveles de
ingreso), a medida que aumenta el ingreso familiar, el consumo
familiar, en promedio, también aumenta.
Pero, ¿qué sucede con el consumo de una familia en relación con su
nivel de ingreso (fijo)?
Dada la gráfica y la tabla de Ingreso familiar semanal X($), que el
consumo de una familia en particular no necesariamente aumenta a
medida que lo hace el nivel de ingreso. Por ejemplo, en la tabla de
Ingreso familiar semanal X($), se observa que en el nivel de ingreso de
100 dólares existe una familia cuyo consumo, de 65, es menor que el
consumo de dos familias cuyo ingreso semanal es sólo de 80 dólares.
Sin embargo, hay que advertir que el consumo promedio de las familias
con ingreso semanal de 100 es mayor que el consumo promedio de las
familias con un ingreso semanal de 80 dólares (77 y 65).
Entonces, ¿qué se puede decir sobre la relación entre el consumo de
una familia y un nivel determinado de ingresos? En la gráfica anterior, se
ve que, con el nivel de ingresos de Xi, el consumo de una familia en
particular se agrupa alrededor del consumo promedio de todas las
familias en ese nivel de Xi, es decir, alrededor de su esperanza
condicional. Por consiguiente, expresamos la desviación de un Yi en
particular alrededor de su valor esperado de la manera siguiente:

donde la desviación ui es una variable aleatoria no observable


que adopta valores positivos o negativos. Técnicamente, ui se
conoce como perturbación estocástica o término de error
estocástico.
¿Cómo se interpreta la ecuación? Se puede decir que el gasto de
una familia en particular, según su nivel de ingreso, se expresa
como la suma de dos componentes: 1) E(Y/Xi), que es
simplemente la media del consumo de todas las familias con el
mismo nivel de ingreso. Este componente se conoce como
componente sistemático, o determinista, y 2) ui que es el
componente aleatorio, o no sistemático. El término asociado a la
perturbación estocástica, por el momento, supondremos que es
una componente que sustituye o representa a todas las variables
omitidas o ignoradas que puedan afectar a Y, pero que no se
incluyen (o no pueden incluirse) en el modelo de regresión.
Si suponemos que E(Y/Xi) es lineal en Xi, reemplazando se
escribe como
La ecuación plantea que el consumo de una familia se relaciona
linealmente con su ingreso más el término de perturbación. Así, el
consumo individual, con X = 80 (tabla de Ingreso familiar semanal X($)),
se expresa como

Ahora, si tomamos el valor esperado en ambos lados,


obtenemos

donde se aprovecha que el valor esperado de una constante sea


la constante misma.8 Observen que en la última ecuación se tomó
la esperanza condicional, condicionada a las X dadas.
Como E(Yi /Xi) es lo mismo que E(Y/Xi), la ecuación queda de la
siguiente forma:

Así, el supuesto de que la línea de regresión pasa a través de las


medias condicionales de Y, implica que los valores de la media
condicional de ui (condicionados al valor dado de X ) son cero.

La especificación estocástica tiene la ventaja que muestra


claramente otras variables, además del ingreso, que afectan el
consumo, y que el consumo de una familia no se explica en su
totalidad sólo por la(s) variable(s) en el modelo de regresión.

Você também pode gostar