Análisis de Regresión y Correlación

1
Anlisis de Regresin y Correlacin Simple en Eviews Una simple estimacin Jeferson Ruiz.
nicaeda@gmail.com
Resumen
En el presente documento se estima un sencillo modelo de regresin lineal simple en el paquete economtrico Eviews versin 6. Los datos del modelo estimado provienen del libro de Estadstica Aplicada para Economa de Allan Webster. Se estudia la correlacin de dos variables para una empresa de servicios areos (publicidad y pasajeros). El objetivo de estimar este modelo en Eviews es para demostrar que este paquete informtico, a pesar de ser solamente para modelos lineales, tambin se puede obtener otros estadsticos de pruebas importantes para la confiabilidad del modelo en estudio. Tambin, pretendo dar a conocer una serie de comandos que he creado para mi propia programacin en este paquete.
Palabras Claves: (Estimacin, Modelo, Vector, Escalar, Comando, Intervalo, Estadstico, Regresin, Lnea Area Hop-Scotch). Clasificacin: (Prcticas de Econometra UCA).
Introduccin
De todas las tcnicas estadsticas que se aprenden en un curso corriente, ninguna es ms importante que el anlisis de regresin y correlacin. Muchos estudios empricos dependen en mximo grado de esta herramienta estadstica, que acaso sean las formas de anlisis estadstico mas utilizadas y que adquieren un valor incalculable en el momento de tomar gran nmero de decisiones empresariales y econmicas. La regresin y la correlacin son vitales para determinar la naturaleza de la relacin entre distintas variables con las cuales trabajan a diario quienes toman decisiones. Es difcil exagerar la importancia del anlisis de regresin y correlacin y la variedad y extensin de sus aplicaciones en la resolucin de problemas y toma de decisiones. El anlisis de regresin y correlacin reconoce que puede haber una relacin determinable y cuantificable entre dos o ms variables. Es decir, una variable dependiente y otra que puede estar determinada por sta; o bien podemos decir que una variable es funcin de otra: Y = f(X).
Datos para el Modelo de Regresin de la lnea area Hop-Scotch

obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 publicidad(X) pasajeros(Y) 10 15 12 17 8 13 17 23 10 16 15 21 10 14 14 20 19 24 10 17 11 16 13 18 16 23 10 15 12 16
Donde obs: son los meses en estudio. Publicidad: se da en miles de dlares Pasajeros: se da en miles. El modelo a estimar es: Pero antes recordemos que no contamos con toda la muestra poblacional y, por tanto, haremos una simplificacin de la realidad. Para ello planteamos nuevamente el modelo en su forma estocstica: Donde el significa estimacin muestral y e el trmino de perturbacin estocstica. Una vez obtenido los datos y planteado el modelo en Eviews, nuestro workfile, se presenta de la siguiente manera:
Donde nos refleja el rango y la muestra de 15 observaciones en estudio (Range, Sample). Y mas abajo nos muestra las variables que estamos sometiendo en estudio. Por ltimo, el nombre en la pestaa de abajo Hop-Scotch, con el cual nombramos nuestro workfile al momento de declarar la serie. Ahora corremos la regresin. Para ello escribimos en la ventana de comandos: ls pasajeros c publicidad (Seguido de enter)
Esta es nuestra rea de comandos
Salida de regresin
Como podemos observar, despus de dar enter, nos aparece una ventana con la respectiva regresin, as como tambin, distintos estadsticos descriptivos. Por tanto, nuestro modelo lineal es: PASAJEROS = 4.3862536302 + 1.08131655373*PUBLICIDAD Interpretacin y prediccin: recordemos que el coeficiente 1, significa cunto variar Y por cada variacin de la variable X. En nuestro caso 1=1.08, por cada 1000 dlares adicionales que la lnea area gaste en publicidad 1080 pasajeros ms elegirn volar en Hop-Scotch. Sin embargo, el modelo nos dice que si se gastan, por ejemplo, 10000 dlares en publicidad (X=10) se tendr: = 15.2 Si se multiplica 15.2 por 1000, predecimos a partir de nuestro modelo que 15200 valientes elegirn volar en Hop-Scotch cuando sta gaste 10000 dlares en publicidad. La simple operacin aritmtica que realizamos para la prediccin, la podemos escribir en Eviews en el rea de comandos. Sin embargo, dado que Eviews no es un programa de salidas estadsticas ni tan matemticas, para realizar esta operacin, tenemos que
generar un vector columna para toda la muestra. Para esto escribimos en el rea de comandos:
genr prediccion1=(4.5+1.08*(10))
Damos enter y, en el rea de workfile, nos aparece un fichero con el nombre prediccion1, lo abrimos y tenemos el vector:
El comando genr es para generar alguna variable, vectores, escalares u otras cosas. En nuestro ejemplo generamos un vector con el nombre prediccion1. Para hacer una segunda prediccin, planteemos la idea que se decide gastar 1000 dlares ms en publicidad (X=11), la estimacin de los pasajeros totales se convierte en: Y = 4.40 + 1.08*(11) =16.27 o 16270. Para hacerlo en Eviews repetimos de nuevo los pasos de la prediccion1 y, escribimos en el rea de comandos:
genr prediccion2=(4.5+1.08*(11))
Nuevamente se nos gener un fichero en el workfile, lo abrimos y obtenemos el siguiente vector columna:
Interpretacin: Si X se incrementa de 10 a 11, el nmero de pasajeros predichos es de 16270, es decir, 1080 mas que los 15200 pasajeros predichos si X=10. Esta informacin es til para determinar si est justificado un aumento del presupuesto de publicidad. Como puede verse, una de las aplicaciones del modelo de regresin lineal es predecir, prever o proyectar el valor de la variable dependiente. Dada cualquier cantidad del presupuesto de publicidad de Hop-Scotch, es fcil hacer una estimacin del nmero de pasajeros que volarn con esta empresa. La recta de Regresin y el Error Tpico de Estimacin. La recta de regresin se suele llamar tambin, recta de ajuste ptimo. Es la que se ajusta o acomoda a la relacin entre X y Y mejor que ninguna otra recta. Pero precisamente porque suministra el mejor ajuste, aunque no hay ninguna garanta de que sea buena. Existen dos mediadas de bondad de ajuste 1) el error tpico de estimacin y 2) el coeficiente de determinacin. Analizaremos despus la tcnica de bondad de ajuste. Ahora nos quedaremos con la segunda medida. Pero antes, estimamos la recta de regresin en una grafica. Para ello nos vamos a la ventana de Quick / Graph
Se nos aparece la siguiente ventana, en la cual, tenemos que escoger las variables que vamos a graficar. En lo nico que hay que tener cuidado ac es en ubicar los ejes coordenados. Al realizar esta accin, Eviews, va a reconocer la primer variable introducida como en eje de las abscisas (X) y la segunda variable introducida la reconocer como el eje de las coordenadas (Y). En nuestro estudio, recordemos que pasajeros est en funcin de publicidad. Por tanto, nuestro eje X ser publicidad y nuestro eje Y ser pasajeros.
Hacemos clic en OK y, nos aparece una nueva ventana:
Esta ventana es el Men de los Grficos en Eviews. En nuestro caso haremos un diagrama de dispersin con su respectiva recta de regresin. Entonces, seleccionamos Scatter, luego nos vamos y hacemo clic en Options y nos aparece una ventanita con el nombre Add Element, donde seleccionaremos la opcin Regression Line. Normalmente ya aparece seleccionada por defecto, pero por si acaso no es as, lo confirmamos. Damos Aceptar en Add Element y nos aparece una nueva ventana:
Donde Eviews nos pregunta si deseamos que nuestra recta de regresin sea a escala logartmica, inversa u otro tipo. Pero en nuestro caso no es necesario seleccionar ninguna opcin ya que por defecto aparece seleccionada en None. Damos clic en Ok y lo mismo en la ventana inicial para obtener nuestro grfico final:
(Te quedar como tarea hacer un anlisis de grfico).

El error tpico de la estimacin es bastante similar a la desviacin tpica de una slo variable. En el anlisis de regresin tenemos dos variables X y Y. El error tpico de estimacin es una medida de la dispersin de los valores de Y en torno a su media, para cualquier valor especfico de X. La regla emprica establece que si los datos siguen una distribucin normal, un intervalo que abarque una desviacin tpica por encima de la media y una desviacin tpica por debajo
8 de la media comprender el 68.3% de todas las observaciones; un intervalo de dos desviaciones tpicas a cada lado de la media contendr el 95.5% de las observaciones y tres desviaciones tpicas a cada lado de la media englobarn el 99.7% de las observaciones. Recordemos que el valor de 15.2 es la estimacin del valor medio que obtendramos para Y si pusiramos X igual a 10 muchas veces. Para ilustrar el significado del error tpico de la estimacin, localicemos los puntos que estn en el error tpico. Pero cmo obtenemos el error tpico? Sencillo, en la salida de regresin que nos arroja Eviews la obtenemos con el nombre: S.E of regression (que normalmente conocemos este estadstico en el nombre de Suma de Errores de la Regresin) reproducimos por conveniencia la salida y, donde aparece sombreado, es justo lo que buscamos.
Matemticamente, realizamos esta funcin a travs de una simple operacin aritmtica. Ya tenemos el valor buscado, el cual lo denotaremos con la letra: S.E que ser igual a 0.9067. Ahora vamos a localizar los puntos por encima y por debajo del valor medio de 15.2. Estos puntos son: (15.2-0.9067)=14.29 y (15.2+0.9067)=16.11. Nuestro intervalo es: (14.2916.11). Si por cada uno de estos punto trazramos rectas paralelas a la de regresin, el 68.3%, aproximadamente de todos los puntos, caeran entre estas rectas y el 31.7% restante de las observaciones estaran fuera de este intervalo. En nuestro caso, el 68.3% de las veces que se gastan 10000 dlares en publicidad, el nmero de pasajeros estara entre 14290 y 16110. El 31.7% restante de las veces, el nmero de pasajeros superara 16110 o, sera inferior a 14290. Sobre S.E concluimos que cuanto mas dispersos estn los datos originales, mayor ser S.E.
Coeficiente de determinacin.
Para comprender el anlisis de correlacin habremos de considerar en primer lugar la desviacin total de Y. este importante concepto es la cantidad en que los valores individuales de Y varan a partir de su media ; es decir, Si tomamos el mes 13, por ejemplo, los datos de la tabla muestran que 23000 personas volaron en Hop-Scotch (Yi=23). Como el valor medio del nmero de pasajeros es:
La sumatoria total de Y es 268 para las 15 observaciones, si intercambiamos valores tenemos:
= 17.87 La desviacin total de mes decimotercero es 23-17.87= 5.13. La desviacin total de entre Yi y Y se puede descomponer en dos tipos. La desviacin explicada, es aquella parte de la desviacin total que queda explicada por nuestro modelo. Es la cifra entre aquello que nuestro modelo predice, y el valor medio de Y; es decir, . De esta forma, la desviacin explicada mide la cantidad de la diferencia total entre , que queda explicada por el modelo de regresin. Como X=16 (publicidad) en el mes decimotercero Por tanto, la desviacin explicada es: De esta desviacin total de 5.13 del mes decimotercero, nuestro modelo explica 3.81. El resto de la desviacin total queda inexplicada. La desviacin no explicada es la parte de la desviacin total de Yi respecto de Y no explicada por nuestro modelo. Es la desviacin adicional a partir de Y que excede de lo que nuestro modelo es capaz de tener en cuenta. Para hallarla hay que calcular la diferencia entre lo que Y era en realidad (Yi) y lo que predijo . Habremos de reconocer que este es el error que hemos nuestro modelo , es decir, cometido. Generamos en Eviews un vector columna para obtener la desviacin, escribiendo en la ventana de comandos:
genr desviacion = (21.68-17.87)
Nos aparece un nuevo workfile en la ventana: vector columna con la desviacin para toda la muestra:
Lo abrimos y observamos un
10 En nuestro modelo de regresin, el error es nicamente Estamos ms cerca del valor real de los pasajeros cuando utilizamos nuestro modelo. Vemos pues que este tiene algo de validez como herramienta explicativa. En Eviews, realizar estas operaciones aritmticas, es sencillo, siempre y cuando se tenga conocimiento de los comandos, claro est. Lo lamentable es que Eviews no nos da muchas salidas estadsticas, sobre todo cuando es una variable que se toma de manera individual. La nica manera en que Eviews nos da estos resultados, en cuanto a la salida, es como productos escalares. Pero ojo, la salida no se crea como un workfile, a menos de que este sea generado como un vector. Ac no generaremos este vector o llmese workfile puesto que no la necesitaremos. Para obtener la sumatoria total de Y, escribimos en la barra de comandos: =@sum(pasajeros) Y el resultado lo obtenemos en la barra de directorio, como se muestra en la siguiente imagen:
Entrada de comando
Salida de Resultado
11 Como podemos observar y, como dije mas arriba, obtenemos el resultado como un producto escalar. Si quisiramos obtener la media por la rutina aritmtica, escribimos el comando:
Y el resultado nos aparece de nuevo como un producto escalar, siendo su valor = 17.87, redondeado a dos cifras decimales. Sin embargo, este no es el chiste, la mejor opcin es obtener el resultado de la media, de una manera directa. Para ello, escribimos en la ventana de comandos: =@mean(pasajeros) Nuevamente esperamos el valor en la barra de directorios, como se muestra en la siguiente figura. No obstante, vamos a generar un vector columna en nuestro workfile ya que lo ocuparemos en posteriores pruebas. Pero antes, ya quedara a criterio personal si hacer paso a paso la media o de manera directa.
Entrada de comando
Salida Generamos entonces, el nuevo vector columna con el nombre de desv_explicada. Escribimos en la ventana de comandos:
genr desv_explicada=(268/15)
Nos aparece un nuevo cono en la ventana de workfile lo abrimos obteniendo el siguiente vector:
, hacemos doble clic y
12 Para ltima ilustracin, si queremos obtener el error, simplemente escribimos en el rea de comandos:
Y obtenemos el mismo resultado como se muestra en la figura:
Procederemos ahora a estimar el coeficiente de correlacin que mide la parte de la desviacin total de Y que es explicada por nuestro modelo. En este sentido, es una medida del poder explicativo del modelo de regresin. Son muchos los casos en que necesitamos calcular el coeficiente de correlacin, desarrollado por Karl Pearson en el cambio de siglo, se designa con la letra r y, no es otra cosa que la raz cuadrara del coeficiente de determinacin: = = 0.96837.
En la salida de regresin de Eviews, no tenemos este valor 0.96838, como podemos observar en la siguiente figura. Los estadsticos sombreados son el R-cuadrado y el R-cuadrado-ajustado. Por tanto, el r de Pearson tenemos que estimarlo y, ajustarlo a nuestro modelo. Hacer esto es de suma importancia, como veremos ms adelante. El comando que hay que escribir en la ventana de comandos es el siguiente:
scalar r = @sqr(@r2)
13 Damos Enter y, en la ventana de workfile, nos tiene que aparecer este cono , sin embargo, al intentar abrir este fichero, lamento decirles que no se abrir. La nica manera de verlo es haciendo doble clic en el cono y ver el resultado en la barra de directorio.
El problema de esto estriba en que no generamos un vector, sino ms bien lo hicimos como un producto escalar. No es necesario para nuestro estudio generar el vector, ya queda a decisin tuya hacerlo. Lo importante es que ya obtuvimos el estadstico deseado. Como dije antes, generamos un escalar de r de Pearson. El smbolo @ en Eviews, normalmente se utiliza para obtener distintos estadsticos de pruebas, como el chi-cuadrado, el estadstico F y, otras pruebas que en este documento no estimaremos. Ac lo hemos utilizado para obtener el coeficiente de determinacin. Estimacin de Intervalo para la media condicional de Y. Se trata de una estimacin de intervalo para el valor medio de Y con la condicin de que X sea igual a 10 muchas veces. Para calcular este intervalo para el valor medio condicional de Y hemos de comenzar por determinar Sy, error tpico de la media condicional. El error tpico de la media condicional reconoce que utilizamos una muestra para calcular en la ecuacin de regresin. La misin de Sy es tener en cuenta los valores diferentes de que resultan de error de muestreo y, viene determinado por:
Donde S.E es el error tpico de la estimacin. Xi es el valor dado de la variable dependiente. El intervalo de confianza para la media condicional es entonces: |
Donde es el estimador puntual hallado a partir de nuestra ecuacin de regresin original y el valor de t se basa en un nivel de confianza elegido con n-2 grados de libertad. Hay n-2 g l.
14 Porque tenemos que calcular dos valores, consiguiente, perdemos dos grados de libertad. a partir de datos muestrales. Por
El valor de S.E nos lo da la salida de regresin en la ventana de Eviews (0.907) y a X le hemos dado el valor de 10. Entonces, para obtener los otros datos, nos vamos a la ventana de Quick / Group Statistics / Descriptive Statistics / Common sample
Nos aparece una nueva ventana muy parecida a la de graficos, o sea, tambin ac tenemos que seleccionar la variable, de la cual, necesitamos la media y la suma de desviaciones al cuadrado. En esta ocasin la variable es publicidad y luego damos Ok y, nos aparece una nueva ventana con distintos estadsticos descriptivos.
En nuestro caso solamente necesitamos la media, y la suma al cuadrado de la desviacin. Al sustituir en la frmula tenemos:
Como: = 4.4 + 107(10) = 15.2 La frmula de intervalo: |
15 Dado el nivel de confianza del 95% ( = 0.05) y n-2 = 13 grados de libertad. Al consultar la tabla de t en el apndice de este documento, pgina 22, da un valor de t = 2.160. Entonces:
Interpretacin: Hop-Scotch puede confiar al 95% en que la media poblacional verdadera de Y se encuentra entre 14550 y 15850 pasajeros en todos aquellos meses en que destinan 10000 dlares en publicidad. En Eviews podemos calcular este intervalo de confianza de la media condicional. Aunque no parezca tan sencillo. Podramos obtener un escalar o mejor aun, generar un vector que, es lo que haremos en este caso. Como primer paso, generaremos un nuevo vector con el nombre se, que ser el producto de la raz cuadrada de la formula anterior. Escribimos en la ventana de comandos:
genr se = sqr(1/15+(10-12.47)^2/137.73333)
Como resultado obtenemos un nuevo workfile en la ventana: si lo abrimos, el resultado es 0.333109 que es el resultado de la raz cuadrada. El segundo paso es generar un nuevo vector con el nombre sy. Escribimos en la ventana de comandos:
genr sy=(se*0.907)
Sabemos que el valor de la suma de errores al cuadrado es 0.907, redondeado a tres cifras decimales. Por tanto, ac estamos generando un vector que, multiplicado el resultado de la raz cuadrada por la S.E de la regresin nos da el vector . Que al abrirlo el resultado es:
Que, redondeado a tres cifras decimales nos queda 0.303. Valla a la pgina 14 y comprubela por formula. No estimaremos nuevamente la prediccin de dado que ya la tenemos, 15.2. Hacemos directamente el intervalo: | Escribiendo en la ventana de comandos:
genr intervalo1=(prediccion1+2.160*0.303) Recuerde que estamos generando el primer intervalo el cual llamamos intervalo1. prediccion1 es 15.2 y 2.160, son los grados de libertad de 15-2=13 y, 0.303 es el resultado de la raz cuadrada que estimamos
16
antes. Nuestro nuevo workfile es: De momento no lo abriremos y, pasaremos a generar el segundo intervalo, para ello escribimos en la ventana de comandos: genr intervalo2 = (prediccion1 - 2.160*0.303)
De igual manera, obtenemos un nuevo workfile: Ahora si los vamos a abrir, pero ojo, primero seleccionamos el intervalo dos, apretando la tecla Ctrl y luego, seleccionamos el intervalo uno, hacemos clic derecho open / as Group
Y como podemos observar ya tenemos nuestro intervalo de confianza para la media condicional en Eviews, tal vez no sea tan sencillo, pero al final, s lo es. Solamente es cuestin de ir adquiriendo prctica. Podramos obtener varios intervalos de confianza para yx y varios valores de X. Ello nos daran varios I.C. Estos intervalos formaran entonces una banda de confianza completa para Intervalo predictivo para un valor nico de Y. El intervalo de confianza elaborado arriba se refiere al valor medio poblacional de todos los valores de Y cuando X se pone igual a una cantidad dada muchas veces. Peor otras veces podra ser til construir un intervalo de confianza para un valor nico de Y que se obtuviera cuando X se pusiera igual a un valor dado una sola vez. Por ejemplo, Hop-Scotch podra estar interesada el predecir el nmero real de clientes del mes prximo si gastan 10000 dlares en publicidad. Este planteamiento difiere del problema anterior, en el cual el inters se centraba en el valor medio de Y si X se pona igual a 10 muchas veces. Nuestro inters se centra ahora en predecir un valor nico de Y si X se pone igual a una cantidad dada una sola vez. Es decir, en lugar de intentar predecir la media de muchos valores de Y obtenida con la condicin de que X se pusiera igual a 10 muchas veces. Ahora tratamos de predecir un valor nico de Y que se obtiene si X se pone igual a 10 una sola vez. Para calcular este intervalo predictivo, hemos de comenzar por calcular el error tpico de la prediccin Syi (que no se debe de confundir con el error tpico de la media condicional, Sy). Este error tpico de la prediccin tiene en cuenta que los valores individuales estn ms dispersos que las medias. El error tpico de la prediccin refleja el error muestral inherente al
17 error tpico de la media condicional Sy, ms la dispersin adicional que ocurre porque tratamos con un valor individual de Y. La frmula para dicho clculo es:
El intervalo predictivo para un solo valor de Y, Yx, es entonces: Construyamos ahora un intervalo de confianza del 95% para un solo valor de Y cuando X = 10 y comparmoslo con el intervalo para la media condicional que hemos elaborado antes. Solucin:
Sabemos que: = 15.2 Obtenemos el intervalo:
Interpretacin: podemos estar seguros al 95% de que si un solo mes X = 10000 dlares, el valor nico resultante de Y, se encontrar entre 13140 y 17270 pasajeros. En Eviews; lo hars esta vez tu solo(a), no es nada complicado, simplemente vas a utilizar la misma metodologa que hicimos para estimar la media condicional. Contraste de Hiptesis sobre el coeficiente de correlacin de la poblacin Como nuestro coeficiente de correlacin r = 0.97 no es cero, los datos muestrales nos llevan a la conclusin de que hay una relacin entre X y Y. Pero recordemos que esta conclusin se basa nicamente en n = 15 observaciones. Sin embargo, aunque el coeficiente de correlacin de la muestra no sea cero, a menudo conviene contrastar la hiptesis de que r poblacional es cero.
18 Nuestra hiptesis sera:
Se realiza este contraste de hiptesis para determinar si es significativamente diferente de cero. Esta prueba emplea el siguiente estadstico:
Tiene n 2 grados de libertad Sr: es el error tpico de la distribucin muestral de r y, simboliza que, si se tomaran varias muestras de tamao 15 obtendramos diferentes valores de r. Es decir, podemos obtener muchas muestras diferentes de la poblacin cada una con su propio valor de r. Si r = 0, los valores de r estaran distribuidos en torno a r, desde 1 a + 1. Sr, se halla por la frmula:
Elegimos en nivel de confianza, por ejemplo el 95% ( = 0.05), al cual contrastar la hiptesis nula de r = 0. Tal eleccin nos permite hallar un valor crtico de t en la tabla t. Si contrastamos la hiptesis nula al nivel de confianza de 95%, hallaramos en la tabla que los valores crticos de t, dados 15 2 = 13 grados de libertad, son 2.160. Esto significa que si r es igual a cero, el 95% de las muestras de tamao 15 que se pudieran tomar tendran datos que daran un valor de t entre 2.160 y + 2.160. Slo hay una probabilidad de un 5% de que si r = 0, la muestra diera un valor de t por debajo de 2.160 o por encima de 2.160. Si al introducir los datos muestrales en la frmula se obtiene un valor t fuera de este intervalo, se puede estar seguro al 95% de que lo cual indica que hay una relacin entre X y Y a nivel poblacional. Por el contrario, si el valor de t esta entre 2.160 y + 2.160 no se puede rechazar la hiptesis nula de r = 0. A pesar de los resultados muestrales no habra pruebas suficientes para llegar a la conclusin, al nivel de confianza del 95%, de que existiera una relacin entre X y Y. Prueba de Hiptesis. Intercambiando valores en la frmula:
Tenemos:
= 13.995
19 Regla de decisin: no rechazar la hiptesis nula de r = 0 si el valor de t est entre 2.160 y + 2.160. Rechazar r = 0 si el valor de t es inferior a 2.160 o superior a 2.160. Interpretacin: como t = 13.995 > 2.160, el gerente de Hop-Scotch puede estar seguro al 95% de que hay una relacin entre X y Y. Tiene que rechazar la hiptesis nula de r = 0 y llegar a la conclusin, con la certidumbre del 95% de que existe una relacin entre X y Y. Esta prueba se dice que es significativa al nivel del 5%. Para hacer esto en Eviews, tenemos que generar vectores. El primer paso consiste en generar un vector llamado sr. Para ello escribimos en la ventana de comandos:
genr sr = (1-0.93776)
Y tenemos nuestro vector Generamos un nuevo vector llamado t Escribimos en la ventana de comandos:
genr t = (0.968380/0.927865)
Y obtenemos el nuevo vector El siguiente comando es:

genr ratio=(sr/13)
El nuevo vector es Recuerde que de sr tenemos que obtener la raz cuadrada del ratio. Escribimos el comando:
genr sr = sqr(ratio)
Por ltimo escribimos el comando:

genr t = (r/sr)
Abrimos nuestro nuevo vector y tenemos el valor crtico de t:
Ya ven que sencillo es
20 Nuestro ltimo paso, ahora consiste en estimar un intervalo de confianza para 1. Bajo el supuesto que ya conocemos la teora adyacente, no perderemos el tiempo y, trabajamos directamente en Eviews. Contraste de hiptesis para 1:
Como la salida de regresin en Eviews nos da el error estndar de cada parmetro, as como tambin, su respectivo valor t, no es necesario que lo estimemos en Eviews o bien, manualmente. Inclusive, sin necesidad de una calculadora bien se pueden obtener estos resultados. Por tanto, haremos esto de una manera directa. Reproducimos la salida de regresin por conveniencia:
El contraste ser realizado con el nivel de confianza del 99%, para dar el mximo grado de seguridad al gerente de Hop-Scotch. Dado nuestro valor t = 13.995 (redondeado a tres cifras decimales) Si = 0.01, los valores crticos de la tabla t son 3.012. (Consulte la tabla t del apndice, pgina 22). Regla de decisin: no rechazar Ho: 1 = 0 si el valor de t se encuentra entre 3.012 y + 3.012. Rechazar si el valor de t est fuera de este intervalo. Interpretacin: como t = 13.995, rechazamos que Ho: 1 = 0 y concluimos que hay una relacin entre X y Y. Slo hay una probabilidad del 1% de que si 1 = 0 nuestra muestra de un valor de t fuera del intervalo especificado. El valor 13.995 de t nos permite rechazar 1 = 0 con un nivel de confianza del 99%.
21 Observacin. El valor de 13.995 que hemos obtenido para t en nuestra prueba del coeficiente de regresin Ho: 1 = 0, es idntico al valor de t que obtuvimos en nuestra prueba del coeficiente de correlacin, Ho: r = 0. Esto no es una coincidencia. Ocurre siempre en la regresin simple. Por tanto, si 1 = 0, r tiene que ser cero. Y en consecuencia, la hiptesis nula de Ho: 1 = 0 es equivalente a Ho: r = 0. En la prctica slo es necesario realizar una de estas pruebas. Intervalo de Confianza para 1 Como 1 = 1.08 es solo una estimacin puntual de 1, podramos necesitar un intervalo de confianza del coeficiente de regresin poblacional. Se consigue mediante:
Recuerde que el estadstico t tiene n 2 grados de libertad. Solucin: Si elegimos un nivel de confianza del 99% para nuestra prueba, hallaremos:
Interpretacin: podemos confiar al 99% de confianza en que 1 est entre 0.849 y 1.314, con lo cual indica una relacin positiva entre publicidad y nmero de pasajeros. Y por fin, el gerente de Hop-Scotch esta dispuesto a admitir que hay sin duda una relacin entre la publicidad y el nmero de pasajeros que eligen volar en esta lnea area. En Eviews, tambin, se puede estimar este intervalo de confianza como lo hicimos con la media condicional. Pero esto te quedar de tarea. Te deseo buena suerte, recuerda que no es difcil, es muy sencillo, simplemente vas a utilizar la misma metodologa con que estimamos la media condicional. Si tienes algn problema y gustas consultarme, no dudes en escribirme a mi correo. Ah estoy siempre y a la orden para ti.
Apndice. Tablas estadsticas de distribucin t
22

Análisis de Regresión y Correlación

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análisis de Regresión y Correlación

Enviado por

Direitos autorais:

Formatos disponíveis

1

Datos para el Modelo de Regresin de la lnea area Hop-Scotch

Esta es nuestra rea de comandos

Hacemos clic en OK y, nos aparece una nueva ventana:

(Te quedar como tarea hacer un anlisis de grfico).

La sumatoria total de Y es 268 para las 15 observaciones, si intercambiamos valores tenemos:

, hacemos doble clic y

Y obtenemos el mismo resultado como se muestra en la figura:

Como: = 4.4 + 107(10) = 15.2 La frmula de intervalo: |

Sabemos que: = 15.2 Obtenemos el intervalo:

18 Nuestra hiptesis sera:

Y obtenemos el nuevo vector El siguiente comando es:

Por ltimo escribimos el comando:

Abrimos nuestro nuevo vector y tenemos el valor crtico de t:

Ya ven que sencillo es

Apndice. Tablas estadsticas de distribucin t

Você também pode gostar