Você está na página 1de 8

Semestre: 3er Carrera: Desarrollo Empresarial Docente: Ing.

Lisceth Hernndez Asignatura: Estadstica I Gua Complementaria Unidad VIII, XI, X

La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada. el anlisis de regresin es una herramienta estadstica que permite analizar y predecir o estimar observaciones futuras de dos o ms variables relacionadas entre s, es decir una herramienta til para la planeacin. La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las variables que van a construir las ecuaciones de la regresin, ya que tomar variables que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es decir ilgico. Diagrama de Dispersin: corresponde a la representacin grfica de una distribucin bidimensional. En algunos casos, si los puntos son demasiados, es conveniente dibujar slo un punto para cada par de valores de la variable, pero sealando entre parntesis su frecuencia. Distribuciones Bivariantes Es cuando sobre una poblacin estudiamos simultneamente los valores de dos variables estadsticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribucin bivariantes. Ejemplo 1: Las notas de 10 alumnos en Matemticas y en Lengua vienen dadas en la siguiente tabla: MATEMTICAS 2 LENGUA 2 4 2 5 5 5 6 6 5 6 7 7 5 7 8 8 7 9 10

Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribucin bivariante. Medida De La Correlacin Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables estadsticas distintas, con el fin de ver si existe alguna relacin entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables estn correlacionadas o bien que hay correlacin entre ellas.

La apreciacin visual de la existencia de correlacin no es suficiente. Usaremos un parmetro, llamado coeficiente de correlacin que denotaremos con la letra r, que nos permite valorar si sta es fuerte o dbil, positiva o negativa. el diagrama de Dispersin indica la forma de relacin entre ambas variables y proporciona una idea sobre las lneas de regresin aplicables. Si el coeficiente de correlacin r es un valor cercano o igual a 1 o a -1, existe una buena correlacin pero que a medida que se aproxime a 0 se desmejora Correlacin Lineal Y Recta De Regresin Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as ocurre diremos que hay correlacin lineal. La recta se denomina recta de regresin.

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a una recta y ser cada vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta. En el grfico observamos que en nuestro ejemplo la correlacin es bastante fuerte, ya que la recta que hemos dibujado est prxima a los puntos de la nube. Cuando la recta es creciente la correlacin es positiva o directa: al aumentar una variable, la otra tiene tambin tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlacin es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

SERIES TEMPORALES
Hasta ahora todas las variables que se han estudiado tenan en comn que, por lo general, nunca han estado fechadas, es decir no estaban vinculadas al tiempo en forma alguna y menos explcitamente. Se trataba de datos de corte transversal o atemporales. Sin embargo es muy frecuente, especialmente en el mbito econmico y en general en las ciencias sociales, que las observaciones de los caracteres de una poblacin se realicen ligadas al tiempo o fechadas en instantes determinados de tiempo. As, por ejemplo, una de los caracteres de una empresa susceptible de ser observado puede ser su volumen de ventas y podemos estar interesados en estudiar el comportamiento y evolucin temporal de esa caracterstica de la empresa. En este caso esa observacin se realizar de forma repetida durante una serie de momentos del tiempo. Esa observacin repetida en el tiempo da lugar a una serie temporal. En este sentido diremos que e s l o q u e s e c o n o c e c o m a una serie temporal, cronolgica, histrica o de tiempo es una sucesin de observaciones cuantitativas de un fenmeno ordenadas en el tiempo. El anlisis de series temporales, desde el punto de vista de su comportamiento, tanto pasado como futuro, requiere el uso de nuevas tcnicas, pues las presentadas hasta el momento, aunque le son aplicables, no cubren las necesidades que surgen en el tratamiento de este tipo de datos. Desde el momento que los valores de una serie temporal van ligados a instantes del tiempo, entonces, podemos decir que el anlisis de una serie implica el manejo conjunto de dos variables, siendo una de ellas nuestra serie temporal y la otra los intervalos o instantes del tiempo sobre los cuales se han realizado las observaciones. Hay que sealar que esa observacin sincronizada de la variable en el tiempo implica que los valores de la misma han de estar perfectamente ordenados, de igual modo que los intervalos del tiempo lo estn. Esas observaciones de una variable cuantitativa pueden estar referidas, como ya se ha sealado, a un instante del tiempo o a un intervalo del mismo, dando lugar a dos tipos de magnitudes. En el primer caso hablaremos de magnitudes stocks o niveles. En el segundo se habla de flujos. Una variable stock es el nmero de empleados de una empresa en un instante del tiempo, a final de cada mes, mientras que un flujo seran las ventas de esa empresa a lo largo de ese mes, por ejemplo. La diferencia entre una y otra es que la primera no es sumable para los distintos instantes de un intervalo, pues se incurrira en d uplicaciones de los valores de esa magnitud. En cambio, el segundo tipo de magnitud si es sumable o acumulable a lo largo de un periodo o intervalo de tiempo. Para este segundo tipo, los intervalos para los que se acumulan deben ser siempre de igual amplitud. Es decir, si se dan datos de ventas de

una empresa, estos debern ser siempre mensuales, trimestrales, etc, pero lo que no nunca deber hacerse es intentar trabajar con una serie que mezcle datos semanales con mensuales o referidos a cualquier otro periodo temporal. Este requisito lleva implcita la idea de homogeneidad. Para que el anlisis de una serie temporal nos conduzca a conclusiones acertadas no basta con utilizar las tcnicas apropiadas, sino que ser imprescindible que esos datos sean comparables y no lo sern nunca si no son homogneos. Si cada ao cambia la metodologa de observacin, se cambian las definiciones, se modifica la poblacin de referencia, etc, el resultado ser una serie temporal compuesta por un conjunto de valores no comparables porque son muy heterogneos. Esta falta de homogeneidad se pierde, de una forma natural, con el transcurso del tiempo, de manera que cuando las series son muy largas no hay garanta de que los datos iniciales y finales sean comparables. Pero esta necesidad de que las series no sean muy largas, para que sus datos no pierdan la deseable homogeneidad, entra en contradiccin con el objetivo ms elemental de la Estadstica que es el de detectar regularidades en los fenmenos de masas. Lo que se pretende con una serie es describir y predecir el comportamiento de un fenmeno que cambia en el tiempo. Esas variaciones que experimenta una serie temporal pueden ser de naturaleza doble. Por un lado las variaciones pueden ser evolutivas o estacionarias. Diremos que las variaciones son evolutivas cuando el valor medio de la serie cambia, no permanece fijo a lo largo del tiempo, mientras que las variaciones estacionarias son aquellas en las su valor medio no cambia, aunque sufra oscilaciones en torno a ese valor medio fijo o constante. Esta clasificacin de las Variaciones de una serie permite hablar de series evolutivas y estacionarias.

Componentes de una serie temporal.


La forma ms sencilla de iniciar el anlisis de una serie temporal es mediante su representacin grfica. Para ello se har uso de un sistema cartesiano en el que los valores o periodos de tiempo se llevan al eje de abscisas y los valores de la serie, y t, se llevan al eje de ordenadas. El resultado es un diagrama de dispersin, con la particularidad de que el eje de abscisas se reserva siempre a la misma variable: el tiempo. Mediante este tipo de representacin se pueden detectar las caractersticas ms sobresalientes de una serie, tales como el movimiento a largo plazo, la amplitud de las oscilaciones, la posible existencia de ciclos, los puntos de ruptura, la presencia de valores atpicos o anmalos, etc. Un ejemplo de este tipo de grficas es el que

aparece en la Figura 1, donde se ha representado la serie que recoge el paro registrado en un pas para un periodo de cinco aos con datos mensuales. Estos datos son los que se dan en la Tabla 1. Una vez iniciado el proceso de descripcin de una serie y superado el primer paso que consiste en su representacin grfica, para poder llegar a conclusiones ms definitivas respecto del comportamiento de la serie, es conveniente recurrir a otras tcnicas que superen el mero anlisis grfico. Tabla 1. Evolucin del paro registrado en un pas parados).
1997 2256,5 2262,7 2227,5 2181,7 2123,8 2091,9 2009,2 1989,0 2040,1 2072,9 2093,9 2075,7 1998 2091,3 2067,8 2039,1 1968,0 1902,2 1860,6 1786,1 1777,1 1788,4 1803,7 1804,5 1785,7 1999 1804,2 1783,9 1757,2 1708,0 1649,1 1612,5 1551,0 1554,5 1570,0 1591,7 1623,7 1613,8 2000 1670,6 1659,8 1628,5 1578,9 1531,2 1500,1 1488,8 1487,6 1501,4 1530,1 1556,9 1556,4

(Miles de

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

2001 1620,7 1598,9 1578,5 1535,1 1478,1 1460,6 1451,5 1459,0 1488,6 1540,0 1572,8 1574,8

2002 1651,7 1666,0 1649,0 1636,3 1589,0 1567,4 1548,4 1552,0 1590,3 1641,7 1678,0 1688,1

Fuente: Servidor web del INE

El objetivo del anlisis de series temporales es doble. Por un lado se busca explicar las variaciones observadas en la serie en el pasado, tratando de determinar si responden a un determinado patrn de comportamiento. Y por otro, si se consigue definir ese patrn o modelo, se intentar predecir el comportamiento futuro de la misma. Para alcanzar este doble objetivo se utiliza una metodologa bastante consolidada, segn la cual se admite que la serie temporal es una funcin del tiempo: y t = f(t). Bajo este esquema, la serie sera una variable dependiente y el tiempo una independiente o explicativa. Sin embargo, es necesario dejar bien claro que el tiempo, en si, no es una variable explicativa, es simplemente el soporte o escenario en el que se realiza o tiene lugar la serie temporal. El tiempo no sirve para explicar el comportamiento de la serie. A esta forma de abordar el estudio de una serie temporal se le conoce como enfoque clsico, frente al causal, segn el cual, cualquier serie, como variable que es, Puede ser explicada por otra u otras series.

Figura 1. Evolucin del paro registrado en un pas


2400000 2300000 2200000 2100000 2000000 1900000 1800000 1700000 1600000 1500000 1400000

Las series cronolgicas son de gran inters especialmente para quien se dedica al anlisis del desarrollo actual y futuro de las actividades econmicas. Existen otros campos en donde tambin se utilizan. Por ejemplo, en el estudio de cierta enfermedad es de importancia la temperatura del enfermo durante un tiempo determinado; en el control de calidad industrial es preciso obtener mediciones de produccin a medida que se desarrolla el proceso; el crecimiento de un determinado bacilo o el de una planta, puede ser ilustrativo de cierta hiptesis en las ciencias biolgicas. Es evidente este anlisis para explicarse el desarrollo de la serie y pronosticar su comportamiento futuro. Previo al anlisis de las series cronolgicas, que son casos especiales de distribuciones bidimensionales, conviene efectuar su representacin grfica en un sistema de ejes coordenados. En el eje horizontal (abscisas), se representa el tiempo como variable independiente (aos, meses, perodos). En el eje vertical (ordenadas), se consideran los valores de las correspondientes variables dependientes (produccin, ventas, ndices, poblacin, etc.). Toda institucin, ya sea una empresa, el gobierno o cualquier otra entidad, tiene que hacer planes para el futuro. Las empresas para hacer frente a las variaciones de la demanda de sus productos, para as mismo programar la produccin, los recursos econmicos, el mercadeo y otras fases de la administracin. La previsin y planificacin suele basarse en lo ocurrido en el pasado, por lo tanto, generalmente el tiempo es una de las variables ms importantes ya que para estimar el valor de una variable o predecir su valor en el futuro se requiere el comportamiento de esta en el pasado y en el presente. El principal objetivo al hacer el anlisis de la serie cronolgica es la proyeccin o inferencia , lo cual resulta complicado y difcil, debido a que las

observaciones del fenmeno que aparecen en la serie de tiempo, frecuentemente estn correlacionadas, con una correlacin que aumenta a medida que el intervalo de tiempo entre un par de observaciones decrece. En consecuencia, los datos de una serie de tiempo violan con frecuencia los supuestos bsicos de independencia que se requieren para hacer un anlisis de regresin, es decir, que en una serie de tiempo generalmente se presenta la auto correlacin. El objetivo del anlisis de las series de tiempo es identificar aquellas componentes presentes para detectar sus causas y predecir valores futuros de la serie. En la mayora de los casos no resulta sencillo, en una serie de tiempo, distinguir entre las componentes; frecuentemente estos efectos se han integrado tanto que resultan inseparables. Por el contrario, si los efectos parecen distinguibles, no es difcil separarlos. Para el anlisis de una serie de tiempo existen diferentes tipos de mtodos, los cuales son aplicables dependiendo de las caractersticas de la informacin y de los recursos tcnicos (computador y paquetes), ya que algunos mtodos son bastante complejos como para aplicarlos manualmente. El uso de las series cronolgicas permite analizar la evolucin en el tiempo de una variable para: Construir un modelo descriptivo de la historia del fenmeno. Poder predecir valores futuros. Economa Precios de venta en das sucesivos. Exportaciones totales en sucesivos aos. Beneficios de una empresa en sucesivos aos - Fsica (Meteorologa, Geofsica, etc...) Lluvias en sucesivos das. Temperatura en sucesivas horas. Presin atmosfrica en diversos das. Demografa Poblacin de un pas medida anualmente. Procesos de control

El problema consiste en detectar cambios en la ejecucin de un proceso de manufactura. Para ello se considera una variable que nos muestra la calidad del proceso. Esta medida se representa frente al tiempo y cuando se aleja de un

determinado valor lmite, entonces hemos de efectuar las correcciones oportunas sobre el proceso. Procesos binarios

Son unas series temporales especiales, en las que las observaciones, slo toman dos valores (que usualmente se representan por 0 y 1), suelen darse en teora de la comunicacin. Por ejemplo la posicin de un enchufe, bien apagado o encendido puede ser representado como 0 y 1, respectivamente. Componentes de las series cronolgicas: los valores observados en toda serie cronolgica (precios de una mercanca, produccin de artculos, etc.) resultan de la interaccin de numerosos factores. El objetivo del anlisis clsico de estas series, es justamente, tratar de descubrir y cuantificar dichas influencias. No siempre es fcil conseguir lo propuesto en forma total, pero generalmente es posible obtener buenas aproximaciones, especialmente si se dispone de una serie suficientemente larga. Pese que en una serie cronolgica influyen numerosos aspectos, para el anlisis de stas suelen considerarse principalmente las variaciones sistmicas (tendencias, estacionales y cclicas) y las aleatorias o no sistmicas. a) Tendencia. Es una variacin sistmica no peridica que corresponde a la forma bsica en que vara suave y constantemente un fenmeno en un perodo relativamente largo. b) Variaciones o Movimientos Estacionales. Son las fluctuaciones que se repiten en forma regular con perodos fijos. Aunque el trmino "estacional" parece implicar una relacin con las estaciones del ao (lluvia, calor, etc.), la idea de variacin estacional comprende tambin cualquier cambio de tipo peridico que se repiten en lapsos ms cortos. por ejemplo, en el consumo de la electricidad puede hablarse de "variaciones estacionales" para las oscilaciones que se presentan en las diferentes horas del da. en su determinacin se emplean los mismos mtodos del perodo anual. c) Variaciones Cclicas. son fluctuaciones de largo plazo, que se repiten regularmente cada cierto nmero de aos, pero de un ciclo no fcilmente determinable. El principal problema consiste en la determinacin de la longitud del ciclo, dificultad que no ocurre con las variaciones estacionales, porque se sabe que su perodo generalmente es de un ao. d) Variaciones Aleatorias, Irregulares o No Sistemticas. Son las que se presentan en forma accidental, determinadas por mltiples causas: sequas, sucesos polticos, terremotos, influencias de mercados extranjeros o simplemente, por factores desconocidos. En ltima instancia, representan el residuo de las series cronolgicas, es decir, la parte que no se puede explicar mediante los otros componentes citados.

Você também pode gostar