Você está na página 1de 7

Anlisis de la varianza

El anlisis de la varianza (o Anova: Analysis of variance) es


un mtodo para comparar dos o ms medias, que es
necesario porque cuando se quiere comparar ms de dos
medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. por dos motivos:

En primer lugar, y como se realizaran simultnea e


independientemente varios contrastes de hiptesis, la
probabilidad de encontrar alguno significativo por azar
aumentara. En cada contraste se rechaza la H0 si la t
supera el nivel crtico, para lo que, en la hiptesis nula, hay
una probabilidad a. Si se realizan m contrastes
independientes, la probabilidad de que, en la hiptesis
nula, ningn estadstico supere el valor crtico es (1 - a)m,
por lo tanto, la probabilidad de que alguno lo supere es 1 -
(1 - a)m, que para valores de a prximos a 0 es
aproximadamente igual a a m. Una primera solucin,
denominada mtodo de Bonferroni, consiste en bajar el
valor de a, usando en su lugar a/m, aunque resulta un
mtodo muy conservador.

Por otro lado, en cada comparacin la hiptesis nula es que


las dos muestras provienen de la misma poblacin, por lo
tanto, cuando se hayan realizado todas las comparaciones,
la hiptesis nula es que todas las muestras provienen de la
misma poblacin y, sin embargo, para cada comparacin,
la estimacin de la varianza necesaria para el contraste es
distinta, pues se ha hecho en base a muestras distintas.
Series de Tiempo
Por serie de tiempo nos referimos a datos estadsticos que
se recopilan, observan o registran en intervalos de tiempo
regulares (diario, semanal, semestral, anual, entre otros). El
trmino serie de tiempo se aplica por ejemplo a datos
registrados en forma peridica que muestran, por ejemplo,
las ventas anuales totales de almacenes, el valor
trimestral total de contratos de construccin otorgados, el
valor trimestral del PIB.
a. Componentes de la serie de tiempo
Supondremos que enuna serie existen cuatro tipos
bsicos de variacin, los cuales sobrepuestos o
actuando en concierto, contribuyen a los cambios
observados en un perodo de tiempo y dan a la serie
su aspecto errtico. Estas cuatro componentes son:
Tendencia secular, variacin estacional, variacin cclica y
variacin irregular. Supondremos, adems, que existe
una relacin multiplicativa entre estas cuatro
componentes; es decir, cualquier valor de una serie es el
producto de factores que se pueden atribuir a las cuatro
componentes.
1.Tendencia secular: La tendencia secular o tendencia
a largo plazo de una serie es por lo comn el
resultado de factores a largo plazo. En trminos
intuitivos, la tendencia de una serie de tiempo
caracteriza el patrn gradual y consistente de las
variaciones de la propia serie, que se consideran
consecuencias de fuerzas persistentes que afectan el
crecimiento o la reduccin de la misma, tales como:
cambios en la poblacin, en las caractersticas
demogrficas de la misma, cambios en los ingresos, en la
salud, en el nivel de educacin y tecnologa.
Las tendencias a largo plazo se ajustan a diversos
esquemas. Algunas se mueven continuamente haca
arriba, otras declinan, y otras ms permanecen igual
en un cierto perodo o intervalo de tiempo.
2.Variacin estacional: El componente de la serie de
tiempo que representa la variabilidad en los datos
debida a influencias de las estaciones, se llama
componente estacional. Esta variacin corresponde a
los movimientos de la serie que recurren ao tras ao
en los mismos meses (o en los mismos trimestres) del ao
poco ms o menos con la misma intensidad. Por ejemplo:
Un fabricante de albercas inflables espera poca actividad
de ventas durante los meses de otoo e invierno y
tiene ventas mximas en los de primavera y verano,
mientras que los fabricantes de equipo para la nieve y ropa
de abrigo esperan un comportamiento anual opuesto al del
fabricante de albercas.
3.Variacin cclica: Con frecuencia las series de tiempo
presentan secuencias alternas de puntos abajo y arriba
de la lnea de tendencia que duran ms de un ao,
esta variacin se mantiene despus de que se han
eliminado las variaciones o tendencias estacional e
irregular. Un ejemplo de este tipo de variacin son
los ciclos comerciales cuyos perodos recurrentes
dependen de la prosperidad, recesin, depresin y
recuperacin, las cuales no dependen de factores
como el clima o las costumbres sociales.
4.Variacin Irregular: Esta se debe a factores a corto
plazo, imprevisibles y no recurrentes que afectan a la
serie de tiempo. Como este componente explica la
variabilidad aleatoria de la serie, es impredecible, es
decir, no se puede esperar predecir su impacto sobre
la serie de tiempo. Existen dos tipos de variacin
irregular: a) Las variaciones que son provocadas por
acontecimientos especiales, fcilmente identificables,
como las elecciones, inundaciones, huelgas, terremotos. b)
Variaciones aleatorias o por casualidad, cuyas causas no
se pueden sealar en forma exacta, pero que tienden a
equilibrarse a la larga.
El mtodo que resuelve ambos problemas es el anova,
aunque es algo ms que esto: es un mtodo que permite
comparar varias medias en diversas situaciones; muy
ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.

Tcnicas de Suavizamiento
Son tcnicas de pronsticos que son apropiadas para
series de tiempo ms o menos estables y que presentan un
patrn horizontal, es decir, las que no muestran efectos
importantes de tendencia, cclicos o estacinales.

Promedio mvil simple:


Un promedio mvil se construye sustituyendo cada valor
de una serie por la media obtenida con esa observacin y
algunos de los valores inmediatamente anteriores y
posteriores.
Suavizamiento exponencial:

El suavizamiento exponencialemplea un promedio


ponderado de la serie de tiempo pasada como pronstico;
es un caso especial del mtodo de promedios mviles
ponderados en el cual slo se selecciona un peso o factor
de ponderacin: el de la observacin ms reciente. En la
prctica comenzamos haciendo que F1, el primer valor
de la serie de valores uniformados, sea igual a Y1,
que es el primer valor real de la serie. El modelo
bsico de suavizamiento exponencial es el siguiente:

Ft+1 = Yt + (1-)Ft

Dnde:

Ft+1 = pronstico de la serie de tiempo para el perodo t+1


Yt = valor real de la serie de tiempo en el perodo t
Ft = pronstico de la serie de tiempo para el perodo t
= constante de suavizamiento, 0 1

Curvas de crecimiento:

Metedo de box

El mtodo original utiliza un enfoque de modelado iterativo


en tres etapas, usando datos de un horno de gas. Estos
datos son conocidos como datos de Box-Jenkins del horno
de gas para la evaluacin comparativa de modelos de
prediccin.

Las tres etapas del modelado iterativo son las siguientes:

Identificacin y seleccin del modelo: asegurarse de que


las variables son estacionarias, la identificacin de la
estacionalidad de la serie dependiente (diferenciacin
estacional, para cierto perodo, si es necesario), y el uso de
los grficos de las funciones de autocorrelacin y de
autocorrelacin parcial de la serie de tiempo se utilizan
para decidir cul componente (si es el caso) se debe utilizar
en el modelo, el promedio autorregresivo (AR) o un
promedio mvil (MA).
Estimacin de parmetros usando algoritmos de clculo
para tener coeficientes que mejor ajusten el modelo ARIMA
seleccionado. Los mtodos ms comunes usan estimacin
de mxima verosimilitud o mnimos cuadrados no lineales.
Comprobar el modelo mediante el ensayo, si el modelo
estimado se ajusta a las especificaciones de un proceso
univariado estacionario. En particular, los residuos deben
ser independientes el uno del otro, adems, la media y la
varianza deben ser constantes en el tiempo. (Para
identificar los errores de especificacin son tiles la
graficacin de la media y la varianza de los residuos a
travs del tiempo y la realizacin de una prueba de Ljung-
Box o bien por medio del trazado de autocorrelacin y
autocorrelacin parcial de los residuos.) Si la estimacin es
inadecuada, tenemos que volver al paso uno e intentar
buscar un modelo mejor.

Modelo de estimacin de Box-Jenkins

La estimacin de los parmetros de los modelos de Box-


Jenkins es un problema de estimacin no lineal bastante
complicado. Por esta razn, la estimacin de parmetros
debe dejarse a un programa de software de alta calidad
que se ajuste a los modelos de Box-Jenkins.
Afortunadamente, muchos programas de software
estadstico ahora encajan modelos Box-Jenkins.

Los principales enfoques de los modelos de Box-Jenkins


montaje son mnimos cuadrados no lineales y la estimacin
de mxima verosimilitud. Estimacin de mxima
verosimilitud es generalmente la tcnica preferida. Las
ecuaciones de verosimilitud para el modelo completo de
Box-Jenkins son complicados y no se incluyen aqu. Ver
(Brockwell y Davis, 1991) para los detalles matemticos. El
diagnstico de modelos Box-Jenkins Supuestos para un
proceso univariado estable

Diagnsticos modelo para los modelos de Box-Jenkins es


similar al modelo de validacin de mnimos cuadrados no
lineales de montaje.

Es decir, el trmino de error Una t se supone que sigue los


supuestos para un proceso univariado estacionaria. Los
residuos deben ser ruido blanco (o independientes cuando
sus distribuciones son normales) dibujos a partir de una
distribucin fija con una media constante y varianza. Si el
modelo de Box-Jenkins es un buen modelo para los datos,
los residuos deben satisfacer estos supuestos.

Si estos supuestos no se cumplen, hay que adaptarse a un


modelo ms apropiado. Es decir, volver a la etapa de
identificacin del modelo y tratar de desarrollar un modelo
mejor. Esperemos que el anlisis de los residuos puede dar
algunas pistas en cuanto a un modelo ms apropiado.

Una forma de evaluar si los residuos del modelo de Box-


Jenkins siguen las hiptesis es la de generar grficos
estadsticos (incluyendo una parcela de autocorrelacin) de
los residuales. Tambin se podra mirar el valor del
estadstico Box-Ljung

Você também pode gostar