Escolar Documentos
Profissional Documentos
Cultura Documentos
Introduccin
1,5
1
0,5
0
-0,5
-1
-1,5
0
20
40
60
80
En general, las series de inters llevan asociados fenmenos aleatorios, de forma que el
estudio de su comportamiento pasado slo permite acercarse a la estructura o modelo
probabilstico para la prediccin del futuro. Estos modelos se denominan tambin procesos
estocsticos. As, un proceso estocstico es una sucesin de variables aleatorias {Yt}, con
t = 1, 2, ..., n, que evolucionan con el tiempo ( representado ste por el subndice t).
Cuando se dispone de n datos de un proceso estocstico, se est frente a n muestras, de
tamao unidad, extradas de la poblacin (variable aleatoria), correspondientes al tiempo en
que se realiz la medicin, y esto es lo que constituye la serie temporal o cronolgica.
Como ejemplo puede servir la evolucin a lo largo de un ao del ndice IBEX35, que recoge
los 35 valores de mayor cotizacin de la bolsa espaola, representada en la figura 1.2.
p12
Series temporales
Lgicamente, el valor del IBEX35 depender del valor alcanzado en los das previos,
adems de recoger la influencia de un conjunto de factores sociales, polticos, econmicos,
etc., que son continuamente cambiantes en el tiempo y cuya conjuncin, en un determinado
instante, configurara una hipottica distribucin de probabilidad del citado ndice econmico.
En casos como ste, es evidente que puede obtenerse un modelo que explique el
comportamiento de la serie en el perodo estudiado, pero puede ser muy arriesgada la
utilizacin de este modelo para hacer previsiones a medio o largo plazo. As, en todas las
series cronolgicas, es necesaria una gran cautela en la previsin a causa de la muy
probable inestabilidad del modelo en un futuro ms o menos alejado del ltimo instante del
que se conocen datos.
IBEX35
5
4,5
4
3,5
3
enero
diciembre
Fig. 1.2.- Evolucin del ndice IBEX35
Otro ejemplo puede ser el constituido por la sucesin de variables aleatorias {Y1, ...,Yt,...},
tales que Yt = 0,80Yt1 + t , con Y0 = 0 y los t distribuidos N(0; 1), independientes para todo
t = 1, 2,...
Esta serie puede expresarse tambin como Yt =
0,8t i i
y la distribucin de
i=1
p13
Introduccin
Yt
20
15
10
5
0
-5
-10
0
10
15
20
25
Todas las formas de estudio de una serie cronolgica, tal como se ir viendo, no conllevan
clculos complicados, pero s reiterativos, con gran volumen de datos manipulados y con
abundancia de grficos; es por ello que para su estudio se hace muy necesario el disponer
de un programa informtico que permita su correcta aplicacin y la obtencin de cuantos
grficos sean necesarios.
p14
Series temporales
Antes de abordar cualquier estudio analtico de una serie temporal, se impone una
representacin grfica de la misma y la observacin detenida de su aspecto evolutivo.
Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores que
puede tomar en un futuro, puede hablarse de distintas metodologas, que denominaremos
modelizacin por componentes y enfoque Box-Jenkins.
Este mtodo consiste en identificar, en la serie Yt, cuatro componentes tericas, que no
tienen por qu existir todas, y que son:
Tendencia: Tt.
Estacionalidad: Et.
Ciclos: Ct.
Residuos: Rt.
Cada una de estas componentes es una funcin del tiempo y el anlisis consistir en la
separacin y obtencin de cada una de ellas, as como en determinar de qu forma se
conjugan para dar lugar a la serie original. Estas componentes se pueden observar en la
figura 2.1, en donde se ha considerado que actan de forma aditiva para dar lugar a la serie
cronolgica.
La tendencia es la componente general a largo plazo y se suele expresar como una funcin
2
del tiempo de tipo polinmico o logartmico, por ejemplo Tt = 0 + 1 t+ 2 t +
Las variaciones estacionales son oscilaciones que se producen, y repiten, en perodos de
tiempo cortos. Pueden estar asociadas a factores dinmicos, por ejemplo la ocupacin
hotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolucin est claramente
ligada a la estacionalidad climtica, vacacional, publicitaria, etc.
Las variaciones cclicas se producen a largo plazo y suelen ir ligadas a etapas de
prosperidad o recesin econmica. Suelen ser tanto ms difciles de identificar cuanto ms
largo sea su perodo, debido, fundamentalmente, a que el tiempo de recogida de
informacin no aporta suficientes datos, por lo que a veces quedarn confundidas con las
otras componentes.
p15
200
175
150
TENDENCIA
125
100
40
20
ESTACIONALIDAD
0
-20
-40
60
30
0
CICLOS
-30
-60
5
3
0
RESIDUOS
-3
-5
300
200
SERIE
CRONOLGICA
100
p16
Series temporales
Para evaluar las distintas componentes se utilizan tcnicas estadsticas tales como modelo
lineal, medias mviles, diferencias finitas, etc.
Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otras
componentes surge un nuevo problema que es el cmo conjuntar tendencia, estacionalidad
y ciclos para dar lugar a la serie definitiva.
As se proponen, entre otros, modelos genricamente denominados aditivos y
multiplicativos.
Modelo aditivo: Y = T + E + C + R
Modelo multiplicativo: Y = T x E x C + R
Para una primera identificacin visual del caso, se puede considerar que si el patrn
estacional se mantiene con amplitud constante se tratar de modelo aditivo (figuras 2.1 y
2.2). Cuando dicho patrn se vaya amplificando con el tiempo, ser multiplicativo (figura
2.3).
Y 250
200
150
100
50
t
Fig. 2.2.- Serie aditiva
Y 400
300
200
100
0
t
Fig. 2.3.- Serie multiplicativa
p17
Yt = 0 + 1 t + Es + Rt = s + 1 t + Rt
con
t = p$ + s; s = 1, , p
As pues, cada estacin (s) componente del perodo conforma una recta con ordenada en el
origen distinta para cada caso y pendiente comn a todos; es decir, segn muestra la figura
2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a una
estacin.
En el modelo multiplicativo, el componente estacional acta sobre la ordenada en el origen y
sobre la pendiente.
Y 250
200
150
100
50
t
Fig. 2.4.- Interpretacin de una serie con modelo aditivo
p18
Series temporales
Yt = Tt Es + Rt = (0 + 1t) Es + Rt,
es decir
Yt = (0 Es ) + ( 1Es ) t + Rt
o sea
Yt = 0s + 1s t + Rt
De esta forma, cada una de las p estaciones del perodo configura una recta distinta, tanto
en lo que se refiere a la ordenada en el origen (0s) como a la pendiente (1s).
El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).
Es evidente que esta divisin, en modelo estrictamente aditivo o estrictamente multiplicativo,
es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambie
slo la pendiente, o slo la ordenada en el origen. Esto constituira un modelo mixto mucho
ms general que los propuestos hasta ahora, los cuales pasaran a ser meros casos
particulares de ste. En la figura 2.6 se presenta una situacin de este tipo.
Y 500
400
300
200
100
0
t
Fig. 2.5.- Interpretacin de una serie con modelo multiplicativo
Y 200
150
100
50
0
t
p19
Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.7.- Proceso de media mvil MA(4)
p20
Series temporales
Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.8.- Proceso autorregresivo AR(2)
Y 90
80
70
60
50
40
30
20
10
0
t
Fig. 2.9.- Proceso ARIMA(2, 1, 3)
p21
(t) = 0 + 1t
polinmica:
2
(t) = 0 + 1t + 2 t + ...
exponencial: (t) = 0 t 1
p22
Series temporales
Ao
1990
1991
1992
1993
1994
1995
Trimestre
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Ventas (Y)
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Y 130
100
70
40
0
12
16
20
24 t
En este ejemplo se ha identificado un patrn estacional compuesto por los cuatro trimestres
y que se repite de ao en ao, adems de una tendencia aparentemente lineal. Si se
decidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendran los
resultados de la tabla 3.II.
p23
Regresin
Residuos
Total
nu
1
22
23
Coef.
Ord. Origen 57,501
t
1,286
S. C.
1901,300
15623,686
17524,985
C. M.
1901,300
710,168
F
2,677
Error tpico
11,229
0,786
t
5,121
1,636
p-val
0,000
0,116
p-val
0,116
R^2 = 0,10849
Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y = 0 + 1t +
El modelo presenta un coeficiente de determinacin (R^2) tan slo del 10,8% y no resulta
estadsticamente significativo, ya que el nivel de significacin (p-val), tanto del ajuste como
de la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primera
especie del 5%. As, se demuestra que este procedimiento no es vlido ya que incluye en el
residuo todo el componente estacional, lo cual produce una inflacin de la suma de
cuadrados residual que desvirta el modelo y cualquier prueba de significacin de la
regresin y de sus coeficientes.
Para evitar esto es necesario estabilizar la serie liberndola de la estacionalidad; esto se
podra conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. En
la tabla 3.IV se detallan los resultados del clculo del modelo de tendencia, considerado tipo
rectilneo.
Ya
t (aos)
Ya
t (aos)
67,4925
75,0900
67,1550
80,7425
71,1875
79,7725
Regresin
Residuos
Total
nu
1
4
5
Coef.
Ord. Origen 62,967
t(aos)
3,030
S.C.
160,711
15,279
175,991
C.M.
160,711
3,820
F
42,073
Error tpico
1,819
0,467
t
34,607
6,486
p-val
0,000
0,003
R^2 = 0,91318
Tabla 3.IV.- Modelo lineal para las medias anuales
p-val
0,003
p24
Series temporales
7
t(aos)
p +1
t =
Y(p+1) / 2 =
i=1
Y1 + Y2
+ A + Yp
p
p25
p+ 1
p + 3
t =
2
Y(p + 3) / 2 =
i= 2
Y2
Y3 +
A +
Yp+ 1
t =
p + 2
2
Y(p+ 2) / 2 =
Y(p+ 1) / 2
t =
p + 4
2
Y(p + 4) / 2 =
Y(p+ 3) / 2
Y(p+ 3) / 2
2
+
Y(p+ 5) / 2
Y
1
2
3
4
5
40,22
54,89
63,51
111,35
46,95
67,4925
69,1750
68,3337
3
4
5
p26
t
3
4
5
6
7
Series temporales
68,3337
68,7662
68,1025
67,5012
66,4588
8
9
10
11
12
67,4725
69,5300
70,5325
72,6825
73,4363
t
13
14
15
16
17
Y
72,9325
74,1300
76,8450
78,1900
78,9000
t
18
19
20
21
22
Y
80,3812
79,3075
78,5175
79,2037
79,5088
Los resultados del modelo lineal, Y = 0 + 1t+ para el clculo de la tendencia constan en
la tabla 3.VII.
nu
1
17
18
Regresin
Residuos
Total
S.C.
393,692
41,108
434,800
Coef.
Error tpico
Ord. Origen 63,0065
0,9188
t
0,8311
0,0651
C.M.
393,692
2,418
F
162,810
t
68,5739
12,7597
p-val
0,0000
0,0000
p-val
0,000
R^2 = 0,905
Tabla 3.VII.- Modelo de tendencia sobre las medias mviles
Trabajando sobre 19 puntos, los 19 valores de las medias mviles, se ha obtenido un buen
ajuste, con un coeficiente de determinacin del 90,5 %. En consecuencia, el modelo de
tendencia resultante es
T = 63,0065 + 0,8311 t
Evidentemente, la interpretacin de la ecuacin de la tendencia permite afirmar que las
ventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido en
trimestres). En la figura 3.3 puede observarse el suavizado conseguido con las medias
mviles junto con el modelo de tendencia estimado a partir de los citados valores.
130
100
70
40
0
12
16
20
24 t
p27
3.2 Estacionalidad
La componente estacional, que provoca una oscilacin sistemtica de perodo corto,
generalmente no superior al ao, puede enmascarar la evolucin a largo plazo, tendencia, si
no se asla convenientemente.
Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valor
de la estacin y la media de todas las estaciones componentes del perodo.
El anlisis de la estacionalidad queda ligado al mtodo que se decida emplear para
modelizar la tendencia; as, en este punto estudiaremos la situacin para el caso de trabajar
con medias mviles.
Para calcular los valores de los ndices estacionales hay que seguir la siguiente sistemtica:
n
Calcular las medias mviles, Yt , sobre los datos, Yt , de la serie original, tomando el
perodo de agrupacin, p, que se considere oportuno.
Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale a
calcular Wt = Yt Yt ; si fuese multiplicativo, en lugar de diferencias seran cocientes, es
decir, Wt = Yt / Yt . Hay que destacar que en Wt estn incluidas las componentes
asociadas a la estacionalidad, los ciclos y los residuos.
Asumiendo que los residuos son variables aleatorias de media nula y que la
componente cclica, caso de existir, es de perodo suficientemente largo como para no
ser recogida por los datos, se procede a evaluar la estacionalidad asociada a cada
componente del perodo, a cada trimestre en el caso del ejemplo. Para ello se calculan
Wt
los promedios de los Wt de la misma estacin
E*s
t = s + p&
s = 1, , p
ns
donde s representa el ndice estacional y ns el nmero de valores asociados a este
ndice que se promedian.
Ya que los ndices estacionales miden discrepancias respecto a la media, sta se
necesita como valor de referencia; por tanto es necesario calcular la media general:
p
E
s=1
E =
n
*
s
p28
Series temporales
E
s =1
= 0.
E
s =1
= p . En modelo
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,5
Yt
----68,3337
68,7662
68,1025
67,5012
66,4588
67,4725
69,5300
70,5325
72,6825
73,4363
72,9325
74,1300
76,8450
78,1900
78,9000
80,3812
79,3075
78,5175
79,2037
79,5088
-----
Wt
-----4,8237
42,5838
-21,1525
-15,8812
-4,9888
41,1075
-28,1500
-5,2325
-8,4325
40,3837
-19,5925
-14,7600
-10,6950
43,3100
-11,5200
-24,2912
-4,1975
45,8725
-23,3037
-18,2588
-----
Estacin: s
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
p29
E*2 = 15,68477
E*3 = 6,6275
E*4 = 42,6515
*
s
s =1
E =
= 0,101125
E2 = 15,5836
E3 = 6,5264
E4 = 42,7526
Los valores de los ndices estacionales recin obtenidos se interpretan de la siguiente forma:
respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; el
segundo est 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que el
cuarto supera a la media en 42,7526 unidades de venta.
t = 4$ + s
p30
Series temporales
130
100
Y
70
40
84
79
T 74
69
64
50
30
E 10
-10
-30
130
T
+
E
100
70
40
11
R 0
-11
Fig. 3.4.- Descomposicin de la serie de ventas de material deportivo por medias mviles
p31
Ao
1996
1997
Estacin: s
25
Tendencia:
T = 63,0065+0,8311 t
83,7840
26
27
28
Estacionalidad: E
#
Previsin: Y
20,6426
63,1414
84,6151
15,5836
69,0315
85,4462
6,5264
78,9198
86,2773
42,7526
129,0299
29
87,1084
20,6426
66,4658
30
87,9395
15,5836
72,3559
31
88,7706
6,5264
82,2442
32
89,6017
42,7526
132,3543
Tabla 3. IX.- Previsiones para 1996 y 1997, segn el modelo de descomposicin clsica
Y 140
90
40
0
12
16
20
24
28
32 t
p32
Series temporales
Ao
Mes
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
26,8
27,2
27,1
26,3
25,4
23,9
23,8
23,6
25,3
25,8
26,4
26,9
27,1
27,5
27,4
26,4
24,8
24,3
23,4
23,4
24,6
25,4
25,8
26,7
26,9
26,3
25,7
25,7
24,8
24,0
23,4
23,5
24,8
25,6
26,2
26,5
26,8
26,9
26,7
26,1
26,2
24,7
23,9
23,7
24,7
25,8
26,1
26,5
26,3
27,1
26,2
25,7
25,5
24,9
24,2
24,6
25,5
25,9
26,4
26,9
27,1
27,1
27,4
26,8
25,4
24,8
23,6
23,9
25,0
25,9
26,3
26,6
26,8
27,1
27,4
26,4
25,5
24,7
24,3
24,4
24,8
26,2
26,3
27,0
27,1
27,5
26,2
28,2
27,1
25,4
25,6
24,5
24,7
26,0
26,5
26,8
26,3
26,7
26,6
25,8
25,2
25,1
23,3
23,8
25,2
25,5
26,4
26,7
27,0
27,4
27,0
26,3
25,9
24,6
24,1
24,3
25,2
26,3
26,4
26,7
Y 30
28
26
24
22
0
24
48
72
96
120 t
p33
Y 30
28
26
24
22
0
24
48
72
96
120 t
Para evaluar la estacionalidad es necesario calcular los ndices estacionales, tal como se ha
detallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y se
presentan grficamente en la figura 3.8.
Mes
(s)
ndice Es
Mes
(s)
ndice Es
1,07496
VII
1,78846
II
1,31478
VIII
1,80143
III
0,97867
IX
0,77967
IV
0,62126
10
0,05413
0,15883
XI
11
0,52959
VI
1,03569
XII
12
0,99070
La interpretacin de los ndices es simple: desde octubre (X) a abril (IV), la temperatura est
por encima de la media anual; mientras que de mayo (V) a septiembre (IX) est por debajo
de la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; por
tanto, de octubre a abril son los meses clidos, y los dems son los fros. Es de destacar
que la oscilacin trmica media, del mes ms clido al ms fro, es relativamente pequea
(1,31 + 1,80 = 3,01C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y
29C permite afirmar que el estudio se est haciendo sobre una ciudad de clima muy suave
y casi permanentemente primaveral.
p34
Series temporales
-1
-2
0
12 s
Regresin
Residuos
Total
Ord. Origen
t
nu
1
106
107
S.C.
2,186
5,205
7,391
C.M.
2,186
0,049
F
44,512
Coeficientes
25,4733
0,00456
Error tpico
0,0459
0,0007
t
554,4281
6,6717
p-val
0,0000
0,0000
p-val
0,000
R^2 = 0,295735
Tabla 3.XII.- Modelo lineal para la tendencia:
Yt = 0 + 1 t +
A pesar del valor del coeficiente de determinacin del ajuste, (29,57 %), la explicacin del
modelo es significativa. As, se puede deducir que parece existir una tendencia muy ligera a
un incremento de la temperatura, que se ha estimado en un aumento de 0,00456 grados
mensuales en promedio.
La evolucin del modelo, junto con los datos reales, se presentan en la figura 3.9. Para su
obtencin, hay que tener en cuenta que, conocidos los ndices estacionales y el modelo de
tendencia, la suma mes a mes de los dichos valores darn lugar al modelo propuesto, es
decir:
# = 25,4733 + 0,00456 t + E
Y
t
s
con
t = 12$ + s
s = 1, , 12
p35
Y 30
28
26
24
22
0
24
48
72
96
120 t
Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hay
algunos puntos que parecen presentar mayores discrepancias.
Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, ya
en los datos iniciales presentaron unas temperaturas medias bastante superiores a las de
los dems aos (es decir hizo un otoo especialmente clido).
En la figura 3.10, se muestran los residuos resultantes de la descomposicin de esta serie,
# . Hay que destacar la buena modelizacin conseguida, pues
obtenidos como Rt = Yt Y
t
en la mayora de las 120 observaciones, el error es inferior a un grado, excepto en los
meses ya comentados.
R 2
-1
-2
0
24
48
72
96
120
p36
Series temporales
Ao
Mes
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
27,1
27,3
27,0
26,7
25,9
25,0
24,3
24,3
25,3
26,1
26,6
27,1
27,2
27,4
27,1
26,7
25,9
25,0
24,3
24,3
25,3
26,2
26,7
27,1
27,2
27,5
27,1
26,8
26,0
25,1
24,4
24,4
25,4
26,2
26,7
27,2
27,3
27,5
27,2
26,8
26,1
25,1
24,4
24,4
25,5
26,3
26,8
27,2
27,3
27,6
27,2
26,9
26,1
25,2
24,5
24,5
25,5
26,3
26,8
27,3
27,4
27,6
27,3
26,9
26,2
25,2
24,5
24,5
25,6
26,4
26,9
27,3
27,4
27,7
27,3
27,0
26,2
25,3
24,6
24,6
25,6
26,5
26,9
27,4
27,5
27,7
27,4
27,0
26,3
25,3
24,7
24,6
25,7
26,5
27,0
27,5
27,5
27,8
27,5
27,1
26,3
25,4
24,7
24,7
25,7
26,6
27,0
27,5
27,6
27,8
27,5
27,2
26,4
25,5
24,8
24,8
25,8
26,6
27,1
27,6
Tabla 3.XIII.- Temperatura prevista para los 10 aos siguientes a la recogida de datos
30
28
26
24
22
0
48
96
144
192
240 t
Fig. 3.11.- Datos desde 1986 a 1995 ( ) y previsiones desde 1996 a 2005 ( 1 )
p37
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
90
88
109
103
103
122
134
132
115
101
91
112
111
115
129
121
112
125
164
158
133
127
110
120
127
107
141
135
133
154
175
174
158
139
112
140
142
139
145
162
144
176
192
190
160
151
134
140
146
155
182
165
165
191
195
205
182
165
138
155
164
151
180
164
184
206
198
235
197
163
148
163
175
161
179
195
189
208
227
249
224
193
170
166
176
194
197
211
191
235
248
273
202
189
167
168
208
189
232
226
222
245
252
242
229
202
192
198
199
190
228
220
222
233
303
253
253
223
191
185
207
198
251
231
234
251
316
285
250
232
190
201
219
206
229
223
231
266
290
294
258
214
206
199
Y 320
240
160
80
0
24
48
72
96
120
144 t
Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos son
mensuales, su perodo ser igual a 12.
p38
Series temporales
El patrn de estacionalidad tiene una forma constante pero presenta una amplificacin
continua en el tiempo. Esta situacin es la que indica que el modelo subyacente es
multiplicativo.
320
240
160
80
0
24
48
72
96
120
144 t
Regresin
Residuos
Total
Ord. Origen
t
t^2
nu
2
129
131
S.C.
194340,33
500,01
194840,34
C.M.
97170,17
3,88
F
25069,58
Coeficientes
100,4749
1,4326
-0,00297
Error tpico
0,6227
0,0197
0,0001
t
161,3636
72,8823
-22,5088
p-val
1,08E-150
1,08E-106
1,66E-46
p-val
7,937E-168
R^2 = 0,9974
Tabla 3.XV.- Estimacin del modelo de tendencia: Y = 0 + 1 t + 2 t2 +
p39
Yt
Yt
c) Asumiendo que los ciclos, caso de existir, son de perodo suficientemente largo como
para no ser recogidos por los datos, calcular los promedios de las Wt de cada estacin y la
media general. s es el indicador de la estacin (mes, en el ejemplo), y ns el nmero de
valores de W que se promedian en la citada estacin
E*s =
*
s
Wt
t = s + p$
s = 1, ..., p
ns
E =
s =1
E*s
E
100
En la tabla 3.XVI se muestran los valores de las componentes estacionales del presente
ejemplo, y se representan grficamente en la figura 3.14.
Mes
Es
Mes
Es
Mes
Es
92,38
97,04
IX
105,50
II
88,41
VI
109,53
94,11
III
101,72
VII
121,91
XI
81,54
IV
99,21
VIII
121,31
XII
87,33
p40
Series temporales
E 130
120
110
100
90
80
12 t
La interpretacin de los ndices podra ser en el sentido de que, por ejemplo, los usuarios de
los meses de julio y agosto son del orden de un 121% superior a la media, mientras que en
noviembre se est en un 81% de la media. Ello podra aconsejar una promocin en los
meses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayor
ocupacin de las plazas disponibles.
La figura 3.15 muestra la concordancia entre los datos y su modelizacin, a partir de la
tendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:
# =
Y
t
(100,4749
1,4326 t
0,00297 t2
Es
100
s = 1, ..., 12
t = s + 12$
320
240
160
80
0
24
48
72
96
120
144 t
Observando la figura 3.15 se puede destacar que hay unos desajustes ms acusados en
ciertos meses de julio o agosto, en concreto, los de los aos 1989, 90, 91, 93 y 94, por lo
que es posible afirmar que en los casos citados ha habido un comportamiento
sustancialmente distinto del esperado en los mismos meses de otros aos; en principio,
sera discutible afirmar la presencia de un cambio en los hbitos de utilizacin de este
transporte, ya que ni el ao 1993 ni el 1995, pertenecientes al perodo en cuestin,
presentan semejantes discrepancias.
p41
A pesar de todo, en este caso, sera prudente tomar con ciertas precauciones las
previsiones para aos venideros, mientras no se confirme la consolidacin en el futuro de un
cambio o de una permanencia de comportamiento. Tambin podra ser interesante intentar
averiguar qu ocurri en estos meses (quizs una campaa publicitaria, quizs una
disminucin de alternativas de la competencia,...).
La figura 3.16 muestra la evolucin de los residuos entre los datos experimentales y el
# . Se observa que, en la mayora de los casos, oscilan entre 16,
modelo ajustado, Rt = Yt Y
t
aunque en algn caso la discrepancia se aproxima a 30 unidades.
Asumiendo que se mantiene el mismo modelo, la previsin de usuarios hasta el ao 2000 se
presenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente los
clculos, que el ltimo valor de t para el que se dispone de datos, diciembre de 1995, es
144; por tanto, para las predicciones, que abarcan el perodo de los prximos 60 meses, los
valores de t irn desde 145 hasta 204.
R
32
16
-16
-32
0
24
48
72
96
120
144
24
48
72
96
120
144
Datos
168
192
Previsiones
p42
Series temporales
s = 1, 2 , @ , p
j = 2 , @ , p
p
j Qj t +
j=2
ti , que viene a
i=1
recoger la tendencia o evolucin general, a largo plazo, de los datos con el tiempo. Los
p
j= 2
del perodo estacional, introducen en la ordenada en el origen del modelo, parte aditiva
p
Q t
j
representan la influencia de la
j= 2
estacionalidad sobre la funcin del tiempo, lo que en el mtodo clsico se interpreta como
parte multiplicativa.
El estudio de la significacin de cada uno de los coeficientes , y , y la consiguiente
eliminacin de los no significativos conducir el modelo que definitivamente explica el
comportamiento de la serie.
p43
Para desarrollar la metodologa de las variables categricas sobre un ejemplo, se van a utilizar
los datos relativos a las ventas de material deportivo estudiados por el mtodo clsico, con el
fin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven a
reproducir los datos de la serie cronolgica, junto a los valores de las variables categricas. La
representacin grfica de los mismos ya se present en la figura 3.1, cuya observacin
condujo a pensar en una tendencia lineal creciente y una estacionalidad de perodo p = 4.
A fin de no confundir los dos efectos, procede la creacin de variables categricas que
identifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el perodo
de repeticin del patrn estacional. Por otra parte, suponiendo que hubiese ciclos, el
intervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo que
su posible existencia quedar enmascarada en los residuos.
En la tabla 4.I estn las variables categricas Q2, Q3 y Q4, cuya conjuncin representa de
forma unvoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que el
primer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los dems que, a
travs del indicador, aportarn la parte del efecto estacional correspondiente.
En este caso, al ser la tendencia rectilnea, se plantea el modelo
Y = 0 + 1 t + 2 Q2 + 3 Q3 +
4 Q4+
2 Q2 +t
3 Q3 +t
4 Q4+ t
Trimestre (s)
Ventas (Y)
Q2
Q3
Q4
1990
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
1991
1992
1993
1994
1995
p44
Series temporales
Los resultados del modelo lineal general evidencian que todos los trminos del tipo Qjt no
son estadsticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo
prescindiendo de ellos.
Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente de
la recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.
Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,
alternativamente, estudiado por la metodologa de la descomposicin clsica, tal como se ha
hecho en el captulo 3. Si alguno de esos trminos hubiese resultado significativo, el sistema
clsico proporcionara un modelo bastante precario.
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
t
t*Q2
t*Q3
t*Q4
nu
7
16
23
S.C.
17166,997
357,988
17524,985
C.M.
2452,428
22,374
F
109,609
Coeficientes
38,9463
15,7735
19,1936
65,6577
1,0832
-0,8026
-0,3513
-0,1485
Error tpico
3,660
5,351
5,535
5,726
0,283
0,400
0,400
0,400
t
10,640
2,948
3,468
11,466
3,832
-2,008
-0,879
-0,371
p-val
0,000
0,009
0,003
0,000
0,001
0,062
0,393
0,715
p-val
0,000
R^2 = 0,9796
Tabla 4.II.- Resultados del modelo lineal general
La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de
Y = 0 + 1t +
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
t
2 Q 2 +
3 Q3 +
4 Q 4 +
nu
4
19
23
S.C.
17064,626
460,359
17524,985
C.M.
4266,157
24,229
F
176,073
Coeficientes
42,5280
6,4674
15,2781
64,5555
0,7576
Error tpico
2,580
2,846
2,857
2,876
0,147
t
16,484
2,273
5,347
22,447
5,151
p-val
0,000
0,035
0,000
0,000
0,000
R^2 = 0,97373
Tabla 4.III.- Resultados del modelo definitivo
p-val
0,000
p45
Res
Res
%P
Res
Fig. 4.1.- Grficos de los residuos del modelo
p46
Series temporales
Para un tiempo correspondiente a un segundo trimestre, las variables categricas toman los
valores Q2 = 1 y Q3 = Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t
Y
t
con
t = 2 + 4$
Para un tiempo de tercer trimestre, las variables categricas toman los valores Q3 = 1 y Q2 =
Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t
Y
t
con
t = 3 + 4$
Y, en el caso del cuarto trimestre, las variables categricas toman los valores Q4 = 1 y
Q2 = Q3 = 0; el modelo es
# = 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con
Y
t
t = 4 + 4$
As, para cada trimestre (estacin del perodo), se obtiene un modelo del mismo tipo,
rectilneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.
Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,
en el segundo el volumen de ventas aade a la funcin del tiempo 6,4674 unidades, en el
tercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,
evidentemente, los coeficientes de las variables categricas.
En consecuencia los coeficientes de las variables categricas representan la cantidad en
que una estacin, sistemticamente, supera (o no alcanza, segn sea el signo) el valor de la
primera estacin del perodo. Es decir, estos coeficientes son una forma de medir el
componente estacional.
Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparacin de los
valores medidos con los estimados a partir del modelo ajustado; se observa la buena
concordancia entre ambos.
La modelizacin tiene como objetivo principal el poder hacer previsiones para un futuro
prximo. En este caso se procede a calcular las previsiones para los prximos 2 aos, a
base de sustituir los valores del tiempo y de las variables categricas en el modelo obtenido.
Los resultados se muestran en la tabla 4.IV y en la figura 4.3.
Y 130
100
70
40
0
12
16
20
24 t
p47
Aqu se detecta la coherencia de la previsin con los datos histricos, siempre que no
cambie el modelo de comportamiento de la serie en el perodo previsto. Esto podra ocurrir,
por ejemplo, si hubiese una recesin econmica, la apertura de otro comercio de similares
caractersticas en las inmediaciones, un cambio de hbitos en la poblacin, una campaa
propagandstica con xito de la competencia, etc.
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
Ao
Q2
Q3
Q4
#
Y
t
1996
25
61,4680
26
68,6930
27
78,2613
28
128,2963
29
64,4984
30
71,7234
31
81,2917
32
131,3267
1997
140
90
40
0
1990
12
datos
16
20
24
28
32 t
1995 1996 1997
previsiones
Fig. 4.3.- Datos, modelo y previsiones para los dos aos siguientes
p48
Series temporales
En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivo
para los ocho trimestres siguientes a la recogida de informacin, es decir, para los aos
1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiar
en este perodo de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsiones
para las dos formas de anlisis estudiadas.
Valores modelizados
130
100
70
40
0
12
16
20
24
p49
15
R(categricas)
10
5
0
-5
-10
-10
-5
10
15
R(descomp. clsica)
Fig. 4.5.- Residuos de la descomposicin frente a los del modelo en variables categricas
Ya que el objetivo del sistema clsico es descomponer la serie como un modelo aditivo, o
multiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesario
identificar cada componente.
Previsiones
140
115
90
65
40
24
28
32
Fig. 4.6.- Previsiones para los dos aos siguientes segn la descomposicin clsica ( )
y las variables categricas ( )
Yt = 0 +
i
t +
i =1
L o s
a u t o r e s ,
j Qj
j=2
2 0 0 1 ;
E d i c i o n s
U P C ,
2 0 0 1 .
p50
Series temporales
a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que los
ciclos, caso de existir, no sean identificables con los datos disponibles, tendremos
Yt =Tt + Et
En este caso, despus de estabilizar la serie, se habr modelizado la tendencia como
Tt = a0
i=1
ti
Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de toma
de datos y otro que identifica la estacin a la que pertenece el dato, cualquier instante t
puede escribirse como t = s + k p = s + p$ , con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t
es un mltiplo del perodo, p, ms el indicador de la estacin, s. As, resulta
Yt = Tt + Et = a0 +
i=1
ti +
Es
donde
s =1
i ti
Yt=1+ p$ = 0
Yt= 2+ p$ = 0
i=1
q
i=1
ti +
ti +
= a0 +
i=1
ti +
2=
a0 +
p =
a0 +
i=1
E1
ti +
E2
ti +
Ep
A
Yt=p+ p$ = 0
i=1
i=1
p 0 +
j = p a0
a0 = 0 +
j= 2
j= 2
p51
Tt = 0 +
j= 2
ti
i=1
i=1
Al ser la estacionalidad Es = Yt = s+ p$
ti + s s = 1, , p
t = s + p$
Tt resulta
p
Es = s
j= 2
Para el caso del ejemplo del material deportivo, p = 4, con variables categricas se obtuvo el
modelo
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
4
j= 2
Tt = 0 +
j= 2
i=1
E1 =
0 21,57525
E2 =
E3 =
E4 =
= 21,57525
p52
Series temporales
Se comprueba que Es = 0 .
s =1
Estos valores, como era de esperar, son muy similares a los obtenidos por la
descomposicin clsica (captulo 3), que resultaron ser 20,6426; 15,5836; 6,5264 y
42,7526, respectivamente.
Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelo
de tendencia y de los ndices estacionales obtenidos por los dos mtodos desarrollados.
Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podra
etiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie donde
la estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del
perodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposicin
clsica no hubiese conseguido modelizarla correctamente.
Es por todo ello que se puede afirmar que la modelizacin global con variables categricas
es un procedimiento mucho ms general para el estudio del comportamiento de una serie
temporal y la realizacin de previsiones.
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Y
99,30
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52
64,30
25,60
76,50
t
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Y
117,66
52,67
63,96
40,85
76,12
116,48
52,86
79,80
44,25
88,39
125,34
46,45
80,05
50,67
94,03
t
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
Y
127,52
30,42
92,71
60,22
88,61
136,60
32,16
104,76
60,62
93,53
142,92
33,34
103,53
68,86
92,50
t
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Y
149,66
34,13
118,31
64,06
106,09
150,28
25,74
114,62
74,64
106,34
149,02
29,06
121,42
76,33
114,29
p53
20
60 t
40
Y
99,3
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52
Q2
0
1
0
0
0
0
1
0
0
0
0
1
Q3
0
0
1
0
0
0
0
1
0
0
0
0
Q4
0
0
0
1
0
0
0
0
1
0
0
0
Q5
0
0
0
0
1
0
0
0
0
1
0
0
...
...
...
...
...
...
p54
Series temporales
3 Q3 +
4 Q4 +
5Q 5 +
2Q2 t+
3Q3+t
4Q4+t
5Q+5t
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q4
t*Q5
nu
9
50
59
Coef.
101,580
-38,364
-53,757
-83,296
-31,512
0,941
-1,636
0,385
0,106
-0,288
S.C.
C.M.
73631,982 8181,331
1151,873
23,037
74783,855
Error tpico
2,675
3,832
3,882
3,933
3,985
0,080
0,114
0,114
0,114
0,114
t
37,978
-10,012
-13,849
-21,179
-7,908
11,718
-14,408
3,387
0,935
-2,539
F
355,132
p-val
0,000
p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,354
0,014
R^2 = 0,9846
Tabla 4.VII.- Resultados del modelo lineal inicial
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q5
nu
8
51
59
Coef.
100,067
-36,851
-52,244
-80,110
-29,999
0,994
-1,689
0,331
-0,341
S.C.
C.M.
73611,831 9201,479
1172,023
22,981
74783,855
Error tpico
2,127
3,469
3,524
1,964
3,637
0,057
0,098
0,098
0,098
t
47,038
-10,622
-14,824
-40,780
-8,247
17,529
-17,198
3,376
-3,476
F
400,398
p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,001
R^2 = 0,9843
Tabla 4.VIII.- Resultados del modelo lineal definitivo
p-val
0,000
p55
200
160
120
80
40
0
20
40
60 t
R 12
8
4
0
-4
-8
-12
0
20
40
60 t
#
Fig. 4.9.- Residuos del modelo: R = Y Y
p56
Lunes:
Viernes:
Series temporales
s=1
s=5
Q2 = Q3 = Q4 = Q5 = 0
Q2 = Q3 = Q4 = 0
Q5 = 1
# = 100,07 + 0,99 t
Y
# = 70,07 + 0,65 t
Y
con t = 5$ +1
con t = 5$ +5
En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,
sobre el fondo de los datos experimentales. Cada recta, a la derecha del grfico, lleva el
indicador estacional que le corresponde (lunes: s =1; martes: s = 2 ). De la ecuacin del
modelo general y del estudio de este grfico se puede concluir que el lunes y el jueves
tienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,
sistemticamente, un mayor nmero de usuarios que el jueves. Esta discrepancia constante
es la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q4, que en este caso
es igual a 80,11. La tendencia comn indica un aumento sostenido de usuarios que se
evala en un incremento de 0,99 usuarios al da (coeficiente de t en las rectas 1 y 4).
Y 160
1
3
120
5
4
80
40
2
0
20
40
60
En cuanto a los mircoles y viernes (rectas 3 y 5), se puede decir que tienen un
comportamiento similar. En los primeros das haba algo ms de usuarios el viernes que el
mircoles; sin embargo, dicho nmero ha aumentado en ambos, pero con mayor velocidad
el mircoles, de forma que actualmente ste ya supera al viernes.
Especial atencin merece el martes (recta 2), ya que inicialmente tena un nmero de
usuarios situado ms o menos en el promedio de los otros das, pero ha sufrido un
decrecimiento progresivo que actualmente lo sita en un valor muy inferior a los dems das
de la semana, los cuales, en mayor o menor grado, han presentado un incremento de
demanda del servicio.
Est claro que, en la prctica, una situacin como sta requerira de un estudio en
profundidad de las causas que han conducido a esta situacin: quizs la persona que
atiende la lnea no es la misma, o hay mayores dificultades para establecer comunicacin y
el pblico deja de llamar los martes,...
La obtencin del modelo tiene como principal objetivo el poder hacer previsiones del
comportamiento de la demanda del servicio durante los prximos das, a fin de programar un
p57
aumento del nmero de lneas telefnicas, del nmero de personas que atienden a los
usuarios, plantearse una redistribucin en el tiempo, etc.
La tabla 4.IX muestra las previsiones para las dos semanas prximas, junto a los valores del
tiempo y de las variables categricas, necesarios para ser sustituidos en el modelo general.
t
61
62
63
64
65
66
67
68
69
70
Q2
0
1
0
0
0
0
1
0
0
0
Q3
0
0
1
0
0
0
0
1
0
0
Q4
0
0
0
1
0
0
0
0
1
0
Q5
0
0
0
0
1
0
0
0
0
1
Y prevista
160,686
20,129
131,312
83,557
112,478
165,655
16,654
137,938
88,526
115,741
En la figura 4.11 se pueden observar los valores de las previsiones como extrapolacin del
modelo ajustado sobre los datos disponibles, constatndose la gran disminucin del nmero
de usuarios del martes.
Y180
150
120
90
60
30
0
0
10
20
30
40
50
60
70 t