Você está na página 1de 47

p11

Introduccin

TEORA DE SERIES TEMPORALES


1 INTRODUCCIN
Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, tambin, la
evolucin de un fenmeno o variable a lo largo de l. Esta variable puede ser econmica
(ventas de una empresa, consumo de cierto producto, evolucin de los tipos de inters,...),
fsica (evolucin del caudal de un ro, de la temperatura de una regin, etc.) o social (nmero
de habitantes de un pas, nmero de alumnos matriculados en ciertos estudios, votos a un
partido,...).
El objetivo del anlisis de una serie temporal, de la que se dispone de datos en perodos
regulares de tiempo, es el conocimiento de su patrn de comportamiento para prever la
evolucin futura, siempre bajo el supuesto de que las condiciones no cambiarn respecto a
las actuales y pasadas.
Si al conocer la evolucin de la serie en el pasado se pudiese predecir su comportamiento
futuro sin ningn tipo de error, estaramos frente a un fenmeno determinista cuyo estudio
no tendra ningn inters especial. Esto correspondera a una situacin como la de la figura
1.1, que muestra la intensidad de corriente, I, que circula a travs de una resistencia, R,
sometida a un voltaje sinusoidal, V(t) = a cos (vt + ); por tanto I(t) = a cos (vt + )/R.
I(t)

1,5
1
0,5
0
-0,5
-1
-1,5
0

20

40

60

80

Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t + /2)

En general, las series de inters llevan asociados fenmenos aleatorios, de forma que el
estudio de su comportamiento pasado slo permite acercarse a la estructura o modelo
probabilstico para la prediccin del futuro. Estos modelos se denominan tambin procesos
estocsticos. As, un proceso estocstico es una sucesin de variables aleatorias {Yt}, con
t = 1, 2, ..., n, que evolucionan con el tiempo ( representado ste por el subndice t).
Cuando se dispone de n datos de un proceso estocstico, se est frente a n muestras, de
tamao unidad, extradas de la poblacin (variable aleatoria), correspondientes al tiempo en
que se realiz la medicin, y esto es lo que constituye la serie temporal o cronolgica.
Como ejemplo puede servir la evolucin a lo largo de un ao del ndice IBEX35, que recoge
los 35 valores de mayor cotizacin de la bolsa espaola, representada en la figura 1.2.

Los autores, 2001; Edicions UPC, 2001.

p12

Series temporales

Lgicamente, el valor del IBEX35 depender del valor alcanzado en los das previos,
adems de recoger la influencia de un conjunto de factores sociales, polticos, econmicos,
etc., que son continuamente cambiantes en el tiempo y cuya conjuncin, en un determinado
instante, configurara una hipottica distribucin de probabilidad del citado ndice econmico.
En casos como ste, es evidente que puede obtenerse un modelo que explique el
comportamiento de la serie en el perodo estudiado, pero puede ser muy arriesgada la
utilizacin de este modelo para hacer previsiones a medio o largo plazo. As, en todas las
series cronolgicas, es necesaria una gran cautela en la previsin a causa de la muy
probable inestabilidad del modelo en un futuro ms o menos alejado del ltimo instante del
que se conocen datos.

IBEX35

5
4,5
4
3,5
3
enero

diciembre
Fig. 1.2.- Evolucin del ndice IBEX35

Otro ejemplo puede ser el constituido por la sucesin de variables aleatorias {Y1, ...,Yt,...},
tales que Yt = 0,80Yt1 + t , con Y0 = 0 y los t distribuidos N(0; 1), independientes para todo
t = 1, 2,...
Esta serie puede expresarse tambin como Yt =

0,8t i i

y la distribucin de

i=1

probabilidad de cualquier Yt corresponde a una ley Normal, con esperanza matemtica


t
t
1 0,8t
1 0,64t
E(Yt ) =
0,8t i =
0,82(t i) =
y variancia V(Yt ) =
.
0,2
0,36
i=1
i=1

La figura 1.3 muestra la ley de probabilidad de la variable Y en los instantes t = 1, t = 4 y t =


20, junto con la serie cronolgica compuesta por las 25 primeras observaciones de la
misma.
La particular forma de la informacin disponible de una serie cronolgica, n muestras de
tamao unidad procedentes de otras tantas poblaciones de distribucin y caractersticas
desconocidas, hacen que las tcnicas de inferencia estadstica, usualmente aplicadas en
muestras de tamao superior a la unidad, no sean vlidas para estos casos.

Los autores, 2001; Edicions UPC, 2001.

p13

Introduccin

En los captulos siguientes se pretende presentar, de forma simple, distintos criterios


metodolgicos que permitan el estudio de estos fenmenos, y en particular la previsin de
su evolucin futura, para aplicarlos a campos tcnicos y econmicos, como por ejemplo
previsin de las ventas de una empresa, de los usuarios de un medio de transporte, de la
caracterstica de inters de un proceso continuo, etc.

Yt

20
15
10
5
0
-5
-10
0

10

15

20

25

Fig. 1.3.- Distribucin de Yt y 25 observaciones de la serie

Todas las formas de estudio de una serie cronolgica, tal como se ir viendo, no conllevan
clculos complicados, pero s reiterativos, con gran volumen de datos manipulados y con
abundancia de grficos; es por ello que para su estudio se hace muy necesario el disponer
de un programa informtico que permita su correcta aplicacin y la obtencin de cuantos
grficos sean necesarios.

Los autores, 2001; Edicions UPC, 2001.

p14

Series temporales

2. ANLISIS DE UNA SERIE TEMPORAL

Antes de abordar cualquier estudio analtico de una serie temporal, se impone una
representacin grfica de la misma y la observacin detenida de su aspecto evolutivo.
Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores que
puede tomar en un futuro, puede hablarse de distintas metodologas, que denominaremos
modelizacin por componentes y enfoque Box-Jenkins.

2.1 Modelizacion por componentes

Este mtodo consiste en identificar, en la serie Yt, cuatro componentes tericas, que no
tienen por qu existir todas, y que son:

Tendencia: Tt.

Estacionalidad: Et.

Ciclos: Ct.

Residuos: Rt.

Cada una de estas componentes es una funcin del tiempo y el anlisis consistir en la
separacin y obtencin de cada una de ellas, as como en determinar de qu forma se
conjugan para dar lugar a la serie original. Estas componentes se pueden observar en la
figura 2.1, en donde se ha considerado que actan de forma aditiva para dar lugar a la serie
cronolgica.
La tendencia es la componente general a largo plazo y se suele expresar como una funcin
2
del tiempo de tipo polinmico o logartmico, por ejemplo Tt = 0 + 1 t+ 2 t +
Las variaciones estacionales son oscilaciones que se producen, y repiten, en perodos de
tiempo cortos. Pueden estar asociadas a factores dinmicos, por ejemplo la ocupacin
hotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolucin est claramente
ligada a la estacionalidad climtica, vacacional, publicitaria, etc.
Las variaciones cclicas se producen a largo plazo y suelen ir ligadas a etapas de
prosperidad o recesin econmica. Suelen ser tanto ms difciles de identificar cuanto ms
largo sea su perodo, debido, fundamentalmente, a que el tiempo de recogida de
informacin no aporta suficientes datos, por lo que a veces quedarn confundidas con las
otras componentes.

Los autores, 2001; Edicions UPC, 2001.

p15

Anlisis de una serie temporal

200
175
150

TENDENCIA

125
100

40
20

ESTACIONALIDAD

0
-20
-40

60
30
0

CICLOS

-30
-60

5
3
0

RESIDUOS
-3
-5
300

200

SERIE
CRONOLGICA

100

Fig. 2.1.- Componentes de una serie cronolgica

La componente residual es la que recoge la aportacin aleatoria de cualquier fenmeno


sujeto al azar.

Los autores, 2001; Edicions UPC, 2001.

p16

Series temporales

Para evaluar las distintas componentes se utilizan tcnicas estadsticas tales como modelo
lineal, medias mviles, diferencias finitas, etc.
Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otras
componentes surge un nuevo problema que es el cmo conjuntar tendencia, estacionalidad
y ciclos para dar lugar a la serie definitiva.
As se proponen, entre otros, modelos genricamente denominados aditivos y
multiplicativos.

Modelo aditivo: Y = T + E + C + R

Modelo multiplicativo: Y = T x E x C + R

Para una primera identificacin visual del caso, se puede considerar que si el patrn
estacional se mantiene con amplitud constante se tratar de modelo aditivo (figuras 2.1 y
2.2). Cuando dicho patrn se vaya amplificando con el tiempo, ser multiplicativo (figura
2.3).
Y 250

200

150

100

50
t
Fig. 2.2.- Serie aditiva

Y 400

300

200

100

0
t
Fig. 2.3.- Serie multiplicativa

Los autores, 2001; Edicions UPC, 2001.

p17

Anlisis de una serie temporal

Un modelo aditivo se puede interpretar como aquel en que la estacionalidad acta


modificando la ordenada en el origen de la tendencia.
Supongamos que no hay ciclos, que la tendencia es de tipo lineal, Tt = 0 + 1 t, y que la
estacionalidad es de perodo p = 4, es decir, cada 4 unidades de tiempo se repite el patrn
(tal como ocurre en la figura 2.2). Representando sus valores por E1, E2, E3 y E4,
respectivamente, el modelo aditivo se puede escribir como
Y1 = 0 + 1 1 + E1 + R1 = 1 + 1 1 + R1
Y2 = 0 + 1 2 + E2 + R2 = 2 + 1 2 + R2
Y3 = 0 + 1 3 + E3 + R3 = 3 + 1 3 + R3
Y4 = 0 + 1 4 + E4 + R4 = 4 + 1 4 + R4
Y5 = 0 + 1 5 + E1 + R5 = 1 + 1 5 + R5

Yt = 0 + 1 t + Es + Rt = s + 1 t + Rt

con

t = p$ + s; s = 1, , p

As pues, cada estacin (s) componente del perodo conforma una recta con ordenada en el
origen distinta para cada caso y pendiente comn a todos; es decir, segn muestra la figura
2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a una
estacin.
En el modelo multiplicativo, el componente estacional acta sobre la ordenada en el origen y
sobre la pendiente.

Y 250

200

150

100

50
t
Fig. 2.4.- Interpretacin de una serie con modelo aditivo

Prescindiendo de los ciclos, supuesta una tendencia lineal tipo Tt = 0 + 1t y una


estacionalidad de perodo p, para cualquier t = p$ + s, con s = 1, , p, resulta

Los autores, 2001; Edicions UPC, 2001.

p18

Series temporales

Yt = Tt Es + Rt = (0 + 1t) Es + Rt,
es decir

Yt = (0 Es ) + ( 1Es ) t + Rt

o sea

Yt = 0s + 1s t + Rt

De esta forma, cada una de las p estaciones del perodo configura una recta distinta, tanto
en lo que se refiere a la ordenada en el origen (0s) como a la pendiente (1s).
El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).
Es evidente que esta divisin, en modelo estrictamente aditivo o estrictamente multiplicativo,
es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambie
slo la pendiente, o slo la ordenada en el origen. Esto constituira un modelo mixto mucho
ms general que los propuestos hasta ahora, los cuales pasaran a ser meros casos
particulares de ste. En la figura 2.6 se presenta una situacin de este tipo.
Y 500
400
300
200
100
0
t
Fig. 2.5.- Interpretacin de una serie con modelo multiplicativo

Y 200

150

100

50

0
t

Fig. 2.6.- Modelo general

Los autores, 2001; Edicions UPC, 2001.

p19

Anlisis de una serie temporal

2.2 Enfoque Box - Jenkins


La forma de encarar el anlisis de las series temporales a travs de la metodologa de BoxJenkins es dirigir el esfuerzo a determinar cul es el modelo probabilstico que rige el
comportamiento del fenmeno a lo largo del tiempo. Es decir, partiendo de la premisa de
que no siempre va a ser posible identificar los componentes de la serie, se trata de estudiar
el componente aleatorio puro, reflejado en los residuos.
La metodologa estadstica utilizada en el estudio de una serie temporal por este sistema, se
basa en los siguientes pasos:

Identificacin del modelo.

Estimacin de los parmetros.

Validacin de los supuestos admitidos en el anlisis, tambin llamado diagnosis del


modelo.

Para poder abordar esta metodologa es imprescindible, en primer lugar, estudiar un


conjunto de modelos de comportamiento que cubran el mayor espectro posible de los
procesos estocsticos objeto de nuestro inters. Entre ellos se pueden destacar los
procesos de ruido blanco, medias mviles (MA), autorregresivos (AR), integrados (I) y sus
conjunciones (ARMA y ARIMA). A partir de aqu se podr identificar la serie de datos con
alguno de los modelos estudiados, estimar sus parmetros y validar la admisibilidad del
modelo adoptado.
En general, se suele asumir que el componente aleatorio, el cual se representa por Z, sigue
2
una distribucin Normal de media cero y variancia . Un proceso estocstico en que todos
sus componentes son independientes y estn constituidos slo por componente aleatorio se
2
denomina proceso de ruido blanco, es decir, Yt = Zt con Zt NINDEP(0; ) t.
Un proceso se denomina de media mvil de orden q, y se representa por MA(q), si su
estructura es del tipo Yt = Zt + t-1 Zt-1 + + t-q Zt-q. En la figura 2.7 se muestra un MA(4).

Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.7.- Proceso de media mvil MA(4)

Los autores, 2001; Edicions UPC, 2001.

p20

Series temporales

Un proceso es autorregresivo de orden p, y se representa por AR(p), cuando cada


componente es funcin de los anteriores ms el trmino aleatorio; su estructura corresponde
a
Yt = Zt + t-1 Yt-1 + + t-p Yt-p
En la figura 2.8 se muestra un AR(2).
Cuando a las estructuras de autorregresin y media mvil se une una dependencia con el
tiempo se llega a un ARIMA(p, r, q), donde p es el orden del AR, q el del MA y r el del
proceso integrado, o, lo que es lo mismo, el grado del polinomio que representa la funcin
del tiempo. En la figura 2.9 se presenta un proceso ARIMA(2,1,3).

Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.8.- Proceso autorregresivo AR(2)

Y 90
80
70
60
50
40
30
20
10
0
t
Fig. 2.9.- Proceso ARIMA(2, 1, 3)

Los autores, 2001; Edicions UPC, 2001.

p21

Descomposicin de una serie temporal

3 DESCOMPOSICIN DE UNA SERIE TEMPORAL


Este mtodo, tambin denominado sistema clsico, descompone la serie en tendencia,
estacionalidad, ciclos y residuos Una vez decidida la conjuncin entre ellos, aditiva o
multiplicativa, se obtiene el modelo con el que hacer previsiones.
La tendencia es la componente ms importante de la serie, al definir lo que se podra
interpretar como comportamiento a largo plazo. Cada observacin va ligada a un valor del
tiempo, lo que permite plantear un modelo del tipo
Y = (t) +

donde la funcin (t) puede ser:


lineal:

(t) = 0 + 1t

polinmica:

2
(t) = 0 + 1t + 2 t + ...

exponencial: (t) = 0 t 1

Si la serie no presenta estacionalidad, el mtodo de estimacin mnimo-cuadrtica y todas


las pruebas de hiptesis relativas a la explicacin del modelo y a la significacin de los
coeficientes estimados,
propios del modelo lineal ordinario, permiten estimar los
coeficientes del modelo de tendencia sobre los datos directos.
Caso de existir componente estacional, para que sta no enmascare la tendencia, es
necesario estabilizar previamente la serie.
Para desarrollar la metodologa de la descomposicin clsica sobre un ejemplo, se dispone
de los datos relativos a las ventas de material deportivo en una gran superficie comercial,
recogidos en la tabla 3.I y representados en la figura 3.1. En esta tabla el tiempo (t) se ha
medido tomando como referencia el inicio del perodo de recogida de datos, y, en este caso,
su unidad es el trimestre.
La observacin de la figura 3.1, permite pensar en una tendencia lineal creciente y una
estacionalidad clara, cuyo patrn se repite anualmente, es decir, cada 4 valores del tiempo
(trimestres). Esto se puede interpretar como una tendencia sostenida de un aumento de las
ventas en esta superficie comercial, unida a un comportamiento distinto para cada uno de
los cuatro trimestres; debido, posiblemente, a que el precio del material deportivo es muy
distinto segn sea el adecuado para una estacin concreta (material de esqu frente a
entretenimiento de playa, por ejemplo). Por otra parte, el patrn estacional se mantiene con
una amplitud aproximadamente constante, lo que conduce a la utilizacin de un modelo
aditivo.

Los autores, 2001; Edicions UPC, 2001.

p22

Series temporales

Ao
1990

1991

1992

1993

1994

1995

Trimestre
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

Ventas (Y)
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50

t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Tabla 3.I.- Ventas de material deportivo

Y 130

100

70

40
0

12

16

20

24 t

Fig. 3.1.- Evolucin cronolgica de las ventas de material deportivo

En este ejemplo se ha identificado un patrn estacional compuesto por los cuatro trimestres
y que se repite de ao en ao, adems de una tendencia aparentemente lineal. Si se
decidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendran los
resultados de la tabla 3.II.

Los autores, 2001; Edicions UPC, 2001.

p23

Descomposicin de una serie temporal

Regresin
Residuos
Total

nu
1
22
23

Coef.
Ord. Origen 57,501
t
1,286

S. C.
1901,300
15623,686
17524,985

C. M.
1901,300
710,168

F
2,677

Error tpico
11,229
0,786

t
5,121
1,636

p-val
0,000
0,116

p-val
0,116

R^2 = 0,10849
Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y = 0 + 1t +

El modelo presenta un coeficiente de determinacin (R^2) tan slo del 10,8% y no resulta
estadsticamente significativo, ya que el nivel de significacin (p-val), tanto del ajuste como
de la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primera
especie del 5%. As, se demuestra que este procedimiento no es vlido ya que incluye en el
residuo todo el componente estacional, lo cual produce una inflacin de la suma de
cuadrados residual que desvirta el modelo y cualquier prueba de significacin de la
regresin y de sus coeficientes.
Para evitar esto es necesario estabilizar la serie liberndola de la estacionalidad; esto se
podra conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. En
la tabla 3.IV se detallan los resultados del clculo del modelo de tendencia, considerado tipo
rectilneo.

Ya

t (aos)

Ya

t (aos)

67,4925

75,0900

67,1550

80,7425

71,1875

79,7725

Tabla 3.III.- Medias anuales de ventas de material deportivo

Regresin
Residuos
Total

nu
1
4
5

Coef.
Ord. Origen 62,967
t(aos)
3,030

S.C.
160,711
15,279
175,991

C.M.
160,711
3,820

F
42,073

Error tpico
1,819
0,467

t
34,607
6,486

p-val
0,000
0,003

R^2 = 0,91318
Tabla 3.IV.- Modelo lineal para las medias anuales

Los autores, 2001; Edicions UPC, 2001.

p-val
0,003

p24

Series temporales

Ahora ya se ha obtenido un modelo de tendencia altamente significativo y con un buen


ajuste (R^2 = 91,3%). En la figura 3.2 se han representado las medias anuales junto a la
estimacin del modelo de tendencia; se observa la estabilizacin conseguida en los valores
de las medias anuales, ya que mientras los datos directos oscilaban entre 40 y 130, las
medias anuales van desde 67 hasta 81.
Hay que destacar que con esta estabilizacin se ha conseguido un modelo de tendencia
significativo; sin embargo, es aceptable este procedimiento? La respuesta sera no, ya que
este sistema tiene el inconveniente de la gran prdida de informacin, pues de los 24 datos
iniciales, se ha acabado estimando el modelo con slo 6 puntos. Este inconveniente queda
paliado desestacionalizando la serie con las medias mviles.
Ya 85
80
75
70
65
0

7
t(aos)

Fig. 3.2.- Evolucin y tendencia de la media anual

3.1 Medias mviles: tendencia


Con este mtodo se consiguen suavizar tanto las oscilaciones peridicas de una serie como
las aleatorias. Su aplicacin requiere decidir, previamente, el perodo en que se repite cierto
patrn de comportamiento, que pueda atribuirse a variaciones estacionales; la observacin
de la evolucin grfica de la serie puede ayudar a tomar la decisin.
Una vez fijado el perodo p, se calculan las medias de los valores de la serie tomados de p
en p, sucesivamente desde el inicio. Asociando cada una de estas medias al valor del
tiempo del punto central del perodo estudiado, se obtiene una nueva serie de valores
mucho ms estables, debido, por una parte, a la reduccin de la variabilidad ocasionada al
promediar y, por otra, a que, si el perodo escogido es el correcto, al pasar de una media
mvil a la siguiente, el nuevo dato incorporado es del mismo comportamiento que el dato
saliente.
Si p es impar la asociacin es directa :
p

p +1
t =

Y(p+1) / 2 =

i=1

Y1 + Y2

Los autores, 2001; Edicions UPC, 2001.

+ A + Yp
p

p25

Descomposicin de una serie temporal

p+ 1

p + 3
t =
2

Y(p + 3) / 2 =

i= 2

Y2

Y3 +

A +

Yp+ 1

Si p es par, el centro del grupo de cada p valores promediados corresponde a un valor no


observado del tiempo; para subsanarlo, la nueva serie queda constituida por los promedios
de las medias mviles tomadas dos a dos. Es decir:

t =

p + 2
2

Y(p+ 2) / 2 =

Y(p+ 1) / 2

t =

p + 4
2

Y(p + 4) / 2 =

Y(p+ 3) / 2

Y(p+ 3) / 2

2
+

Y(p+ 5) / 2

La representacin grfica de las medias mviles, o la regresin de dichos valores frente al


tiempo, permiten evaluar la tendencia de la serie liberada de la componente estacional.
Uno de los inconvenientes de este sistema es la prdida de valores en los dos extremos de
la serie, tanto mayor cuanto mayor es p. En ocasiones, se propone como alternativa a este
problema la sustitucin de los valores extremos de las medias mviles por los resultantes de
una extrapolacin lineal de los observados; sin embargo, si el nmero de datos disponibles
es grande, la prdida de informacin es negligible.
En el caso del ejemplo de las ventas de material deportivo, ya se ha comentado que la
estacionalidad se manifiesta de forma anual, es decir, cada cuatro trimestres; ello conduce
al clculo de las medias mviles tomando p = 4.
En la tabla 3.V se detalla el clculo de los primeros valores de la nueva serie, y la tabla 3.VI
resume la totalidad de los mismos.
t

Y
1
2
3
4
5

40,22
54,89
63,51
111,35
46,95

67,4925
69,1750

68,3337

Tabla 3.V.- Detalle del clculo de las medias mviles con p = 4

Los autores, 2001; Edicions UPC, 2001.

3
4
5

p26

t
3
4
5
6
7

Series temporales

68,3337
68,7662
68,1025
67,5012
66,4588

8
9
10
11
12

67,4725
69,5300
70,5325
72,6825
73,4363

t
13
14
15
16
17

Y
72,9325
74,1300
76,8450
78,1900
78,9000

t
18
19
20
21
22

Y
80,3812
79,3075
78,5175
79,2037
79,5088

Tabla 3.VI.- Medias mviles con p = 4

Los resultados del modelo lineal, Y = 0 + 1t+ para el clculo de la tendencia constan en
la tabla 3.VII.
nu
1
17
18

Regresin
Residuos
Total

S.C.
393,692
41,108
434,800

Coef.
Error tpico
Ord. Origen 63,0065
0,9188
t
0,8311
0,0651

C.M.
393,692
2,418

F
162,810

t
68,5739
12,7597

p-val
0,0000
0,0000

p-val
0,000

R^2 = 0,905
Tabla 3.VII.- Modelo de tendencia sobre las medias mviles

Trabajando sobre 19 puntos, los 19 valores de las medias mviles, se ha obtenido un buen
ajuste, con un coeficiente de determinacin del 90,5 %. En consecuencia, el modelo de
tendencia resultante es
T = 63,0065 + 0,8311 t
Evidentemente, la interpretacin de la ecuacin de la tendencia permite afirmar que las
ventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido en
trimestres). En la figura 3.3 puede observarse el suavizado conseguido con las medias
mviles junto con el modelo de tendencia estimado a partir de los citados valores.
130

100

70

40
0

12

16

20

24 t

Fig. 3.3.- Evolucin ( ), medias mviles ( 1 ) y tendencia ( ), para p = 4

Los autores, 2001; Edicions UPC, 2001.

p27

Descomposicin de una serie temporal

3.2 Estacionalidad
La componente estacional, que provoca una oscilacin sistemtica de perodo corto,
generalmente no superior al ao, puede enmascarar la evolucin a largo plazo, tendencia, si
no se asla convenientemente.
Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valor
de la estacin y la media de todas las estaciones componentes del perodo.
El anlisis de la estacionalidad queda ligado al mtodo que se decida emplear para
modelizar la tendencia; as, en este punto estudiaremos la situacin para el caso de trabajar
con medias mviles.
Para calcular los valores de los ndices estacionales hay que seguir la siguiente sistemtica:
n

Calcular las medias mviles, Yt , sobre los datos, Yt , de la serie original, tomando el
perodo de agrupacin, p, que se considere oportuno.

Proponer un modelo de agrupacin de las componentes, aditivo o multiplicativo.

Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale a
calcular Wt = Yt Yt ; si fuese multiplicativo, en lugar de diferencias seran cocientes, es
decir, Wt = Yt / Yt . Hay que destacar que en Wt estn incluidas las componentes
asociadas a la estacionalidad, los ciclos y los residuos.

Asumiendo que los residuos son variables aleatorias de media nula y que la
componente cclica, caso de existir, es de perodo suficientemente largo como para no
ser recogida por los datos, se procede a evaluar la estacionalidad asociada a cada
componente del perodo, a cada trimestre en el caso del ejemplo. Para ello se calculan
Wt
los promedios de los Wt de la misma estacin

E*s

t = s + p&

s = 1, , p
ns
donde s representa el ndice estacional y ns el nmero de valores asociados a este
ndice que se promedian.
Ya que los ndices estacionales miden discrepancias respecto a la media, sta se
necesita como valor de referencia; por tanto es necesario calcular la media general:
p

E
s=1

E =
n

*
s

Calcular los ndices estacionales en modelo aditivo


Los ndices estacionales son las diferencias entre los promedios de las Wt de cada
estacin y la media general que se acaba de definir, es decir
Es = E*s E

p28

Series temporales

Es obvio destacar que la suma de estos ndices es cero:

E
s =1

= 0.

Calcular los ndices estacionales en modelo multiplicativo.


En este caso, los ndices estacionales son el cociente entre los promedios de las Wt de
cada estacin y la media general, es decir
E*
Es = s
E
Ahora, la suma de estos ndices es igual al perodo,

E
s =1

= p . En modelo

multiplicativo, no es extrao que los ndices estacionales se representen en %.


En la tabla 3.VIII se detallan los clculos del caso de modelo aditivo de las ventas de
material deportivo. Por ejemplo, para el tercer trimestre (s = 3), el promedio de las Wt, cuyos
valores del tiempo correspondiesen al tercer trimestre, por ser mltiplos de 4 ms 3 (t = 3, 7,
11, 15, 19), sera:
*
E3 =

t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

-4,8237 - 4,9888 - 8,4325 - 10,6950 - 4,1975


= - 6,6275
5
Yt

40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,5

Yt
----68,3337
68,7662
68,1025
67,5012
66,4588
67,4725
69,5300
70,5325
72,6825
73,4363
72,9325
74,1300
76,8450
78,1900
78,9000
80,3812
79,3075
78,5175
79,2037
79,5088
-----

Wt

-----4,8237
42,5838
-21,1525
-15,8812
-4,9888
41,1075
-28,1500
-5,2325
-8,4325
40,3837
-19,5925
-14,7600
-10,6950
43,3100
-11,5200
-24,2912
-4,1975
45,8725
-23,3037
-18,2588
-----

Estacin: s
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

Tabla 3.VIII.- Evaluacin de la estacionalidad por medias mviles.

Los autores, 2001; Edicions UPC, 2001.

p29

Descomposicin de una serie temporal

Anlogamente, para cada trimestre, se obtiene:


E1* = 20,7438

E*2 = 15,68477

E*3 = 6,6275

E*4 = 42,6515

*
s

La media general es:

s =1

E =

= 0,101125

y los ndices estacionales, resultan


E1 = 20,6426

E2 = 15,5836

E3 = 6,5264

E4 = 42,7526

Los valores de los ndices estacionales recin obtenidos se interpretan de la siguiente forma:
respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; el
segundo est 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que el
cuarto supera a la media en 42,7526 unidades de venta.

Con el modelo de tendencia de la tabla 3.VII y la estacionalidad, se ha obtenido la


descomposicin de la serie original, mostrada en la figura 3.4.

Evidentemente, los residuos se calculan como : R = Y - T - E. La buena modelizacin


conseguida queda confirmada por los residuos, ya que en su mayora estn en el intervalo
5 y slo en 3 puntos se llega a valores de 10 u 11 unidades.

Tal como se ha ido repitiendo, el objetivo de la modelizacin de la serie es poder realizar


previsiones para los prximos valores del tiempo. En la tabla 3.IX se presentan las
previsiones para los 2 aos inmediatos siguientes. Atendiendo a que el perodo estacional
es igual a 4, para realizar la previsin hay que identificar el tiempo como un mltiplo de 4
ms s (s = 1, 2, 3, 4), para aadir a la tendencia el valor correcto de la estacionalidad. As,
la previsin se calcula como:
# = 63,0065 + 0,8311 t + E con
Y
t
s

t = 4$ + s

La figura 3.5 muestra la evolucin de las previsiones y su buena concordancia con la


evolucin histrica de los datos recogidos en el estudio.

Los autores, 2001; Edicions UPC, 2001.

p30

Series temporales

130
100
Y
70
40

84
79
T 74
69
64

50
30
E 10

-10
-30
130

T
+
E

100

70

40

11

R 0

-11

Fig. 3.4.- Descomposicin de la serie de ventas de material deportivo por medias mviles

Los autores, 2001; Edicions UPC, 2001.

p31

Descomposicin de una serie temporal

Ao
1996

1997

Estacin: s

25

Tendencia:
T = 63,0065+0,8311 t
83,7840

26

27
28

Estacionalidad: E

#
Previsin: Y

20,6426

63,1414

84,6151

15,5836

69,0315

85,4462

6,5264

78,9198

86,2773

42,7526

129,0299

29

87,1084

20,6426

66,4658

30

87,9395

15,5836

72,3559

31

88,7706

6,5264

82,2442

32

89,6017

42,7526

132,3543

Tabla 3. IX.- Previsiones para 1996 y 1997, segn el modelo de descomposicin clsica

Y 140

90

40
0

12

16

20

24

28

32 t

Fig. 3.5.- Evolucin histrica ( ), modelo ( ) y previsiones ( p )

3.3 Caso temperaturas


La tabla 3.X presenta las temperaturas medias mensuales registradas en una ciudad del
hemisferio sur, en el perodo de tiempo que abarca desde enero de 1986 a diciembre de
1995. Interesa estudiar el modelo de comportamiento y realizar una previsin de las
temperaturas de la dcada siguiente.

Los autores, 2001; Edicions UPC, 2001.

p32

Series temporales

Ao
Mes

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII

26,8
27,2
27,1
26,3
25,4
23,9
23,8
23,6
25,3
25,8
26,4
26,9

27,1
27,5
27,4
26,4
24,8
24,3
23,4
23,4
24,6
25,4
25,8
26,7

26,9
26,3
25,7
25,7
24,8
24,0
23,4
23,5
24,8
25,6
26,2
26,5

26,8
26,9
26,7
26,1
26,2
24,7
23,9
23,7
24,7
25,8
26,1
26,5

26,3
27,1
26,2
25,7
25,5
24,9
24,2
24,6
25,5
25,9
26,4
26,9

27,1
27,1
27,4
26,8
25,4
24,8
23,6
23,9
25,0
25,9
26,3
26,6

26,8
27,1
27,4
26,4
25,5
24,7
24,3
24,4
24,8
26,2
26,3
27,0

27,1
27,5
26,2
28,2
27,1
25,4
25,6
24,5
24,7
26,0
26,5
26,8

26,3
26,7
26,6
25,8
25,2
25,1
23,3
23,8
25,2
25,5
26,4
26,7

27,0
27,4
27,0
26,3
25,9
24,6
24,1
24,3
25,2
26,3
26,4
26,7

Tabla 3.X.- Registro de las temperaturas mensuales

La evolucin cronolgica de los datos se muestra en la figura 3.6, en donde se pone de


manifiesto que la tendencia es prcticamente inapreciable, por la aparente horizontalidad del
eje virtual de la serie. Por otra parte se observa la existencia de una componente estacional
clara que se repite, lgicamente, cada ao y mantiene la amplitud, dando idea de que es un
modelo aditivo. Al ser los datos mensuales, la longitud del perodo es igual a 12.
El clculo de las medias mviles, con p = 12, y su representacin grfica (figura 3.7)
confirman la estacionalidad, por la estabilizacin conseguida en la serie, pero ponen en
entredicho la ausencia de tendencia.
La observacin del grfico hace recomendable ajustar un modelo de tendencia, que se har
posteriormente y que ya se ha representado en esta figura.

Y 30

28

26

24

22
0

24

48

72

96

Fig. 3.6.- Evolucin cronolgica de las temperaturas

Los autores, 2001; Edicions UPC, 2001.

120 t

p33

Descomposicin de una serie temporal

Y 30

28

26

24

22
0

24

48

72

96

120 t

Fig. 3.7.- Temperaturas mensuales ( ), medias mviles ( ) y lnea de tendencia ajustada ( )

Para evaluar la estacionalidad es necesario calcular los ndices estacionales, tal como se ha
detallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y se
presentan grficamente en la figura 3.8.

Mes

(s)

ndice Es

Mes

(s)

ndice Es

1,07496

VII

1,78846

II

1,31478

VIII

1,80143

III

0,97867

IX

0,77967

IV

0,62126

10

0,05413

0,15883

XI

11

0,52959

VI

1,03569

XII

12

0,99070

Tabla 3.XI.- ndices estacionales

La interpretacin de los ndices es simple: desde octubre (X) a abril (IV), la temperatura est
por encima de la media anual; mientras que de mayo (V) a septiembre (IX) est por debajo
de la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; por
tanto, de octubre a abril son los meses clidos, y los dems son los fros. Es de destacar
que la oscilacin trmica media, del mes ms clido al ms fro, es relativamente pequea
(1,31 + 1,80 = 3,01C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y
29C permite afirmar que el estudio se est haciendo sobre una ciudad de clima muy suave
y casi permanentemente primaveral.

Los autores, 2001; Edicions UPC, 2001.

p34

Series temporales

-1

-2
0

12 s

Fig. 3.8.- Componente estacional: ndices

La tendencia, aunque dbil, existe y es de tipo lineal. Su evaluacin se efectuar mediante


el modelo lineal aplicado a las medias mviles (tabla 3.XII).

Regresin
Residuos
Total

Ord. Origen
t

nu
1
106
107

S.C.
2,186
5,205
7,391

C.M.
2,186
0,049

F
44,512

Coeficientes
25,4733
0,00456

Error tpico
0,0459
0,0007

t
554,4281
6,6717

p-val
0,0000
0,0000

p-val
0,000

R^2 = 0,295735
Tabla 3.XII.- Modelo lineal para la tendencia:

Yt = 0 + 1 t +

A pesar del valor del coeficiente de determinacin del ajuste, (29,57 %), la explicacin del
modelo es significativa. As, se puede deducir que parece existir una tendencia muy ligera a
un incremento de la temperatura, que se ha estimado en un aumento de 0,00456 grados
mensuales en promedio.
La evolucin del modelo, junto con los datos reales, se presentan en la figura 3.9. Para su
obtencin, hay que tener en cuenta que, conocidos los ndices estacionales y el modelo de
tendencia, la suma mes a mes de los dichos valores darn lugar al modelo propuesto, es
decir:
# = 25,4733 + 0,00456 t + E
Y
t
s

con

t = 12$ + s

Los autores, 2001; Edicions UPC, 2001.

s = 1, , 12

p35

Descomposicin de una serie temporal

Y 30

28

26

24

22
0

24

48

72

96

120 t

Fig. 3.9.- Datos ( ) y modelo ajustado ( )

Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hay
algunos puntos que parecen presentar mayores discrepancias.
Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, ya
en los datos iniciales presentaron unas temperaturas medias bastante superiores a las de
los dems aos (es decir hizo un otoo especialmente clido).
En la figura 3.10, se muestran los residuos resultantes de la descomposicin de esta serie,
# . Hay que destacar la buena modelizacin conseguida, pues
obtenidos como Rt = Yt Y
t
en la mayora de las 120 observaciones, el error es inferior a un grado, excepto en los
meses ya comentados.
R 2

-1

-2
0

24

48

72

Fig. 3.10.- Residuos del modelo

Los autores, 2001; Edicions UPC, 2001.

96

120

p36

Series temporales

A partir de la descomposicin, y suponiendo que no cambiase el comportamiento


meteorolgico de la zona, la previsin de la temperatura para los 10 aos siguientes sera la
de la tabla 3.XIII, que se muestra en la figura 3.11 junto a los datos disponibles. Aqu se
observa que, de mantenerse la tendencia, la temperatura media mensual, poco a poco, se
va incrementando.
Comparando los datos reales con las previsiones, se ve en estas ltimas la ausencia del
componente aleatorio. Se est haciendo una previsin de temperaturas medias, pero el azar
meteorolgico se unir a la previsin alterndola en aquellos perodos de tiempo en los que
las temperaturas sean distintas a las de la tnica general: inviernos muy fros o muy suaves,
veranos ms extremos, etc.

Ao
Mes

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII

27,1
27,3
27,0
26,7
25,9
25,0
24,3
24,3
25,3
26,1
26,6
27,1

27,2
27,4
27,1
26,7
25,9
25,0
24,3
24,3
25,3
26,2
26,7
27,1

27,2
27,5
27,1
26,8
26,0
25,1
24,4
24,4
25,4
26,2
26,7
27,2

27,3
27,5
27,2
26,8
26,1
25,1
24,4
24,4
25,5
26,3
26,8
27,2

27,3
27,6
27,2
26,9
26,1
25,2
24,5
24,5
25,5
26,3
26,8
27,3

27,4
27,6
27,3
26,9
26,2
25,2
24,5
24,5
25,6
26,4
26,9
27,3

27,4
27,7
27,3
27,0
26,2
25,3
24,6
24,6
25,6
26,5
26,9
27,4

27,5
27,7
27,4
27,0
26,3
25,3
24,7
24,6
25,7
26,5
27,0
27,5

27,5
27,8
27,5
27,1
26,3
25,4
24,7
24,7
25,7
26,6
27,0
27,5

27,6
27,8
27,5
27,2
26,4
25,5
24,8
24,8
25,8
26,6
27,1
27,6

Tabla 3.XIII.- Temperatura prevista para los 10 aos siguientes a la recogida de datos

30

28

26

24

22
0

48

96

144

192

240 t

Fig. 3.11.- Datos desde 1986 a 1995 ( ) y previsiones desde 1996 a 2005 ( 1 )

Los autores, 2001; Edicions UPC, 2001.

p37

Descomposicin de una serie temporal

3.4 Caso usuarios transporte pblico


En la tabla 3.XIV se recogen los datos relativos al nmero de usuarios de un determinado
transporte pblico en el perodo que abarca desde 1984 hasta 1995, y la figura 3.2 muestra
su evolucin cronolgica.
Ao
Mes

1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII

90
88
109
103
103
122
134
132
115
101
91
112

111
115
129
121
112
125
164
158
133
127
110
120

127
107
141
135
133
154
175
174
158
139
112
140

142
139
145
162
144
176
192
190
160
151
134
140

146
155
182
165
165
191
195
205
182
165
138
155

164
151
180
164
184
206
198
235
197
163
148
163

175
161
179
195
189
208
227
249
224
193
170
166

176
194
197
211
191
235
248
273
202
189
167
168

208
189
232
226
222
245
252
242
229
202
192
198

199
190
228
220
222
233
303
253
253
223
191
185

207
198
251
231
234
251
316
285
250
232
190
201

219
206
229
223
231
266
290
294
258
214
206
199

Tabla 3. XIV.- Usuarios de un transporte pblico.

Y 320

240

160

80
0

24

48

72

96

120

144 t

Fig. 3.12.- Evolucin cronolgica del nmero de usuarios.

La observacin de la figura 3.12 permite realizar las siguientes consideraciones:

Se detecta una clara tendencia creciente en el tiempo.

Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos son
mensuales, su perodo ser igual a 12.

Los autores, 2001; Edicions UPC, 2001.

p38

Series temporales

El patrn de estacionalidad tiene una forma constante pero presenta una amplificacin
continua en el tiempo. Esta situacin es la que indica que el modelo subyacente es
multiplicativo.

Para obtener la descomposicin de la serie cronolgica, es necesario estabilizarla


previamente, mediante medias mviles de p = 12; y despus modelizar la tendencia y
calcular los ndices estacionales.
La evolucin de las medias mviles se muestra en la figura 3.13, y se aprecia un crecimiento
que no es proporcional al tiempo, sino que parece sufrir un amortiguamiento al final de la
serie; es decir, probablemente se tratar de un modelo parablico.

320

240

160

80
0

24

48

72

96

120

144 t

Fig. 3.13.- Tendencia a travs de las medias mviles (p =12)

La estimacin mnimo-cuadrtica conduce al modelo de tendencia, sobre las medias


mviles, cuya estimacin se muestra en la tabla 3.XV. En ella se observa, adems de un
muy buen ajuste reflejado por una R2 del 99,74%, que el trmino cuadrtico es altamente
significativo. El signo negativo de este trmino da idea de una especie de freno en el
crecimiento sostenido del nmero de usuarios, representado por el coeficiente positivo del
tiempo.

Regresin
Residuos
Total

Ord. Origen
t
t^2

nu
2
129
131

S.C.
194340,33
500,01
194840,34

C.M.
97170,17
3,88

F
25069,58

Coeficientes
100,4749
1,4326
-0,00297

Error tpico
0,6227
0,0197
0,0001

t
161,3636
72,8823
-22,5088

p-val
1,08E-150
1,08E-106
1,66E-46

p-val
7,937E-168

R^2 = 0,9974
Tabla 3.XV.- Estimacin del modelo de tendencia: Y = 0 + 1 t + 2 t2 +

Los autores, 2001; Edicions UPC, 2001.

p39

Descomposicin de una serie temporal

As pues, el modelo de tendencia puede escribirse como:


T = 100,4749 + 1,4326 t 0,00297 t2
En modelos multiplicativos, como el del actual ejemplo, la componente estacional representa
la relacin entre cada estacin y la media general. Recordemos que, en estos casos, el
clculo de la estacionalidad se realiza de acuerdo con los siguientes pasos:
a) Calcular las medias mviles Yt , a partir de los datos, Yt, de la serie.
b) Separar la tendencia, es decir, calcular Wt =

Yt
Yt

c) Asumiendo que los ciclos, caso de existir, son de perodo suficientemente largo como
para no ser recogidos por los datos, calcular los promedios de las Wt de cada estacin y la
media general. s es el indicador de la estacin (mes, en el ejemplo), y ns el nmero de
valores de W que se promedian en la citada estacin

E*s =

*
s

Wt

t = s + p$

s = 1, ..., p

ns

E =

s =1

d) Finalmente, los valores de las componentes estacionales, generalmente expresados en %


en modelos multiplicativos, se obtienen como:
Es =

E*s
E

100

En la tabla 3.XVI se muestran los valores de las componentes estacionales del presente
ejemplo, y se representan grficamente en la figura 3.14.

Mes

Es

Mes

Es

Mes

Es

92,38

97,04

IX

105,50

II

88,41

VI

109,53

94,11

III

101,72

VII

121,91

XI

81,54

IV

99,21

VIII

121,31

XII

87,33

Tabla 3.XVI.- Componente estacional.

Los autores, 2001; Edicions UPC, 2001.

p40

Series temporales

E 130
120
110
100
90
80

12 t

Fig. 3.14.-ndices estacionales

La interpretacin de los ndices podra ser en el sentido de que, por ejemplo, los usuarios de
los meses de julio y agosto son del orden de un 121% superior a la media, mientras que en
noviembre se est en un 81% de la media. Ello podra aconsejar una promocin en los
meses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayor
ocupacin de las plazas disponibles.
La figura 3.15 muestra la concordancia entre los datos y su modelizacin, a partir de la
tendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:
# =
Y
t

(100,4749

1,4326 t

0,00297 t2

Es
100

s = 1, ..., 12

t = s + 12$

320

240

160

80
0

24

48

72

96

120

144 t

Fig. 3.15.- Serie cronolgica experimental ( ) y ajustada ( !).

Observando la figura 3.15 se puede destacar que hay unos desajustes ms acusados en
ciertos meses de julio o agosto, en concreto, los de los aos 1989, 90, 91, 93 y 94, por lo
que es posible afirmar que en los casos citados ha habido un comportamiento
sustancialmente distinto del esperado en los mismos meses de otros aos; en principio,
sera discutible afirmar la presencia de un cambio en los hbitos de utilizacin de este
transporte, ya que ni el ao 1993 ni el 1995, pertenecientes al perodo en cuestin,
presentan semejantes discrepancias.

Los autores, 2001; Edicions UPC, 2001.

p41

Descomposicin de una serie temporal

A pesar de todo, en este caso, sera prudente tomar con ciertas precauciones las
previsiones para aos venideros, mientras no se confirme la consolidacin en el futuro de un
cambio o de una permanencia de comportamiento. Tambin podra ser interesante intentar
averiguar qu ocurri en estos meses (quizs una campaa publicitaria, quizs una
disminucin de alternativas de la competencia,...).
La figura 3.16 muestra la evolucin de los residuos entre los datos experimentales y el
# . Se observa que, en la mayora de los casos, oscilan entre 16,
modelo ajustado, Rt = Yt Y
t
aunque en algn caso la discrepancia se aproxima a 30 unidades.
Asumiendo que se mantiene el mismo modelo, la previsin de usuarios hasta el ao 2000 se
presenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente los
clculos, que el ltimo valor de t para el que se dispone de datos, diciembre de 1995, es
144; por tanto, para las predicciones, que abarcan el perodo de los prximos 60 meses, los
valores de t irn desde 145 hasta 204.
R

32

16

-16

-32
0

24

48

72

96

120

144

Fig. 3.16.- Residuos del modelo ajustado

En el grfico de la previsin se puede observar la reduccin de la velocidad de crecimiento


inicial de la serie que se ha comentado en la modelizacin de la tendencia.
330
280
230
180
130
80
0

24

48

72

96

120

144

Datos

168

192

Previsiones

Fig. 3.17.- Serie observada y previsiones hasta el ao 2000

Los autores, 2001; Edicions UPC, 2001.

p42

Series temporales

4 MODELIZACIN CON VARIABLES CATEGRICAS


Tal como se ha comentado en el captulo anterior, si hubiera estacionalidad, estimar el modelo
de tendencia sobre los datos directos, por procedimientos usuales de ajuste mnimocuadrtico, sera improcedente. Ello es debido a que se producira una inflacin de los
residuos no atribuible a la aleatoriedad sino a la variabilidad ocasionada por el componente
estacional. Para evitarlo, se pueden modelizar conjuntamente la tendencia y la estacionalidad
con variables categricas asociadas a cada estacin, o bien desestacionalizar previamente la
serie y entonces ajustar el modelo de tendencia, como ya se ha expuesto.
La modelizacin conjunta, con variables categricas, de la tendencia y la estacionalidad
presenta como principal ventaja la generalidad del mtodo. Por este procedimiento no es
necesario, a priori, asumir un modelo aditivo o multiplicativo, sino que se plantea un modelo
general que incluye todas las posibilidades.
Sea p el perodo estacional, es decir, el nmero de unidades de tiempo que conforman el
patrn de comportamiento que se repite sistemticamente. Cada uno de los valores del
tiempo contenidos en p corresponde a una estacin, la cual se designar por el subndice s,
de forma que s = 1, 2, ..., p.
Cada estacin debe estar ligada biunvocamente a una variable categrica. Dicha variable
es un indicador que toma el valor 1 en la estacin a la que est asociada y 0 en todas las
dems, excepto para la primera estacin, en que todas toman el valor 0. sta es la razn
por la cual con p-1 variables categricas es suficiente para estudiar una serie de perodo p.
Las variables categricas, Q, quedan, pues, definidas como
Qj = 0 j s
con
Qj = 1 j = s

s = 1, 2 , @ , p

Con estas variables se plantea un modelo tipo


p
Y = ( t ) + j Qj +
j=2

j = 2 , @ , p

p
j Qj t +
j=2

donde (t) es una funcin polinmica del tiempo, o sea, (t) = 0 +

ti , que viene a

i=1

recoger la tendencia o evolucin general, a largo plazo, de los datos con el tiempo. Los
p

trminos del grupo

Q indican los cambios que las distintas estaciones, componentes


j

j= 2

del perodo estacional, introducen en la ordenada en el origen del modelo, parte aditiva
p

segn el sistema clsico. Mientras que los del grupo

Q t
j

representan la influencia de la

j= 2

estacionalidad sobre la funcin del tiempo, lo que en el mtodo clsico se interpreta como
parte multiplicativa.
El estudio de la significacin de cada uno de los coeficientes , y , y la consiguiente
eliminacin de los no significativos conducir el modelo que definitivamente explica el
comportamiento de la serie.

Los autores, 2001; Edicions UPC, 2001.

p43

Modelizacin con variables categricas

Para desarrollar la metodologa de las variables categricas sobre un ejemplo, se van a utilizar
los datos relativos a las ventas de material deportivo estudiados por el mtodo clsico, con el
fin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven a
reproducir los datos de la serie cronolgica, junto a los valores de las variables categricas. La
representacin grfica de los mismos ya se present en la figura 3.1, cuya observacin
condujo a pensar en una tendencia lineal creciente y una estacionalidad de perodo p = 4.
A fin de no confundir los dos efectos, procede la creacin de variables categricas que
identifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el perodo
de repeticin del patrn estacional. Por otra parte, suponiendo que hubiese ciclos, el
intervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo que
su posible existencia quedar enmascarada en los residuos.
En la tabla 4.I estn las variables categricas Q2, Q3 y Q4, cuya conjuncin representa de
forma unvoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que el
primer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los dems que, a
travs del indicador, aportarn la parte del efecto estacional correspondiente.
En este caso, al ser la tendencia rectilnea, se plantea el modelo
Y = 0 + 1 t + 2 Q2 + 3 Q3 +

4 Q4+

2 Q2 +t

3 Q3 +t

4 Q4+ t

La estimacin de sus parmetros conduce a los resultados expuestos en la tabla 4.II.


Ao

Trimestre (s)

Ventas (Y)

Q2

Q3

Q4

1990

1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50

0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0

0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0

0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

1991

1992

1993

1994

1995

Tabla 4.I.- Ventas de material deportivo

Los autores, 2001; Edicions UPC, 2001.

p44

Series temporales

Los resultados del modelo lineal general evidencian que todos los trminos del tipo Qjt no
son estadsticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo
prescindiendo de ellos.
Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente de
la recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.
Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,
alternativamente, estudiado por la metodologa de la descomposicin clsica, tal como se ha
hecho en el captulo 3. Si alguno de esos trminos hubiese resultado significativo, el sistema
clsico proporcionara un modelo bastante precario.

Regresin
Residuos
Total

Ord. Origen
Q2
Q3
Q4
t
t*Q2
t*Q3
t*Q4

nu
7
16
23

S.C.
17166,997
357,988
17524,985

C.M.
2452,428
22,374

F
109,609

Coeficientes
38,9463
15,7735
19,1936
65,6577
1,0832
-0,8026
-0,3513
-0,1485

Error tpico
3,660
5,351
5,535
5,726
0,283
0,400
0,400
0,400

t
10,640
2,948
3,468
11,466
3,832
-2,008
-0,879
-0,371

p-val
0,000
0,009
0,003
0,000
0,001
0,062
0,393
0,715

p-val
0,000

R^2 = 0,9796
Tabla 4.II.- Resultados del modelo lineal general

La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de
Y = 0 + 1t +

Regresin
Residuos
Total

Ord. Origen
Q2
Q3
Q4
t

2 Q 2 +

3 Q3 +

4 Q 4 +

nu
4
19
23

S.C.
17064,626
460,359
17524,985

C.M.
4266,157
24,229

F
176,073

Coeficientes
42,5280
6,4674
15,2781
64,5555
0,7576

Error tpico
2,580
2,846
2,857
2,876
0,147

t
16,484
2,273
5,347
22,447
5,151

p-val
0,000
0,035
0,000
0,000
0,000

R^2 = 0,97373
Tabla 4.III.- Resultados del modelo definitivo

Los autores, 2001; Edicions UPC, 2001.

p-val
0,000

p45

Modelizacin con variables categricas

Los grficos de residuos y probabilstico Normal se presentan en la figura 4.1, y no


presentan ninguna peculiaridad especial.
En consecuencia queda validado el modelo obtenido.

Res

Res

%P

Res
Fig. 4.1.- Grficos de los residuos del modelo

Como resumen de todo lo anterior, el modelo que explica el comportamiento de la serie, y


que va a ser utilizado para hacer previsiones de las ventas futuras, ha resultado ser
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
La interpretacin de los coeficientes del modelo
estacionalidad.

permite identificar tendencia y

En cuanto a la primera, se detecta un incremento de las ventas de 0,7576 unidades cada


unidad de tiempo (trimestre); incremento que se mantiene constante sea cual sea la
estacin.
En consecuencia, la estacionalidad slo afecta a la ordenada en el origen de cada una de
las cuatro estaciones (trimestres) que componen el perodo.
Tomando como referencia el primer trimestre, en el que Q2 = Q3 = Q4 = 0, se observa que en
l las ventas dependen del tiempo, segn la ecuacin
# = 42,5280 + 0,7576 t
Y
con t = 1 + 4$
t

Los autores, 2001; Edicions UPC, 2001.

p46

Series temporales

Para un tiempo correspondiente a un segundo trimestre, las variables categricas toman los
valores Q2 = 1 y Q3 = Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t
Y
t

con

t = 2 + 4$

Para un tiempo de tercer trimestre, las variables categricas toman los valores Q3 = 1 y Q2 =
Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t
Y
t

con

t = 3 + 4$

Y, en el caso del cuarto trimestre, las variables categricas toman los valores Q4 = 1 y
Q2 = Q3 = 0; el modelo es
# = 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con
Y
t

t = 4 + 4$

As, para cada trimestre (estacin del perodo), se obtiene un modelo del mismo tipo,
rectilneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.
Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,
en el segundo el volumen de ventas aade a la funcin del tiempo 6,4674 unidades, en el
tercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,
evidentemente, los coeficientes de las variables categricas.
En consecuencia los coeficientes de las variables categricas representan la cantidad en
que una estacin, sistemticamente, supera (o no alcanza, segn sea el signo) el valor de la
primera estacin del perodo. Es decir, estos coeficientes son una forma de medir el
componente estacional.
Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparacin de los
valores medidos con los estimados a partir del modelo ajustado; se observa la buena
concordancia entre ambos.
La modelizacin tiene como objetivo principal el poder hacer previsiones para un futuro
prximo. En este caso se procede a calcular las previsiones para los prximos 2 aos, a
base de sustituir los valores del tiempo y de las variables categricas en el modelo obtenido.
Los resultados se muestran en la tabla 4.IV y en la figura 4.3.
Y 130

100

70

40
0

12

16

20

Fig. 4.2.- Datos reales ( ) y modelo ajustado ( )

Los autores, 2001; Edicions UPC, 2001.

24 t

p47

Modelizacin con variables categricas

Aqu se detecta la coherencia de la previsin con los datos histricos, siempre que no
cambie el modelo de comportamiento de la serie en el perodo previsto. Esto podra ocurrir,
por ejemplo, si hubiese una recesin econmica, la apertura de otro comercio de similares
caractersticas en las inmediaciones, un cambio de hbitos en la poblacin, una campaa
propagandstica con xito de la competencia, etc.
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4

Ao

Q2

Q3

Q4

#
Y
t

1996

25

61,4680

26

68,6930

27

78,2613

28

128,2963

29

64,4984

30

71,7234

31

81,2917

32

131,3267

1997

Tabla 4.IV.- Previsiones para 1996 y 1997

140

90

40
0

1990

12

datos

16

20

24

28

32 t
1995 1996 1997
previsiones

Fig. 4.3.- Datos, modelo y previsiones para los dos aos siguientes

Los autores, 2001; Edicions UPC, 2001.

p48

Series temporales

4.1 Comparacin del mtodo de descomposicin con el de variables categricas


Se han expuesto dos mtodos para la descomposicin de la serie y ambos se han aplicado
a un caso de modelo aditivo puro, es decir, en el que la estacionalidad no afecta a la
pendiente de la recta de tendencia. El de variables categricas es ms simple en cuanto a
manipulacin y clculos, aunque, si el perodo tiene muchas componentes, adquiere mayor
aparatosidad por el nmero de variables categricas que se manejan. El clsico, que
identifica los componentes del modelo por medio del uso de medias mviles, conduce a
resultados similares, en un caso en que se insiste que es aditivo puro; en casos ms
generales la descomposicin clsica no sera capaz de conseguir un buen modelo.

La comparacin de ambos, sobre el ejemplo desarrollado, se presenta en las figuras 4.4 y


4.5. La primera compara los resultados de los dos modelos dentro del perodo de recogida
de informacin; la segunda confronta los valores de los residuos obtenidos mediante los dos
sistemas. Ambos grficos confirman la gran concordancia de los resultados.

En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivo
para los ocho trimestres siguientes a la recogida de informacin, es decir, para los aos
1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiar
en este perodo de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsiones
para las dos formas de anlisis estudiadas.

Valores modelizados

130

100

70

40
0

12

16

20

24

Fig. 4.4.- Modelo segn la descomposicin clsica ( ) y las variables categricas ( )

Los autores, 2001; Edicions UPC, 2001.

p49

Modelizacin con variables categricas

15

R(categricas)

10
5
0
-5
-10
-10

-5

10

15

R(descomp. clsica)

Fig. 4.5.- Residuos de la descomposicin frente a los del modelo en variables categricas

Ya que el objetivo del sistema clsico es descomponer la serie como un modelo aditivo, o
multiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesario
identificar cada componente.

Previsiones

140
115
90
65
40
24

28

32

Fig. 4.6.- Previsiones para los dos aos siguientes segn la descomposicin clsica ( )
y las variables categricas ( )

Refirindonos slo a tendencia y estacionalidad, y considerando el modelo puramente


aditivo, como es el caso de los datos de las ventas de material deportivo, se tratar de pasar
del modelo en variables categricas
q

Yt = 0 +

i
t +

i =1

L o s

a u t o r e s ,

j Qj

j=2

2 0 0 1 ;

E d i c i o n s

U P C ,

2 0 0 1 .

p50

Series temporales

a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que los
ciclos, caso de existir, no sean identificables con los datos disponibles, tendremos
Yt =Tt + Et
En este caso, despus de estabilizar la serie, se habr modelizado la tendencia como
Tt = a0

i=1

ti

Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de toma
de datos y otro que identifica la estacin a la que pertenece el dato, cualquier instante t
puede escribirse como t = s + k p = s + p$ , con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t
es un mltiplo del perodo, p, ms el indicador de la estacin, s. As, resulta
Yt = Tt + Et = a0 +

i=1

ti +

Es

donde

= 0 ya que se ha definido cada componente estacional como la diferencia

s =1

respecto a la media del perodo.


Se asume que, en caso de modelo aditivo puro, los coeficientes asociados a las potencias
del tiempo deben ser los mismos, sea cual sea el procedimiento empleado para su estudio;
en consecuencia, las posibles discrepancias entre los valores estimados por ambos
mtodos sern muy pequeas.
Desarrollando las ecuaciones del modelo clsico y del de variables categricas para s = 1,. .
. , p, igualndolas para cada s se obtiene
q

i ti

Yt=1+ p$ = 0

Yt= 2+ p$ = 0

i=1
q

i=1

ti +

ti +

= a0 +

i=1

ti +

2=

a0 +

p =

a0 +

i=1

E1

ti +

E2

ti +

Ep

A
Yt=p+ p$ = 0

i=1

i=1

y sumando miembro a miembro, resulta


p

p 0 +

j = p a0

a0 = 0 +

j= 2

j= 2

de donde se deduce la expresin que da directamente la tendencia global, T, en funcin de


los parmetros estimados en el modelo de variables categricas:

Los autores, 2001; Edicions UPC, 2001.

p51

Modelizacin con variables categricas

Tt = 0 +

j= 2

ti

i=1

Para cualquier estacin, s, componente del perodo p, el modelo en variables categricas


puede escribirse como
Yt = 0 +

i=1

Al ser la estacionalidad Es = Yt = s+ p$

ti + s s = 1, , p

t = s + p$

Tt= s+ p$ , restando las dos ltimas expresiones de Yt y

Tt resulta
p

Es = s

j= 2

Para el caso del ejemplo del material deportivo, p = 4, con variables categricas se obtuvo el
modelo
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
4

del cual resulta

j= 2

= 21,57525 . A partir de este modelo la ecuacin pura de la tendencia,


4
o esqueleto de la serie, es
p

Tt = 0 +

j= 2

i=1

ti = 42,5280 + 21,57525 + 0,7576 t = 64,10325 + 0,7576 t

Cuando, a partir de la estabilizacin por medias mviles, se estim el modelo de tendencia


(sistema clsico), el resultado fue
Tt = 63,0065 + 0,8311 t
Es evidente que ambos resultados, procedentes de tcnicas de modelizacin distintas, son
muy parecidos; su similitud ya ha quedado puesta de manifiesto en las comparaciones
grficas de modelos , residuos y previsiones de las figuras 4.4, 4.5 y 4.6.
En cuanto a los valores de la estacionalidad, referidos a la media general, es decir, segn
los define el modelo clsico, se obtiene

E1 =

0 21,57525

E2 =

6,46475 21,57525 = 15,10785

E3 =

15,2781 21,57525 = 6,29715

E4 =

64,5555 21,57525 = 42,98025

= 21,57525

Los autores, 2001; Edicions UPC, 2001.

p52

Series temporales

Se comprueba que Es = 0 .
s =1

Estos valores, como era de esperar, son muy similares a los obtenidos por la
descomposicin clsica (captulo 3), que resultaron ser 20,6426; 15,5836; 6,5264 y
42,7526, respectivamente.
Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelo
de tendencia y de los ndices estacionales obtenidos por los dos mtodos desarrollados.
Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podra
etiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie donde
la estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del
perodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposicin
clsica no hubiese conseguido modelizarla correctamente.
Es por todo ello que se puede afirmar que la modelizacin global con variables categricas
es un procedimiento mucho ms general para el estudio del comportamiento de una serie
temporal y la realizacin de previsiones.

4.2 Caso usuarios de un telfono


En la tabla 4.5 se exponen unos datos cronolgicos correspondientes al nmero de usuarios
de un telfono de atencin al cliente de lunes a viernes, recogidos durante las 12 primeras
semanas de puesta en marcha del servicio.

t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Y
99,30
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52
64,30
25,60
76,50

t
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Y
117,66
52,67
63,96
40,85
76,12
116,48
52,86
79,80
44,25
88,39
125,34
46,45
80,05
50,67
94,03

t
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45

Y
127,52
30,42
92,71
60,22
88,61
136,60
32,16
104,76
60,62
93,53
142,92
33,34
103,53
68,86
92,50

Tabla 4.V.- Usuarios del telfono de atencin al cliente

Los autores, 2001; Edicions UPC, 2001.

t
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

Y
149,66
34,13
118,31
64,06
106,09
150,28
25,74
114,62
74,64
106,34
149,02
29,06
121,42
76,33
114,29

p53

Modelizacin con variables categricas

En la figura 4.7 se muestra la evolucin de la demanda de utilizacin de este servicio, y se


observa que la simplicidad del mtodo clsico de considerar la serie aditiva o multiplicativa,
no est nada clara pues el patrn estacional ni se mantiene constante ni se amplifica
sistemticamente.
Es natural que, de haber estacionalidad, sta sea de perodo 5, correspondiente a posibles
diferencias de utilizacin de dicho servicio en los distintos das de la semana. La observacin
del grfico confirma esta estacionalidad. En cuanto a la tendencia, tampoco se ve muy claro si
la hay; si se observan los datos del primer da de cada semana (lunes) parece que haya un
crecimiento sostenido de la demanda, mientras que viendo el comportamiento de los martes
(tabla 4.V) la tendencia es a una disminucin. Si slo se dispusiese del mtodo clsico de
descomposicin de la serie sera difcil analizar esta situacin, ya que la tendencia general, all
definida como esqueleto de la serie, parece mantenerse ms o menos constante.
Y 160
120
80
40
0
0

20

60 t

40

Fig. 4.7.- Evolucin cronolgica de la demanda

Aplicando la sistemtica de anlisis de variables categricas, corresponde definir 4


variables, Q2, Q3, Q4 y Q5, que identificarn cada uno de los cinco das de la semana. En la
tabla 4.VI, se muestra un fragmento de los valores de dichas variables asociados a los datos
disponibles.
t
1
2
3
4
5
6
7
8
9
10
11
12

Y
99,3
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52

Q2
0
1
0
0
0
0
1
0
0
0
0
1

Q3
0
0
1
0
0
0
0
1
0
0
0
0

Q4
0
0
0
1
0
0
0
0
1
0
0
0

Q5
0
0
0
0
1
0
0
0
0
1
0
0

...

...

...

...

...

...

Tabla 4. VI.- Variables categricas

Los autores, 2001; Edicions UPC, 2001.

p54

Series temporales

El modelo inicial que debe plantearse es del tipo


Y = 0 + 1t + 2Q2+

3 Q3 +

4 Q4 +

5Q 5 +

2Q2 t+

3Q3+t

4Q4+t

5Q+5t

y los resultados de la estimacin mnimo-cuadrtica de los coeficientes se muestran en la


tabla 4.VII. De ella se deduce que el trmino t=Q4 no es significativo (p-val > 0,05) y puede
ser eliminado del modelo. Al recalcular el nuevo modelo se obtienen los resultados
mostrados en la tabla 4.VIII.

Regresin
Residuos
Total

Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q4
t*Q5

nu
9
50
59
Coef.
101,580
-38,364
-53,757
-83,296
-31,512
0,941
-1,636
0,385
0,106
-0,288

S.C.
C.M.
73631,982 8181,331
1151,873
23,037
74783,855
Error tpico
2,675
3,832
3,882
3,933
3,985
0,080
0,114
0,114
0,114
0,114

t
37,978
-10,012
-13,849
-21,179
-7,908
11,718
-14,408
3,387
0,935
-2,539

F
355,132

p-val
0,000

p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,354
0,014

R^2 = 0,9846
Tabla 4.VII.- Resultados del modelo lineal inicial

Regresin
Residuos
Total

Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q5

nu
8
51
59
Coef.
100,067
-36,851
-52,244
-80,110
-29,999
0,994
-1,689
0,331
-0,341

S.C.
C.M.
73611,831 9201,479
1172,023
22,981
74783,855
Error tpico
2,127
3,469
3,524
1,964
3,637
0,057
0,098
0,098
0,098

t
47,038
-10,622
-14,824
-40,780
-8,247
17,529
-17,198
3,376
-3,476

F
400,398

p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,001

R^2 = 0,9843
Tabla 4.VIII.- Resultados del modelo lineal definitivo

Los autores, 2001; Edicions UPC, 2001.

p-val
0,000

p55

Modelizacin con variables categricas

El modelo que explica el comportamiento de la serie presenta un elevado grado de ajuste


2
(R = 98,43%) y, segn los coeficientes de la tabla 4.VIII, toma la expresin
# = 100,07 36,85 Q 52,24 Q 80,11 Q 30 Q
Y
t
2
3
4
5
+ 0,99 t 1,69 t Q2 + 0,33 t Q3 0,34 t Q5
La figura 4.8 presenta el modelo ajustado junto a los datos, y la figura 4.9 los residuos del
modelo. Se observa que la mayora de los valores estn en el intervalo 4 unidades, y slo
en algn caso la discrepancias alcanza 10 unidades; ello confirma el buen ajuste.

200
160
120
80
40
0

20

40

60 t

Fig. 4.8.- Datos experimentales ( ) y modelo ajustado ( )

R 12
8
4
0
-4
-8
-12
0

20

40

60 t

#
Fig. 4.9.- Residuos del modelo: R = Y Y

La interpretacin del modelo obtenido, se puede hacer determinando la ecuacin de


previsin asociada a cada uno de los das de la semana, es decir, a cada componente de la
estacin. A ttulo de ejemplo, los modelos para el lunes y el viernes son:

Los autores, 2001; Edicions UPC, 2001.

p56

Lunes:
Viernes:

Series temporales

s=1
s=5

Q2 = Q3 = Q4 = Q5 = 0
Q2 = Q3 = Q4 = 0
Q5 = 1

# = 100,07 + 0,99 t
Y
# = 70,07 + 0,65 t
Y

con t = 5$ +1
con t = 5$ +5

En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,
sobre el fondo de los datos experimentales. Cada recta, a la derecha del grfico, lleva el
indicador estacional que le corresponde (lunes: s =1; martes: s = 2 ). De la ecuacin del
modelo general y del estudio de este grfico se puede concluir que el lunes y el jueves
tienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,
sistemticamente, un mayor nmero de usuarios que el jueves. Esta discrepancia constante
es la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q4, que en este caso
es igual a 80,11. La tendencia comn indica un aumento sostenido de usuarios que se
evala en un incremento de 0,99 usuarios al da (coeficiente de t en las rectas 1 y 4).

Y 160

1
3

120

5
4

80

40

2
0

20

40

60

Fig. 4.10.- Modelos asociados a cada da de la semana

En cuanto a los mircoles y viernes (rectas 3 y 5), se puede decir que tienen un
comportamiento similar. En los primeros das haba algo ms de usuarios el viernes que el
mircoles; sin embargo, dicho nmero ha aumentado en ambos, pero con mayor velocidad
el mircoles, de forma que actualmente ste ya supera al viernes.
Especial atencin merece el martes (recta 2), ya que inicialmente tena un nmero de
usuarios situado ms o menos en el promedio de los otros das, pero ha sufrido un
decrecimiento progresivo que actualmente lo sita en un valor muy inferior a los dems das
de la semana, los cuales, en mayor o menor grado, han presentado un incremento de
demanda del servicio.
Est claro que, en la prctica, una situacin como sta requerira de un estudio en
profundidad de las causas que han conducido a esta situacin: quizs la persona que
atiende la lnea no es la misma, o hay mayores dificultades para establecer comunicacin y
el pblico deja de llamar los martes,...
La obtencin del modelo tiene como principal objetivo el poder hacer previsiones del
comportamiento de la demanda del servicio durante los prximos das, a fin de programar un

Los autores, 2001; Edicions UPC, 2001.

p57

Modelizacin con variables categricas

aumento del nmero de lneas telefnicas, del nmero de personas que atienden a los
usuarios, plantearse una redistribucin en el tiempo, etc.
La tabla 4.IX muestra las previsiones para las dos semanas prximas, junto a los valores del
tiempo y de las variables categricas, necesarios para ser sustituidos en el modelo general.
t
61
62
63
64
65
66
67
68
69
70

Q2
0
1
0
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
0
1
0

Q5
0
0
0
0
1
0
0
0
0
1

Y prevista
160,686
20,129
131,312
83,557
112,478
165,655
16,654
137,938
88,526
115,741

Tabla 4.IX.- Previsiones para dos semanas

En la figura 4.11 se pueden observar los valores de las previsiones como extrapolacin del
modelo ajustado sobre los datos disponibles, constatndose la gran disminucin del nmero
de usuarios del martes.

Y180
150
120
90
60
30
0
0

10

20

30

40

50

60

70 t

Fig. 4.11. - Datos ( ), modelo ( --- ) y previsiones (1)

Dichas previsiones sern vlidas siempre que se mantenga el modelo de comportamiento


que han puesto de manifiesto los datos disponibles. Es evidente que si se encontrase la
causa de la disminucin de llamadas producida en los martes, y se corrigiese, sera
necesario llevar a cabo una nueva recogida de informacin para elaborar los modelos
correspondientes y hacer previsiones en la nueva situacin.

Los autores, 2001; Edicions UPC, 2001.

Você também pode gostar