Você está na página 1de 14

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

METODOLOGA DE ANLISIS

SERIES DE TIEMPO

ESTADSTICA INFERENCIAL
o Pruebas de hiptesis
o Anlisis de varianza
o Tablas de contingencia

CONTROL ESTADSTICO DE
PROCESOS

Pgina 1

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

METODOLOGA DE SERIES DE TIEMPO


1. INTRODUCCIN
Definicin de serie de tiempo: Es una secuencia ordenada de valores de una
variable en intervalos de tiempo peridicos y consecutivos.
Aplicacin: la aplicacin de estos mtodos tiene dos propsitos: comprender las
fuerzas de influencia en los datos y descubrir la estructura que produjo los datos
observados. Ajustar el modelo y proceder a realizar pronsticos, monitoreo,
retroalimentacin y control en avance.

2. TENDENCIA Y ESTACIONALIDAD
Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con
algn tipo de curva o recta.
Por ejemplo:
Causar o provocar escandalo en lugares publicos o privados
QuadraticTrendModel
Yt = 6166.86 - 873.060* t + 69.4405* t* * 2
Variable
Actual
Fits

5500

AccuracyMeasures
MAPE
3.9
MAD
164.9
MSD
36852.8

Clave 2

5000
4500
4000
3500
3000
2003

2004

2005

2006
Year

2007

2008

2009

Estacionalidad: son fluctuaciones peridicas, por ejemplo cuando hay picos de


faltas en vacaciones y despus declinan.

Pgina 2

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

FALTAS ADMINISTRATIVAS
LinearTrendModel
Yt = 1411.87 - 0.782418* t
1800

Variable
Actual
Fits

FALTAS ADMINISTR

1700

AccuracyMeasures
MAPE
8.3
MAD
115.1
MSD
20328.9

1600
1500
1400
1300
1200
1100
Month Ene
Year 2004

Mar

May

Jul

Sep

Nov

Ene
2005

En la grfica anterior se observa un comportamiento mensual, con un mximo en


Julio y un mnimo en Noviembre.

3. INDICADORES DE MODELOS DE SERIES DE TIEMPO


Estos indicadores sirven para comparar la efectividad de diferentes modelos
utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y
MSD ya que representa un mejor ajuste del modelo, se definen como sigue:
MAPE: Porcentaje promedio absoluto de error.
MAD: Desviacin media absoluta.
MSD: Desviacin cuadrtica media, es ms sensible a errores anormales.

4. MTODOS DE PRONSTICO
Los mtodos de series de tiempo incluyen mtodos de pronstico y de
suavizamiento simples, mtodos de anlisis de correlacin y mtodos de Box
Jenkins ARIMA.
4.1 MTODOS DE PRONSTICO Y SUAVIZAMIENTO SIMPLE:
Modelan componentes en una serie que normalmente son fciles de ver en una
serie de tiempo.
Cuando hay un patrn curvilneo de los datos, se usa un anlisis de tendencias
con un modelo cuadrtico.
Las instrucciones de Minitab son las siguientes:

Pgina 3

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

1 Open Worksheet FALTASADM.MTW.


2 Ejecutar Stat > Time Series > Trend Analysis.
3 En Variable, poner Clave 1.
4 En Model Type, seleccionar Quadratic.
5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.
6 Seleccionar Storage .
7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en
cada dilogo.
Trend Analysis for Trade
Yt = 8721.43 - 2337.40*t + 191.024*t**2
Accuracy Measures
MAPE
12
MAD
340
MSD
142893
Forecasts
Period Forecast
2011
2247.71

Deambular en la via publica en estado de embriaguez o drogado


QuadraticTrendModel
Yt = 8721.43 - 2337.40* t + 191.024* t* * 2
Variable
Actual
Fits
Forecasts

7000
6000

AccuracyMeasures
MAPE
12
MAD
340
MSD
142893

Clave 1

5000
4000
3000
2000
1000
2004

2005

2006

2007
2008
Year

2009

2010

2011

Mtodo de Descomposicin
Se usa para pronosticar cuando hay un componente de estacionalidad en la serie
de tiempo o si se quiere analizar la naturaleza de los componentes. Separa las
series de tiempo en componentes de tendencia lineal y estacionalidad as como el
error. Se puede usar componente de estacionalidad en modo aditivo o
multiplicativo con la tendencia.
Por ejemplo:
Se desea predecir la tasa de faltas administrativas durante 2006 a 2009. Como los
datos tienen una tendencia que se ajusta bien con un modelo de tendencia
cuadrtica y tiene un componente estacional se utilizan los residuos del ejemplo
del anlisis de tendencias para combinar el anlisis de tendencias y
descomposicin para pronosticar.
Pgina 4

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

Las intrucciones de Minitab son las siguientes:


1 Correr el ejemplo de Anlisis de Tendencias con el archivo DELITOS.MTW
2 Stat > Time Series > Decomposition.
3 En Variable indicar FALTAS ADM
4 En Seasonal length, poner 12.
5 EnModel Type, seleccionar Additive. En Model Components, seleccionar Seasonal only.
6 Seleccionar Generate forecasts y poner 1 en Number of forecasts.
7 Seleccionar Storage . Seleccionar Forecasts y Fits.
8 Seleccionar OK en cada cuadro de dilogo
Fitted Trend Equation
Yt = 1453.46 + 0.791168*t
Accuracy Measures
MAPE
2.12
MAD
30.87
MSD
5551.93

FALTAS ADMINISTRATIVAS
MultiplicativeModel
1900

Variable
Actual
Fits
Trend

1800

FALTAS ADM

1700

AccuracyMeasures
MAPE
2.12
MAD
30.87
MSD
5551.93

1600
1500
1400
1300
1200
1100
Month Ene
Year 2004

Ene
2005

Ene
2006

Ene
2007

Ene
2008

Ene
2009

Seasonal Analysis for FALTAS ADM


MultiplicativeModel
SeasonalIndices

Detrended Data, by Seasonal Period

1.2

1.2

1.0

1.0

0.8

0.8
1

10 11 12

Percent Variation, by Seasonal Period

10 11 12

Residuals, by Seasonal Period


200

20
0
10

-200
-400
1

10 11 12

Pgina 5

10 11 12

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

Interpretacin de los resultados


La descomposicin genera tres tipos de grficas:
1. Una grfica de serie de tiempo mostrando los datos originales con la lnea
de tendencia ajustada, valores estimados y pronsticos
2. Un anlisis de componentes con grficas separadas para la serie, datos sin
tendencia, datos ajustados con estacionalidad y los datos ajustados
estacionalmente y sin tendencias (los residuos).
3. Un anlisis estacional, mostrando los ndices estacionales y la variacin
porcentual dentro de cada estacin respecto a la suma de la variacin por
estacin y grficas de caja de los residuos por periodo estacional.
METODO DE WINTERS
Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y
estacionalidad.
Suaviza los datos por el mtodo exponencial de Holt Winters. Se recomienda
este mtodo cuando se tienen presentes los componentes de tendencia y
estacionalidad ya sea en forma aditiva o multiplicativa.
El efecto multiplicativo se presenta cuando el patrn estacional en los datos
depende del tamao de los datos o sea cuando la magnitud del patrn estacional
se incrementa conforme los valores aumentan y se decrementa cuando los valores
de los datos disminuyen.
El efecto aditivo es mejor cuando el patrn estacional en los datos no depende del
valor de los datos, o sea que el patrn estacional no cambia conforme la serie se
incrementa o disminuye de valor.
El mtodo de Winters calcula los estimados de de tres componentes: nivel,
tendencia y estacionalidad. Calcula estimados dinmicos con ecuaciones para los
tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una
mayor ponderacin a observaciones recientes y menos peso a observaciones
pasadas, las ponderaciones decrecen geomtricamente a una tasa constante
La ponderacin seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si
se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0
y 1 para reducir los errores de estimacin.
Ejemplo de pronsticos utilizando el Mtodo de Winters
Se desea predecir el empleo para los siguientes seis meses en la industria
alimenticia usando datos colectados sobre los ltimos 60 meses, usando el

Pgina 6

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

mtodo de Winters con el modelo multiplicativo, dado que hay componente


estacional y de tendencia aparente en los datos.
Instrucciones de Minitab
1 Open Worksheet DELITOS.MTW.
2 Ejecutar Stat > Time Series > Winters' Method.
3 En Variable, poner Lesionados por arma. In Seasonal length, 12 .
4 En Model Type, seleccionar Multiplicative.
5 Seleccionar Generate forecasts poner 4 en Number of forecasts. Seleccionar OK.
Winters' Method for Food

Multiplicative Method
Smoothing Constants
Alpha (level)
0.2
Gamma (trend)
0.2
Delta (seasonal) 0.2
Accuracy Measures
MAPE 13.8561
MAD
4.8550
MSD
44.5868
Lesionados por arma
Multiplicative Method
70

Variable
Actual
Fits
Forecasts
95.0% PI

LESIONADOS POR ARMA

60

SmoothingConstants
Alpha (level)
0.2
Gamma (trend)
0.2
Delta (seasonal)
0.2

50
40

AccuracyMeasures
MAPE
13.8561
MAD
4.8550
MSD
44.5868

30
20
10
Month Ene
Year 2004

Ene
2005

Ene
2006

Ene
2007

Ene
2008

Ene
2009

Ene
2010

Interpretacin de los resultados


La grfica muestra los valores de la serie y los valores estimados (un periodo
adelante) y los cuatro pronsticos.
Los valores de exactitud del modelo MAPE, MAD y MSD utilizando el modelo
Aditivo proporcionan un mejor ajuste en dos de los tres indicadores que con el
modelo Multiplicativo como se muestra a continuacin.
Accuracy Measures
MAPE
MAD
MSD

13.5600
4.7628
43.1327

Pgina 7

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico


Accuracy Measures
Multiplicative

Additive

MAPE
MAD
MSD

13.5600
4.7628
43.1327

13.8561
4.8550
44.5868

4.4 ANLISIS DE CORRELACIN Y MTODO DE ARIMA


El anlisis de correlacin, anlisis de diferencias, autocorrelacin y autocorrelacin
parcial, son utilizadas para identificar un modelo adecuado de ARIMA.
El Modelo ARIMA puede utilizarse para modelar series de tiempo con o sin
componentes de tendencia o estacionalidad y proporcionar pronsticos.
Las diferencias se calculan entre los valores de los datos de la serie de tiempo,
sirven para identificar patrones de tendencia y estacionalidad.
Los atrasos (lags), son valores anteriores con los que se determina el siguiente
valor pronosticado
La autocorrelacin: es la correlacin entre observaciones de una serie de tiempo
separadas por K unidades de tiempo, su grfica se denomina funcin de
autocorrelacin (ACF), su anlisis permite seleccionar los trminos a ser incluidos
en el modelo ARIMA.

Ejemplo de ARIMA:
Instrucciones de Minitab
1 Worksheet DELITOS.MTW.
2 Stat > Time Series > ARIMA.
3 En Series, poner FALTAS_ADM.
4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en
Autoregressive. En Seasonal y en Difference poner 0.
5 Seleccionar Graphs. Seleccionar ACF of residuals y PACF of residuals .
6 En Forecasts poner 12 en Lead e indicar una columna vaca para Store los pronsticos.
7 OK en cada cuadro de dilogo.
ARIMA Model: FALTAS_ADM

Interpretacin de resultados

ACF of Residuals for FALTAS_ ADM


(with 5% significance limits for the autocorrelations)
1.0
0.8

Autocorrelation

0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1

3
Lag

El modelo ARIMA converge en 10


iteraciones. El modelo AR(1) tiene un
estadstico t de 46.78, como regla si t
es mayor a 2 se puede juzgar el
parmetro como significativo diferente
de cero. Los residuos no parecen
estar correlacionados como se
muestra en las grficas (estn dentro
de los intervalos de confianza,

Pgina 8

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

asumiendo que el valor 10 es aleatorio). El modelo AR(1) parece ser adecuado


para pronosticar.

Time Series Plot for FALTAS_ ADM


(with forecasts and their 95% confidence limits)
2250

FALTAS_ ADM

2000
1750
1500
1250
1000

12

15

18
Time

21

24

27

30

33

Interpretacin de resultados
El modelo ARIMA proporciona pronsticos con bandas de confianza en 95%,
usando el modelo AR(1) la estacionalidad domina el perfil de pronsticos para los
prximos 12 meses con los valores pronosticados similares a los 12 meses
previos.

Pgina 9

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

METODOLOGA DE ESTADSTICA INFERENCIAL


1. INTRODUCCIN
La estadstica inferencial sirve para hacer inferencias sobre los parmetros de la
poblacin que pueden ser medias, varianzas y proporciones en base a los datos
obtenidos de muestras.
PRUEBA PARA LA IGUALDAD DE DOS MEDIAS
Consideraremos ahora pruebas de hiptesis respecto a la igualdad de las medias
1 y 2 de dos distribuciones normales donde no se conocen las varianzas 12 y 22 .
Tenemos dos casos en el primero las varianzas son iguales y en el segundo las
varianzas son desiguales, a continuacin analizaremos cada uno de ellos.
En Minitab las instrucciones son las siguientes:
Prueba Minitab
>Stat >Basic statistics > 2- Sample t
Samples in different columns
First
Escndalos 2004
Second
Escndalos 2005
! Assume equal variances
Options: Confidence level
95%
Test difference 0.0
Alternate
Not equal
OK

Resultados
Two-Sample T-Test and CI: Escndalos 2004, Escndalos 2005
Two-sample T for Escandalos 2004 vs Escandalos 2005
Escandalos 2004
Escandalos 2005

N
3
4

Mean
3795
2804

StDev
962
585

SE Mean
556
293

Difference = mu (Escandalos 2004) - mu (Escandalos 2005)


Estimate for difference: 990.417
95% CI for difference: (-499.848, 2480.681) Como el cero se encuentra en el

Intervalo de confianza, no se rechaza la Ho.

T-Test of difference = 0 (vs not =): T-Value = 1.71

P-Value = 0.148

Como el valor P de la prueba es mayor a 0.05 no se rechaza Ho

Pgina 10

DF = 5

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

ANLISIS DE VARIANZA (ANOVA)


El anlisis de la varianza de un criterio (ANOVA) es una metodologa para analizar
la variacin entre muestras y la variacin al interior de las mismas mediante la
determinacin de varianzas. Es llamado de un criterio porque analiza un variable
independiente o Factor ej: Velocidad. Como tal, es un mtodo estadstico til para
comparar dos o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:
H 0 1 2 3 .... k

H 1 : Al menos dos medias poblacionales son diferentes.


Ejemplo :
Se desea saber si los promedios de faltas administrativas por escndalos son estadsticamente
iguales (Ho) o diferentes (Ha), se toman los datos siguientes:
Escndalos Escndalos
2004
2005
4536
3520
2707
2992
4141
2543
2162
ANOVA en Minitab.
Seleccionar:
Stat > ANOVA > One Way (Unstacked)
Response in separate columns Escndalos 2004, Escndalos 2005
Seleccionar ! Store Residuals ! Store Fits Confidence level 95%
Graphs
Seleccionar Normal plot of residuals
Comparisons
Seleccionar Tukeys Family error rate OK
Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo

One-way ANOVA: Escandalos 2004, Escandalos 2005


Source DF
Factor
1
Error
5
Total
6
S = 759.1

SS
MS
F
P
1681586 1681586 2.92 0.148
2880825
576165
4562411
R-Sq = 36.86%
R-Sq(adj) = 24.23%

Como este valor P es mayor a 0.05 no se rechaza la hiptesis nula y no hay


diferencia significativa entre 2004 y 2005
S = 2.198

R-Sq = 28.69%

R-Sq(adj) = 16.80%

Pgina 11

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

Para todos los casos,


Ho: No hay diferencia o la variable de columna NO depende de la variable de
rengln
H1: Hay diferencia la variable de columna SI depende de la variable de rengln
Ejemplo de Corrida en Minitab
Se desea saber si hay dependencia entre el tipo de delitos administrativos y la
zona donde se realizan. Se registran las faltas administrativas durante 2004 y
2005 como sigue:

Las instrucciones de Minitab son las siguientes:


1

Open Worksheet FALTASADM.MTW.

2 Seleccionar Stat > Tables > Chi-Square Test (Tabla cargada en la


Worksheet).
3 En las Columnas de la tabla poner Zona Centro, Zona Norte y Zona Sur, OK.
Los resultados se muestran a continuacin:
Chi-Sq = 1951.221, DF = 8, P-Value = 0.000
Interpretacin de resultados
Como el P value de 0.00 es menor a 0.05, se rechaza Ho, por tanto existe
dependencia entre el tipo de delitos y la zona donde se realizan.

Pgina 12

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

METODOLOGA DE CONTROL ESTADSTICO DE


PROCESOS
El Control Estadstico del Proceso por medio de las cartas de control son la
herramienta ms poderosa para analizar la variacin en los procesos. Las cartas
de control enfocan la atencin hacia las causas especiales de variacin cuando
aparecen y reflejan la magnitud de la variacin debida a las causas comunes.
Las causas comunes o aleatorias se deben a la variacin natural del proceso. Las
causas especiales o atribuibles son por ejemplo: una situacin anormal en el
proceso.
Un proceso est bajo Control Estadstico cuando presenta causas comunes
nicamente. Cuando ocurre esto tenemos un proceso estable y predecible.
Cuando existen causas especiales el proceso est fuera de Control Estadstico;
las grficas de control detectan la existencia de estas causas en el momento en
que se dan, lo cual permite que podamos tomar acciones al momento.
Cartas de control por variables
El trmino variable designa a cualquier caracterstica de calidad medible tal
como un tiempo de respuesta, nmero de incidentes, etc.

Carta de Individuales (Datos variables)

A menudo esta carta se llama I-MR.


Esta Carta monitorea la tendencia de un proceso con datos variables
individuales.
La lnea central se basa en el promedio de los datos, y los lmites de control se
basan en la desviacin estndar (+/- 3 sigmas)

Ejemplo: Se registra el nmero de robo a comercios durante 2004 y 2005. Realice


la grfica de control individual.

Pgina 13

Metodologa de anlisis con Series de tiempo, Estadstica inferencial y Control Estadstico

I -MR Chart of ROBO A COMERCI OS

I ndividual Value

UCL=54.28
50
40

_
X=36.20

30
20

LC L=18.11
1

14

21

28

35
42
Observation

49

56

63

70

UCL=22.22

Moving Range

20
15
10

__
MR=6.80

5
0

LC L=0
1

14

21

28

35
42
Observation

Pgina 14

49

56

63

70

Você também pode gostar