Escolar Documentos
Profissional Documentos
Cultura Documentos
CURITIBA
2018
ELIAS ALBERTO DA SILVA
CURITIBA
2018
Dedico aos meus familiares e amigos que sempre estiveram ao meu lado.
AGRADECIMENTOS
A todos os meus colegas de turma, pela amizade e pela ajuda nos momentos
de dificuldade.
Stan Lee
RESUMO
1 INTRODUÇÃO.................................................................................................... 10
1.1 O PROBLEMA.................................................................................................... 10
1.2 OBJETIVOS........................................................................................................ 11
1.2.1 Objetivo Geral.............................................................................................. 11
1.2.2 Objetivos Específicos................................................................................... 12
2 FUNDAMENTAÇÃO TEÓRICA..........................................................................13
3 MATERIAL E MÉTODOS................................................................................... 34
3.1 MATERIAL..........................................................................................................34
3.2 MÉTODOS.......................................................................................................... 38
4 RESULTADOS....................................................................................................40
5 CONCLUSÕES................................................................................................... 48
REFERÊNCIAS««««««««««««««««««««««««««««« 49
10
1 INTRODUÇÃO
1.1 O PROBLEMA
Estes quatro tipos de outliers, AO, IO, LS e TC, interferem na série de modo
diferente, ora causando impacto somente no instante da sua ocorrência, ora
afetando toda série subjacente ao instante que ocorre a perturbação. Chen e Liu
(1993) mostraram que a presença de dados atípicos afeta os procedimentos
convencionais de análise estatística, além de prejudicar as estimativas dos
parâmetros e as possíveis previsões obtidas a partir dos modelos ARMA ajustados.
1
FOX, A. J. Outliers in Time Series. Journal of the Royal Statistical Society. Series B. Vol. 34, No. 3
(1972), pp. 350-363.
11
Estes eventos são tipicamente não sistemáticos e não podem ser capturados
por modelos básicos de séries temporais. Uma análise preliminar dos dados pode
revelar a existência de eventos excepcionais que não seguem aos padrões
capturados pelos modelos de séries temporais, isto é, efeitos que são exógenos ao
modelo (LACALLE, 2016).
Este trabalho aplica a metodologia proposta por Chen e Liu (1993) para
localizar e eliminar os efeitos de valores discrepantes nos dados das séries
temporais de dois instrumentos de monitoramento da barragem da usina hidrelétrica
Itaipu Binacional com o objetivo de elaborar cartas de controle e seus limites
estatísticos para as médias amostrais, além de reduzir os erros nas previsões.
1.2 OBJETIVOS
2 FUNDAMENTAÇÃO TEÓRICA
ܥܵܮ ൌ ߤ௪ ߪܮ௪ ǡ
ܥܮ ൌ ߤ௪ ǡ
ܥܫܮ ൌ ߤ௪ െ ߪܮ௪ ǡ
onde ܮé a distância dos limites de controle à linha central expressa em unidades de
desvio padrão. Como estes princípios foram estabelecidos inicialmente por Walter S.
Shewhart, tais gráficos de controle são chamados de gráficos de controle de
Shewhart (LAZZAROTTO, 2016).
calculado. Então, novos dados são coletados e comparados com esses limites
revisados (MONTGOMERY, 2013).
Algumas vezes, esse tipo de análise exigirá vários ciclos de análise nos quais
o gráfico de controle é usado, causas atribuíveis são detectadas e corrigidas, limites
de controle revisados são calculados, e o plano de ação para situação fora de
controle é atualizado e expandido. Eventualmente, o processo se estabiliza, e
obtém-se um conjunto limpo de dados que representam o desempenho do processo
sob controle para uso na fase II. Geralmente, gráficos de controle de Shewhart são
muito eficazes na fase I por serem de fácil construção e interpretação, e porque são
eficazes na detecção tanto de mudanças grandes, contínuas nos parâmetros do
processo, quanto de valores atípicos (desvios únicos que podem ser resultados de
causas atribuíveis de curta duração), erros de medida, erros de registro e/ou
transmissão de dados, e outros semelhantes (MONTGOMERY, 2013).
estacionariedade, como tendência linear, em que flutua ao redor de uma reta com
inclinação não nula ou tendência exponencial (LAZZAROTTO, 2016). Mais
especificamente, costuma-se adotar estacionariedade de 2ª ordem (fraca) de uma
série ݕ௧ se a média e a variância (incondicionais) do processo permanecem
invariantes ao longo do tempo.
Seja ݕ௧ ሺ ݐൌ ͳǡ ǥ ǡ ܶሻ uma série temporal estacionária (ou não estacionária que
possa ser estacionária mediante algum tipo de transformação como, por exemplo,
diferenciações). Denotando o operador de translação ao passado por ܤ, pode-se
escrever que ݕܤ௧ ൌ ݕ௧ିଵ, ܤ ݕ௧ ൌ ݕ௧ି e o operador diferença ߘ usada para obter
estacionariedade, de modo que ߘݕ௧ ൌ ݕ௧ െ ݕ௧ିଵ ൌ ሺͳ െ ܤሻݕ௧ , os modelos lineares
estacionários ܣܯܴܣሺǡ ݍሻ tem a forma
ௗ
߮ሺܤሻܼ௧ ൌ ߶ሺܤሻߘ
ᇣᇧᇤᇧᇥ ܼ௧ ൌ ߶ሺܤሻሺͳ െ ܤሻௗ ܼ௧ ൌ ߠሺܤሻܽ௧ Ǥ
ఝ
O modelo também pode ser escrito na forma ܴܣሺλሻ como ߨሺܤሻܼ௧ ൌ ܽ௧ , onde
ߘ ௗ ߶ሺܤሻ
ߨሺܤሻ ൌ ൌ ͳ െ ߨଵ ܤെ ߨଶ ܤെ ڮǡ (3)
ߠሺܤሻ
ߠሺܤሻ
߰ሺܤሻ ൌ Ǥ (4)
ߘ ௗ ߶ሺܤሻ
Quando as séries temporais são do tipo com correlação serial entre e dentro
dos períodos sazonais tem-se a seguinte formulação geral:
Onde
com ߔǡ ߆ ൌ Ͳpara ݅ ൌ ͳǡ ʹǡ ǥ ǡ ݏെ ͳǡ ݏ ͳǡ ǥǡ ߔǡ ߆ ് Ͳ para ݅ ൌ ݏǡ ʹݏǡ ǥ ǡ ܲݏȀܳݏ,
ߘ௦ ൌ ሺͳ െ ܤ௦ ሻ e ݏé o comprimento do período sazonal (MORETTIN e TOLOI,
2006).
23
Quando houver uma relação linear perfeita entre ݕ௧ e ݕ௧ି , ou seja, entre uma
observação no instante ݐe ݇ instantes de tempo antes, então ȁߩ ȁ ൏ ͳ e se ߩ ൌ Ͳ,
pode haver algum outro tipo de relação entre ݕ௧ e ݕ௧ି (relação não-linear) onde
σି
௧ୀଵ ሺݕ௧ െ ݕሻሺݕ௧ା െ ݕሻ
ߩ ൌ Ǥ (7)
σ௧ୀଵሺݕ௧ െ ݕሻଶ
ߘ ଶ ܼሺݐሻ ൌ ߘ൫ߘܼሺݐሻ൯ ൌ ߘ൫ܼሺݐሻ െ ܼሺ ݐെ ͳሻ൯ ൌ ܼሺݐሻ െ ʹܼሺ ݐെ ͳሻ ܼሺ ݐെ ʹሻ (9)
e, assim sucessivamente, normalmente é suficiente tomar uma ou duas diferenças
para que a série se torne estacionária.
Muitas vezes são identificados vários modelos que passam pelos estágios de
estimação e verificação e escolhe-se aquele que apresenta o menor erro quadrático
médio de previsão.
25
Os valores de uma série temporal podem, muitas vezes, serem afetados por
eventos inesperados tais como mudanças de política ou crises econômicas, ondas
inesperadas de frio ou calor, erros de medida, erros de digitação, etc. A
consequência da ocorrência desses tipos de eventos é a criação de observações
espúrias que são inconsistentes com o restante da série; tais observações são
GHQRPLQDGDVYDORUHVDWtSLFRVRX³outliers´A presença de valores atípicos tem efeito
na estimação dos parâmetros do modelo ARIMA e, consequentemente, na
especificação correta do modelo e nas previsões de valores futuros (MORETTIN e
TOLOI, 2006). Serão considerados três tipos de outliers, conforme o QUADRO 1.
ܮሺܤሻܫሺܶሻǡ
ͳ
ܵܮǣܮሺܤሻ ൌ (11)
ሺͳ െ ܤሻ
ܱܣǣܮሺܤሻ ൌ ͳ (12)
ͳ
ܶܥǣܮሺܤሻ ൌ Ǥ (13)
ሺͳ െ ߜܤሻ
ܻ௧ ǡ ്ܶݐ
ܼ௧ ൌ ൜ (14)
ܻ௧ ߱ ǡ ݐൌ ܶǤ
ሺ்ሻ
ܼ௧ ൌ ߱ ܫ௧ ߰ሺܤሻܽ௧ Ǥ (15)
ܻ௧ ǡ ݐ൏ܶ
ܼ௧ ൌ ൜ (16)
ܻ௧ ߱ ǡ ݐ ܶǤ
߱ ሺ்ሻ
ܼ௧ ൌ ܫ ߰ሺܤሻܽ௧ ǡ (17)
ͳെ ܤ௧
ሺ்ሻ ሺ்ሻ
que pode ser reescrita como ܼ௧ ൌ ߱ ܵ௧ ߰ሺܤሻܽ௧ , onde ܵ௧ é uma função degrau
que assume o valor Ͳ antes de ܶ e ͳ quando ݐ ܶ. Segundo Peña, Tiao e Tsay
(2001), esta função está relacionada com a função impulso da seguinte forma
ሺ்ሻ ͳ ሺ்ሻ
ܵ௧ ൌ ܫ௧ Ǥ
ͳെܤ
nível que decresce de forma exponencial (PEÑA, TIAO e TSAY, 2001) e seu modelo
é definido como:
ఠ ሺ்ሻ
ܼ௧ ൌ ܫ ߰ሺܤሻܽ௧ . (18)
ሺଵିఋሻ ௧
De uma forma geral, uma série temporal pode conter ݇ valores atípicos de
diferentes tipos e pode ser representada pelo modelo
ሺ் ሻ
ܼ௧ ൌ ߱ ܮ ሺܤሻܫ௧ ܻ௧ Ǥ (19)
ୀଵ
݁Ƹ௧ ൌ ߨሺܤሻܼ௧
30
݁Ƹ௧ ൌ ߱ ݔ௧ ܽ௧ ǡ
onde
ሺ்ሻ
߱ ൌ ߱ e ݔ௧ ൌ ߨሺܤሻܫ௧ para outliers aditivos,
߱ ൌ ߱ e ݔ௧ ൌ ߨሺܤሻȀሺͳ െ ܤሻ para outliers de mudança de nível e
߱ ൌ ߱ ் e ݔ௧ ൌ ߨሺܤሻȀሺͳ െ ߜܤሻ para outliers de mudança temporária.
ෝ ൌ ߩଶ ߨሺܨሻ்݁ ǡ
߱
ͳ
ߩଶ ൌ ଶ Ǥ
ͳ ߨଵଶ ڮ ߨି்
ෝ ൌ ߩଶ ݈ሺܨሻ݁Ƹ௧ ,
߱
గሺிሻ
em que ݈ሺܨሻ ൌ ଵିி
e
ͳ
ߩଶ ൌ ଶ ǡ
ͳ ݈ଵଶ ڮ ݈ି்
31
ଶ
ෝ ் ൌ ߩ்
߱ ߚሺܨሻ்݁ ,
onde
ଶ
ͳ
ߩ் ൌ ଶ ǡ
ͳ ߚଵଶ ڮ ߚି்
గሺிሻ
no qual os ߚ são os coeficiente de ߚሺܨሻ ൌ ଵିఋி .
ܪ ǣ߱ ൌ Ͳ
ܪଵ ǣ߱ ് Ͳ
߱
ෝǡ௧
ܪ ൈ ܪଵ ǣߣǡ௧ ൌ (21)
ߩǡ௧ ߪ
em que ߩǡ௧ ൌ ටߩଶ no ponto ݐ, e a distribuição de ߣǡ௧ é t de Student (PEÑA, TIAO e
TSAY, 2001). Para calcular o teste estatístico para outliers é necessário estimar ߪ .
A determinação de outliers pode ser sensível a esta estimativa. Na presença de
valores atípicos, os resíduos são contaminados; portanto ߪ pode ser superestimado
se o desvio padrão usual for utilizado (CHEN e LIU, 1993). O desvio padrão residual
é estimado inicialmente pelo desvio mediano absoluto, ߪො , definido por
onde ݁ǁ ൌ ݉݁݀݅ܽ݊ܽሺ݁Ƹ௧ ሻ.
ሺ௧ ሻ ߠሺܤሻ
ܼ௧ ൌ ߱ ܮ ሺܤሻܫ௧ ܽǤ (23)
ߘ ௗ ߶ሺܤሻ ௧
ୀଵ
ሺଵሻ ሺଵሻ ሺ௧ ሻ
݁Ƹ௧ ൌ ߨො ෝ ܮ ሺܤሻܫ௧ ൩
ሺܤሻ ܼ௧ െ ߱ (24)
ୀଵ
6) Repetem-se os passos de (2) a (5) até que todas as observações atípicas sejam
identificadas e seus impactos estimados simultaneamente.
ሺ௧ ሻ ߠሺܤሻ
ෝ ܮ ሺܤሻܫ௧
ܼ௧ ൌ ߱ ܽ௧ ǡ (25)
ߘ ௗ ߶ሺܤሻ
ୀଵ
3 MATERIAL E MÉTODOS
3.1 MATERIAL
2
www.itaipu.gov.br/energia/geracao
35
3.2 MÉTODOS
4 RESULTADOS
4.1 Extensômetro 1
A linha cinza representa a série original, enquanto a linha azul mostra como
seria a série sem os efeitos de outliers (a mudança de nível na série). O segundo
gráfico em vermelho representa os tipos de outliers encontrados. A TABELA 1
mostra os valores atípicos encontrados.
O gráfico com as novas localizações e efeitos dos outliers pode ser visto na Figura 7.
Série Valor-p
Com outliers (11/1981) ͷǤͺʹͳ ൈ ͳͲିଵଶ
Com outliers (07/1983) ʹǤͲͻʹ ൈ ͳͲି଼
Sem outliers (07/1983) ͲǤͳͺʹ
Uma das motivações do estudo foi investigar o efeito de valores atípicos nas
cartas de controle para a média nos resíduos das previsões. As Figuras 8 e 9 a
seguir mostram as cartas de controle da média dos resíduos com e sem outliers.
43
Resíduos
0,7
0,4 0,393648
0,1
X
-0,0101906
-0,2
-0,41403
-0,5
-0,8
0 100 200 300 400 500
Observação
Resíduos
0,4
0,365069
0,2
0
X
-0,00944073
-0,2
-0,4 -0,38395
0 100 200 300 400 500
Observação
Observa-se que a remoção dos efeitos dos dois valores atípicos encontrados
reduziu em módulo os limites de controle ɐ, e o número de observações fora de
controle passou de cinco para dois.
4.2 Extensômetro 2
O gráfico com as novas localizações e efeitos dos outliers pode ser visto na
Figura 11.
Uma vez removidos os efeitos dos outliers, um novo modelo ARIMA Sazonal
ሺͳǡͳǡͲሻ ൈ ሺͳǡͳǡͳሻଵଶ foi ajustado a série. Na TABELA 8 são exibidos os erros obtidos
com e sem a presença de outliers.
46
Série Valor-p
Com outliers (03/1982) ǤʹͳͶ ൈ ͳͲିଽ
Com outliers (12/1982) Ǥͳͳͷ ൈ ͳͲି
Sem outliers (12/1982) ͲǤͳ͵ʹ
Resíduos
0,09
0,05 0,0535686
0,01
-0,00186231
X
-0,03
-0,0572932
-0,07
-0,11
0 100 200 300 400 500
Observation
Resíduos
0,05 0,0497563
0,03
0,01
-0,00139421
-0,01
X
-0,03
-0,05 -0,0525447
-0,07
0 100 200 300 400 500
Observation
Observa-se nessa série que a remoção dos efeitos dos valores atípicos
encontrados também reduziu em módulo os limites de controle ɐ, e o número de
observações fora de controle passou de cinco para um.
5 CONCLUSÕES
Com a remoção dos efeitos dos outliers nas séries, observou-se redução nos
erros de previsão, normalidade dos resíduos estatisticamente significativa e redução
de pontos fora dos limites da carta de controle. Esses resultados mostram a
importância de se considerar o efeito de outliers na modelagem de séries temporais.
REFERÊNCIAS
CHATFIELD, C. The analysis of time series. 5a. ed. London: Chapman &
Hall/CRC, 1996.
ICOLD - CIGB. Dams & The World's Water - An educational book that explains
how dams help to manage the world's water. Paris: International Comission on
Large Dams/Comission Internationale des Grand Barrages, 2008.
PEÑA, D., TIAO, G. C., TSAY, R. S. A Course on time Series Analysis, Toronto:
John Wiley & Sons, 2001.