Escolar Documentos
Profissional Documentos
Cultura Documentos
Oleh : Ariyoso
ARIMA adalah kependekan dari model autoregressive integrated moving average. ARIMA
univariat (vektor tunggal) merupakan teknik peramalan yang memprediksi nilai masa depan dari
serangkaian kejadian berdasarkan data yang tersedia. Untuk peramalan jagka pendek, ARIMA
memerlukan paling tidak 40 bagian data historis. ARIMA akan optimal apabila data kita stabil atau
konsisten dengan jumlah pencilan (outliers) yang kecil.
ARIMA juga dikenal sebagai metodologi Box-Jenkins (sesuai nama penulisnya), ARIMA unggul
dalam teknik pemulusan eksponensial ketika data tersedia dalam jangka panjang dan korelasi
antar pengamatan di masa lampau dalam kondisi stabil. Jika data tersedia dalam jangka pendek
atau terlalu bergejolak (volatil), maka metode smoothing akan lebih unggul.
Langkah pertama dalam teknik pemodelan ARIMA adalah memeriksa stasioneritas data (kamu
bisa pelajari tentang stasioneritas disini >>>). Implikasinya adalah pada rangkaian kejadian yang
bersifat konstan sepanjang waktu. Jika data mengandung trend, sebagaimana yang biasanya
terdapat pada ranah ekonomi dan bisnis, maka data kita tidak stasioner. Data harus menunjukkan
keragaman yang konstan dalam fluktuasinya sepanjang waktu. Hal ini dapat kita lihat pada
rangkaian data yang mengandung komponen musiman tinggi dan tingkat pertumbuhan yang
terlalu cepat. Pada kasus tersebut, turun naiknya komponen musiman akan menjadi tidak
terkendali tanpa adanya kondisi stasioneritas.
Metodologi Box-Jenkins atau model ARIMA memungkinkan kita untuk memadukan kompone
autoregressif dan moving average secara bersamaan. Model ini mengacu pada “mixed model”.
Walaupun metode ini cukup kompleks untuk peramalan, struktur model kita dapat menyusun
simulasi rangkaian data dengan lebih baik dan tentunya akan menghasilkan peramalan yang lebih
akurat. Model asli peramalan hanya mengandung komponen autoregresif atau moving
average saja, tetapi ARIMA memadukan keduanya.
Untuk kamu yang belum mengerti komponen autoregresif (AR) bisa baca kembali disini >>>
Sedangkan bahasan tentang moving average (MA) bisa baca kembali disini >>>
Model yang dikembangkan dengan metoder ARIMA biasanya kita sebut dengan model ARIMA
karena merupakan kombinasi antara komponen autoregresif (AR) dan moving average (MA).
Dengan metode ini, kita akan lakukan proses differencing dan perataan bergerak (MA) secara
berulang-ulang hingga kita memperoleh hasil peramalan. ARIMA model biasanya dinyatakan
dengan ARIMA (p, d, q) yang merepresentasikan order dari komponen autoregresif (p),
jumlah differencing (d), dan istilah untuk tingkatan perataan bergerak (moving average). Misalnya
yt = xtβ + µt
Maka dengan ARMA(1, 1) menjadi
yt = α + ρyt−1 + θεt−1 + εt
dimana:
ρ = parameter autokorelasi tingkat pertama
θ = parameter rata-rata bergerak tingkat pertama
εt = white noise disturbance
Ilustrasi:
Kita memiliki data kuartal indeks volume perdagangan merchandise Uni Eropa (EU) selama 11
tahun yang dimulai dari 2005q1 – 2015q2, data diambil dari www.wto.org. Untuk contoh data bisa
kamu ambil disini >>>
Model ARIMA yang kita gunakan adalah model sederhana melalui differencing, komponen
autoregresif dan moving average dengan spesifikasi model (1, 1, 1). Kita akan menyusun model
ARIMA dengan bantuan software stata 12, sebagai berikut.
Dengan demikian periode waktu telah kita dapatkan dalam format quarterly, tetapi tipe data masih
dalam bentuk string yang tidak dikenali oleh command stata, maka kita akan format data kita
menjadi bentuk time series atau float dengan fungsi %tq,
Bagaimana jika data kamu dalam bentuk tahunan, bulanan, semester, atau formalt lain? coba lihat
beberapa format di bawah ini yang bisa kamu gunakan;
Untuk data semester (misalnya dimulai dari 1969h2), h menyatakan half a year,
Nah, untuk komponen waktu kalender dalam stata saya kira sudah jelas, tinggal diikutin aja.
2. Kita kembali kepada ilustrasi kita, lihat kembali storage type atau tipe datanya,
.describe
Nah, komponen waktu period telah berubah menjadi float (lihat storage type),
Kemudian kita nyatakan tipe data (time series) ke dalam stata, ini hanya dapat dilakukan setelah
komponen waktu dibaca sebagai variabel selain string oleh stata,
.tsline indices
Dari plot data dapat kita lihat dinamika data terjadi penurunan signifikan pada sekitar 2008q4
hingga 2009q1, hal ini mungkin dikarenakan faktor ekonomi atau resesi dunia yang mempengaruhi
perdagangan UE. Data kita asumsikan tidak mengandung gejala yang tidak biasa, oleh karena itu
transformasi tidak diperlukan.
Dari plot yang kita peroleh, data masih belum stasioner. Dinamika perubahan data seketika terjadi
dalam jangka pendek, dan seketika perubahan terjadi dalam jangka panjang, kita tidak
menemukan adanya trend dalam data. Dengan demikian kita perlu melakukan diferensiasi tingkat
pertama (first order differencing).
Kita akan generate variabel baru dengan nama indices_d1 yang berarti dilakukan diferensiasi
terhadap data pada order ke-1. Mari kita lakukan seasonally adjusment dengan diferensiasi tingkat
pertama,
Kita telah memperoleh variabel baru yaitu indices_seasonal d1 dengan first order
differencing (seasonald2), data telah stasioner dengan diferensiasi tanpa ada kecenderungan
trend jangka panjang walaupun masih terdapat penurunan signifikan pada 2008q4.
Penentuan AR dan MA
Berikutnya kita akan menentukan komponen autoregresif dan moving average berdasarkan
correlogram autokorelasi (ACF) dan autokorelasi parsial (PACF),
Dapat kita lihat dari plot PACF untuk variabel first order
differencing, indices_seasonald1 menunjukkan spike pada lag ke-1, ini adalah kondisi autokorelasi
positif atau underdifferenced. Kita dapat mempertimbangkan untuk menambahkan AR(1) ke dalam
model. Dengan demikian model pertama kita adalah ARIMA(1,1,0), dimana model mengandung
order pertama autoregresif, diferensiasi tingkat pertama, dan tanpa pengurangan diferensiasi atau
moving average.
Kita juga dapat memperimbangkan penambahan moving average ke dalam model, ketika plot ACF
menunjukkan spike pada lag ke-1, dengan demikian model alternatif kita adalah ARIMA(1,1,1),
dimana model mengandung order pertama autoregresif, diferensiasi tingkat pertama, dan moving
average order ke-2.
Alternatif berikutnya kita akan mencoba model ARIMA(2,1,1) untuk perbandingan pemilihan model,
Berikutnya kita akan membandingkan model dengan akaike information criteria (AIC) dan bayesian
information criteria (BIC), dimana semakin kecil nilai AIC dan BIC, maka model semakin baik.
.estat ic
2. Model ARIMA(2,1,0)
3. Model ARIMA(1,1,1)
. arima indices_seasonald1, arima (1,1,1)
.estat ic
Dari ketiga model, kita ketahui bahwa model yang terbaik adalah ARIMA(1,1,1), degan nilai AIC
dan BIC paling kecil yaitu 199,9 dan 204,9. Dengan demikian model kita mengandung komponen
autoregresif kelas pertama (AR1), diferensiasi tingkat pertama (d1), dan moving average tingkat
pertama (MA1), maka model ARIMA(1,1,1) akan kita terapkan dalam peramalan.