Dasar-dasar Deret Waktu

Tingkat Kesulitan: Menengah Waktu Baca: 12 menit

Apa yang membuat deret waktu spesial

Deret waktu sederhananya adalah urutan titik data yang dikumpulkan dari waktu ke waktu: harga saham harian, angka penjualan bulanan, pembacaan suhu per jam, atau hitungan populasi tahunan. Yang membuat data deret waktu berbeda dari jenis data lain adalah urutannya penting. Setiap pengamatan terhubung dengan yang sebelum dan sesudahnya. Suhu besok terkait dengan suhu hari ini. Pendapatan bulan ini dipengaruhi oleh bulan lalu.

Ketergantungan waktu ini melanggar asumsi kunci sebagian besar metode statistik standar, yang mengharuskan pengamatan independen satu sama lain. Anda tidak bisa begitu saja menerapkan uji t atau regresi biasa pada data deret waktu tanpa memperhitungkan bahwa titik-titik terdekat berkorelasi. Analisis deret waktu menyediakan alat khusus yang dirancang untuk jenis data ini.

2 4 6 8 10 12 120 140 160 180

Diagram sebar di atas menunjukkan data penjualan bulanan selama setahun. Bahkan dalam seri pendek ini, Anda bisa melihat gerakan umum ke atas. Mengidentifikasi pola-pola ini adalah langkah pertama dalam analisis deret waktu.

Tren: arah jangka panjang

Tren adalah gerakan naik atau turun jangka panjang dalam deret waktu. Jika pendapatan perusahaan telah tumbuh secara stabil selama lima tahun, pertumbuhan itu adalah tren. Tren bisa linear (kenaikan tetap per periode) atau nonlinear (pertumbuhan yang mempercepat atau melambat).

Mengidentifikasi tren membantu memahami gambaran besar dan memisahkan sinyal dari noise. Satu bulan buruk dalam tren naik sangat berbeda dari satu bulan buruk di awal penurunan berkelanjutan. Analis sering "menghilangkan tren" data dengan menghapus komponen tren sehingga mereka bisa mempelajari pola yang tersisa, seperti musiman dan fluktuasi acak, dengan lebih jelas.

Musiman: pola berulang

Musiman mengacu pada pola reguler dan dapat diprediksi yang berulang dalam periode tetap. Penjualan ritel melonjak setiap Desember. Penjualan es krim memuncak di musim panas. Keanggotaan gym melonjak di Januari. Pola-pola ini didorong oleh efek kalender, cuaca, hari libur, atau kebiasaan budaya.

5 10 15 20 80 100 120 140 160

Grafik di atas menunjukkan dua tahun data dengan puncak musiman yang jelas di tengah setiap tahun, menunjukkan puncak musim panas. Perhatikan bahwa nilai tahun kedua sedikit lebih tinggi dari pertama, menunjukkan tren naik dikombinasikan dengan musiman. Memisahkan kedua komponen ini adalah salah satu tugas kunci dalam analisis deret waktu, proses yang disebut dekomposisi.

Musiman berbeda dari siklus. Pola musiman memiliki periode tetap dan diketahui (12 bulan, 7 hari, 4 kuartal). Siklus adalah fluktuasi jangka lebih panjang tanpa periode tetap, seperti siklus bisnis yang bisa berlangsung tiga sampai sepuluh tahun. Keduanya pola nyata, tapi musiman lebih dapat diprediksi.

Rata-rata bergerak: menghaluskan noise

Data deret waktu mentah sering berisik. Fluktuasi hari ke hari bisa mempersulit melihat pola yang mendasari. Rata-rata bergerak menghaluskan data dengan mengganti setiap titik dengan rata-rata titik-titik sekitarnya. Rata-rata bergerak 7 hari mengganti nilai setiap hari dengan rata-rata 3 hari sebelumnya, hari itu sendiri, dan 3 hari sesudahnya.

Rata-rata bergerak sangat populer karena sederhana dan efektif. Analis keuangan menggunakannya untuk mengidentifikasi tren harga saham. Epidemiolog menggunakan rata-rata bergerak 7 hari untuk menghaluskan hitungan kasus harian. Tim operasional menggunakannya untuk mendeteksi perubahan lalu lintas situs. Ukuran jendela (berapa titik yang dirata-ratakan) mengontrol jumlah penghalusan: jendela lebih lebar menghasilkan garis lebih halus tapi bereaksi lebih lambat terhadap perubahan nyata.

Contoh

Selama pandemi, hitungan kasus harian berfluktuasi liar karena keterlambatan pelaporan (lebih sedikit kasus dilaporkan di akhir pekan, lonjakan di hari Senin). Rata-rata bergerak 7 hari menghilangkan efek hari-dalam-seminggu ini dan mengungkap tren sebenarnya. Pejabat kesehatan masyarakat mengandalkan rata-rata bergerak daripada hitungan harian untuk membuat keputusan kebijakan karena data yang dihaluskan menceritakan kisah yang lebih jelas.

Autokorelasi: bagaimana hari ini berhubungan dengan kemarin

Autokorelasi mengukur seberapa kuat deret waktu berkorelasi dengan versi tertundanya sendiri. Jika nilai hari ini sangat terkait dengan nilai kemarin, deret memiliki autokorelasi tinggi pada lag 1. Jika penjualan minggu ini memprediksi penjualan minggu depan, ada autokorelasi pada lag 1 dalam data mingguan.

Autokorelasi penting karena dua alasan. Pertama, mengungkap pola tersembunyi. Jika deret menunjukkan autokorelasi tinggi pada lag 12 dalam data bulanan, itu sangat menunjukkan pola musiman tahunan. Kedua, ini input kritis untuk memilih model peramalan yang tepat. Banyak model deret waktu, seperti ARIMA, dibangun langsung pada struktur autokorelasi data.

Plot autokorelasi (juga disebut korelogram) menunjukkan korelasi pada setiap lag. Lonjakan signifikan dalam plot ini memberitahu titik waktu masa lalu mana yang mengandung informasi berguna untuk memprediksi masa depan. Jika hanya beberapa lag pertama yang signifikan dan cepat menurun, deret memiliki memori jangka pendek. Jika banyak lag signifikan, deret memiliki ketergantungan jangka panjang.

Peramalan: melihat ke depan

Tujuan utama banyak analisis deret waktu adalah peramalan: menggunakan pola historis untuk memprediksi nilai masa depan. Metode sederhana termasuk mengekstrapolasi tren dan pola musiman ke depan. Metode lebih canggih seperti penghalusan eksponensial memberi bobot lebih pada pengamatan terbaru, sementara model ARIMA menggunakan struktur autokorelasi untuk menghasilkan prediksi.

Semua metode peramalan berbagi asumsi inti: pola yang diamati di masa lalu akan berlanjut ke masa depan. Ini bekerja baik untuk prediksi jangka pendek tapi menjadi semakin tidak andal saat melihat lebih jauh. Tidak ada model yang memprediksi pandemi 2020, dan tidak ada metode deret waktu yang akan mengantisipasi guncangan pasar mendadak. Peramalan harus selalu menyertakan interval ketidakpastian, dan semakin jauh Anda memprediksi, semakin lebar interval tersebut seharusnya.

Poin penting

Data deret waktu unik karena urutan pengamatan penting dan titik-titik terdekat saling terkait. Tiga komponen utama yang harus dicari adalah tren (arah jangka panjang), musiman (pola berulang), dan noise (fluktuasi acak). Rata-rata bergerak menghaluskan noise untuk mengungkap pola, dan autokorelasi mengungkap seberapa kuat nilai masa lalu memprediksi nilai masa depan. Dasar-dasar ini adalah fondasi semua peramalan deret waktu.