Zaman Serisini Özel Kılan Nedir
Zaman serisi basitçe zaman boyunca toplanan veri noktalarının bir dizisidir: günlük hisse senedi fiyatları, aylık satış rakamları, saatlik sıcaklık okumaları veya yıllık nüfus sayımları. Zaman serisi verilerini diğer veri türlerinden farklı kılan şey sıranın önemli olmasıdır. Her gözlem önceki ve sonrakilerle bağlantılıdır. Yarının sıcaklığı bugünkü ile ilişkilidir. Bu ayın geliri geçen ayki tarafından etkilenir.
Bu zamana bağımlılık, çoğu standart istatistiksel yöntemin temel bir varsayımını -- gözlemlerin birbirinden bağımsız olması gerektiğini -- ihlal eder. Zaman bağımlılığını hesaba katmadan zaman serisi verilerine t-testi veya sıradan regresyon uygulayamazsınız. Zaman serisi analizi, tam olarak bu tür veriler için tasarlanmış özel araçlar sağlar.
Yukarıdaki saçılım grafiği bir yıllık aylık satış verilerini gösterir. Bu kısa seride bile zaman içinde genel bir yukarı hareket görebilirsiniz. Bu örüntüleri belirlemek, zaman serisi analizinin ilk adımıdır.
Trendler: Uzun Vadeli Yön
Trend, bir zaman serisindeki uzun vadeli yukarı veya aşağı harekettir. Bir şirketin geliri beş yıl boyunca istikrarlı biçimde büyüyorsa, bu büyüme trenddir. Trendler lineer (her dönem sabit bir miktar artış) veya doğrusal olmayan (zamanla hızlanan veya yavaşlayan büyüme) olabilir.
Trendi belirlemek, büyük resmi anlamanıza ve sinyali gürültüden ayırmanıza yardımcı olur. Aksi takdirde yukarı bir trendde tek bir kötü ay, sürdürülen bir düşüşün başlangıcındaki tek bir kötü aydan çok farklıdır. Analistler genellikle mevsimsellik ve rastgele dalgalanmalar gibi kalan örüntüleri daha net inceleyebilmek için trend bileşenini kaldırarak veriyi "trendden arındırır".
Mevsimsellik: Tekrarlayan Örüntüler
Mevsimsellik, sabit bir dönemde tekrarlanan düzenli, tahmin edilebilir örüntüleri ifade eder. Perakende satışları her Aralık'ta zirve yapar. Dondurma satışları yazın en yüksek seviyeye ulaşır. Spor salonu üyelikleri Ocak'ta artar. Bu örüntüler takvim etkileri, hava durumu, tatiller veya kültürel alışkanlıklar tarafından yönlendirilir.
Yukarıdaki grafik, her yılın ortasında belirgin bir mevsimsel tepecikle iki yıllık veriyi gösterir ve yaz zirvesini düşündürür. İkinci yılın değerlerinin birinciden biraz daha yüksek olduğuna dikkat edin, bu da mevsimsellikle birleşen yukarı bir trendi gösterir. Bu iki bileşeni ayırmak, zaman serisi analizinin temel görevlerinden biridir -- ayrıştırma adı verilen bir süreç.
Mevsimsellik döngüden farklıdır. Mevsimsel örüntülerin sabit, bilinen bir dönemi vardır (12 ay, 7 gün, 4 çeyrek). Döngüler, sabit bir dönemi olmayan daha uzun vadeli dalgalanmalardır, örneğin üç ila on yıl sürebilen iş döngüleri. Her ikisi de gerçek örüntülerdir, ancak mevsimsellik daha tahmin edilebilirdir.
Hareketli Ortalamalar: Gürültüyü Yumuşatma
Ham zaman serisi verileri genellikle gürültülüdür. Günlük dalgalanmalar, altta yatan örüntüyü görmeyi zorlaştırabilir. Hareketli ortalama, her noktayı çevresindeki noktaların ortalamasıyla değiştirerek veriyi yumuşatır. Örneğin, 7 günlük bir hareketli ortalama, her günün değerini önceki 3 gün, gün kendisi ve sonraki 3 günün ortalamasıyla değiştirir.
Hareketli ortalamalar son derece popülerdir çünkü basit ve etkilidir. Finansal analistler hisse senedi fiyat trendlerini belirlemek için kullanır. Epidemiyologlar günlük vaka sayılarını yumuşatmak için 7 günlük hareketli ortalamalar kullanır. Operasyon ekipleri web sitesi trafiğindeki değişiklikleri tespit etmek için kullanır. Pencere boyutu (kaç noktanın ortalamasını aldığınız), ne kadar yumuşatma elde edeceğinizi kontrol eder: daha geniş pencere daha yumuşak bir çizgi üretir ama gerçek değişikliklere daha yavaş tepki verir.
Pandemi sırasında günlük vaka sayıları, raporlama gecikmeleri nedeniyle (hafta sonlarında daha az vaka raporlanır, Pazartesi günleri bir artış) çılgınca sallanır. 7 günlük hareketli ortalama bu hafta günü etkisini ortadan kaldırır ve gerçek trendi ortaya çıkarır. Kamu sağlığı yetkilileri, yumuşatılmış veriler daha net bir hikâye anlattığı için politika kararları almak için günlük sayımlara değil hareketli ortalamalara güvenir.
Otokorelasyon: Bugün Dünle Nasıl İlişkili
Otokorelasyon, bir zaman serisinin kendisinin gecikmeli bir versiyonuyla ne kadar güçlü korelasyon gösterdiğini ölçer. Bugünkü değer dünkü değerle güçlü bir şekilde ilişkiliyse, seri 1. gecikmede yüksek otokorelasyona sahiptir.
Otokorelasyon iki nedenden ötürü önemlidir. Birincisi, gizli örüntüleri ortaya çıkarır. Aylık veride 12. gecikmede yüksek otokorelasyon gösteren bir seri, yıllık mevsimsel bir örüntüyü güçlü biçimde düşündürür. İkincisi, doğru tahmin modelini seçmek için kritik bir girdidir. ARIMA gibi birçok zaman serisi modeli doğrudan verinin otokorelasyon yapısı üzerine kurulmuştur.
Otokorelasyon grafiği (korelogram olarak da adlandırılır) her gecikmede korelasyonu gösterir. Bu grafikteki anlamlı sivri uçlar, hangi geçmiş zaman noktalarının geleceği tahmin etmek için yararlı bilgi içerdiğini söyler.
Tahminleme: İleriye Bakmak
Birçok zaman serisi analizinin nihai amacı tahminlemedir: gelecekteki değerleri tahmin etmek için tarihsel örüntüleri kullanmak. Basit yöntemler arasında trendi ve mevsimsel örüntüyü ileriye taşıma bulunur. Üstel yumuşatma gibi daha sofistike yöntemler son gözlemlere daha fazla ağırlık verirken, ARIMA modelleri tahminler üretmek için otokorelasyon yapısını kullanır.
Tüm tahminleme yöntemleri ortak bir temel varsayımı paylaşır: geçmişte gözlemlenen örüntüler gelecekte de devam edecektir. Bu, kısa vadeli tahminler için iyi çalışır ancak ileriye baktıkça giderek daha güvenilmez hale gelir. Hiçbir model 2020 pandemisini öngörmedi ve hiçbir zaman serisi yöntemi ani bir piyasa şokunu öngörmeyecektir. Tahminler her zaman belirsizlik aralıklarını içermelidir ve geleceğe ne kadar uzağa tahmin ederseniz, bu aralıklar o kadar geniş olmalıdır.
Zaman serisi verileri benzersizdir çünkü gözlemlerin sırası önemlidir ve yakın noktalar birbiriyle ilişkilidir. Aranacak üç ana bileşen trend (uzun vadeli yön), mevsimsellik (tekrarlayan örüntüler) ve gürültüdür (rastgele dalgalanmalar). Hareketli ortalamalar gürültüyü yumuşatarak örüntüleri ortaya çıkarır ve otokorelasyon geçmiş değerlerin gelecek değerleri ne kadar güçlü tahmin ettiğini ortaya koyar. Bu temeller tüm zaman serisi tahminlemenin temelidir.