Mis teeb aegread eriliseks
Aegread on lihtsalt aja jooksul kogutud andmepunktide jada: igapäevased aktsiahinnad, kuised müüginumbrid, tunnipõhised temperatuurinäidud või aastased rahvastiku loendused. Aegridade andmed erinevad teistest andmetüüpidest selle poolest, et järjekord loeb. Iga vaatlus on seotud eelmise ja järgmisega. Homne temperatuur on seotud tänasega. Selle kuu tulu on mõjutatud eelmise kuu omast.
See ajast sõltuvus rikub enamiku standardsete statistiliste meetodite põhieeldust -- et vaatlused peavad olema üksteisest sõltumatud. Te ei saa lihtsalt rakendada t-testi ega tavalist regressiooni aegridade andmetele ilma ajalist korrelatsiooni arvestamata. Aegridade analüüs pakub spetsialiseeritud tööriistu, mis on loodud just selliste andmete jaoks.
Ülaltoodud hajuvusdiagramm näitab aasta kuiseid müügiandmeid. Isegi selles lühikeses aegreas on näha üldine tõususuundumus. Nende mustrite tuvastamine on aegridade analüüsi esimene samm.
Trendid: pikaajaline suund
Trend on aegrea pikaajaline tõusu- või langusliikumine. Kui ettevõtte tulu on viie aasta jooksul pidevalt kasvanud, on see kasv trend. Trendid võivad olla lineaarsed (püsiv kasv kindla summa võrra igal perioodil) või mittelineaarsed (aja jooksul kiirenev või aeglustuv kasv).
Trendi tuvastamine aitab mõista suurt pilti ja eraldada signaali mürast. Üks halb kuu muidu tõusvas trendis on väga erinev ühest halvast kuust püsiva languse alguses. Analüütikud "eemaldavad trendi" sageli andmetest, et uurida selgemalt ülejäänud mustreid nagu hooajalisus ja juhuslikud kõikumised.
Hooajalisus: korduvad mustrid
Hooajalisus viitab regulaarsetele, ennustatavatele mustritele, mis korduvad kindla perioodi jooksul. Jaemüük tõuseb igal detsembril. Jäätisemüük saavutab tipu suvel. Jõusaali liikmelisused hüppavad jaanuaris. Need mustrid on tingitud kalendriefektidest, ilmast, pühadest või kultuurilistest harjumustest.
Ülaltoodud graafik näitab kahe aasta andmeid selge hooajalise kühmu iga aasta keskel, viidates suvisele tipule. Pange tähele, et teise aasta väärtused on veidi kõrgemad kui esimesel, mis näitab tõusutrendit koos hooajalisusega. Nende kahe komponendi eraldamine on aegridade analüüsi üks põhiülesandeid -- protsess nimega dekompositsioon.
Hooajalisus erineb tsüklist. Hooajalistel mustritel on fikseeritud, teadaolev periood (12 kuud, 7 päeva, 4 kvartalit). Tsüklid on pikemaajalised kõikumised ilma fikseeritud perioodita, nagu majandustsüklid, mis võivad kesta kolm kuni kümme aastat. Mõlemad on tegelikud mustrid, kuid hooajalisus on paremini ennustatav.
Libisevad keskmised: müra silumine
Toor-aegridade andmed on sageli mürarikkad. Päevased kõikumised võivad raskendada alusmustri nägemist. Libisev keskmine silub andmeid, asendades iga punkti ümbritsevate punktide keskmisega. Näiteks 7-päevane libisev keskmine asendab iga päeva väärtuse 3 eelneva päeva, päeva enda ja 3 järgneva päeva keskmisega.
Libisevad keskmised on äärmiselt populaarsed, sest need on lihtsad ja tõhusad. Finantsanalüütikud kasutavad neid aktsiahinna trendide tuvastamiseks. Epidemioloogid kasutavad 7-päevaseid libisevaid keskmisi päevaste juhtumiarvude silumiseks. Akna suurus kontrollib silumise astet: laiem aken annab sujuvama joone, kuid reageerib aeglasemalt tegelikele muutustele.
Pandeemia ajal kõiguvad päevased juhtumiarvud metsikult aruandluse viivituste tõttu (nädalavahetustel vähem juhtumeid, esmaspäeviti tõus). 7-päevane libisev keskmine kõrvaldab selle nädalapäeva efekti ja paljastab tegeliku trendi. Rahvatervise ametnikud tuginevad poliitikaotsuste tegemisel libisevatele keskmistele, mitte päevastele arvudele, sest silutud andmed räägivad selgema loo.
Autokorrelatsioon: kuidas täna on seotud eilsega
Autokorrelatsioon mõõdab, kui tugevalt on aegread korreleeritud iseenda viivitatud versiooniga. Kui tänane väärtus on tugevalt seotud eilsega, on aegreal kõrge autokorrelatsioon viivitusel 1.
Autokorrelatsioon on oluline kahel põhjusel. Esiteks paljastab see varjatud mustreid. Kui aegreal on kuistes andmetes kõrge autokorrelatsioon viivitusel 12, viitab see tugevalt aastasele hooajalisele mustrile. Teiseks on see kriitiline sisend õige prognoosimudeli valikuks. Paljud aegridade mudelid, nagu ARIMA, on ehitatud otse andmete autokorrelatsioonistruktuurile.
Autokorrelatsiooni graafik (nimetatakse ka korelogrammiks) näitab korrelatsiooni igal viivitusel. Selle graafiku olulised tipud ütlevad, millised mineviku ajapunktid sisaldavad kasulikku teavet tuleviku ennustamiseks.
Prognoosimine: tulevikku vaatamine
Paljude aegridade analüüside lõppeesmärk on prognoosimine: ajalooliste mustrite kasutamine tulevaste väärtuste ennustamiseks. Lihtsad meetodid hõlmavad trendi ja hooajalise mustri ekstrapoleerimist. Keerukamad meetodid nagu eksponentsiaalne silumine annavad rohkem kaalu hiljutistele vaatlustele, samas kui ARIMA mudelid kasutavad prognooside genereerimiseks autokorrelatsiooni struktuuri.
Kõik prognoosimeetodid jagavad põhieeldust: minevikus täheldatud mustrid jätkuvad tulevikus. See toimib hästi lühiajaliste prognooside puhul, kuid muutub üha ebausaldatavamaks, mida kaugemale tulevikku vaatate. Ükski mudel ei ennustanud 2020. aasta pandeemiat ja ükski aegridade meetod ei ennusta äkilist turuschokki. Prognoosid peaksid alati sisaldama ebakindluse intervalle ja mida kaugemale tulevikku ennustate, seda laiemad need intervallid peaksid olema.
Aegridade andmed on unikaalsed, sest vaatluste järjekord loeb ja lähedased punktid on omavahel seotud. Kolm peamist otsitavat komponenti on trend (pikaajaline suund), hooajalisus (korduvad mustrid) ja müra (juhuslikud kõikumised). Libisevad keskmised siluvad müra, paljastades mustreid, ja autokorrelatsioon näitab, kui tugevalt mineviku väärtused ennustavad tulevasi. Need alused on kogu aegridade prognoosimise vundament.