Aegridade alused

Raskusaste: Keskmine Lugemisaeg: 12 minutit

Mis teeb aegread eriliseks

Aegread on lihtsalt aja jooksul kogutud andmepunktide jada: igapäevased aktsiahinnad, kuised müüginumbrid, tunnipõhised temperatuurinäidud või aastased rahvastiku loendused. Aegridade andmed erinevad teistest andmetüüpidest selle poolest, et järjekord loeb. Iga vaatlus on seotud eelmise ja järgmisega. Homne temperatuur on seotud tänasega. Selle kuu tulu on mõjutatud eelmise kuu omast.

See ajast sõltuvus rikub enamiku standardsete statistiliste meetodite põhieeldust -- et vaatlused peavad olema üksteisest sõltumatud. Te ei saa lihtsalt rakendada t-testi ega tavalist regressiooni aegridade andmetele ilma ajalist korrelatsiooni arvestamata. Aegridade analüüs pakub spetsialiseeritud tööriistu, mis on loodud just selliste andmete jaoks.

2 4 6 8 10 12 120 140 160 180

Ülaltoodud hajuvusdiagramm näitab aasta kuiseid müügiandmeid. Isegi selles lühikeses aegreas on näha üldine tõususuundumus. Nende mustrite tuvastamine on aegridade analüüsi esimene samm.

Trendid: pikaajaline suund

Trend on aegrea pikaajaline tõusu- või langusliikumine. Kui ettevõtte tulu on viie aasta jooksul pidevalt kasvanud, on see kasv trend. Trendid võivad olla lineaarsed (püsiv kasv kindla summa võrra igal perioodil) või mittelineaarsed (aja jooksul kiirenev või aeglustuv kasv).

Trendi tuvastamine aitab mõista suurt pilti ja eraldada signaali mürast. Üks halb kuu muidu tõusvas trendis on väga erinev ühest halvast kuust püsiva languse alguses. Analüütikud "eemaldavad trendi" sageli andmetest, et uurida selgemalt ülejäänud mustreid nagu hooajalisus ja juhuslikud kõikumised.

Hooajalisus: korduvad mustrid

Hooajalisus viitab regulaarsetele, ennustatavatele mustritele, mis korduvad kindla perioodi jooksul. Jaemüük tõuseb igal detsembril. Jäätisemüük saavutab tipu suvel. Jõusaali liikmelisused hüppavad jaanuaris. Need mustrid on tingitud kalendriefektidest, ilmast, pühadest või kultuurilistest harjumustest.

5 10 15 20 80 100 120 140 160

Ülaltoodud graafik näitab kahe aasta andmeid selge hooajalise kühmu iga aasta keskel, viidates suvisele tipule. Pange tähele, et teise aasta väärtused on veidi kõrgemad kui esimesel, mis näitab tõusutrendit koos hooajalisusega. Nende kahe komponendi eraldamine on aegridade analüüsi üks põhiülesandeid -- protsess nimega dekompositsioon.

Hooajalisus erineb tsüklist. Hooajalistel mustritel on fikseeritud, teadaolev periood (12 kuud, 7 päeva, 4 kvartalit). Tsüklid on pikemaajalised kõikumised ilma fikseeritud perioodita, nagu majandustsüklid, mis võivad kesta kolm kuni kümme aastat. Mõlemad on tegelikud mustrid, kuid hooajalisus on paremini ennustatav.

Libisevad keskmised: müra silumine

Toor-aegridade andmed on sageli mürarikkad. Päevased kõikumised võivad raskendada alusmustri nägemist. Libisev keskmine silub andmeid, asendades iga punkti ümbritsevate punktide keskmisega. Näiteks 7-päevane libisev keskmine asendab iga päeva väärtuse 3 eelneva päeva, päeva enda ja 3 järgneva päeva keskmisega.

Libisevad keskmised on äärmiselt populaarsed, sest need on lihtsad ja tõhusad. Finantsanalüütikud kasutavad neid aktsiahinna trendide tuvastamiseks. Epidemioloogid kasutavad 7-päevaseid libisevaid keskmisi päevaste juhtumiarvude silumiseks. Akna suurus kontrollib silumise astet: laiem aken annab sujuvama joone, kuid reageerib aeglasemalt tegelikele muutustele.

Näide

Pandeemia ajal kõiguvad päevased juhtumiarvud metsikult aruandluse viivituste tõttu (nädalavahetustel vähem juhtumeid, esmaspäeviti tõus). 7-päevane libisev keskmine kõrvaldab selle nädalapäeva efekti ja paljastab tegeliku trendi. Rahvatervise ametnikud tuginevad poliitikaotsuste tegemisel libisevatele keskmistele, mitte päevastele arvudele, sest silutud andmed räägivad selgema loo.

Autokorrelatsioon: kuidas täna on seotud eilsega

Autokorrelatsioon mõõdab, kui tugevalt on aegread korreleeritud iseenda viivitatud versiooniga. Kui tänane väärtus on tugevalt seotud eilsega, on aegreal kõrge autokorrelatsioon viivitusel 1.

Autokorrelatsioon on oluline kahel põhjusel. Esiteks paljastab see varjatud mustreid. Kui aegreal on kuistes andmetes kõrge autokorrelatsioon viivitusel 12, viitab see tugevalt aastasele hooajalisele mustrile. Teiseks on see kriitiline sisend õige prognoosimudeli valikuks. Paljud aegridade mudelid, nagu ARIMA, on ehitatud otse andmete autokorrelatsioonistruktuurile.

Autokorrelatsiooni graafik (nimetatakse ka korelogrammiks) näitab korrelatsiooni igal viivitusel. Selle graafiku olulised tipud ütlevad, millised mineviku ajapunktid sisaldavad kasulikku teavet tuleviku ennustamiseks.

Prognoosimine: tulevikku vaatamine

Paljude aegridade analüüside lõppeesmärk on prognoosimine: ajalooliste mustrite kasutamine tulevaste väärtuste ennustamiseks. Lihtsad meetodid hõlmavad trendi ja hooajalise mustri ekstrapoleerimist. Keerukamad meetodid nagu eksponentsiaalne silumine annavad rohkem kaalu hiljutistele vaatlustele, samas kui ARIMA mudelid kasutavad prognooside genereerimiseks autokorrelatsiooni struktuuri.

Kõik prognoosimeetodid jagavad põhieeldust: minevikus täheldatud mustrid jätkuvad tulevikus. See toimib hästi lühiajaliste prognooside puhul, kuid muutub üha ebausaldatavamaks, mida kaugemale tulevikku vaatate. Ükski mudel ei ennustanud 2020. aasta pandeemiat ja ükski aegridade meetod ei ennusta äkilist turuschokki. Prognoosid peaksid alati sisaldama ebakindluse intervalle ja mida kaugemale tulevikku ennustate, seda laiemad need intervallid peaksid olema.

Põhijäreldus

Aegridade andmed on unikaalsed, sest vaatluste järjekord loeb ja lähedased punktid on omavahel seotud. Kolm peamist otsitavat komponenti on trend (pikaajaline suund), hooajalisus (korduvad mustrid) ja müra (juhuslikud kõikumised). Libisevad keskmised siluvad müra, paljastades mustreid, ja autokorrelatsioon näitab, kui tugevalt mineviku väärtused ennustavad tulevasi. Need alused on kogu aegridade prognoosimise vundament.