Bevezető útmutató az idősoros adatokhoz

Az „idő” kulcsfontosságú változó, amikor az adatgyűjtésről van szó. Az idősorelemzésben az idő fontos eleme az adatoknak.

Mi az idősoros adat?

Az idősoros adatok az időben rendezett adatpontok sorozatára utalnak. Sorrendfüggőséget vezet be a megfigyelések halmaza között. Az idősorok mindenütt jelen vannak a mai adatvezérelt világban. Mivel minden esemény az idő nyilát követi, folyamatos interakcióban vagyunk különféle idősoros adatokkal.

Általában feltételezik, hogy az idősorokat rendszeres időközönként állítják elő, és rendszeres idősoroknak nevezik őket. Az ezen idősoron belüli adatokat azonban nem kell rendszeres időközönként előállítani. Az ilyen esetek olyan szabálytalan idősorokat foglalnak magukban, ahol az adatok időbeli fázisú sorozatot követnek. Ez azt jelenti, hogy a mérések nem rendszeres időközönként történnek. Előfordulhat azonban, hogy az adatok diszkrét időközönként vagy sorozatként is előállíthatók. A szabálytalan idősorok példái az ATM-kifizetések vagy számlabefizetések.

Technikailag egy idősorban egy vagy több változó egy adott időtartam alatt változik. Ha egy változó idővel változik, akkor egyváltozós idősornak nevezzük. Vegyünk például egy érzékelőt, amely másodpercenként méri a helyiség hőmérsékletét. Itt minden pillanatban (azaz másodpercben) csak egydimenziós hőmérsékleti érték jön létre. Ellenkezőleg, ha egynél több változó idővel változik, azt többváltozós idősornak nevezzük. Vegyük például a bankgazdaságot. Ilyen esetekben többváltozós idősorokat használnak annak megértésére, hogy az egyik változóra, például a repo kamatra vonatkozó politikai változtatások hogyan befolyásolhatnak más változókat (azaz a kereskedelmi bankok hitelfolyósítását).

Az idősoros adatok minden tudományterületen alkalmazhatók, a pénzügytől, geológiától, meteorológiától, gyártástól a számítástechnikáig, az IoT-ig, a fizikai és társadalomtudományokig. Az időjárási változások, a születési arány, a halálozási arány, a piaci ingadozások, a hálózati teljesítmény és sok más alkalmazás nyomon követésére szolgál. Néhány fő felhasználási esete a megfigyelés, az előrejelzés és az anomáliák észlelése. Például az idősoros előrejelzés kritikus szerepet játszik az adatbázis-kezelő rendszerek népszerűségének meghatározásában. Az alábbi ábra a DBMS növekvő népszerűségét mutatja az évek során (2019-2021) idősoros diagramon.

https://www.influxdata.com/time-series-database/

Az idősorok kulcsfontosságú összetevői

Azokat a tényezőket, amelyek egy idősorban egy megfigyelés értékeit befolyásolják, kulcskomponenseikként kezeljük. Az összetevők három kategóriája a következőket tartalmazza:

  • Trend vagy hosszú távú mozgások
  • Rövid távú mozgások
  • Szezonális variációk
  • Ciklikus variációk
  • Véletlenszerű vagy szabálytalan mozgások
  • Irányzat

    Az adatok hosszú távú növekedésének vagy csökkenésének tendenciáját trendnek vagy hosszú távú összetevőnek nevezzük. Fontos azonban megjegyezni, hogy a felfelé vagy lefelé irányuló mozgásnak nem kell feltétlenül azonos irányúnak lennie egy adott időintervallumban.

    A tendenciák emelkedhetnek, csökkenhetnek vagy stabilak maradhatnak az idő különböző szakaszaiban. Az általános trendnek azonban mindig meg kell egyeznie a felfelé, lefelé vagy stabil mintával. Ilyen mozgási tendenciák mutatkoznak meg az olyan példákban, mint a mezőgazdasági termelékenység, a halálozási arány, a gyártott eszközök, a gyárak száma stb.

    Lineáris és nemlineáris trend

    Az idősorok értékeinek grafikonon való ábrázolása az idő függvényében megmutatja a trend típusát az adatklaszterezés mintáján alapul. Ha az adatklaszter többé-kevésbé egy egyenes vonal körül van, akkor a trendet lineáris trendnek nevezzük. Ellenkező esetben az adatklaszter-mintázat nemlineáris trendet mutat, mivel a két változó közötti változás aránya nem stabil vagy állandó. Ezért az ilyen trendeket görbevonalas korrelációknak is nevezik.

    Rövid távú mozgások

    Egy idősorban ezek a komponensek hajlamosak megismétlődni egy időn keresztül. Szabálytalan rövid sorozataik vannak, és hatással vannak a vizsgált változókra. A rövid távú mozgás két kategóriatípusa a következők:

    Szezonális variációk

    Ezek a verziók rendszeresen és időszakosan, kevesebb mint egy éven keresztül működnek. Általában hasonló vagy majdnem azonos mintázatot mutatnak egy 12 hónapos időszak alatt. Az ilyen eltérések akkor válnak egy idősor részévé, ha az adatokat rendszeresen, azaz óránként, naponta, hetente, havonta vagy negyedévente rögzítik.

      8 legjobb virtualizációs megfigyelő eszköz közepes és nagyvállalatok számára

    A szezonális eltérések vagy mesterségesek, vagy természetben előfordulóak. A különböző évszakok vagy éghajlati viszonyok kritikus szerepet játszanak az ilyen változásokban. Például a növénytermesztés teljes mértékben az évszakoktól függ. Hasonlóképpen, az esernyők vagy esőkabátok piaca az esős évszaktól függ, míg a hűtők és a klímaberendezések eladása a nyári szezonban tetőzik.

    Az ember alkotta egyezmények közé tartoznak a fesztiválok, partik és olyan alkalmak, mint a házasságok. Az ilyen rövid távú események évről évre megismétlődnek.

    Ciklikus variációk

    Azokat az idősor-változatokat, amelyek általában egy évnél hosszabb ideig működnek, ciklikus változásnak nevezzük. Egy vállalkozás esetében egy teljes időszakot tekintünk „üzleti ciklusnak”. Az üzleti teljesítmény kiugrása vagy hanyatlása számos tényezőtől függ, például a gazdasági szerkezettől, az üzleti menedzsmenttől és más kölcsönhatásban lévő erőktől. Ezek a ciklikus üzleti változások lehetnek rendszeresek, de nem időszakosak. Általában a vállalkozások négy szakaszból álló ciklikus folyamaton mennek keresztül, amely magában foglalja a jólétet, a recessziót, a depressziót és az újjászületést.

    Az ilyen ciklikus ingadozások szerves részét képezik az idősor-mintának, mivel az üzletfejlesztés nagymértékben támaszkodik a generált „szekvenciális adatpontokra”.

    Véletlenszerű vagy szabálytalan mozgások

    A véletlenszerű összetevők jelentős eltérést okoznak a megfigyelt változóban. Ezek tisztán szabálytalan ingadozások, minden meghatározott minta nélkül. Az erők előre nem láthatóak, kiszámíthatatlanok és ingadozó jellegűek – például földrengések, árvizek, éhínségek és egyéb katasztrófák.

    A fent leírt véletlenszerű eseményeket a forrás idősoros adatok felhasználásával elemezzük, hogy jobban kezeljük az ilyen, a jövőben előforduló valós forgatókönyveket.

    Az idősorok típusai

    Az idősorok adatai négy típusra oszthatók: determinisztikus, nem determinisztikus, stacionárius és nem stacionárius. Nézzük meg részletesen az egyes típusokat.

    #1. Determinisztikus idősor

    Egy determinisztikus idősor leírható analitikus kifejezéssel. Nem tartalmaz véletlenszerű vagy valószínűségi szempontokat. Matematikailag minden időintervallumra pontosan kifejezhető a Taylor sorozat kiterjesztésével. Ez akkor lehetséges, ha az összes deriváltja ismert egy tetszőleges időpontban. Ezek a származékok kifejezetten meghatározzák az akkori múltat ​​és jövőt. Ha minden feltétel teljesül, akkor pontosan megjósolható jövőbeli viselkedése, és elemezhető, hogyan viselkedett a múltban.

    #2. Nem determinisztikus idősor

    Egy nem determinisztikus idősorhoz véletlenszerű aspektus tartozik, amely megakadályozza explicit leírását. Ezért az analitikus kifejezések nem eléggé megvalósítható megoldások egy ilyen idősor kifejezésére. Egy idősor a következő okok miatt lehet nem determinisztikus:

  • A leírásához szükséges információk nem állnak rendelkezésre teljes egészében. Bár elvileg jelen lehetnek adatok, nem kezelhetők kifejezetten számszerűsíthetőként.
  • Az adatgenerálási folyamat véletlenszerű jellegű.
  • A véletlenszerű tényező miatt a nem determinisztikus idősorok valószínűségi törvényeknek engedelmeskednek. Ezért az adatokat statisztikai terminusokkal kezeljük – az implikáló adatokat különböző formájú valószínűségi eloszlások és átlagok határozzák meg. Ez magában foglalja a diszperzió átlagait és mértékeit, azaz az eltéréseket.

    #3. Álló idősorok

    Stacionárius idősorokban az olyan statisztikai tulajdonságok, mint az átlag, a variancia és mások, nem támaszkodnak az időaspektusra. Egy stacionárius idősort könnyebb megjósolni, mivel biztosan kijelenthetjük, hogy statisztikai tulajdonságai ugyanazok maradnak, mint a múltban. Ezért a különböző statisztikai előrejelzési módszerek azon az érvön alapulnak, hogy az idősorok csaknem stacionáriusak. Ez azt jelenti, hogy az idősorok közelítésben stacionáriusnak tekinthetők egyszerű matematikai transzformációk alkalmazásával.

    #4. Nem stacionárius idősorok

    Egy nem stacionárius sorozatban a statisztikai tulajdonságok idővel változnak. Ezért a trendeket vagy szezonalitást tartalmazó idősorok a nem stacionárius kategóriába tartoznak, mivel a trend és a szezonalitás különböző időintervallumokban befolyásolhatja az idősorok értékét. A nem stacionárius idősorok előre nem látható adatokat írnak le, megakadályozva azok modellezését vagy előrejelzését.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Idősor elemzés és előrejelzés

    Az idősorelemzés és előrejelzés praktikus eszközök a különféle létfontosságú folyamatok és objektumok evolúciójának és dinamikájának megfigyelésére, elemzésére és tanulmányozására. Nézzük meg mindegyiket alaposabban.

    Idősor elemzés

    Az idősor-elemzés egy adott időszak alatt összegyűjtött adatok elemzésének folyamata. Itt az adatelemzők állandó időközönként rögzítik az adatokat egy meghatározott időtartam alatt. Az adatok megfigyelési aránya, azaz az időintervallum másodperctől évekig változhat.

    Az idősoros adatok a vizsgált változókat írják le, mivel részletes elemzést adnak az ingadozó mintáról egy adott időintervallumban. Az elemzéshez szükséges paraméterek a különböző területeken és tudományágakban változhatnak. Néhány példa a következőket tartalmazhatja:

    • Tudományos műszerek – Naponta rögzített adatok
    • Kereskedelmi webhely – Ügyféllátogatás naponta
    • Tőzsde – Részvényértékek hetente
    • Szezon – esős napok évente
      A 14 legjobb internetsebesség-tesztelő eszköz a Wi-Fi és a mobil sávszélesség ellenőrzéséhez

    A következetesség és megbízhatóság érdekében az idősorelemzés nagy mennyiségű adatponton működik. A jó mintaméret finoman tükrözi a felfedezett trend vagy minta hitelességét.

    Ezenkívül az idősorelemzés alkalmas a jövőbeli események előrejelzésére is a múltban rögzített adatok alapján.

    Idősoros előrejelzés

    Az idősorelemzés lehetővé teszi a szervezetek számára, hogy azonosítsák a trendek időbeli ingadozásainak kiváltó okát. Az adatok birtokában a vállalatok tovább tanulhatnak és kutathatnak, hogy jobban megértsék, hogyan kezelhetik az ismeretlen trendeket és hogyan jelezhetik előre a közelgő eseményeket. A vállalatok általában adatvizualizációs technikákat alkalmaznak az adatok ilyen anomáliáinak meghatározására.

    Az idősoros előrejelzés két alapvető tényező körül forog:

  • A múltbeli adatok viselkedése alapján megjósolhatja a jövőbeli eseményeket.
  • Tegyük fel, hogy az elkövetkező trendek hasonlóságot mutatnak a múltbeli adatmintával.
  • Az előrejelzés során az elsődleges cél annak előrejelzése, hogy az adatpontok hogyan maradnak változatlanok vagy változnak a jövőben. Íme néhány példa a különböző iparágakból, hogy jobban megértsük az idősorelemzés és az előrejelzés árnyalatait.

    • Tőzsde – A részvény záróárának előrejelzése minden nap.
    • Értékesítés – Megjósolja egy üzlet termékértékesítését minden nap.
    • Árképzés – Az átlagos üzemanyagár előrejelzése minden nap.

    Az idősorok előrejelzéséhez használt általános statisztikai technikák közé tartozik az egyszerű mozgóátlag (SMA), az exponenciális simítás (SES), az autoregresszív integrált mozgóátlag (ARIMA) és a neurális hálózat (NN).

    Idősoros adatok a felhőben

    Az idősoros adatok értékének feltárásához a vállalkozásoknak képesnek kell lenniük az adatok gyors tárolására és lekérdezésére. A tőkepiaci vállalatok nagy mennyiségű történelmi és streaming adatra támaszkodnak, hogy valós idejű adatelemzést alkalmazzanak, és hatásos üzleti döntéseket hozzanak. Ez magában foglalhatja a sérülékenység előrejelzését részvényárfolyamokon, a nettó tőkekövetelmény meghatározását vagy az árfolyamok előrejelzését. A rugalmasság és az adatok zökkenőmentes feldolgozása érdekében sok cég úgy dönt, hogy idősoros adatbázisait a felhőbe migrálja.

    Az idősoros adatbázisok felhőbe való migrációjával a szervezetek igény szerint korlátlan erőforrásokhoz férhetnek hozzá. Lehetővé teszi a cégek számára, hogy több száz magot használjanak fel feladataik elvégzéséhez, amivel késleltetési problémák nélkül maximalizálják a hálózati átviteli sebességet.

    A felhő infrastruktúrájában található idősoros adatbázisok alkalmasak a számításigényes munkaterhelésekre. Ez magában foglalja a kockázati számítások elvégzését a valós idejű piaci trendekre reagálva. A pénzügyi cégek megszüntethetik az adatközpont többletköltségét, és nulla az erőforrások felhasználását, hogy javítsák munkaterheléseik termelékenységét.

    A felhőszolgáltatók, például az AWS biztosítják Amazon Timestream, egy idősoros adatbázis-szolgáltatás, amely lehetővé teszi az idősoros adatkészletek egyszerű betöltését, tárolását és elemzését. Tárhelyet kínálnak a tranzakcióigényes munkaterhelések kezelésére, valós idejű elemző eszközöket és adatfolyam-funkciókat kínálnak az események megjelenítéséhez, amikor és amikor azok előfordulnak.

    Ezért a felhő-infrastruktúra felerősíti és skálázza az idősoros adatok előnyeit.

    Az idősorok alkalmazásai

    Az idősoros modellek két célt szolgálnak,

  • Értse meg azokat a mögöttes tényezőket, amelyek egy bizonyos adatmintázatot hoztak létre.
  • Az elemzés alapján állítson be egy modellt az előrejelzéshez és a monitorozáshoz.
  • Nézzünk meg néhány alkalmazáshasználati esetet az idősoros adatokból.

    #1. Idősorok pénzügyi és üzleti területen

    Minden pénzügyi, üzleti és befektetési döntést az aktuális piaci trendek és a keresleti előrejelzések alapján hozzák meg. Az idősoros adatokat a dinamikus pénzügyi piac magyarázatára, korrelálására és előrejelzésére használják. A pénzügyi szakértők megvizsgálhatják a pénzügyi adatokat, hogy előrejelzéseket adhassanak olyan alkalmazásokhoz, amelyek segítenek a kockázatcsökkentésben, stabilizálni az árazást és a kereskedést.

    Az idősorelemzés kulcsszerepet játszik a pénzügyi elemzésben. Kamatláb-előrejelzésben, a tőzsdék volatilitásának előrejelzésében és még sok másban használják. Az üzleti érdekelt felek és a döntéshozók megalapozott döntéseket hozhatnak a gyártásról, a beszerzésekről, az erőforrások elosztásáról, és optimalizálhatják üzleti működésüket.

    Ezt az elemzést hatékonyan használják a befektetési szektorban a biztonsági ráták és azok időbeli ingadozásainak nyomon követésére. Az értékpapír árfolyama rövid távon (azaz óránkénti vagy napi adatrögzítés) vagy hosszú távon (vagyis hónapokra vagy évekre húzódó megfigyelés) is megfigyelhető. Az idősorelemzés hasznos eszköz annak nyomon követésére, hogy egy értékpapír, eszköz vagy gazdasági változó hogyan teljesít hosszabb időn keresztül.

    #2. Idősorok az orvosi területen

    Az egészségügy gyorsan fejlődik adatvezérelt területté. A pénzügyi és üzleti elemzés mellett az orvosi terület nagymértékben kihasználja az idősorelemzést.

      12 alkalmazás, amiért érdemes sétálni

    Vegyünk egy olyan forgatókönyvet, amely az idősoros adatok, az orvosilag összehangolt eljárások és az adatbányászati ​​technikák szinergiáját igényli a rákos betegek kezelése során. Egy ilyen hibrid keretrendszer használható az összegyűjtött idősoros adatokból (azaz a páciens röntgenfelvételeiből) jellemző kivonási funkciók kihasználására, hogy nyomon kövessék a páciens előrehaladását és az orvosi testvériség által nyújtott kezelésekre adott válaszát.

    Az egészségügyben kritikus érték a folyamatosan változó idősoros adatokból levonni a következtetéseket. Ezenkívül a fejlett orvosi gyakorlatok megkövetelik, hogy a betegrekordokat idővel összekapcsolják a beteg egészségi állapotának jobb láthatósága érdekében. Ezenkívül a páciens egészségi paramétereit rendszeres időközönként pontosan rögzíteni kell, hogy tisztább képet kapjunk a páciens egészségi állapotáról.

    A fejlett orvosi műszerek előtérbe kerülésével az idősor-elemzés meghonosodott az egészségügy területén. Vegye figyelembe az alábbi példákat,

    • EKG-készülékek: A szív állapotának monitorozására kifejlesztett eszközök a szív elektromos impulzusainak rögzítésével.
    • EEG-eszközök: Az agy elektromos aktivitásának számszerűsítésére használt eszközök.

    Az ilyen eszközök lehetővé tették az orvosok számára, hogy idősorelemzést végezzenek a gyorsabb, hatékony és pontos orvosi diagnózis érdekében.

    Ezenkívül az IoT-eszközök, például a hordható érzékelők és a hordozható egészségügyi eszközök megjelenésével az emberek minimális bemeneti ráfordítással rendszeresen mérhetik egészségügyi változóikat. Ez az időfüggő orvosi adatok következetes adatgyűjtését eredményezi mind a betegek, mind az egészséges személyek esetében.

    #3. Idősorok a csillagászatban

    A csillagászat és az asztrofizika az a két modern tudományág, ahol jelentős mértékben hasznosítják az idősoros adatokat.

    A csillagászat alapvetően magában foglalja a kozmikus objektumok röppályáinak és égitesteinek feltérképezését, valamint pontos méréseket, hogy jobban megértsük a Föld légkörén túli világegyetemet. Ennek a követelménynek köszönhetően a csillagászati ​​szakértők jártasak az idősorok adatainak kezelésében, miközben komplex műszereket kalibrálnak és konfigurálnak, valamint tanulmányozzák az érdeklődésre számot tartó csillagászati ​​objektumokat.

    Az idősoros adatokat régóta a csillagászat területéhez kötik. Kr.e. 800-ban rendszeres időközönként gyűjtötték a napfoltok idősorait. Azóta az idősorelemzést használják

    • Fedezze fel a távoli csillagokat a csillagok távolsága alapján,
    • Figyelje meg a kozmikus eseményeket, például a szupernóvákat, hogy jobban megértse univerzumunk eredetét.

    Az idősoros adatok ebben az esetben a csillagok, égitestek vagy objektumok által kibocsátott fény hullámhosszára és intenzitására vonatkoznak. A csillagászok folyamatosan figyelik az ilyen élő közvetítési adatokat, hogy valós időben észleljék a kozmikus eseményeket, amikor és amikor azok bekövetkeznek.

    Az utóbbi időben olyan kutatási területek jelentek meg, mint az asztroinformatika és az asztrstatisztika, amelyek különböző tudományágakat vegyítenek, mint például az adatbányászat, a gépi tanulás, a számítási intelligencia és a statisztika. Ezeken az újszerű kutatási területeken az idősoros adatok szerepe a csillagászati ​​objektumok gyors és hatékony észlelése és osztályozása.

    #4. Idősor az időjárás előrejelzésében

    Arisztotelész alaposan tanulmányozta az időjárási mintákat, hogy jobban megértse az ókorban megfigyelt időjárási változások okait és hatásait. A napok előrehaladtával a tudósok elkezdték rögzíteni az időjárással kapcsolatos adatokat olyan műszerekkel, mint a „barométer”, hogy kiszámítsák a légköri változókat. Az adatokat rendszeres időközönként gyűjtötték, és különböző helyeken tárolták.

    Idővel idővel az időjárás-előrejelzések megjelentek az újságokban. Gyorsan előre haladva a mai napra és korra, mindenütt jelenlévő időjárás-előrejelző állomások vannak telepítve a világ különböző területein, hogy pontos időjárási változókat gyűjtsenek.

    Az ilyen állomások fejlett funkcionális eszközökkel rendelkeznek, amelyek egymással összekapcsolva összegyűjtik és korrelálják a különböző helyekről származó időjárási adatokat. A korrelált adatok az időjárási körülmények előrejelzésére szolgálnak minden alkalommal, a követelményektől függően.

    #5. Idősorok az üzletfejlesztésben

    Az idősoros adatok lehetővé teszik a vállalkozások számára, hogy üzleti döntéseket hozzanak. Ezt úgy érik el, hogy a folyamat elemzi a múltbeli adatokat, hogy levonja a jövőbeli eseményeket, és rávilágítson a valószínű lehetőségekre. A múltbeli adatminta a következő paraméterek származtatására szolgál:

    • Üzleti növekedés: Az általános pénzügyi és üzleti teljesítmény értékeléséhez és a növekedés méréséhez az idősoros adatok a legalkalmasabb és legmegbízhatóbb eszköz.
    • Trendbecslés: Különféle idősoros módszerek alkalmazhatók a kialakuló trendek becslésére. Vegyük például, hogy ezek a módszerek egy bizonyos időszakra vonatkozó adatmegfigyelések elemzésére szolgálnak, hogy tükrözzék egy adott elektronikus eszköz értékesítésének növekedését vagy csökkenését.
    • Szezonális minták feltárása: A rögzített adatpontok ingadozásokat és szezonális mintákat tárhatnak fel, amelyek segíthetik az adatok előrejelzését. A kapott adatinformáció kulcsszerepet játszik azokon a piacokon, ahol a termékárak szezonálisan ingadoznak. Az ilyen adatok segíthetik a vállalkozásokat a jobb terméktervezésben és -fejlesztésben.

    Következtetés 👨‍🏫

    Összefoglalva, az idősoros adatok egy állandó időtartam alatt gyűjtött összetett adatpontok jellemzőiként tekinthetők. Az idősorok elemzése, modellezése és előrejelzése mindennapi életünk szerves részévé vált az IoT kütyük, intelligens háztartási készülékek és hordozható eszközök megjelenésével. Emellett az idősoros adatok számos területen alkalmazást találnak, beleértve az egészségügyet, az asztrofizikát, a közgazdaságtant, a mérnöki tudományokat, az üzleti életet és még sok mást.