Statisztikai és gépi tanuló megoldások használata egy webáruház készletgazdálkodásának támogatásában
Elmentve itt :
Szerző: | |
---|---|
További közreműködők: | |
Dokumentumtípus: | Diplomadolgozat |
Kulcsszavak: | algoritmikus modellek e-business idősorelemzés készletgazdálkodás statisztikai adatelemzés |
Online Access: | http://dolgozattar.uni-bge.hu/53798 |
Kivonat: | A dolgozatban azt vizsgálom, milyen statisztikai és gépi tanuló megoldásokkal lehet hatékonyan támogatni egy webáruházat üzemeltető középvállalkozás készletgazdálkodását. A dolgozat célkitűzése annak a kérdésnek a megválaszolása, hogy melyik algoritmus képes a legjobb előjelzési teljesítményt elérni olyan alacsony volumenű idősoros tranzakciós adatokon, amelyeket erős szezonális keresletingadozás jellemez. Szakirodalmi áttekintés, valamint az esettanulmány alapjául szolgáló idősoros adatok feltáró elemzése alapján három algoritmust választottam összehasonlításra: a statisztikai alapú SARIMA (szezonális autoregresszív integrált mozgóátlagos) algoritmust, az STL (szezonális, trend, és maradványértéken alapuló, azokat lokális regressziós simítással kiegészítő) algoritmust, valamint a szezonális- és trend-dekompozíciós alapokon nyugvó, azt egyéb paraméterezési lehetőségekkel kiegészítő algoritmust, a Prophet-et. Az elemzésben felhasznált adatok havi aggregációs szinten mutatják a vásárlói keresletet tekintve erős szezonalitást mutató termékcsoportok (pl. fűnyíró, sövényvágó) eladási számait.Az elemzésben összesen hat termékcsoport 49 havi eladási adatait használtam fel. A modelleket az első 37 hónap adatain illesztettem; teljesítményüket az utolsó 12 hó adataira adott előjelzések, és a tesztmintaként szolgáló tényleges eladási adatok összehasonlításával értékeltem ki. A modellek teljesítményét az átlagos négyzetes hibagyök (RMSE), valamint az átlagos abszolút százalékos hiba (MAPE) alapján értékeltem ki, az Auto-ARIMA paraméterkeresési eljárással elért előjelzési eredményeket tekintve referenciaértéknek. Az előjelzési eredmények összehasonlításából megállapítottam, hogy a legjobb teljesítményt az STL modellek hozták. Az STL algoritmus mind a hat vizsgált termékcsoport esetében jobb eredményt ért el, mint a referenciamodell. Ezzel szemben a Prophet modellek négy esetben a referenciamodelleknél jobb, két esetben viszont rosszabb előjelző teljesítményt értek el. Az eredményekből levonható következtetés, hogy egy középvállalkozás esetében, ahol az erős szezonalitást mutató termékcsoportok eladási volumene alacsony, egy automatizált hiperparaméter-kereséssel kiegészített statisztikai megoldás is viszonylag jó becslést adhat a várható keresletre; valamint, hogy a becslés tovább pontosítható az STL algoritmusra jellemző, nemparametrikus alapokon nyugvó gépi tanuló megoldással. |
---|