Statisztikai és gépi tanuló megoldások használata egy webáruház készletgazdálkodásának támogatásában

Saved in:
Bibliographic Details
Main Author: Orosz Kata
Other Authors: Kovács Dr. Endre
Format: Thesis
Kulcsszavak:algoritmikus modellek
e-business
idősorelemzés
készletgazdálkodás
statisztikai adatelemzés
Online Access:http://dolgozattar.uni-bge.hu/53798
Description
Abstract:A dolgozatban azt vizsgálom, milyen statisztikai és gépi tanuló megoldásokkal lehet hatékonyan támogatni egy webáruházat üzemeltető középvállalkozás készletgazdálkodását. A dolgozat célkitűzése annak a kérdésnek a megválaszolása, hogy melyik algoritmus képes a legjobb előjelzési teljesítményt elérni olyan alacsony volumenű idősoros tranzakciós adatokon, amelyeket erős szezonális keresletingadozás jellemez. Szakirodalmi áttekintés, valamint az esettanulmány alapjául szolgáló idősoros adatok feltáró elemzése alapján három algoritmust választottam összehasonlításra: a statisztikai alapú SARIMA (szezonális autoregresszív integrált mozgóátlagos) algoritmust, az STL (szezonális, trend, és maradványértéken alapuló, azokat lokális regressziós simítással kiegészítő) algoritmust, valamint a szezonális- és trend-dekompozíciós alapokon nyugvó, azt egyéb paraméterezési lehetőségekkel kiegészítő algoritmust, a Prophet-et. Az elemzésben felhasznált adatok havi aggregációs szinten mutatják a vásárlói keresletet tekintve erős szezonalitást mutató termékcsoportok (pl. fűnyíró, sövényvágó) eladási számait.Az elemzésben összesen hat termékcsoport 49 havi eladási adatait használtam fel. A modelleket az első 37 hónap adatain illesztettem; teljesítményüket az utolsó 12 hó adataira adott előjelzések, és a tesztmintaként szolgáló tényleges eladási adatok összehasonlításával értékeltem ki. A modellek teljesítményét az átlagos négyzetes hibagyök (RMSE), valamint az átlagos abszolút százalékos hiba (MAPE) alapján értékeltem ki, az Auto-ARIMA paraméterkeresési eljárással elért előjelzési eredményeket tekintve referenciaértéknek. Az előjelzési eredmények összehasonlításából megállapítottam, hogy a legjobb teljesítményt az STL modellek hozták. Az STL algoritmus mind a hat vizsgált termékcsoport esetében jobb eredményt ért el, mint a referenciamodell. Ezzel szemben a Prophet modellek négy esetben a referenciamodelleknél jobb, két esetben viszont rosszabb előjelző teljesítményt értek el. Az eredményekből levonható következtetés, hogy egy középvállalkozás esetében, ahol az erős szezonalitást mutató termékcsoportok eladási volumene alacsony, egy automatizált hiperparaméter-kereséssel kiegészített statisztikai megoldás is viszonylag jó becslést adhat a várható keresletre; valamint, hogy a becslés tovább pontosítható az STL algoritmusra jellemző, nemparametrikus alapokon nyugvó gépi tanuló megoldással.