Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban
Elmentve itt :
Szerző: | |
---|---|
További közreműködők: | |
Dokumentumtípus: | Diplomadolgozat |
Kulcsszavak: | adatbányászat ábraelemzés big data gépi tanulás mesterséges intelligencia |
Online Access: | http://dolgozattar.uni-bge.hu/29481 |
MARC
LEADER | 00000nta a2200000 i 4500 | ||
---|---|---|---|
001 | dolg29481 | ||
005 | 20210316125400.0 | ||
008 | 210316suuuu hu om 000 hun d | ||
040 | |a BGE Dolgozattár Repozitórium |b hun | ||
041 | |a hu | ||
100 | 1 | |a Pelikán Balázs | |
245 | 1 | 0 | |a Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban |c Pelikán Balázs |h [elektronikus dokumentum] |
520 | 3 | |a Szakdolgozatom írása idején az OTP Bank Nyrt. Adatmenedzsment Megoldások Fejlesztési és Üzemeltetési Főosztályának, Big Data csapatában gyakornokoskodom. Dolgozatom témáját az egyik, nemrég indult projekt inspirálta, melynek célja, hogy kifejlesszünk a Bankon belül egy bankkártya csalások észlelésére képes gépi tanulási algoritmust, melyet egy Big Data környezetben helyezünk majd el. A mesterséges intelligencia egyik területe, a gépi tanulás egy rendkívül felkapott szakterület, melynek alkalmazása a legtöbb iparágban már megjelent. Ennek a technológiának a megismerése minden intelligens rendszerekkel foglalkozó számítástechnikai szakember számára elengedhetetlen. A célom, hogy megalapozott irodalomkutatás után rávilágítsak a sok adattal járó előnyökre, majd alkalmazzam ezeket és a gépi tanulási technikák segítségével egy bankkártya csalások detektálására szolgáló előrejelző algoritmust fejlesszek. Szakdolgozatom három (elsősorban irodalomkutatáson alapuló) fejezete adja meg az alappilléreit a gyakorlatiasabb OTP Bank Big Data ökoszisztémájának ismertetéshez, Python nyelven való programozáshoz, illetve a H2O Flow programban való fejlesztéshez. Kutatásaim során sikerült létrehoznom egy logisztikus regressziós gépi tanulási modellt. Ezt egy anonimizált adathalmaz felhasználásával sikerült tanítanom, és végül 98 százalékos pontossággal tudta megmondani egy tranzakcióról, hogy az csalás-e vagy sem. A logisztikus regressziós modell kialakítása egy tökéletes alapot adott ahhoz, hogy folytatni tudjam ezen téma további kutatását a mély tanulás témakörében. Bonyolultabb modellek, pl.: neurális hálózatok és SVM modellek kialakításával jóval pontosabb eredményt lehet majd elérni. (James D., 2018) Szakdolgozatomban bemutattam, hogy az OTP Bank hogyan kezeli és tárolja a rendelkezésére álló hatalmas adatmennyiséget egy Big Data ökoszisztémában. Ezek után pedig szimulálva végeztem el egy olyan közel jövőben végbemenő projekt gépi tanulási algoritmusának fejlesztését, mely alkalmas lehet ebbe az ökoszisztémába való implementálásába. | |
695 | |a adatbányászat | ||
695 | |a ábraelemzés | ||
695 | |a big data | ||
695 | |a gépi tanulás | ||
695 | |a mesterséges intelligencia | ||
700 | 1 | |a Kaderják Gyula |e ths | |
700 | 1 | |a Kemenes Rudolf Zoltán |e ths | |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/29481/1/Szakdolgozat_Pelika%CC%81n_Bala%CC%81zs_MEEG9L.pdf |z Dokumentum-elérés |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/29481/2/BA_TO_Pelika%CC%81n_Bala%CC%81zs_meeg9l.pdf |z Dokumentum-elérés |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/29481/3/model_interju.zip |z Dokumentum-elérés |