Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban

Elmentve itt :
Bibliográfiai részletek
Szerző: Pelikán Balázs
További közreműködők: Kaderják Gyula
Kemenes Rudolf Zoltán
Dokumentumtípus: Diplomadolgozat
Kulcsszavak:adatbányászat
ábraelemzés
big data
gépi tanulás
mesterséges intelligencia
Online Access:http://dolgozattar.uni-bge.hu/29481

MARC

LEADER 00000nta a2200000 i 4500
001 dolg29481
005 20210316125400.0
008 210316suuuu hu om 000 hun d
040 |a BGE Dolgozattár Repozitórium  |b hun 
041 |a hu 
100 1 |a Pelikán Balázs 
245 1 0 |a Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban  |c Pelikán Balázs  |h [elektronikus dokumentum] 
520 3 |a Szakdolgozatom írása idején az OTP Bank Nyrt. Adatmenedzsment Megoldások Fejlesztési és Üzemeltetési Főosztályának, Big Data csapatában gyakornokoskodom. Dolgozatom témáját az egyik, nemrég indult projekt inspirálta, melynek célja, hogy kifejlesszünk a Bankon belül egy bankkártya csalások észlelésére képes gépi tanulási algoritmust, melyet egy Big Data környezetben helyezünk majd el. A mesterséges intelligencia egyik területe, a gépi tanulás egy rendkívül felkapott szakterület, melynek alkalmazása a legtöbb iparágban már megjelent. Ennek a technológiának a megismerése minden intelligens rendszerekkel foglalkozó számítástechnikai szakember számára elengedhetetlen. A célom, hogy megalapozott irodalomkutatás után rávilágítsak a sok adattal járó előnyökre, majd alkalmazzam ezeket és a gépi tanulási technikák segítségével egy bankkártya csalások detektálására szolgáló előrejelző algoritmust fejlesszek. Szakdolgozatom három (elsősorban irodalomkutatáson alapuló) fejezete adja meg az alappilléreit a gyakorlatiasabb OTP Bank Big Data ökoszisztémájának ismertetéshez, Python nyelven való programozáshoz, illetve a H2O Flow programban való fejlesztéshez. Kutatásaim során sikerült létrehoznom egy logisztikus regressziós gépi tanulási modellt. Ezt egy anonimizált adathalmaz felhasználásával sikerült tanítanom, és végül 98 százalékos pontossággal tudta megmondani egy tranzakcióról, hogy az csalás-e vagy sem. A logisztikus regressziós modell kialakítása egy tökéletes alapot adott ahhoz, hogy folytatni tudjam ezen téma további kutatását a mély tanulás témakörében. Bonyolultabb modellek, pl.: neurális hálózatok és SVM modellek kialakításával jóval pontosabb eredményt lehet majd elérni. (James D., 2018) Szakdolgozatomban bemutattam, hogy az OTP Bank hogyan kezeli és tárolja a rendelkezésére álló hatalmas adatmennyiséget egy Big Data ökoszisztémában. Ezek után pedig szimulálva végeztem el egy olyan közel jövőben végbemenő projekt gépi tanulási algoritmusának fejlesztését, mely alkalmas lehet ebbe az ökoszisztémába való implementálásába. 
695 |a adatbányászat 
695 |a ábraelemzés 
695 |a big data 
695 |a gépi tanulás 
695 |a mesterséges intelligencia 
700 1 |a Kaderják Gyula  |e ths 
700 1 |a Kemenes Rudolf Zoltán  |e ths 
856 4 0 |u http://dolgozattar.uni-bge.hu/29481/1/Szakdolgozat_Pelika%CC%81n_Bala%CC%81zs_MEEG9L.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/29481/2/BA_TO_Pelika%CC%81n_Bala%CC%81zs_meeg9l.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/29481/3/model_interju.zip  |z Dokumentum-elérés