A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise
Elmentve itt :
| Szerző: | |
|---|---|
| További közreműködők: | |
| Dokumentumtípus: | Diplomadolgozat |
| Kulcsszavak: | ábrák Budapest ingatlanpiac Python regresszió analízis vizuális modellezés |
| Online Access: | http://dolgozattar.uni-bge.hu/38167 |
MARC
| LEADER | 00000nta a2200000 i 4500 | ||
|---|---|---|---|
| 001 | dolg38167 | ||
| 005 | 20211105131016.0 | ||
| 008 | 211105suuuu hu om 000 hun d | ||
| 040 | |a BGE Dolgozattár Repozitórium |b hun | ||
| 041 | |a hu | ||
| 100 | 1 | |a Szabó Nóra | |
| 245 | 1 | 2 | |a A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise |c Szabó Nóra |h [elektronikus dokumentum] |
| 520 | 3 | |a Dolgozatom egyik fő célja volt, hogy összefogó képet alkossak Budapest ingatlan piacáról adatvizualizáció segítségével, ami alapján mindenki számára könnyen és gyorsan értelmezhető lesz, hogy a lakásárakat milyen tényezők befolyásolják. Másrészről pedig célom volt, hogy a regresszióanalízis eszköztárát felhasználva becslést végezhessek a budapesti lakásárakra vonatkozóan, ami az adatbázis folyamatos frissítésével bármikor segíthet számunkra jóslást végezni. A kutatásom első részében a web scrapinget, azaz webes adatgyűjtést végeztem az ingatlan.com oldalról, amihez a Selenium web automatizáló eszközét választottam. A programmal a jövőben további adatokat tudok gyűjteni, ami alapján már időszakos elemzéseket is el tudok majd végezni. A szakdolgozat 3. fejezetében a Tableau program közül a Tableau Prep szoftver használata kapott jelentőséget, amivel az adattisztítást és az adattranszformálást végeztem. Az adattisztítás során az volt a célom, hogy a hibás, helytelenül formázott, duplikált vagy hiányos adatokat kijavítsam, az adattranszformálás tekintetében pedig az adatok egyik formátumból a másikba történő átalakítása. Az adatelőkészítés során a Tableau Prep-pel megvalósítható volt az, hogy a hosszú kódsorok helyett egérkattintásokkal alakítsam át az adataimat, ezzel rengeteg időt megspórolva. Ezt követően el tudtam kezdeni feltérképezni Budapest ingatlanpiacát a Tableau Desktop segítségével. A Tableau Desktop számos vizualizációt kínál és emellett útmutatást ad az egyes vizualizációk használatához, és az alkalmazás során egyértelműen bizonyította, hogy méltón az egyik legjobb BI eszköz ma a piacon. Egyértelműen kiderült a vizualizációból, hogy Buda-Pest viszonylatban a budai kerületek jóval felkapottabbak, és ehhez mérten drágábbak is átlagosan, bár az átlagárak közül a versenyt az 5. kerület tartja. Az árakban a pesti kerületekben az 5. kerületen kívül 6., 7. és 13. kerület vezet, azonban utóbbi kerület az, ami összességében a legjobban fejlődő kerület Budapesten, ezért is számos újépítésű lakás kerül meghirdetésre. Abban a kérdés körben, hogy panelt vagy téglát érdemes inkább vásárolni, nehéz egyértelmű választ adni. Az adatokból megállapítható volt, hogy a panel lakások ára alacsonyabb a tégla építésű lakásokhoz képest, azonban ha hosszú távon akar valaki elköteleződni egy ingatlanban, akkor a rezsi árakat figyelembe véve jobb választás a tégla, nem beszélve azok értékállóságáról. Viszont, ha valaki kizárólag befektetés céljából tervez használt lakást venni, annak jobban megérheti panel lakást venni. Hisz be kell látni, bár sokan előítélettel vannak a panel lakásokkal szemben, azok még jó ideig Budapest arculatát fogják képezni, és remélhetőleg a panel program jóvoltából annak megítélése javul nem csak energia-megtakarítást eredményező korszerűsítések, hanem a külső rekonstrukció miatt is. Az utolsó részben pedig sikerült több olyan modell megalkotni, amivel becslést lehet végezni a budapesti lakásárakra vonatkozóan és ezek közül kerestem a legjobbat. Az alapmodell felépítése során lineáris regressziós modell alkottam meg, kiértékelése után igyekeztem tovább javítani a modellt. Ehhez először a Lasso regressziós modellt választottam, ami azonban kifejezetten jobb eredményt nem hozott. Végül a legjobb választást a Gradient Boosting regressziós modell eredményezte a statisztikai mutatókat megfigyelve. Összefoglalva elmondható, hogy a szakdolgozatom elérte célját. A vizualizációs eszközökkel gyors információ átadás vált lehetővé, amelyhez a Tableau szoftver nagy segítségemre volt. A modell alkotás fázisában pedig sikerült a Gradient Boosting regressziós modellel javítani a mutatókat, a lineáris és a Lasso regressziós modellhez képest. | |
| 695 | |a ábrák | ||
| 695 | |a Budapest | ||
| 695 | |a ingatlanpiac | ||
| 695 | |a Python | ||
| 695 | |a regresszió analízis | ||
| 695 | |a vizuális modellezés | ||
| 700 | 1 | |a Fábián Gábor |e ths | |
| 700 | 1 | |a Kovács Dr Endre |e ths | |
| 856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/1/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_gazdas%C3%A1ginformatikus_%C3%BCzleti%20adatelemz%C5%91.pdf |z Dokumentum-elérés |
| 856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/2/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_mell%C3%A9kletek.zip |z Dokumentum-elérés |
| 856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/3/Szab%C3%B3%20N%C3%B3ra_G8Y2VL_temavazlat-es-osszefoglalas.pdf |z Dokumentum-elérés |