Ensamble de múltiples subconjuntos de datos balanceados aplicado a calificación crediticia

Loading...
Thumbnail Image
Date
2020
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Católica San Pablo
Abstract
La investigación actual en calificación crediticia no ha prestado atención al desbalance presente en los conjuntos de datos. Por esta razón, en este trabajo se importó un método reciente de ensamble para clasificar datos desbalanceados en el dominio de crédito. Se usaron cuatro clasificadores base de diversas familias, y tres conjuntos de datos heterogéneos como prueba. Luego de ejecutar los experimentos, los resultados son bastante alentadores; el área bajo la curva (AUC) mejoró en diez de doce clasificadores base. Además, los clasificadores ensamblados creados son estadísticamente superiores a los algoritmos de estado del arte Random Forest y XGBoost. Finalmente, al comparar los resultados de este estudio con los resultados de otros estudios en dos conjuntos de datos de referencia se ratifica que los resultados son bastante competitivos.
Description
Citation