Comparação de métodos de inferência dos rejeitados em modelos de
Credit Scoring
Inferência dos rejeitados, Aprendizagem de máquina, Credit
scoring, Risco de crédito
Os modelos de Credit Scoring oferecem benefícios para os credores e
tomadores por muitos anos. No entanto, na prática, esses modelos são
normalmente construídos em uma amostra da população de clientes aprovados e
não consideram os que foram rejeitados. Isso tende a causar um viés
amostral. Inferência dos rejeitados é um método para estimar como os
requerentes rejeitados teriam se comportado se tivessem sido concedidos e
incorporando essas informações na reconstrução do modelo de Credit Scoring.
Nesta dissertação vão ser comparados 4 (cinco) métodos de inferência dos
negados: Reclassificação, Augmentation, Cluster e Parcelamento. E também a
inclusão de um algoritmo de deep learning, o Deep Embedded Clustering
(DEC). Os métodos serão avaliados por diversas métricas de performance,
tais como: AUC, KS, F1, acurácia, DTI, teste não paramétrico de
Kruskal-Wallis e um teste post-hoc de Nemenyi. Os métodos são analisados em
3 (três) conjuntos de dados reais com diversos perfis de taxa de
reprovação, para verificar se o efeito do comportamento da aprovação
impacta na performance dos métodos. Os experimentos realizados evidenciaram
que existe diferença significativa entre os métodos estudados e também que
o método de DEC teve desempenho superior que os demais métodos para a
maioria das métricas avaliadas.