Bons e maus pagadores são identificados!

Métodos estatísticos e computacionais de classificação de bons e maus pagadores

A empresa Confidencial (nome fictício por tratar-se de um projeto cujos resultados e identificação não serão públicos) submeteu um projeto numa chamada do NEA, em dezembro de 2017. O projeto foi direcionado aos alunos da disciplina Mineração de Dados do Bacharelado em Estatística ICMC/USP para ser conduzido pela metodologia educacional PBL (Aprendizado Baseado em Problema – Problem Based Learning, em inglês). A equipe de alunos de graduação contou com o apoio de alunos de pós-graduação da disciplina Desenvolvimentos de Projetos Industriais I, do programa de pós-graduação em Ciências de Computação e Matemática Computacional, e com a supervisão do docente responsável pela disciplina e de um pós-doutorando do ICMC.

Quando o risco de inadimplência é alto, o crédito não é autorizado. Ou ainda, quanto maior é o risco de inadimplência, maiores são os juros cobrados. Sabemos que é assim que funciona quase sempre. Mas como identificar quem deve pagar mais, quem deve ter o crédito autorizado? Respostas a estas perguntas, a empresa Confidencial gostaria de que extraíssemos da sua base de dados.

Primeiramente os alunos precisaram minerar as informações importantes dentro do enorme conjunto de dados fornecido. Uma análise descritiva bem minuciosa guiou o estudo, pois ajudou na seleção das melhores técnicas para redução de dimensão e mostrou como deveriam ser tratados os valores especiais e faltantes do conjunto de dados fornecido.

Foram várias as metodologias usadas para obter as respostas desejadas: Máquina de Vetores de Suporte, Florestas Aleatórias, Regressão Logística LASSO. Comparando os modelos adotados, os alunos selecionaram o de maior especificidade e acurácia que foi a Floresta Aleatória. Com isso, conseguiram identificar os bons e os maus pagadores com base em seu perfil socioeconômico.

Proponente: Confidencial (nome fictício).

Aprendizes: Áulus Barbosa Lustosa,  Felipe Hernandez Bisca, Isabela Vegini de Matos e Lucas Alves da Rosa do Bacharelado em Estatística. E

Apoio: Mateus Paranaíba Ribeiro e Zeray Hagos Gebrezabher, da disciplina Desenvolvimentos de Projetos Industriais, ministrada pelo Prof. Gustavo Buscaglia (2018/1).

Supervisores: Profª. Mariana Cúri e pós-doutorando Luciano Carli Moreira de Andrade