【算法业务】互联网风控业务中的续贷审批模型(融合还款意愿分层的逾期风险识别模型)

1、背景说明

        本文旨在提出一种针对风控催收受限情况下,如何提升风控审批模型的风险识别能力,以缓解贷后催收的压力,降低贷款资金坏账的风险。这篇工作依然是很早期的项目,分享的目的一方面做笔记,另一方面则是希望其中涉及的算法思想和优化点,对读者有一定的启发作用。

        本文所涉任务是面向续贷审批场景,当然也可以将该思想扩展到其他场景。主要是提出一种融合还款意愿分层的逾期⻛险识别的新模型。之前风控场景流⾏的建模⽅式,是对Y的定义为贷后⽤户是否为dpd10+。这样的处理⽅式,在模型训练时,虽然能够⼀定程度把 ⾮dpd10+的⽤户排在前⼏档, 但是不能保证这⼏档的好⽤户还款意愿强弱与后⼏档的好⽤户存在差异。 在低⻛险档中,很容易混⼊ dpd1-10的“好⽤户”,⽽这些⽤户越往后其逾期的概率越⼤。 因此随着催收的⼒度降低,更容易造成dpd10+的⽤户产⽣,影响全⽣命周期的坏账率。 所以通过对Y进⼀步细化,引⼊⽤户的还款意识强度的识别,进⼀步提升模型对还款意识强的好⽤户的识别能⼒。

2、数据分析

        还款⾏为在续贷贷后不同期的分布转移分析:

初步分析结论:
(1)M1各类用户到M2,M3的迁移分布保持一致。

(2)M1各类用户到M3的迁移分布与M2各类用户到M3的迁移分布保持一致。

(3)从M1-M3&M2-M3,可看出,M1的各类用户能够体现出还款意愿强弱差异。

(4)对用户按照意愿强度分层具备意义,如果控制放款的用户为“提前还款”用户,有利于在当前催收力度下降的情况下,控制全生命周期的坏账。

(5)因此评判模型的优劣,需额外引入新的指标,即topK档的好用户中“提前还款或者当天还款”用户占比。

        因此我们希望通过改变模型的学习目标后,模型评估的结果分布可以将提前还款用户占比提升。

3、续贷审批流程

4、融合还款意识分层的信用风险识别审批模型

4.1 模型思路

        针对申请的⽤户,⾸先会识别其还款意愿度, 筛选出有较强还款意识的申请者。因为不同的
还款意识强度,会对应不同的还款⾏为。提前还款⽤户偏好提前还款或者按时还款。
        针对1-3 类的每⼀分层,都会构建对应场景限制的逾期⻛险模型。如针对提前还款场景,在M1-M3任意⼀期逾期dpd10+ 作为坏⽤户,反之作为好⽤户,训练⻛险识别模型。对于第4 类,由于其本身属于还款意识弱的⾼危⽤户,因此会直接作为⾼⻛险⽤户。
        通过有效融合还款意识模型分以及各分层信⽤⻛险模型分,得到最终的⽤户排序分值,从低到⾼⻛险排序⽤户。

4.2 模型实践

4.2.1 初步策略探索(baseline+策略1~4)

baseline 不加⼊还款意图分层,使⽤ Xgboost 进⾏⼆分类
融合策略 1 加⼊还款意图分层 ( P repay_intention), 除 dpd10 还款类别外,各分层单独训练主信⽤⻛险模型 ( P overdue_risk)
融合策略 2 在融合策略 1 的基础上,对 P overdue_risk (x, repay_intention) 进⾏ Min-Max Scale MMS
融合策略 3 加⼊还款意图分层, 单独训练主信⽤⻛险模型
融合策略 4 加⼊还款意图分层, 单独训练主信⽤⻛险模型 , 输⼊ RF stacking 进⾏模型融合

不同融合策略结果对⽐:  还款意愿分层确实能够改变 L1-L3 的好⽤户组成⽐例

4.2.2 优势策略融合

4.2.2.1 策略5

融合策略5:策略1+策略4优势互补

        从实验结果来看,策略1 可以明显提升 L1-L3 的提前还款⽤户⽐例,⽽策略 4 可以明显降低 L1 的容忍期还款⽤户⽐例。 我们希望通过对策略1 和策略 4 结合进⾏优势互补, 既能提升 L1-L3 的提前还款⽤户⽐例,⼜能明显降低 L1 的容忍期还款⽤户⽐例
4.2.2.1.1 策略5新数据结果
结果说明 ( 融合策略 5 相对于 baseline )
(1) L1-L3 提前还款⽤户占⽐ 都有提升,其中 L1 提升⽐例 19.54%
(2) L1-L3 容忍期还款⽤户占⽐ 都有降低,其中 L1 降低幅度 39.05%
(3) 前三档总的 坏账率由 0.561% 下降到 0.549%
(4) ks 保持⼀致
4.2.2.2 策略6
融合策略6(融合策略5+加法模型)
增加加法模型,从实验结果来看,策略 6 相对于策略 5 ,可以使前三档逾期率有明显的下降。
加法模型, 该方法我们已经在《 互联网风控业务中的拒绝推断场景算法应用分享(涉及半监督算法、异常检测、变分自编码、样本权重自适应调整、迁移学习等) 》中提及:
4.2.2.2.1 策略6新数据结果
结果说明 ( 融合策略 5 相对于 baseline )
(1) L1-L3 提前还款⽤户占⽐ 都有提升,其中 L1 提升⽐例 17.35%
(2) L1-L3 容忍期还款⽤户占⽐ 都有降低,其中 L1 降低幅度 39.64%
(3) 前三档总的 坏账率由 0.561% 大幅 下降到 0.527%

4.2.3 算法优化点总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1542869.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

多类别物体检测系统源码分享

多类别物体检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

YOLO航拍车辆和行人识别

YOLO航拍车辆和行人识别 图片数量9695,标注为xml和txt格式; class:car,pedestrian,truck,bus 用于yolo,Python,目标检测,机器学习,人工智能,深度学…

LeetCode 热题 100 回顾18

干货分享,感谢您的阅读!原文见:LeetCode 热题 100 回顾_力code热题100-CSDN博客 一、哈希部分 1.两数之和 (简单) 题目描述 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标…

洛谷P5740——结构体运用

简单的结构体&#xff0c;但是要注意这个排序还有求和重复 时的特判 AC代码附在后面 #include<bits/stdc.h> using namespace std; struct Node{string name;int a,b,c,sum;//语文&#xff0c;数学&#xff0c;英语 }node[1000]; bool cmp(Node a,Node b){return a.sum…

三端全隔离压接端子485中继器磁耦隔离数据双向透传工业级2口信号放大器抗干扰防雷

美思联压接端子485中继器磁耦隔离工业级2口信号放大器抗干扰防雷https://item.taobao.com/item.htm?ftt&id736247434823 MS-H312S是一款专为工业自动化通信而生解决RS-485总线星型结构组网&#xff0c;解决复杂电磁场环境下RS-485大系统要求而设计的RS-485总线分割集线器(…

分布式网络存储技术是什么?分布式存储技术有哪些

分布式储存是指将数据分散存储在多个节点上的一种技术。但是你们知道分布式网络存储技术是什么&#xff1f;相比传统的集中式存储&#xff0c;分布式储存具有更高的可靠性和可用性。分布式网络存储是一种将数据分散存储在多个节点或服务器上的架构。 分布式网络存储技术是什么&…

【算法与数据结构复习】| 快速排序

今天刷力扣215.数组中第K个最大元素&#xff0c;题目要求用时间复杂度O(n)。因此跟着左程云算法课23复习了随机快速排序。 随机快速排序的核心思想就是在数组中随机选一个值x&#xff0c;把<x的值移到左边&#xff0c;>x的值移动到右边。x这个值必须在左边区间的最左边&a…

Java笔试面试题AI答之设计模式(3)

文章目录 11. Spring开发中的哪里使用了工厂设计模式 &#xff1f;1. BeanFactory2. 工厂方法模式3. 抽象工厂模式4. 示例说明总结 12. 什么是代理模式 &#xff1f;13. 请列举代理模式的应用场景 &#xff1f;14. 什么是原型模式 &#xff1f;15. 请简述Java中原型模式的使用方…

stm32 外部中断

1.每个IO都可以配置外部中断&#xff0c;中断的出发方式有上升沿、下降沿、双边沿。这个是在EXTI里配置。 2.所有IO总共分成了16组&#xff0c;&#xff08;PA0,PB0…&#xff09;、&#xff08;PA1,PB1…&#xff09;、&#xff08;PA2,PB2…&#xff09;,…,&#xff08;PA15…

【Proteus仿真】基于51单片机的电机调速和速度实时显示

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 基于51单片机&#xff0c;可采用按键对电机进行方向的调控和速度的加减&#xff0c;并通过DAC0832设置放大电路进行对电机的设置&#xff0c;通过四位数码管显示电机转向和速度&#xff0c;非常精…

LLMs之PE:AI for Grant Writing的简介、使用方法、案例应用之详细攻略

LLMs之PE&#xff1a;AI for Grant Writing的简介、使用方法、案例应用之详细攻略 目录 AI for Grant Writing的简介 AI for Grant Writing的使用方法—提示资源 1、提示集合 2、提示工程 3、快速提示 为了提高文本清晰度 为了让文本更有吸引力 为了改进文本的结构和流…

变压器设备漏油数据集 voc txt

变压器设备漏油数据集 油浸式变压器通常采用油浸自冷式、油浸风冷式和强迫油循环三种冷却方式。该数据集采集于油浸式变压器的设备漏油情况&#xff0c;一般用于变电站的无人巡检&#xff0c;代替传统的人工巡检&#xff0c;与绝缘子的破损检测来源于同一课题。数据集一部分来自…

LeetCode 2374.边积分最高的节点:模拟

【LetMeFly】2374.边积分最高的节点&#xff1a;模拟 力扣题目链接&#xff1a;https://leetcode.cn/problems/node-with-highest-edge-score/ 给你一个有向图&#xff0c;图中有 n 个节点&#xff0c;节点编号从 0 到 n - 1 &#xff0c;其中每个节点都 恰有一条 出边。 图…

hCaptcha 图像识别 API 对接说明

本文将介绍一种 hCaptcha 图像识别 API 对接说明&#xff0c;它可以通过用户输入识别的内容和 hCaptcha验证码图像&#xff0c;最后返回需要点击的小图像的坐标&#xff0c;完成验证。 接下来介绍下 hCaptcha 图像识别 API 的对接说明。 申请流程 要使用 API&#xff0c;需要…

使用思科搭建企业网规划训练,让网络全部互通,使用规则提高工作效率。

1. 企业背景&#xff1a; 某企业分为销售部、行政部、人力资源部、财务部、业务部、接待中心等主要六个部门&#xff1b;配置网管中心&#xff0c;允许网络管理员登录企业交换机和路由器对企业网络进行管理&#xff1b;配置服务器集群&#xff0c;设置FTP、DNS、WEB服务器&am…

泛微开发修炼之旅--44用友U9与ecology对接方案及源码

文章链接&#xff1a;44用友U9与ecology对接方案及源码

蓝桥杯算法之暴力

暴力 1.十进制数转换成罗马数字 2.判断给出的罗马数字是否正确 小知识 %&#xff08;模除&#xff09;&#xff1a; % 符号用作模除&#xff08;或取模&#xff09;运算符。模除运算是一种数学运算&#xff0c;它返回两个数相除的余数。 具体来说&#xff0c;如果 a 和 b 是…

分布式系统的CAP原理

CAP 理论的起源 CAP 理论起源于 2000 年&#xff0c;由加州大学伯克利分校的 Eric Brewer 教授在分布式计算原理研讨会&#xff08;PODC&#xff09;上提出&#xff0c;因此 CAP 定理又被称作布鲁尔定理&#xff08;Brewer’s Theorem&#xff09;。2002 年&#xff0c;麻省理…

低代码开发平台:高效开发新体验

在数字化转型的浪潮中&#xff0c;企业对软件开发的需求日益加剧&#xff0c;对开发效率和响应市场变化的速度有着前所未有的要求。传统的软件开发方法由于其复杂性和耗时性&#xff0c;已经逐渐难以满足这种快速变化的需求。低代码平台作为一种新兴的开发工具&#xff0c;因其…

C语言理解 —— printf 格式化输出

目 录 printf 函数一、短整型输出二、长整型输出三、浮点型输出四、字符型输出五、字符串输出六、注意问题 printf 函数 在软件开发过程中&#xff0c;通常需要打印一些字符串信息&#xff0c;或把一些变量值输出到上位机显示。打印函数printf是最常用的。 一般格式&#xff…