专业的短链接生成工具
链接域名
短网址有效期
模型在风控策略中用到什么细节?
更新时间:2025-5-5 08:09:23 作者:爱短链
模型:使用数学算法通过历史样本数据预测未来;我们的一般信用模型a卡是根据客户的申请数据字段,然后通过算法计算系数的组合,得到相应的预测概率(0-1),这是最初的模型——它代表预测客户逾期的概率,模型评分卡只是方便管理和转换。
策略:即通过一系列规则的组合,实现目标,成为策略。
因此,风险控制中会许多术语:因素、规则、规则、策略、策略、事件等。
风险控制最基本的因素是因素,因素构成规则,多功能相似的属性规则构成规则集,多规则集成为策略;如反欺诈策略、访问策略、配额策略、模型策略,这些组合成策略集,整个策略集构成了风险控制的贷前审计事件。
大致介绍了一些风险控制相关的概念。
风险控制模型的位置是什么? 事实上,可以理解模型是一个因素,它可以作为一个规则,成为一个规则集,一个策略集,一个事件;合作伙伴询问规则、模型、策略,具体如何使用、如何组合、规则和模型的区别等,熟悉上述逻辑可能很清楚。
另一个模型在风险控制中起着重要作用的原因是模型通过多个规则因素(即包含更多的规则)组合,代表了一系列规则因素的风险预测能力;因此,它比任何规则都有很好的区别,因此模型的单一因素比其他简单规则在风险控制中的地位要高得多。
换句话说,模型概率或分数在风险控制中回归到一个因素。
如何具体应用? 一、选择cutoff,即决策点 (模型决策表) 这张图是根据模型衍生的风险控制策略决策表。
当我们的模型制作时,我们如何选择?cutoff呢? 如果该模型是一个拒绝解释的模型,则代表所有样本的分布得分;让我们先看看bin_pdrate 模型的单调性完美,从78.57%的单调性下降到1.85%,ks为23,bin_rate是箱子的比例,整体分布非常正常。
重要的是,让我们看看后两列。
这两列是通过前几列计算的每个阈值点的通过率和相应的坏账率。
随着通过率的降低,坏账也随之降低。
通常有几种风险控制KPI评估指标,如坏账率;如果KPI我们选择了680分以上、30.16%以上的通过率,这是一个简单的选择。
有些公司会复杂地计算每行的利润,然后根据利润来决定cutoff选择哪一个。
有很多方法,有的通过率可能达不到30%KPI,将选择630-680之间的部分客户进行人工审核、信件审核,或使用其他数据模型进行回收。
以下是如何使用模型的回收策略。
二、模型回收提高通过率,细化风险评估 回收是指一些被模型拒绝的相对较差的客户使用其他不同的模型进行再评估,以提高通过率。
(模型矩阵表) 以我们常用的模型矩阵为例,这与分组建模的想法相同。
在上图(图中的数据非真实模拟)中,通过矩阵坏账的比例给出不同的金额。
在申请分660-679中,我们可以通过芝麻分更好地区分这一范围内的人群风险,实现精细化管理。
在申请分660-679中,我可以选择芝麻分680以上、金额1万以上的客户贷款;因为这些客户的模型风险与申请分680以上的相同颜色相同,所以通过率可以根据模型矩阵提高。
三、多模型泄漏更合理地选择客户 (模型补漏策略) 在实际情况下,我们还会遇到另一种情况,即我们模型的数据有完全覆盖,有一定的缺失,一定的检查率,通常不是一个模型可以解决问题;因为你不能拒绝,因为没有数据,通常需要太多的模型来弥补遗漏。
也就是说,如果有5个备用模型,很有可能决定任何用户的贷款。
模型的数据源越多,客户群越多,客户风险评估越合理。
例如,如果第一个模型A没有数据,则运行模型B,按顺序转移;一般模型的应用策略是最好的,覆盖率最高的放在前面。
四、多模型组合使用的整体风险稳定 (模型组合表)图表模型名称敏感,用字母替换 这种风险控制模型不仅可以作为模型A-B Test用于测试新模型的效果(该表同时运行8个模型,每个模型分配不同的流量),然后评估测试模型的效果。
此外,通过长期的工作经验,还可以使用几个不同程度的模型,整体效果更好;主要原因是数据稳定性、数据衰减、市场等,多模型组合往往比单个模型更稳定,数据性能更好,理想效果更好。
我们不认为模型A是最好的,然后给所有的流量A,因为给A会有很大的不确定性;比如数据源停止供应,数据源失真,数据源预测质量明显下降;这些现象在实际工作中经常遇到,事后发现有点晚。
另一方面,通过几个更好模型的组合,会发现有更稳定、更理想的数据性能,图中没有淘宝模型的组合有五个模型。
5.模型日志的重要性 (模型日志) 以上是模型使用变化的所有简要记录日志,必须注意;我们有很多时间可追溯,或风险控制性能滞后,经常调查原因不能准确定位,浪费时间,最终可能找不到原因。
如果今天客户群表现不佳,我提前知道有一天模型的阈值改变了,就在今天有表现的时候,往往会很快定位。
数据风险只有两种变化,外部客户群和内部风险控制,风险控制日志的每一个变化都会带来风险变化。
所以从日志上找任何理由都是最方便的。
他就像我们写代码一样log日志很好,很方便,也很需要,直接告诉你病点在哪里。
以上是模型具体使用的一些细节,在如何选择决策点、模型回收、模型泄漏具体风险控制实施的一些细节。
希望能给读者一些思路上的帮助和谢! 特别说明:本网站的主要目的是收集与互联网运营相关的干货知识,为运营伙伴提供便利。
本网站收集的公共内容来自互联网或用户的贡献,这并不意味着本网站同意其观点,也不对网站内容的真实性负责。
如有侵权行为,请联系网站管理员删除,。