额度模型初探(一)粗暴方案
长时间没写文章了,最近在忙一些自己的事情,补一下去年就留下的作业,虽迟必补!!!
这次这个文章写写自己在额度和增额体系上的一些探索和想法,欢迎各位交流(关注公众号加我哈哈哈)
接着去年的额度模型的文章,不知道大家还记不记得
34er5:额度授予模型(评价指标)
先说一个指标,授信规模 = 平均授信额度*授信通过用户数
这个指标描述了授信的规模,直接影响了在授信后一定时期的用户动支金额的上限,在现在这个阶段用户流量见顶,单日的授信用户规模逐渐下行,如何保持规模依赖上面的指标其实就只有一个办法提高平均授信额度。这个坑先挖一个,额度模型的事情中间我会解释为啥要扯这个,哈哈哈。
额度模型的开发
基本的额度模型开发的流程主要是基于风险分档再加上各类资质维度变量的额度分配,这里主要是策略同学用画格子的方式,通过将主风险评分进行多档位划分,然后确定每分档的额度上下限,之后在对应的分档内部应用其他维度,例如收入系数,负债系数或者其他资质维度给用户的在分档内的额度系数变动最终获得用户最终额度的一个过程,该方法在刚开始的时候会比较稳健,额度因子的规模也相对较小,但是用户的额度比较离散不够平滑,可能百万级别的用户的额度空间在几百到几千的规模,未能实现额度的精细化构造,同时用户和用户之间不同维度的差异在额度上的差异无法体现,基于这个因素可以应用机器学习模型的方式结合之前已有的用户数据做用户额度的精细化打分,体现用户在不同额度因子条件下的额度差异,真正实现一人一定额,这里有一个大前提就是额度已经给了一个阶段,积累大量不同额度情况下的用户风险表现。
额度模型的开发主要是分成两个阶段:排序阶段、映射阶段
为啥要做成两个阶段的模型第一个排序是说当前的模型开发是期望构建一个算法模型可以有效的反应额度的高和低的情况,降低由于时间因素导致的相似用户给了不同额度的情况(策略不断的调整导致)基于这个排序值可以在后续的额度映射阶段来实现最终用户额度的体现,方案如下图,当时有两种方案,一种方案是卡高和低额度然后做分类排序模型,另一种是应用回归技术,但是需要做精细的样本筛选排除额度实验流量影响导致的建模样本,将样本额度/max额度获得0.x-1之间的额度排序值,通过回归模型来获取排序值。排序值不受额度量纲的影响后续的映射可以按照不同方式来进行设置提高了最终生成用户额度的灵活性。
排序阶段:
如果应用了分类模型会出现大量中间样本排序能力下降的情况,需要应用校准函数来对这个排序值校准,这个应用了点击率预估里面的分数校准,主要想法是对数据做了一定的采样(高额样本/低额样本排除了中间样本)会对排序值造成一定的偏差,需要对偏差值恢复得到最终的排序值;(上述操作会对模型带来一定的复杂度)
回归方法则不需要做这个操作直接建模和输出
映射阶段:
在排序模型构建成功以后,映射函数的设计做了简单粗暴的设计,当时的设计主要考虑的是平滑额度,因此映射函数选择和分位点映射方式,获取原始额度的分位点,然后将该分位点应用与排序映射值,不同分位点之间的映射采用简单线性公式映射,也可以有比较复杂的映射函数(例如贝塞尔曲线),但是无论哪种本质是一样的就是一种投影方式
下一节扯一扯模型的效果和offline测试&&online测试的效果