开发者

如何搭建和实现互联网金融授信领域的风控模型??

开发者 https://www.devze.com 2023-01-20 16:36 出处:网络 作者:运维知识库
jason218 2021-10-12 05:35 互联网金融其实就是互联网+金融的简称,这个词语算是属于中国特有,其实就是通过互联网的手段进行金融的交易,毕竟国有的金融机构覆盖人群范围还是比较狭窄。风控模型是互联网金融的
jason218 2021-10-12 05:35

互联网金融其实就是互联网+金融的简称,这个词语算是属于中国特有,其实就是通过互联网的手段进行金融的交易,毕竟国有的金融机构覆盖人群范围还是比较狭窄。风控模型是互联网金融的核心,能够决定一个款互金产品的生死,毕竟这个是关系到钱的安全的存在。今天我们就用一篇文章来讨论下风控模型的设计方式。

第一:什么是风控?

风控其实是包含风险管理和风险控制。风险管理,它是指如何在项目或者企业在一定的风险的环境里,把风险减至最低的管理过程。它的基本程序包括风险识别、风险估测、风险评价、风险控制和风险管理效果评价等环节。 风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或者减少风险事件发生时造成的损失。所以其实风险控制是风险管理中的一个环节。

第三:风控模型的设计纬度

从下面面的流程我们可以看到,风控模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式。模型审核同时大致分为三个阶段,它通过用户提交的数据,对用户的资质进行审核,最终得到一个评分卡的分数。对于存疑和通过的进见,需要人工进行确认。所以说,风控模型的计算策略和机制在一个公司属于绝密,规则出了核心的员工,其他人是不能知道风控规则的。

第四:如果说金融产品的核心是风控,那么风控的核心是什么?

答案其实就是: 信用评估 + 模型规则。

第一步就是获取数据

信用评估来自于用户数据,模型规则其实就是用户数据规则,信息的纬度也比较广泛,大致可以分为基本信息/行为信息/信用信息/社交信息和消费信息等。

当然获取信息的方式也是千奇百怪,主要的来源有用户提交/接口用户授权/爬虫/信息购买/黑白名单等方法。

第三步: 调整指标分数,给出评分。建立每个指标的评分规则,反复调试指标分,保证模型准确性。

笔者也只是短暂接触互联网金融方面的知识,贻笑大方开发者_运维技巧了!


360U1427302046 2021-10-12 05:52

简单回答一下,权当抛砖引玉,希望能有专家出来回答 :-D


首先要解释风控和授信

风控是风险控制,主要是控制业务流程中作弊和欺诈行为的发生授信是指企业向客户提供资金支持的行为

所以,互联网金融授信过程中的风控,目的主要是控制欺诈,核实本人身份和资料真假


领域限定:互联网上的个人信贷

不同领域的风控业务相差较大,其他领域不太熟悉。


目前主要的风控方式有3种:

线下风控:就是靠人工面对面确定身份、居所和工作单位等;线上风控:银行卡实名认证、手机号实名认证、央行征信、第三方征信、其他黑名单数据、自己黑名单、防伪冒欺诈数据……主要是各种自己获取的数据和第三方数据交叉验证,训练自己的风控模型;线上和线下结合风控:部分高风险业务,可以投入人力审核,但要注意ROI。

如果是线上风控,核心3要点有:

数据模型规则

其中,最重要的是数据,因为核心数据资源是稀缺的。

线上风控使用的数据大多属于2类:行为数据和资质数据。

做个人信贷,比较重要的资质数据是:个人身份信息、社交信息、电商购物信息、信用信息。

常用的数据采集点包括:

个人身份信息(身份证、学生证、学信网)社交信息(通讯录、通话记录、搜索引擎、微博人人等社交网站)电商购物信息(电商购物、快递记录)信用信息(信用卡、贷款情况)

以上资料,主要是由客户主动提供,再加上企业从各种渠道拿到的数据,进行交叉验证。

比较重要的行为数据有:设备数据(cookie、MAC、IMEI)、位置数据(IP/LBS/GPS)、时间属(填写速度、时间)、业务行为(资料修改)等等。


业界使用的风控模型差距不大,比较通用。

从线性的LR模型,到GBDT、随机森林,再到最近很火的神经网络,性能逐步提升。

模型的选取,主要考虑业务需求和技术能力,虽然LR比较简单,但也有很多优点,所以在特定领域特定问题上表现很好,仍被广泛采用。

具体到个人信贷业务上,需要一个非常抗过拟合、非线性能力的模型。


规则一般由经验丰富的专家来人工定义,在业务量不大的初期,完全可以通过人工规则来处理风控问题。

当然,随着业务量的增大,后期还是很依赖模型的学习能力。


常见的应用案例

paypal/支付宝在支付领域的风控:https://gigaom.com/2016/how-paypal-uses-deep-learning-and-detective-work-to-fight-fraud/


如何评估效果

有2个关键指标:准确率/召回率,分别对开发者_运维问答应误警和漏警。

准确率/误警:错误识别,将好客户当做风险点处理。需要平衡用户体验和可解释性,处罚规则不应过于粗暴。召回率/漏警:漏掉了风险,将风险客户当做好客户处理。

模型和规则的更改,在上线前,需要做很多离线和在线的测试,确保最终效果是可以接受的。


暂不清楚业界是否有其他方法,请专家补充。


其他

除了风控模型,整体的风控流程也非常重要。风控与业务高度相关,更换客户群体和领域后,风控策略、模型特征、规则就会发生巨大的变化,所以很多东西是不能通用的。比如大学生消费贷款和白领的信用贷款,所需要的数据特征就很不一样。


得瑟出毛病了吧 2021-10-12 05:54

谢邀!感觉回答完你的问题,可以写本书了,哈哈。。今天先尝试第一个问题:风控开发者_运维百科模型是如何搭建的?

我本身并不是专门从事风控这一块的,但一直对风控建模这块挺有兴趣,加之在银行的工作,对风控模型的理解如下,如有错误之处欢迎指正:

1)风控模型的作用,四个字“量化风险”;

2)进行量化的话,有两种方法:一是评级,主要是对各个指标进行打分,然后;二是建模,数学模型或计量模型。FICO就是一种评级的方法。

3)无论是评级,还是建模,第一步就是选取量化因子,通俗的说就是哪些指标可以反映客户的风险情况

4)第二步,确定模型。如果是评级的话,需要确定每个指标的分数等级和指标间的权重;如果是建模的话,需要确定具体采用哪种模型,我对计量比较熟悉,如果是计量模型的话,还要考虑指标间的多重共线性、模型的拟合优度等等问题。

3)第三步,就是需要大量数据和信息验证模型的正确性和精确性。


太平喇嘛 2021-10-12 06:00

开发者_JS百科

@神器诸葛


0

精彩评论

暂无评论...
验证码 换一张
取 消