欺诈军团竟进行技术输出 互金企业如何用大数据有效风控?
2017-07-17 19:07:00 来源:搜狐财经

  中新经纬客户端7月17日电(毕彤彤)互联网金融和大数据的浪潮中,大数据风控成为各家金融机构需要构建的重要核心竞争力之一。

  在日前举行的2017朗迪中国峰会上,上海市互联网金融行业协会联合普华永道发布了《大数据风控行业实践研究报告》(以下简称“报告”)。报告指出,大数据风控体系已成为现代金融机构风控的发展方向。

  

  2017朗迪中国峰会 中新经纬 毕彤彤 摄

  将大数据变为信用评估工具

  大数据风控面临着数据来源、建模等各种挑战,如何应对挑战?报告建议从外部数据引入、数据平台和风险数据集市、反欺诈模型、模型建设及风控输出,客制化营销价值分析这些方面考虑。

  上述报告指出,目前互联网金融机构运用大数据风控技术,将海量用户的网购、社交、互联网金融等各种数据,通过强大的技术手段进行规范化、标准化处理,转变为信用评估工具,实现从数据到信息的质变。

  51信用卡金融中心总经理蒋燕青认为,目前国内的信用与数据实践模式是多元化的,但从最后的商业性结果来看,基本上都要用数据、技术和场景之间的匹配来实现大数据领域的新信用模式探索。目前整个行业正在逐步形成一种可以和传统金融信用和风控模式相互配合,但又能产生自身独特信用生态的大数据运用模式。

  恒昌公司首席技术官薛正华表示,通过大数据分析以及共享体系的建立,能更清楚的认识到一些客户的风险情况和信用情况,整个信贷行业,也更加便捷、高效、低成本。

  “我们会根据用户的行为偏好、履约能力、信用历史、资产历史,包括学历、工作地点等各种数据,为用户进行多属性多角度的用户画像体系。”薛正华介绍到。

  巧妇难为无米之炊,如果风控体系是一台“发动机”,那么数据和应用方案就是“燃油”。如果数据纯度不高、质量低可能会直接导致风控效率低下甚至出现故障,进而引入劣质资产,影响资产端质量。

  凡普金科创始合伙人兼董事长张辉告诉中新经纬客户端(微信公众号:jwview),现在互联网金融公司大都在探索用弱相关数据做风控模型,比如电商消费数据、通讯数据、天气数据等,而不是传统金融机构用的收入、工作稳定性等强关联信息。

  “强相关的数据维度比较少,因此欺诈概率也会较高,欺诈团体只需要伪造十几个数据就可以。而弱相关的数据颗粒非常多,要伪造这一套数据,难度会更高。因此,很难说哪种数据更优,关键在于依据数据来探索自己的风控模型。”张辉进一步解释道。

  张辉介绍到,数据来源的不同也决定风控模型的差异,传统金融机构强关联信息是采用线性相关的模型,而弱相关数据由于数据来源广,采用的是决策树、随机森林等来构建风控模型。

  打败欺诈“军团”

  “参加培训班学习利用信贷平台风控漏洞进行欺诈,且包学包会;去偏远山村购买当地居民身份信息再去进行欺诈信贷行为”,这样的场景每日都在上演,互联网金融平台也与这些欺诈军团斗智斗勇。

  《大数据风控行业实践研究报告》总结出金融行业风控的五个场景需求,分别是降低欺诈、提升审批、激活客户、助力催收、增强合规。其中降低欺诈被认为是重中之重。

  据了解,当前互联网金融平台信贷业务的风险并非集中在信用风险,而是集中在欺诈案件。大量的欺诈人员及黑灰产业链的存在,将互金平台信贷业务当成资金来源。报告指出,依据信用卡行业的经验,约7成的申请欺诈是非孤立行为,涉及团伙欺诈,而不少于6成的团伙欺诈,被发现会同时攻击多家机构。

  “关键是欺诈团伙还会进行技术输出。” 据蒋燕青介绍,在二三线城市,会举行一些特殊的“培训班”,召集上百人讲解如何利用风控的漏洞,如何利用数据做欺诈,并且这个班还有一个特点——包教包会,本期不会下期重学,且已经变成一个产业。

  蒋燕青还指出,在偏远山区,人们愿意将自己的身份证以很便宜的价格出售,两三年前在福建的山区,有人用两筐鸡蛋换一个真实的身份证,所以用真实身份证做假银行卡非常普遍。

  TalkingData首席金融行业专家鲍忠铁对此深有同感,其指出,五年前大部分的电商欺诈、互联网欺诈来自于福建的泉州,但现在这些欺诈技术已经输出到郑州和成都。前几年,50元就能买到一套身份信息,现在一套完整的身份信息也只要500-1200元。

  欺诈的低成本,也让这一黑产愈发庞大。鲍忠铁提供了一组数据,网络黑产的从业者大概超过40万人,依托上下游的辅助产业大概有160万人,年均的产值约1100亿元。

  为了抵制成千上万的欺诈军团,各家互联网金融平台也都重点打磨反欺诈模型。薛正华介绍,恒昌利用数据风控和人工干预等手段进行反欺诈,包括人脸识别、自然语言处理、大规模的数据图谱等。

  薛正华进一步解释,有效的图数据库技术也能有效分辨欺诈团伙。每个用户都有多维度信息,如地点、工作、通讯录等,因此用户各信息间会有关联。如果一个用户周围有三四个人有逾期或失联现象,那就基本可以将此用户排除在外。此外,薛正华称,恒昌利用这个数据库还曾通过关联用户找到了失联用户。

  张辉介绍到,会利用多个数据源来进行交叉验证,来排除欺诈风险。“比如网购行为,每个月花多少钱,买什么类型的东西,这跟电话费都会有相关性,如果差异非常大的话,那可能就会有欺诈的风险。”(中新经纬APP)

  中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其它方式使用。

  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉