知识图谱在金融行业的应用展望

知识图谱在金融行业的应用展望

随着大数据时代的到来,各行各业使用数据的方式都发生了巨大的变化。在金融行业中,数据是异常重要的资源,如何突破既有的数据使用模式,更高效、精准、迅速地获得数据带来的价值,一直都是金融机构关注的问题。利用基于关联关系的知识图谱概念,可以突破现有的关系型数据库的限制,在金融行业中让数据发挥更大的价值。



什么是知识图谱?

知识图谱,本质上是语义网络,是一种基于图的数据结构。由“节点”和“边”组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。

现实世界中,人、车、手机号等实体对象可简单抽象为一个个实体点,两个实体之间的“关系”用一条线来表示。在知识图谱的体系里,可以做到“万物互联”,用高度抽象的数据表达方式最大限度地还原真实世界,从而在大量的关联关系中挖掘数据的价值。在金融行业的数据中,存在着大量的实体和关系,将其建立连接,可以突破传统的计算模式,从“关系“的维度深度整合金融行业现有数据,结合外部数据,更有效地挖掘潜在客户、预警潜在风险,帮助金融行业各项业务提升效率、发挥价值。



图1:明略数据产品SCOPA,专注关联关系,用数据还原真实世界

相较于传统的关系型数据库,建立知识图谱使用的图数据库更擅长建立复杂的关系网络,并在关联查询的效率上比传统的存储方式有显著提高,尤其是涉及到2、3度关系查询。另外,基于图的存储在设计上会非常灵活,一般只需要局部的改动即可,而关系型数据库灵活性方面比较差。实体和关系存储在图数据结构里是用数据还原真实世界,挖掘数据关联关系的最好的方式。


如何建立企业级知识图谱产品?

针对于指定行业、企业建立一个知识图谱产品首先需要基于行业特定的数据特点创建统一的数据模型和统一的数据视图。有了统一的数据视图,接下来要对结构化和非结构化的数据进行智能地治理和整合,并通过关联计算建立数据间的实体联系,并通过图数据库的关系表达出来。在此基础上,基于业务模型对全量数据进行机器学习,然后再通过可视化、交互式接口,支撑业务场景。


图2:如何建立企业级知识图谱产品


知识图谱在金融行业应用展望


——营销类应用

1)挖掘潜在客户:

挖掘潜在客户一直是金融行业关注的一项重要应用,通过现有数据和外部数据精准、迅速地找到相关业务的潜在客户,对于银行业务的提升会起到较大助益。我们可以基于现有银行客户建立社交网络知识图谱,根据不同的交往方式和频次定义图谱的关系模型。对客户的亲属、朋友、同事、同学、陌生人等进行相关的社交挖掘,评估关系紧密度。比如,基于现有VIP客户,挖掘相关联系人及其爱好,或可以在现有客户中去发现具有共同爱好的一个组织,从而可以有针对性地对某一部分或一类人群制定营销策略。

2)深挖客户潜在需求:

除了挖掘潜在客户外,我们也需要挖掘现有客户的需求,针对他们的特点推送相关产品。当我们建立好一个基于银行客户关系的知识图谱系统后,可以进行弹性扩展,如增加车辆信息、个人爱好、行为等。结合多种数据源,更加精准地分析客户行为,了解客户潜在需求,进行精准推送。

以上的业务不仅可以针对个人客户,还可以针对企业级客户。分析企业级客户的资金关系、法人关系、上下游投资关系、相似企业业务关系等,为企业推荐合适产品、服务。

 

——风控类应用


1)反欺诈应用:

在反欺诈领域,知识图谱同样有适当的应用场景。最近几年,金融欺诈的形式多种多样,提供虚假资料,团伙欺诈,内外勾结等手法越来越“高明”,在这种情况下,原来通过单点突破进行反欺诈的方法已经远远不够,需要我们建立起一个积极有效的知识图谱。反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为机器可以理解的结构化数据。在这里,我们不仅可以整合借款人的基本信息,还可以把借款人的消费记录、行为记录、关系信息、线上日志信息等整合到反欺诈知识图谱里,从而进行分析和预测。

除了申请阶段的反欺诈,通过构建已知欺诈要素(手机、设备、账号、地域等)的关系图谱,全方位了解客户海量风险数据的离线统计分析,按主题要素收集风险运营的结果反馈,建立客户风险特征信息库,优化风险模型和规则,还能做到交易阶段的反欺诈。


2)内审内控应用

同样,借助关系挖掘和知识图谱,我们也可以帮助金融机构提高内审、内控系统的效率和精度。在防范内外勾结等方面帮助金融机构,比如对受监管人员的邮件和账户往来进行数据挖掘并构建关联关系网,可以及时发现勾结外部人员或者账户异常往来的违规行为。

 

3)反洗钱应用

在反洗钱领域,我们同样可以帮助监管部门进行有效的监控,通过对关系账号进行逐级挖掘,可以找到隐藏在背后的洗钱账号。相比单独账号、关系的识别,对反洗钱团伙的挖掘难度更大,这种组织往往隐藏在在非常复杂的关系网络中,很难被发现。我们只有把其中隐含的关系网络梳理清楚,同时从时间、空间多维角度进行分析,才能识别潜在的风险,发现隐藏的反洗钱团伙。

 

——预测类应用

1)潜在风险行业预测:

基于多维度数据,我们可以在客户、企业、行业间建立起紧密关联的知识图谱,从行业关联的维度预测风险。通过对行业进行细分,根据贷款信息、行业信息建立关系挖掘模型,并通过机器学习进行模型的训练,可展示每个行业及与其关联度最高的几个行业,如果某一行业发生了行业风险或高风险事件,我们可以及时预测未来有潜在风险的关联行业,金融机构从而可对相关行业的风险做出预判,尽早地发现并规避风险。

2)潜在风险客户预测

通过建立客户、企业、行业的知识图谱,也可以将行业和企业之间数据进行连接,基于对行业的潜在风险预测,及时发现行业风险、系统性风险相关联的企业客户。比如某省最近某行业的连续出现了多笔逾期贷款,通过对行业和客户的知识图谱进行分析,我们也可以及时发现可能位于关联行业,也有可能位于上下游潜在的其他存在潜在风险的客户。

未来,机器利用数据的方式一定会更趋近于人脑,利用知识图谱,我们可以真正做到让机器读懂真实世界,通过分析、挖掘数据为人类的决策提供支持。明略数据经过长期的思考和实践,以大数据关联关系分析挖掘技术为核心研发了SCOPA产品,可以将海量多源异构的数据打通关联整合在一起,并且通过图数据库技术为全量数据建立可视化的关联关系网络,帮助金融行业实现更好的数据应用。

图3:明略数据SCOPA产品理念


(完)

 

作者:明略数据姜渊、黄桦、赵奕

个人资料
snowice
等级:-2147483644
文章:4篇
访问:4.2k
排名: 34
推荐圈子
上一篇: 恒昌:数亿实体和数十亿关系的图数据库在风控上应用
下一篇:知识图谱如何助力实现智能金融
猜你感兴趣的圈子:
互联网+金融
标签: 图谱、行业、客户、潜在、知识、面试题
隐藏