互联网金融的两个部分,分别是流量和模型。其中,模型又分为实然和应然两个部分。实然是指客观存在的事实,应然是指事实与风险的内在联系。今天我和大家分享的是实然究竟包含哪些内容,其中有什么界限,有什么亟待解决的问题,以及数联铭品在实然领域的一些实践。
实然是指客观存在的事实。实然的主体包括两种,自然人和法人。实然的内容涵盖了主体的方方面面,比如财务状况、基本信息、关联关系、法律信息、交易信息、客观环境、履约记录等等。实然的一个应用是画像,即通过主体的相关事实推断主体的一些特征,从而对主体的可能行为有一个快速的了解。这个应用已经非常广泛。大家熟悉的“猜你喜欢”模块正式利用用户画像,预测用户可能购买的产品。目前已经有不少企业在从事这方面的应用,这里不再敷述。
实然的另一个应用是征信。大数据征信也是当下非常热门的话题。根据定义,征信是专业化的、独立的第三方机构为个人或企业建立信用档案,依法采集、客观记录其信用信息,并依法对外提供信用信息服务的一种活动,它为专业化的授信机构提供了一个信用信息共享的平台。传统的征信方式是各个部门独立搜集征信对象的相关信息,再由征信机构进行汇总和发布。进入了大数据时代,数据的搜集渠道空前扩张,任何一家互联网企业每时每刻都在产生大量数据。同时,也不断有更多数据被公开出来。因此,征信不再局限于整合各个部门独立搜集的数据,而是朝着数据来源多元化、异构化、海量化发展。
实然部分看似简单,展示客观存在的事实即可。实际上实然有诸多边界,任何边界的跨越都会给实然的应用带来威胁和变革。
1、个人隐私与公共信息的边界。这个话题目前国内讨论的最热烈,也最受关注。这块国内的《征信业管理条例》已有明确的红线规定。基于我们与合作伙伴的共同研究,个人信息包括两大类:个人敏感信息和个人一般信息。其中个人敏感信息的一般原则是指一旦遭到泄露或修改,会对标识的个人信息主体造成不良影响。并且,各个行业的个人敏感信息的具体内容也不同,根据接受服务的个人信息主体意愿和各自业务特点确定。比如,个人健康信息,各级医疗卫生计生服务机构以及各类数据服务商在服务和管理过程中产生的个人基本信息、医疗卫生服务信息等,在某些情况下也属于个人敏感信息。一般来说,个人敏感信息可以包括身份证号码、手机号码、种族、政治观点、宗教信仰、基因、指纹等。在一些情况下,个人的相关信息,诸如年龄、性别、公司、职业等,通过组合在一起可以很容易定位一个人的信息,也属于个人敏感信息。此外,个人的属性标签,也就是将相关信息进行一定的泛化,形成模糊一些的描述性标签,也就是个人用户画像的内容,是否属于个人敏感信息,是当下激烈争执的一个点。
2、歧视与公正的边界。什么是歧视?歧视指因为信息主体的某个缺陷、缺点、能力、出身等因素得到不平等的对待。比如,经过模型分析,得出出生于某个省份的人信用记录普遍不良,从而对所有出生于这个省份的人进行较低的信用评价,这是地域的歧视。再比如,经过模型分析,得出总监职位的人信用记录普遍优于入门员工,从而依据职级对个人信用评价,这是职级的歧视。歧视与公正的边界,国内几乎无人谈及。但它在西方发达国家已经引起了非常广泛的讨论,并形成了相关的广泛接受的约定。常见的不得用于信用评估的歧视有性别歧视、种族歧视、常见疾病歧视、地域歧视、外貌歧视、智力歧视等等。随着我国社会的发展,歧视与公正的边界的讨论会很快进入公众的视野。
3、独立与利益冲突的边界。独立包括指实质上的独立和形式上的独立。实质上的独立,是指信用评估机构在进行信用评估时其专业判断不受影响,公正执业,保持客观;形式上的独立,是指信用评估机构避免出现这样的情形,使得拥有充分相关信息的理性第三方推断其公正性、客观性或专业怀疑受到损害。这在传统信用评估行业容易发生,因为传统信用评估行业主要基于人的工作,而人的社交环境较为复杂,很难去评价怎样的情形才能完全保证实质和形式上的独立。在大数据时代,因为主要工作基于计算机而非人,所以只要能够保证形式上的独立,基本就能保证实质上的独立。
数联铭品的浩格云信企业全息画像,是我们在实然方面基于公开数据的实践。我们的主打产品是企业关联方图谱,基于全量的企业工商注册信息,可在一瞬间实时生成关联方拓扑图,并且可以互动操作,追踪每一个关联节点的直接关联方。同时可以实时搜索和展现拓扑图中任一节点与目标公司的关联关系链。除此之外,企业全息画像还集合了在诉信息、裁判文书、商标专利、招标中标、招聘人事、土地财产等各方面企业相关背景信息,打造一站式的非财务信息搜索服务。企业全息画像作为第一个完全基于公开数据的征信产品,开创了大数据征信的先河。
目前数联铭品的企业全息画像产品,广泛用于银行、P2P等信贷机构,会计师、PE/VC等股权融资机构,以及新三板、证监局、人民银行、金融局等监管机构,为客户提供目标企业的基础背景信息,其中尤其是关联方图谱,服务于反欺诈、贷前/投前、贷中/投中、贷后/投后等一系列风险管理过程,提供了所需的基础数据以及相关线索。其中,我们根据企业业务本质初步总结出了关联方图谱的相关特征,例如关联方图谱呈现太阳形则一定是投资型企业,若呈现菊花形则一定是中介型企业,等等。这些结论为大家提供了一个超越普通的基于财报评价企业的维度去看待企业,使我们可以一眼就看出企业业务的本质,从而迅速对企业风险做一个判断。
数联铭品希望通过非财务数据丰富风险管理的基础数据。过去金融机构过多基于财务数据,对非财务数据仅做定性分析。发展到今天,我们看到会计师的服务边界已经模糊,从过去的仅着重财务报表到今天的着重对目标企业客观事实的描述。在信贷行业,尤其国内的中小微企业,财务数据非常不可靠,导致过去借鉴自西方的基于财务数据的风险管理模型水土不服。我们需要重构一个基于企业完整画像的风险管理模型。这个模型,就是明天我们将讨论的基于大数据的风控模型,也是数联铭品在风控领域的最新实践。
登录 | 立即注册