正本清源话“征信”

李铭  北京大数据研究院专家、原央行征信中心顾问

2021.5.11

李铭:正本清源话“征信” 征信行业在中国市场已经发展了二十年,但社会上仍然在为“什么是‘征信’”而争吵,想起来也让人齿冷。本文想重谈这个入门级的话题。然而要说明什么是征信,先要说说授信机构为什么需要征信机构,为什么要创建这样一个行业。
尽管有学者引经据典,从古代文献中找出各种证据,有记载的征信活动在中国出现不早于1915年。当时的银行公会推动建立征信所,给“征信”下的定义是“取法于欧美日本诸国称作‘Mercantile Agency’的一类机构所开展的业务”(非原话)。Mercantile Agency当时翻译为“商情调查所”或“信用调查所”。上世纪三十年代在上海建立中国最早的征信所时,上海已经有了五家外国征信机构。
中国之外,征信在早期主要用来帮助商家寻找可以信赖的客户或合作伙伴。这个时代的征信活动主要是我们现在所称的企业征信活动,银行成为征信机构的客户是晚一点的事。常常被看作是征信实践楷模的美国,差不多到上世纪后半叶银行才大规模开展个人信贷业务,因为对经营金融业务的地域性限制和各州的高利贷法使得银行经营个人信贷业务没有利润。于是在很长一段时间,征信所针对的商业交易活动,交易物是物而不是钱。直到现在,从国际征信行业实践看,企业征信业务仍然主要关注“物-钱”交易,而个人征信业务则主要关注“钱-钱”交易。
征信关注的交易活动是一种特殊的交易活动。交易活动的一方多付一点钱(如称“利息”),换取交易物的事先(指付清全部费用之前)使用权。于是交易的卖方(授信方)要确认买方(受信方)未来能够按约定付钱。这在早期的商业活动中并不困难。由于交易活动的地域性局限及交易规模相对有限,企业主或店主依据自己的观察和来自他人的传言往往能够准确地把握客户的信誉情况,并不需要借助第三方的“调查”。
随着“做熟人生意”的状况渐渐被打破,了解客户的成本逐渐增加,出现了雇佣专业人员对潜在客户进行调查的需求。然而专业调查机构出现的一个重要因素是竞争对手数量地增加。虚构一个开酒馆的例子:假设镇子上只有一家酒馆,酒馆老板可以从顾客还账的实际表现决定是否允许他或她继续挂账,即便吃亏也只吃一次。但如果有很多家酒馆,这位顾客可以游走在各家酒馆之间“享受”免费待遇,直到所有酒馆都吃过亏之后才停止“薅羊毛”。于是,如果所有酒馆能够联合起来,建立一个共享的“黑名单”机制,共享客户的信誉信息,显然符合所有经营者的利益。
很显然,由于存在商业利益冲突,这个“黑名单”机制不能由任何一家酒馆来管理,只能交给与大家不存在利益纠葛的第三方。这便是征信机构。征信机构从各家酒馆获取“欠账不还”的信息,汇总以后返还给各位酒馆老板,各酒馆向征信机构支付一点费用,费用出自于节省下来的违约导致的损失。完善的商业模式。酒馆老板需要有“独立第三方”性质的征信机构,因为自己没有办法从竞争对手手里得到需要的信息。这是征信机构存在的最大理由。①

那么,酒馆老板不得不依赖征信机构收集的信息有哪些呢?酒馆老板自己无法得到而完全依赖征信机构收集的信息只有两类信息:顾客当前欠账的总量,以及在各家酒馆挂账及还账的历史。这两类信息都是需要向竞争对手采集的信息。提供来自竞争对手的信息是酒馆老板使用征信机构服务的最大理由,是征信机构存在的最大意义。其他信息或许也很重要,但可以通过其他渠道或其他方式得到,最多是个性能、成本或便捷性方面的考虑,不构成不得不成立一家征信机构的理由。例如,征信机构可以提供对顾客可信度的评估意见,但酒馆老板可以听取这些意见,也可以选择完全无视这些意见而做自己的判断。提供评估意见是有益的服务,但不是酒馆老板需要征信服务的最主要理由。前几年国内那场“征信市场化”活动的参与者没有弄清这个道理,把过多的精力和资源花在开发和销售评分产品上,而没有意识到征信机构的价值和不可替代性只反映在所占有的交易账户上。最终结果不尽人意,是个教训。
于是,征信的真正意义和价值,是收集、汇总并报告彼此为竞争对手的多家授信机构各自的债务交易信息,实现交易信息的共享,以减少交易中的信用风险。征信活动是一个闭环的过程,是信用交易生态圈中不可缺少的一环,有合理并有效的商业模式来保障各个参与者的生存。
这也同时说明为什么近年来流行的所谓“大数据征信”、“互联网征信”、“市场征信”等等“新征信”是多么离谱的概念。这些名称光鲜的商业活动或许满足信贷机构的部分信息需要,但同“征信”其实没有任何关系。
征信信息为信用评估提供了基本素材。根据行业普遍接受的理念,做信用评估希望了解信用主体的履约能力和履约意愿。信用主体在契约到期时要有钱偿债,同时又要有意愿真的拿这些钱来偿债。我们接下去来看看在“能力加意愿”的公式中,前面说到的“当前债务总额”和“借债偿债历史”这两项征信机构必须提供的信息占了什么地位。
“能力”或通过下图描述:

图中,资产指任何可变现的财务工具。可偿债资产与债务之差体现为信用主体的偿债能力,而“当前债务总额”以及“历史借债信息”是比较的基准,是不易从征信信息之外来源得到的重要信息。注意到,对于偿债能力的判断不仅在信用风险评估时起作用,也可能在规避合规风险时起作用。例如美国国会2009年通过的信用卡法案中规定,发卡机构超出申请人还款能力提供信贷产品导致逾期时要承担法律责任,于是发卡机构必须知道借贷人究竟有多大的“能力”。
“意愿”或通过下图表示: 

图中,机制约束反映为诸如征信体系这样的机制存在的威慑力(例如,“网贷违约会不会影响到未来房贷申请?”);社会约束指信用主体对自己所在的社会环境(朋友、家人、社区、职业圈和学术圈等)中的声誉的考虑;环境约束指某些外在的条件的压力(例如,“如果大家都不还债,我为什么要吃这个亏?”);心理特质包括责任心、易冲动性等心理因素,认知能力包括知识水平及做判断和做计划的能力等生理能力;其他自明。各项因素可能有一定程度的重叠,例如许多这些因素最终或许都会表现在“利益”上。此外,各因素在图中的排列并无一定顺序。例如,一些信用主体可能会将“利益”放在责任与义务之上。有些国外的研究认为决定“意愿”的最根本的因素是对利益的评估结果。
征信机构所提供的两方面信息之一的“偿债历史”信息并不直接贡献于上图中的许多因素。“偿债历史”主要通过信用主体过往的实际偿债表现间接地反映“意愿”是否存在。当然,这仅当当前债务与历史债务在上述各项因素上具有可比性时,“用历史预测未来”才可能成功。要特别提到“机制约束”这一项。征信体系之所以在风险管理方面有作用,具体说,“用历史预测未来”到目前为止表现之稳定和可靠,“机制”的威慑力疑似起到相当大的作用。换句话说,没有完善和有效的征信体系来记忆借贷和偿债历史,“用历史预测未来”未必能成功。
对“能力加意愿”的公式做了梳理之后,可以进而进行两个相关题目的讨论。一个是征信实践在信用风险评估生态圈里的地位和作用;另一个是征信监管的必要性。
前文已经说明,评分或其他形式的对受信人违约风险的评估并不是需要征信机构的根本原因,故评估是从征信数据上生长出来的一项业务,但不算是征信机构的核心业务。我们来进一步刨析一下信用评分建模过程,看看征信信息在评分创建过程中所起的作用。
下图是描述评分建模过程的一个粗略的示意图: 

基于统计学原理的分析建模过程是寻找从观察数据(或称预测数据)到表现数据之间的数学映射的过程。从图中可有四点观察:
其一,虽然观察数据来源众多,表现数据仅出自于征信机构(授信机构仅掌握本机构客户的表现数据)。由于征信机构除合作或委托开发之外一般不会将其提供给第三方(无论有偿还是无偿),除征信机构外的任何其他机构于是很难基于信用主体完整负债数据开发信用评分模型。就这一点而言,任何过分高估(不使用征信数据的)所谓“大数据评分”的能力的说法显然是没有根据的。
其二,为了解决债务“白户”不存在表现数据的问题,本世纪初国外一些机构提出“替代数据”的概念,使用类似债务数据的非信贷信用交易数据作为信贷表现数据的替代。“类信贷”信用交易数据需要满足几个条件:首先,它们必须是“信用”交易数据,即交易具备“先服务、后付费”的特性;其次,它们的“借债”和“偿债”方式必须类似于借贷,即主动申请、主动付款、周期性付款等;最后,它们必须同信贷一样,属于“影响消费者(或企业)重要利益”的信用交易活动。业界和金融监管机构一般将替代数据看作是预测能力弱于征信数据的另类数据(例如,还房贷和还燃气费的意愿并非一致),仅在不存在征信表现数据的情况下使用。注意到,任何债务“白户”在持有第一个债务产品达一段时间(通常是6个月)以后就不再是“白户”,所以替代数据的生命期其实并不长。应该强调的是,“替代数据”概念的提出主要解决缺少表现数据的问题,不是缺少观察数据的问题。将“大数据”统称“替代数据”的说法,没有理解“替代数据”的真正含义。
其三,选择使用哪些数据做预测数据通常有多方面的考虑。除去对数据预测能力、数据质量、数据获取成本、获取渠道稳定与否、数据加工难易等因素的考虑之外,还需要考虑数据使用是否合规以及是否可能招致道德、文化、习俗等许多方面的麻烦。这其中,社会及监管对授信机构选择数据的宽容度会大一些,因为一来社会和监管愿意给予授信企业较大的创新空间,二来单一企业错用数据对整个市场的可能造成的冲击和对消费者可能造成的伤害都相对有限。征信机构为所有授信机构提供同样的信息,一旦出现问题,影响会广泛和深远得多,于是征信机构需要承担的合规责任远大于单一的数据中介机构、专业建模机构或授信机构。
最后,上图中浅粉色的箭头指示基于征信数据的评分建模过程,浅绿色箭头指示的是基于替代数据的建模过程(脱离了白户状态但未积累到足够长的负债历史时可因混合使用征信数据和替代数据建模而受益)。这些类型的评分产品一般而言相当准确且稳定。然而这些模型用过往表现预测未来表现,依赖于一个假设,即从过去到未来评分主体的状态(工作、居住、收入、日常花销等)要相对稳定。使用“大数据”的长处是更能够反映评分主体状态的变化,能够更准确地识别个别评分主体的特定情况,但“大数据 ”模型的稳定性可能会差一些,或许需要较频繁地迭代。在一定程度上,“大数据”在建模中恐更适于作为征信数据的补充,而不是作为征信数据的替代。另外,有些“大数据”模型参照非征信表现数据建模,然后拿到授信场景下使用,在预测的合理性和合规性方面均令人生疑。
第二个题目是关于征信监管。征信监管的必要性来自于征信行业的特点。上文已经谈过,征信机构的根本使命是收集和报告信用主体的债务总额以及负债和偿还历史两项信息,因为这两项信息极端重要且非征信机构所不可得。债务和偿还信息要完整才有价值,于是对任何一个市场来说,信息的“全面和完整”的要求不可避免地会导致信息的唯一性和垄断性,②否则将影响市场的效率。由于全市场都会访问这同一个“唯一且垄断”的信息,一旦信息中出现任何问题而错误地影响了信用主体的金融信誉,整个信贷行业都会被误导,而该信息主体的经济利益可能会受到严重损害,于是需要有严格的法律和法规来约束征信机构的业务实践,保护市场活动参与者特别是弱势群体的经济利益。归纳起来,征信行业需要严格监管的理由有三个:首先,征信行业服务于信贷(或债务)市场,而信贷(或债务)影响到消费者(或企业)重要利益;其次,征信机构采集全市场的借债和偿债信息,该信息为信贷或债务市场所必须,且无法通过其他渠道得到;最后,征信市场对效率的追求终将导致征信信息及征信服务的垄断性,而垄断的市场若不加节制可能严重影响市场的公平和公正、严重损害市场活动参与者的利益。丢失了这三个理由的任何一个,征信监管的必要性则会被质疑。例如,如果征信机构服务于共享单车租赁市场(非消费者重要利益),如果征信机构收集并报告债务及偿还信息之外的消费者/企业信息(授信机构的选择众多),如果征信机构仅服务于市场的一小部分(信用主体有其他选择),对征信行业的独特而严格地监管将不再有足够的理由。
需要对征信行业进行严格监管的理由也同时说明为什么征信机构不能在核心业务中使用“大数据”。上世纪70年代以后各国对征信机构的监管要求中均规定消费者信用报告只能使用“事实”信息,不能使用“传闻”信息。世界银行发布的《征信通用准则》中要求信用报告信息必须“相关、准确、完整并更新及时”。“大数据”就其本质而言明显难以满足这些要求。无怪乎迄今为止,尽管“大数据”在信贷信用评估领域得到广泛地应用,世界上几乎没有任何国家的征信机构将“大数据”认可为征信数据,③也没有哪家征信机构使用信贷交易数据和替代信用交易数据之外的“大数据“开发信用评分产品。
脚注:

①为了简化对问题的讨论,这里只涉及到行业内的信息共享,没有谈到不同行业之间的信息共享。但目前的金融信贷机构与征信机构的关系,仍然主要体现为行业内的信息共享。

②注意这里强调的是征信数据走向唯一和垄断,并不等同于征信机构对市场的垄断。高效率的市场上应该只有一份征信数据。多少家征信机构手中掌握这份数据不是个原则问题,只要各家机构有合理并可行的商业模式。当然,征信机构数量过多造成社会资源的浪费,也导致商业模式设计上的困难。

③也许唯一的例外是南美一家征信机构对心理测量学数据的使用。在众多不同类型的“大数据“当中,电商数据、电信CDR数据可以满足“基于事实”的要求但相关性成疑,社交媒体数据、上网行为数据的准确性广泛为人诟病。或许心理测量学数据是唯一一类在一定程度上能够满足《征信通用准则》要求的非信用交易数据,但未必一定能通过隐私保护立法的审查。

发表评论

邮箱地址不会被公开。 必填项已用*标注