查看原文
其他

人物访谈 | 冰鉴科技CEO顾凌云:从梁朝侯景之乱中,发现做好征信的启示

2016-07-25 人物访谈 OF  爱分析ifenxi


冰,明净;鉴,镜也。“冰鉴”则比喻明察秋毫、洞悉内情。《冰鉴》是曾国藩所著之书,是一部总结其自身识人、用人心得而成的传世奇书。

冰鉴科技的取名正是来于此。在CEO顾凌云看来,书中所体现的识人要诀和学问,与冰鉴搜集不同维度信息,对小微企业和个人做出信用评估并量化评分有相似之处。



顾凌云在美国生活了16年,先后在知名金融科技公司ZestFinance、Kabbage任职,并担任ZestFinance算法模型负责人,领导开发了前四代风控模型,奠定了为没有信贷历史的贷款申请人进行信用评估的算法的基础,同时在算法方面获得了美国多项专利。

此外,顾凌云还是美国Turbo Financial Group联合创始人和首席风控官。在大数据的基础上,利用自己的核心算法为机构客户提供个人和企业的信用评估服务。

顾凌云可以说是精通金融、大数据和机器学习的行家。

近几年,随着中国金融业的发展,顾凌云发现与美国相比,中国在金融领域上的创新具有很大的发展空间,并且为以科技驱动的公司发展营造了有利环境。

2013年,他选择回国发展。

顾凌云先在IDG资本做了两年驻站企业家,观察中国金融行业。经过更深入的观察,他逐渐发现有一个极大的空白市场还没有人做,那就是独立的第三方征信平台。于是,在2015年,他创办了冰鉴科技。

在回国之初,顾凌云说服了14位美国同事一起回国创业,因此,冰鉴初创团队具备其独特的技术优势。而技术,也是顾凌云反复强调并引以为傲的地方,他认为冰鉴最大的特点,便是立足于技术,利用技术对小微企业和个人征信进行革新和改变。

近日,爱分析对冰鉴科技CEO顾凌云进行了专访,顾凌云博士在征信和科技领域经验丰富,兼具美国和中国征信经验,可以说是征信行业里的资深专家。

在访谈中,顾凌云博士从企业征信发展方向、企业征信技术优势、美国征信市场借鉴意义等角度,深入阐述了自己的理解和观点。现摘选部分访谈内容,与各位分享。

顾凌云

冰鉴科技|CEO

小微企业征信护城河足够宽,可以兼容个人征信

爱分析:为什么选择从小微企业征信切入?

顾凌云:对于我个人来讲,企业征信和个人征信二者之间,并不是不可逾越或者不可互换的,二者之间是有方向性的,企业征信可以向下兼容个人征信,反过来个人征信无法向上兼容企业征信,这跟企业征信内在的逻辑有关系。

首先,做企业征信,一是要对小微企业的贷前进行风控,包括企业的税务、流水、经营状况等等;二是要对小微企业的贷后进行分析;三是对于企业法人和主要股东的征信,通常有些企业的实际控制人既不是法人,也不是主要股东,甚至没有出现在任何一个和企业相关的名目当中。

当然,冰鉴本身要解决的问题,也是一个从0到1、从1到8的过程,我们并不希望从0直接跳到10。因此,冰鉴在初期并不会过多关注边边角角的问题,或致力于解决所有问题,主要还是从企业征信的贷前、法人或者股东、贷后这三大方向来解决问题。

其次,从这三个方向来讲,企业征信自然而然就包括了个人征信,只不过它包括的是一个相对比较特殊的群体,或拥有企业,或部分参与企业经营的个人,但从理念的角度看,分析的方法论几乎是一致的,这就决定了企业征信可以兼容个人征信,并且,小微企业征信的护城河在技术门槛上面相对会更高一点。

再次,小微企业的数据源天然会形成一个壁垒,跟个人征信相比,企业征信的数据来源更多。然而数据源本身的质量会更加参差不齐,因此对它的清洗和要求都会更加高,也更加有挑战性。

最后,从市场发展、技术门槛和监管风险的角度来看,一是美国个人征信市场是三大巨头鼎立格局,而中国个人征信市场,在我看来,在5年之内一定会收窄成5-10家。同时,美国市场还有一个特点是,在主流征信局出现之后,一定会有评级机构出现,也就是以数据源为依托提供量化征信,但只是一个特定小方向的量化征信,中国也一定会出现类似的评级机构,并且应该是50—100家。

二是对于个人征信机构来说,所有的变量和维度都是高度趋同的,基本上是性别、年龄、学历等个人身份信息。另外,做好个人征信,更多的是行政、地推等资源和因素糅合在一起,包括是否能以更便宜的价格拿到更多的数据源,是否能保证用户的粘性。因此,从某种程度上看,对于个人征信,技术并不是门槛。

三是个人征信还可能具备高监管风险。未来监管会越来越严格,一定会以个人征信作为切入点,出于保护个人隐私的需要,个人数据的使用会逐渐常规化,很多个人数据将不能再使用。而这在企业征信中是不存在的,因为企业本身就是为公众服务的,比如不管上市不上市,企业的财报对某些机构来说就是应该披露的,从这个角度来说,小微企业的监管风险也远远小于个人征信。

所以这几点加在一起,对于我来讲,第一,如果做小微企业征信,并不意味着个人征信不能做,第二,从小微企业征信本身来讲,它的难度比较大,并不是所有人想竞争,就能竞争的,这就是之所以选择小微企业征信的原因。

爱分析:对比美国,邓白氏是美国企业征信领域的巨头公司,那么它有涉及个人征信吗?

顾凌云:这个和美国征信市场的早期发展有很大关系。大概在1840年到1860年,美国个人借贷需求的满足,往往是依靠社区银行或信用社,并不取决于大规模全国性金融机构的借贷,因此市场对于量化征信的需求并不明显。

但是相反,全国企业征信的市场需求就很大,因为往往地方融资不能一次性解决其融资需求,所以,全国银行对于企业借贷的需求强于个人借贷。这就是邓白氏存在的时间远远长于三大个人征信公司的原因,也是邓白氏上市时间早于它们三个的原因。

到了上世纪60年代,由于FICO出现,才使得三大个人征信局在搜集数据的前提之下,有了量化评估的可能。也就是先有了邓白氏对于企业基础事实数据的评估,再有了三大个人征信局对于个人基础事实的评估,然后三大征信局再把数据给到FICO,FICO量化之后再返还给三大征信局,才形成了一个泾渭分明的格局,征信局就是征信局,只做数据搜集的事情,FICO就是FICO,只做量化的事情。 

这种明确的分工在中国还没有出现,现在中国还会是做征信的想做下游数据的事情,做数据的想做上游征信的事情。这可能是中美之间会有不同的地方,但这在我看来,区分也可以是微乎其微的。

回到这个问题,邓白氏初期提供的是企业基础运营数据,而且因为市场对于个人征信需求不大,所以邓白氏在长时间内,一直没有介入到个人征信领域当中来。另外,美国相对来讲,比较信奉专业的人做专业的事,即使是三大征信局也会留出一些空间给FICO做征信。

所以从这个历史沿革的角度上来讲,邓白氏在早期没有切入个人征信,之后就没有切入个人征信的机会了,但这件事情目前在中国几乎不成立。

爱分析:您怎样定义“小微”?

顾凌云:“小微”有很多种定义方法,有以人数定义的,比如雇佣人数不超过50、150,或者200人;有以营收定义的,比如一年营收不超过3000万;还有以时间定义的,比如企业的存续期不超过3年或5年的,等等类似这样的。

对于冰鉴来讲,我们也会考虑这些因素,但不会把它们作为评估小微企业的主要标准,我们定义“小微”最重要的标准,是其借贷金额。

比如我们认为150万以下的纯信用贷款,往往只会是小微企业在做。事实上不能百分之百区分出来,但在实际的金融实践中,一般大企业是不会借150万的,所以自动就会通过借款金额区分开来了,而且这个区分相对来讲还比较有效的。

最关键的是,这对于我们后面的建模来讲是比较有意义的,比如说30万以上的小微企业借款所表现出来的形式,和30万以下的借款是完全不同的。

30万以上的,几乎都是以小微企业注册的企业为单元来进行借款;而30万以下的,尤其是十几万波动的,往往是以个人的形式和名义来借款,尤其是个体户、工商个体户,但也是为了企业的经营和发展来借款的。

这样相对来讲,就会以比较清晰的方式定义小微企业的借贷。因此,冰鉴并不去界定什么是小微企业,而是去界定什么是小微企业贷款。

爱分析:所以冰鉴也会覆盖30万以下借款?

顾凌云:是的,只不过是30万以下和30万以上,企业的表现形式、冰鉴的建模方法,以及对应的模型形态是不同的。

建立三级风控,解决小微企业征信难点

爱分析:相对于个人征信,小微企业征信的难点是什么?

顾凌云:举个最实际的例子,对企业网上的留存信息进行舆情分析,当然这件事情在企业征信和个人征信中都存在,但是企业征信更为重要。

比方说e租宝,如果只是简单将一个企业有没有被法院裁决、有没有上黑名单,来作为对于企业征信主要的判断标准之一,那么就会发现对于e租宝来说显然不合适,因为很多企业从基本面的角度来讲,已经处于出问题的边缘。

但出问题不意味着法院的审判已经进入到正规的程序,甚至进入也没有用,因为判决下来也要很长时间。另外,也不能因为企业被起诉就进入灰名单,因为有的时候可能是没有问题的,可是要等到判决结果出来,那就都晚了。

所以对于企业的舆情进行分析,就会变得比较重要,当然,这只是我们对企业进行评估的维度之一。

爱分析:那么如何做好对于企业的舆情分析?

顾凌云:对企业的舆情进行分析,是挺有技术难度的。首先,要做好自然语言处理,而这个首要就是分词,分词在美国比较简单,因为英文单词天然就是分开的,但是在中国就不一样了,到底是切哪几个汉字在一起,这样就是一件很难的事情,切出来以后还要把褒义的和贬义的分开,分完了还要再建矢量,再建模。最后才能决定一篇文章当中,对这件事情的态度到底是怎样的。

那么对于很多论坛平台的爬取,最终都是要通过层层递推的数据的清洗、整理、建模,才能形成最后在报告上简简单单的指向,也就是舆情分析这家公司目前到底是怎样的。但实际上,对应背后的技术积累是需要很长时间才能完成的。

同样,对于法院的起诉也是一样,并不是认为法院起诉这件事比较重要就可以了,还要看企业主或企业有没有法院的判决,等等。有些时候很可能一看有黑名单击中了,征信的结果分数就会比较低,也有可能对应的金融机构就不会放款了。

但仔细看来,还是因为颗粒度做得不够细,因为有的企业是由于劳动法的问题,比如说最低工资、职工退休金发放等问题,员工把企业告了,告企业就自动告到法人了,所以法人也受到牵连。

但这和法人的借贷、企业的借贷其实没什么太大的关系,这对于衡量整个企业的经营来讲,不能说没有影响,但是是微乎其微的,跟企业欠钱或者涉诉是完全不同的。而怎样能把这些因素有效细分到一定的颗粒度,并放到模型当中去,也并不是任何一家征信公司想做就能做到。

爱分析:企业征信的难点在于,相对于个人信息,企业信息是快变量,冰鉴是如何解决这个难点的?

顾凌云:具体体现在技术上,第一,如何处理稀疏数据,这在个人征信当中不难,但是在企业当中很难,因为很多企业受行业的限制,想完全采集到一个行业的密集数据,几乎是不可能的,所以,如何对这些稀疏数据进行有效处理和建模,就比较困难。

第二,如何处理缺失变量,通常大家比较简单的方法是,获取一百条数据,如果有一千个维度,其中可能不到30%的维度对应有数据,其余就会扔掉,但是这样就会发现只剩下一半数据,而这些也不能建模,所以得出结论这些数据源不可用。但实际上不是这样,很多缺失的数据都是可以通过一些技术方法解决的。

第三,如何跳出行业的分析,这也是为什么冰鉴想用金额来取代行业的原因。就是在借贷金额比较确定的情况下,有没有一些通用的变量,或者相对比较通用的变量,建立一个比较稳定的模型,来预测企业。

举个例子,行业再不同,只要使用POS机,冰鉴就可以进行集中建模,并不要求具体到一个特定的行业,就可以相对把很多原来不太能解决的问题,近似地解决掉。

其实还是回到一开始讲的,冰鉴不解决一个从0到10的问题,而是解决从0到8的问题。但是有些我们还是不能解决,比如说前面讲到的实际控制人,这个在企业的表象性上一点都看不出来。在这方面冰鉴就吃过亏,没有做好。

比较典型的例子就是,一个煤老板资金亏空很厉害,但是他拿出几百万让手下的人开10家餐馆,这对他十几亿的资金缺口来讲是没问题的。而这10家餐馆从法人、资金流、经营等各方面看都是健全的,如果这10家餐馆每家都借100万,那也是可以的,但一转眼就投到煤矿的黑洞里了,这种几乎是完全没有办法的。

针对这种情况,想要完全通过线上纯粹的小微企业征信建模,是不现实的,冰鉴会做成三级风控,来逐步解决这个问题。

爱分析:冰鉴的三级风控具体是怎样的?

顾凌云:一级风控,是只根据企业的名称,针对所有不需要授权的信息进行建模,给金融机构一个初步的白名单,金融机构也比较接受。以前所有小微企业都需要他们线下尽调,这也是为什么小微企业在银行的批准率不超过2%的原因。而我们把白名单给金融机构后,金融机构就可以筛选出一些较质优的,并进行简化的现场尽调,这样他们的资金借贷规模可以向下沉,避免大规模系统风险。

当然,目前在有些地方是不能实现的,但是比如在北京,告诉我要看东城区,冰鉴就可以自动在包含6600万家企业的数据库里跑一遍,把注册在东城区的企业全部过一遍,并给出一个白名单。

二级风控,我们对白名单里的部分企业发出邀请,有反馈回来的,便会要求其提供法人的身份证号码、纳税信息、银行流水、应收应付账款信息等等,根据这些信息会做二级建模。这在一定金额下,就不是白名单,是最终的借款了,也就是在一定的场景下,不用见企业就可以放款。这种一般在30万以下,有合作的金融机构已经这样做了,并且违约率很低。

三级风控,当借款金额比较高的时候,比如100万,不仅需要前面两步,我们还会让线下合作尽调团队一起完成,通过标准化的线下尽调流程,把尽调过程当中拿到的信息,放到冰鉴的模型里。

通过形成三级风控,当出现小微企业不同借款需求的时候,冰鉴才能更好地满足所服务的金融机构的要求。

冰鉴要做的是标准的SaaS平台

爱分析:您之前介绍过,刚开始冰鉴是想做纯技术,后来发现不做数据是不行的,那么对于冰鉴的定位是什么?

顾凌云:冰鉴的定位是跨领域的征信公司。我们是很想专心把一件事情做好,但在现阶段的中国是不可能的。因为有时候下游数据供应商提供的数据质量不高,往往根据一个标准卡号得出的结果是非常稀奇古怪的,即使经过清洗也没办法用,这就给我们带来了极大的困扰。另外,有些数据几乎是掌握在一些独有的资源方手中的,如果只是纯粹做技术是不可能的,不过好在现在的趋势就是要打通数据孤岛。

所以,对于冰鉴来讲,只有部分掌控下游的数据,才能把这件事情做好。 

我比较喜欢中国历史,举个例子,任何一个中国南方政权能够在南方长久的经营,一定不会是以长江划线的。最好的例子就是陈,陈之所以灭亡,是因为其在梁朝侯景之乱的时候,把所有江淮的领域全部丢掉了,只能以长江防线来防守,这是守不住的。也就是所谓的守江必守淮,想要控制住长江以南,就一定要把淮河和长江之间的领域控制在自己的手中,才有和北方讨价还价和拉锯的场所。

做征信也是一样,纯粹只是局限在技术领域当中,在美国是可以的,但是想在中国做好,一定要把自己的触角向下延伸才行,只有这样才能保证生命线不完全掌握在别人手上。

爱分析:冰鉴在数据清洗和处理方面的优势是什么?

顾凌云:主要有两方面,一方面冰鉴行业经验比较好,知道把数据处理成什么样子。比如,仅仅知道一个人在什么时间点搬家,把这些数据放到模型当中是没有用的,也不会认为这是个有效变量。但是,如果有经验就会知道,应该把所有这些时间连在一起求一阶导数,求完了以后看这个人搬家的频率是越来越快,还是越来越慢,而这个才是有用的变量。怎样把变量变成有用变量,是要行业经验加上技术,才能解决的。

另一方面,是我们对于大规模的数据处理,比较有经验,这点其实还是比较有难度的。可以处理16G的数据,并不代表也能处理一个T的数据,因为同样的算法做不了。比如使用阿里云,如果它最多给你128G,但是数据远远大于这个,不能一次性读到内存当中去,就意味着现在市面上所有的统计软件都是失效的,也意味着这些算法不能一次性把这些数据放到里面来算。

对于冰鉴来讲,我们会把这些算法单独重写,这样才会变成单线程事情来做。我们现在基本上所有的东西,都是我们自己重写的软件包。

爱分析:您之前提到过,中国还远远没有达到建模的阶段,具体怎么理解?

顾凌云:什么情况下需要建模,举个例子,天上有个隐形飞机,肉眼看不见,必须要用隐形雷达、多孔径雷达才能找到,这个过程就是一个建模的过程,也就是当用最原始的方法无法进行判断的时候,就可以做这件事情。但是在目前,中国还没到这一步,因为中国现在还处于底层数据的拼杀过程中。

合成孔径雷达要想做得好,前提条件是所有的器材和材料要能达到这一步,这就好比是数据源,在数据源都还不全的情况下,是无法做到建模的。皮之不存,毛将焉附?而且某种程度上中国往往是只要拿到数据源,就不用征信了,这还是强调数据源的重要性。

只有当数据源的重要性变得不再重要了,也就是当肉眼已经无法看到云层以下的飞机了,云层以上的隐形飞机才需要用技术来解决,到目前为止,中国还没到这一步,或者说只是刚刚才开始。

爱分析:对比美国的发展历史,是怎样解决这个问题的?

顾凌云:早期美国市场大概有两千多家征信机构,最后逐渐演变成3家大的、100多家中型和几百家小型的。主要的叫征信局,其它叫做评级机构、可替换数据源。原因就是所有的数据在最后一定不能成为征信的核心环节,因为数据本身最终一定会成为期货,是可以通过价格的调节和自由市场的配置来获得的,数据并不是一个行政垄断的稀缺资源。 

随着中国征信市场的开放,数据源会逐渐变成看谁能更便宜拿到,而不是你有我没有的区别。所以数据源最后一定会形成强强联合,征信机构也会变成越来越少,越来越强有力,越来越能占据市场,就像Experian、TransUnion和Equifax这样。 

但是以技术立足的征信公司就不太一样,更多是建立在数据源基础之上,对于那么多数据源,能不能判断出有没有用,能不能以更好的形式把不同数据整合起来,达到意想不到的效果,都是要依靠技术才能解决的,这才是冰鉴最基础想要做的事情。而获取下面更多的数据源,是为了保证在建模的过程当中,不受到数据的过多干扰。

爱分析:冰鉴未来的发展目标是什么?

顾凌云:冰鉴想做的是一个标准的SaaS平台。既然要做SaaS平台,对于我们来讲,就必须要有取舍,我们是把个性化建模放在次要地位,而把提供标准化产品放到一个更主要的位置上。也就是我们会更专注地以自己为中心,来发展市场上有最大公约数的标准产品。 

换言之,客户只要给一个冰鉴要求的输入,而且很少,例如身份证号码、手机号,冰鉴就能给到标准的输出。比如说,如果这个人是3千元的线上借贷,他的风控危险有多少;如果这个人是线下4万的现金贷,他的风控危险是多少。

只要有固定的输入,就会有完全不会改变的固定输出,当然这是指形式,分数肯定是会有改变的。总之,这种会成为冰鉴的重中之重。因为只有这样才能够快速发展,并且能够在极大程度上把其他产品带起来。

爱分析是一家专注于创新企业研究和评价的互联网投研平台。爱分析以企业价值为研究内核,以独特的产品形态,对创新领域和标杆企业长期跟踪调研,服务于企业决策者、从业者及投资者用户群体。关注爱分析公众号ifenxicom,及时获取重要信息。



读完文章,您有没有什么想聊聊?

或者您也是互联网金融领域的创业者,希望我们报道?

您可以发邮件至xuekaili@ifenxi.com

或者加微信号xkl1227联系作者。



爱分析热文

互联网金融估值榜 | 互金50人

互联网金融服务估值榜 | 互联网财富管理估值榜

移动医疗估值榜 | 移动医疗30人 | 企服估值榜

微众银行 | 蚂蚁金服 | 人人友信 | 拍拍贷 | 微贷网

众安保险| 点融网 | 分期乐 | 融360 | 好买财富

金电联行 | 淘当铺 | 宜信财富 | 中天嘉华 | 牛股王

真融宝 | 黄金钱包 | 量化派 | 金蛋科技 | 数来宝

盈泰财富云 | 美信 | 懒财网 | 米多财富 | 会分期

银客 | 大数金融 百度金融 | 飞贷 | 小虎金融 

马上金融 | 京东金融 | 绿地创新 | 掌众金融

春雨医生 | 华康 | 医联 | 趣医网 | 就医160 | 乐牙

杏仁医生 | 糖护士 | 一呼医生 | 微医| 卓健

UCloud | 北森 | Testin | 今目标 | 个推  

红圈营销 | 理才网 | LeanCloud | 有云

娜迦 | 青云 | 乐视云 | 阳光印网 | 纷享逍客


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存