趋势网(微博|微信)讯:
经验论还是数据论?这个话题在美国一直都讨论的非常红火。在NBA,选潜力新秀到底是数据靠谱还是球探的经验靠谱一直在争论不休,双方阵营也都各自拍电影来支持自己的论调。今天,我们要讨论的并不是篮球,而是P2P。
自从第一个跑路平台诞生起,如何避免踩雷就已经成了一个必须要反复讨论的话题。在这个过程中,经验论和数据论的阵营也在逐步形成。经验论主义者喜欢说,一个靠谱的平台他通常是这样这样的,这些大牛的极致表现甚至已经到了,我看到他的官网风格就知道一定是一个跑路平台——当然了,一般都是跑路以后我们才听到了这个声音。另一个阵营看起来更符合社会主义核心价值观。他们讲事实,他们分析数据,这样的东西发出来更有说服力,也更具备复制能力。毕竟经验的东西是无法复制的,但数据的东西,只要我把得出数据的模型告诉你,你就可以立刻复制。
当然,如果你看了文章的标题就知道我并不是完全站在数据控这一边的。我看问题喜欢讲中正平和,如果数据控真的拥有压倒性的优势,那经验党早就灰飞烟灭了。今天要讲的就是大数据的局限性。
第一:所有的数据都是过时的
有一个笑话,说的是一个人跳楼。当他下落到3楼的时候,3楼的住户问了他一句:“哥们,你感觉怎么样?”那个跳楼者说:“目前看来,跳楼好像也没什么。”虽然我们都知道一秒钟之后这位跳楼者的话就会被证明是错误的了,但在那一刻,我们不能说他在说谎。
这就是数据的第一个尴尬,他反应的永远是过去的事实。 “我们平台自成立至今没有出现过坏账”,但这并不意味着他在明天也不会出现坏账,这中间并没有强逻辑关系。我们应该还记得中晋的员工在接受采访的时候说的就是:“我们平台从来没有拖欠过哪怕一次利息,怎么可能说倒就倒呢?”是的,你们平台没有拖欠过利息,但那只是昨天,那也只是昨天了!
第二:数据永远不够全面
阿里管大数据总监在刚上任的时候第一天就发现一件很尴尬的事情。阿里的数据分析是散落到各个部门的,当他上任后要求各部门出一份关于用户购买的下一件货物的可能性分析时,各个部门交上来的数据竟然南辕北辙。然后这位老总去研究每一份预测报告,发现每一份报告在逻辑上都严丝合缝无懈可击。那为什么会得出截然不同的预测数据呢?
原因在于每个部门可以拿到数据是不同的。有些部门是根据浏览的数据来做分析和预测,有些部门是根据上次购买来做预测,有些是根据用户的性别和年龄来做预测。虽然每一份数据都是准确的,但是因为数据本身不够全面,所以得出的结论往往非常离奇。
回到网贷。有些投资者用历史成交数据为依据来投资,有些用注册人数和日均成交额作为依据来投资,还有用满标时间、坏账率、大客户比例等等数据作为参考的。假设我们得到的每一分数据都是真实的,但因为每一分数据反映的都只是一个侧面,这会导致我们的判断离事实很远很远。
第三:数据未必和结果拥有对应性
知道影响冰激凌销量的因素有哪些吗?其中有一项一定让人大跌眼镜。所有数据都显示当避孕套的销量上升时,冰激凌的销量也上升。避孕套和冰激凌在销量上是正相关的。狗血的数据,但数据从来不会说谎。我们来解释一下背后的逻辑,因为冰激凌的销售旺季是夏天,夏天妹子们都穿的比较少,妹子穿的少会牵动男士体内的洪荒之力,于是避孕套的销量就上升了。如果你是一家冰激凌公司的总裁在看到冰激凌和避孕套在销量上正相关之后为了提高冰激凌销量而在公司成立避孕套研发部,那你肯定就要被大数据坑死了。
回到网贷。之前经常可以看到因为汇付天下的平台没有跑路的,所以我只投汇付天下的平台。其实这中间的逻辑就和冰激凌逻辑是一样的。汇付天下绑定平台没有跑路的,并不意味着一定是绑定汇付天下这一行为产生了效用,这中间是没有必然的逻辑关系的。后来事实也证明了汇付天下的绑定平台也出现了跑路的。所以如果我们以后还打算说我只投A,因为做过A的平台都没有跑路,我们应该静下心来思考一下,这到底是不是一个冰激凌逻辑?