趋势网(微博)讯:男子疑被误当成猎物遭枪击身亡 大学生300元抢6399元电车提车被拒 清华学生疑因北航女友作弊被抓殴打辅导员 珠海驾车撞人案嫌疑人被批捕 质问不修宿舍学生已被家长领回家
趋势网配图:Facebook所推出的图谱搜索功能,使普通用户第一次有机会真正接触互联网公司庞大的大数据。
尽管离我1964年在UC伯克利大学已经过去了近五十年的时光,但在那时兴起的要求言论自由运动的口号我却至今记忆犹新,“不要掩盖,不要踢皮球,不要压制。”这样的口号曾印在IBM公司为学校提供的卡片上,这种卡片能够帮助学生在校园网上实现课程注册。在后来的要求言论自由运动中,这句口号大行其道,因为它将大的科技公司和知名高校联系在了一起。在那时,电脑还只是大学、政府部门和大公司才有的稀罕玩意。
但这种局面很快就得到了改变,个人电脑和智能手机开始走进千家万户,它们的计算能力要比当年的大块头电脑强出许多,甚至个人拥有一台超级计算机也不再是难事。但有一样东西任然是大公司所独享的:大数据。大数据是一种巨量的数据集合,它的容量大到了已经无法通过一般的逻辑关联推出结论的程度。
诸如谷歌和必应这样的搜索引擎为用户提供了触摸数以千万亿兆的数据的机会,但它们并不能分析出数据之间的逻辑关系。并且用户实际所能接触到的数据也十分有限,因为世界上最为要害的信息都收到了最严密的保护。
但社交网络的出现开始改变这一现状,比如facebook刚刚推出的“图谱搜索”功能。通过这项功能,我们能够从来自于我们好友的,组成我们的线上社交生活的巨量信息海洋中撷取一小部分,分析这些信息之间的关系。
长久以来,facebook一直掌握着远超出我们想象的私人信息,比如用户地理位置,与好友的密切程度,兴趣爱好和照片等。而当这些数据来自于超过十亿的用户时,无论从哪个方面看,这都称得上是“大数据”了。但知道facebook正式宣布推出图谱搜索功能前,我们都还无法真正触及这一片信息的海洋。
不久前笔者得到一个图谱搜索的内测机会,经过初步实用,除了发现它极度容易上瘾之外,我还有自己的一些心得体会。我输入的第一条搜索是“我的朋友们爱看的电影”,随后我找到了一部之前从未听说过的影片,看了之后感觉还不错。我很喜欢吃日本料理,但一直苦于找不到正宗的料理店,拜图谱搜索所赐,我现在找到了一家我们这最火爆的由日本人经营的料理店了。我同时还了解到了我的哪些朋友喜欢我目前供职的一家非营利性组织,以及如何扩大组织影响力的办法。
但我必须承认,facebook并没有把整个大数据展现给我们。为了保护用户的隐私,在搜索结果中我们只能看到即使不通过搜索我们也能找到的内容。如果你不是某位用户的好友的话,那么即使你想搜索有关他的内容,也是搜索不到的。你所能看到的是你的好友的信息,以及这条信息所牵涉到的好友的好友的信息。但即使这样,普通用户所能获取的数据仍然十分可观。以目前facebook用户平均245个好友数计算的话,你所能看到的最大好友数通过这样一个两级传播后达到了6万人,包括你的直接好友和间接好友。这还不算那些“主页对所有人可见”的用户。再加上facebook的信息量不断增长,因此普通用户所能获取的信息量还是非常可观的。
这就意味着,随着时间的推移,用户所能搜集到的数据也就越来越多,从而能够独立从这些来自好友的数据中分析出一些社交方面的结论。目前已有充足的证据表明,人们通常会喜欢自己的朋友所喜欢的,行为方面也经常会收到朋友的影响而潜移默化。
行为学是一门帮助人们改善生活习惯的科学,比如帮助人们戒烟戒酒,这一学科告诉我们,人的行为受身边的人影响很大。如果你的朋友们都不抽烟的话,那么你抽烟的可能性也会大大降低。这样的道理还适用于我们看什么电影、在哪家餐馆吃饭、去哪里度假等。尽管人不像绵羊一样完全合群,但当这种趋从性有助于改善我们的生活习惯时,这种特性算是一件好事。
尽管我仍然十分担心社交媒体的大数据所可能带来的一系列问题,而且防范这种可能出现的问题甚至比思考发一条什么状态、观察别人怎么在社交媒体上评价你更加重要。但通过我这几天对图谱搜索的使用体验来看,这一项技术仍然是利大于弊。