每个用户都是Facebook的网络爬虫:社交图谱搜索是怎么炼成的

screenshot2

我不关心Facebook在这场社交图谱搜索(Graph Search)的发布会之后股价又下跌了多少,更不在意那些意淫Facebook要发布智能手机OS的人们有多失望——我只想说,Facebook做了一件对它自己来说很重要的事。

人们对Facebook推出搜索引擎的猜测和传闻已经不止一两次了,如果仅从技术角度讲,Facebook的图谱搜索让人们挺失望的:它没能从算法和技术革新上对当前的网页搜索有多少改变。而Facebook CEO扎克伯格在发布会上所宣称的Google网页搜索只能带你链接到相关页面,而Facebook能直接帮你找到问题答案也十分不靠谱——Google现在通过情境和数据直接找到答案的能力一点也不差。而且,Facebook的图谱搜索目前只能在网页版实现,再度暴露了其移动客户端和原生应用开发的薄弱……从这些角度,Facebook对搜索技术没什么贡献。扎克伯格自己也在发布会上开玩笑说:我们在做的其实更像是为一个巨大的filter list(过滤列表)。

但这句把Facebook的图谱搜索比喻成“过滤列表”的玩笑话,其实是扎克伯格在这场发布会上所说的最真实、最真切的一句话,所以他才要故意当做玩笑来讲。

Facebook的社交图谱搜索,与其说是在搜索,倒不如说是在过滤——它完全是Facebook自己围墙花园里的事,不需要爬取Facebook站外的任何网页和上面的数据,Facebook只需要在自己10亿用户,2400亿张图片和10000亿连接关系的元数据(meta data)中处理搜索,根据每个人的社交关系图谱提供筛选给他/她的那部分特定信息——这其实真的就像是一个分类检索和过滤的过程。

只不过这个过滤器(filter)太庞大了。而Facebook之所以能把其图谱搜索的实质转化成分类检索和过滤,还是因为它根本不需要抓取其它任何外部网站的信息,一句话,Facebook就是整个数字世界。

它是怎么做到这一点的?

原因是:Facebook的10亿用户,每个人都是Facebook的爬虫。Facebook不需要爬取外部网站的任何信息,就知道这个世界上发生了什么。最近两岸三地在热映《一代宗师》、NFL下周末将有一场新的决赛、旧金山的Inner Richmond的街区又开了一家新的墨西哥餐厅……Facebook并没有努力去知道这些,这些都是你们——10亿Facebook的用户,只要有人Like或分享了这些信息,就等于这些用户扮演了搜索引擎的蜘蛛爬虫,主动把这些信息爬给了Facebook。也就是说,10亿用户带给了Facebook 2000亿张图片,上完亿条信息流和20000万人与人的关系链接,这些数据背后的信息,Facebook不费吹灰之力就知道了。

这就是Facebook敢在自己的围墙花园里将搜索变为分类过滤的原因。当然了,Facebook会告诉你,这叫“为每个人呈现不同的搜索结果”。

“为每个人呈现不同的搜索结果”——对Facebook这家突然宣称社交图谱搜索已成为动态消息(News Feed)、时间线(Timeline)之后的第三根支柱的公司来说,又意味着什么?

至少,它意味着Facebook已经杀进搜索引擎市场了。我仍然不认为Facebook对搜索技术本身有多大贡献,但通过分类和过滤的算法,以及Like和分享等社交按钮的权重,能在一个搜索对话框中直接找到我的朋友在纽约拍摄的照片、和我一样喜欢《太极宗师》的好友、生活在旧金山但来自中国的女生(甚至可以从好友的好友中公开了个人页面信息的那部分去找)、渔人码头附近我的中国朋友们like过的中餐馆,我的好友在Facebook上like了哪家牙医之类,对10亿Facebook用户的意义就不言而喻了——过去人们也经常会去每个人的Facebook的页面试图查找这些被分散割裂甚至隐藏起来的数据和信息(只要它是允许被公开的),现在这些信息通过一次性搜索被直接呈现在你眼前了,这意味着用户会越来越离不开Facebook。

Facebook的搜索目的是让人们在Facebook上停留的时间更长,而Google则希望通过搜索让人们迅速完成任务离开这里。这是两者最微妙的差异。而且,Facebook通过这种方式,从Google那里拦截了相当一部分比例的搜索请求——只要它们是有关社交关系与人、图片、地点与爱好结合,能让人们从身边的人那里获得更多智慧和帮助的话。

而社交图谱搜索的意义在于动态且及时精准的社交图谱数据。这应该是这些数据第一次被以搜索或过滤的形式,如此大规模地挖掘与呈现。

它意味着什么还不清楚么?Facebook似乎一点也不讳言这背后的商业价值。Facebook工程主管Lars Rasmussen说:广告商们都喜欢靠推送与受众最相关的信息来增强与潜在客户的互动,而社交图谱搜索能让这些信息变得更精准更匹配,它将具备共性的、在某种条件和场景下的人与人的连接,精确到了前所未有的程度,而这正是广告商最喜欢的。

当你准备组织在旧金山湾区的喜欢《301角斗士》的好友集体看这部电影的时候,你似乎可以用Facebook的社交搜索一次性找到人并发送邀请了,但这时,如果旁边就显示出一个《301角斗士》电影票折扣价的广告,你一定还会故意做厌恶广告状视而不见么? 而且,搜索广告比起Facebook现在的展示广告和赞助故事广告,市场规模要大到不知道哪里去了吧。

让你可能再多点几个广告而且变得更心甘情愿,更是Facebook社交图谱搜索背后的意义。

当然,我听说这款搜索迄今不支持移动客户端,无法且并无清晰计划采取语音识别和控制等技术的时候,还是多少有点震惊了,这款产品如果做不到Mobile First,上面说的那些东西至少有一半也就白说了。

 

订阅更多文章