微软大数据和实时搜索技术的新玩意儿,社会化影响力数据追踪平台BingScore

“如今的互联网早已不再是一个单纯由Web页构成的集合。由于社交网站的兴起,一个人在网络上的言论与行为,纷纷变成可以存储、传输和追溯的海量信号源。衡量一个人的影响力,已不能仅仅按照页面被引用和链接的次数进行排序。在这样的背景里,无论是利用传统的统计和分析模型、还是依据粉丝或内容的评论转发数量来衡量个体的影响力,都会因为评估维度相对单一而很难做出一个客观的评价”。

基于上述理由,微软推出了必应影响力(Bing Score)这项服务,它是一个以“人”为单位的互联网影响力评估及趋势分析平台。它的基本思路是,通过搜集尽可能多的社交网络信号源、建立可验证的数学模型以及计算公式,尝试为“人”的影响力赋值,从而把“影响力”这个抽象的概念量化。

bingscore2

这个事情百度也干过,而且事实上百度指数也确实成为一件衡量事情传播广度和受关注度的重要指标之一,但是与百度指数不同的是,BingScore还整合进了社交网络的信息,并且是以人以及人的行为为追踪对象。这也就意味着会涉及到信号混乱、人的轨迹难以追踪、信息不平等让人头疼的问题。

那么必应是怎么做的?

BingScore的负责人、微软亚洲互联网工程院项目总监李明章向我们介绍称,决定BingScore的指标主要来自三个部分:社交网络、搜索引擎和媒体网站,分别包括在社交网站上的粉丝互动量、在多个搜索引擎上的被搜索量和在媒体网站上的浏览量。通过集合数据挖掘和实体搜索(Entity Search)技术,必应会把一个人在社交网络上的痕迹以及与之相关的互动,都加以搜集、整理,转换为可以分析的信号,并通过数据清洗,过滤掉噪音,再通过数学模型与加权算法得出影响力的数值。可以说,它源于对散落于社交网络中的结构化数据、非结构化数据和流数据的挖掘与分析。李明章还称,这种挖掘与分析还有一个特点就是实时,由于影响力数值是和其他人相互比较的结果,所以每隔1~2小时就会更新一次,以反映影响力的即时变化。

bingscore

虽然数据源来自多个社交网络,包括腾讯微博等,但是从目前来看,新浪微博才是BingScore的深度合作方,而且李明章也表示,新浪微博所占权重“很高”,但是他并不愿透露究竟占到多少比重。

除去给影响力打分外,BingScore还有一个“影响力时刻”,即对一个人影响力发生变化的热点时刻进行追踪和梳理,常见的热点包括微博得到了更多回应、搜索量大幅增加等。这些影响力时刻以时间轴和历史曲线两种方式来呈现,前者主要是把该个体发布的具有高转发数的新浪微博进行一个纵向的呈现,后者则是以曲线图的方式对一个人的影响力变化进行追踪。不过,这也导致一个问题,如果该人物没有新浪微博账号,比如任正非,则排名与影响力时刻都会收到影响。

目前,针对个人用户,BingScore仅推出财经、娱乐、体育、科技四个行业的人物影响力分类排行榜。不过,项目团队更想做的是,在搜索引擎与大数据增值服务领域进行尝试。

微软亚洲互联网工程院院长王永东就表示,BingScore是微软首次在中国市场,先于其他区域市场推出的产品,从产品设计、开发到运营,都由本地团队自主进行。他们想把其作为从微软大数据和实体搜索技术转化而来的标杆产品,尝试进军增值服务市场。

在项目团队的构想中,它的公共基础服务包括交互层(比如向媒体提供数据和交互)、应用层(数据实时查询和交换,开放API)和数据层(数据定制服务),他们还可以作为第三方独立服务商,提供数据给行业合作伙伴做精分析。

不过,构想是美好的,现实往往是残酷的。已经有百度指数珠玉在前,无论是在大众接受程度还是渠道商,BingScore在短期内都难与之抗衡;更关键的是,整个产品不断强调“技术支持”或者“体现搜索价值”,使得它更像是一个出于技术能力做出来的产品,即基于“我们能做到”,然后再衍生出应用场景,而非基于现实的用户需求——比方说,不少人对此的第一反应都是“wow,不错”,然后便问,“它有什么用”?这也导致它的定位还不是很清晰,包括究竟是继续放大二八效应,还是挖掘长尾市场等。

当然,BingScore才刚推出不到一周,现在还处于快速迭代的阶段,根据李明章的介绍,在未来的版本中,它还将向普通社交网络用户开放,让用户可以向BingScore提交申请收录个人数据,以对自己的影响力进行浏览,让自身的网络行为更有价值(我觉得这到是个不错的方向),并将推出定制化数据查询,实现对影响力人物以时间线为索引的精华阅读,以及探索细分领域的排行领袖等。

如果上述功能能实现,或许真的可以帮助Bing从一个小角度切入市场。总之,我们不妨再看看。

订阅更多文章

你可能感兴趣的: