专访Mashable CTO:人工智能如何帮助媒体编辑提升效率

科技博客 Mashable 创建于 2005 年 7 月,其创始人是当时年仅 19 岁的苏格兰人 Pete Cashmore。在那之前 Pete 没有任何媒体工作经验,网站主要从社交网络上追踪最受用户关注的科技公司新闻。到现在,Mashable 在全球的 Alexa 排名已经达到 516 名,成为世界上访问量最多的博客之一。

正是因为 Mashable 的创始人没有任何媒体从业经历,这个科技博客才没有从传统媒体那里继承任何过时的新闻操作方式。在 Mashable 创办初期,整个团队 20 多人每天最重要的工作是在 Facebook、Twitter 和 LinkedIn 等社交网络上查看自己关注的大量用户都在转发什么内容,并根据热门内容撰写相关的文章。

后来随着现任 CTO Robyn Peterson 的加入,Mashable 开始使用自己开发人工智能工具来代替团队每天在社交网络上追踪内容的工作。Robyn 带领研发团队设计了一个人工智能数据分析系统 Velocity,通过自然语言理解技术分析社交网络用户对相关事件的讨论,并通过可视化的图表向编辑部预测可能会爆发的热点内容。

在今年的腾讯网媒体高峰论坛上,Robyn 接受了 PingWest品玩的专访,并详细解释了 Velocity 系统的工作原理。Robyn 表示 Velocity 会根据社交网络上的分享和讨论生成一个热度曲线,它其实很类似于经济学中的供求曲线,横轴代表时间,纵轴代表需求量。相应的,当某一个话题的需求量(热度)提升时,Mashable 就会生产相关的内容进行“供应”。

static2.politico

Robyn Peterson,Mashable CTO,图片来源:Politico

“举个例子,通过分析我们预测到接下来一个关于食品比较大的事件有可能是《纽约时报》上所发表的转基因西红柿的故事,现在关于这条新闻的转发量只有几十条,但我们的系统可以预测到接下来几个小时它的转发量将达到上万。”Robyn 说。

使用自然语言处理等人工智能技术的基础是能够拥有大量数据,Volecity 每天能够分析 300 万个不同页面的链接数据,这些链接包括社交网络帖子、文章、图片和视频,并从中分析出下一个热点。

2012 年 12 月,Robyn 曾在 Mashable 上发表了一篇文章称媒体应该像做程序员做产品一样生产内容。在这篇文章里,Robyn 给了正在衰落的媒体公司 4 点建议,分别是:社交网络比搜索引擎更重要、拥抱移动互联网、提供个性化的广告和以产品为主导生产内容。

Robyn 认为媒体公司的衰落主要在于工程师几乎不为媒体公司工作来帮助他们创造更好的数据挖掘工具,但换句话来说,就是媒体公司根本就不重视工程师和产品经理的作用。但没有任何传统媒体基因的 Mashable 却利用数据挖掘工具和算法成为了新媒体里的佼佼者。

在 Mashable 的网站上,每篇文章下面都会有一个小小的曲线图表,读者可以直观地看到与这篇文章相关的话题的热度变化。但 Robyn 解释道,这个曲线本来是给编辑作为内部参考的,只是初期将它放在了前台做一个常识。但后来 Mashable 的读者都习惯了这个小图表,甚至在他们取消掉图表后发出了抗议,所以这个图表就被保留了下来,成为了 Mashable 的一个特色。

WechatIMG145

在中国,将人工智能算法和新闻编辑结合起来的公司同样有很多,其中最成功的非今日头条莫属。Robyn 表示自己并不知道今日头条这家公司,但他很赞同今日头条用机器和算法辅助人类编辑的做法。但他认为在新闻编辑这件事上,人的作用应该比算法重要,而机器只能起到辅助作用。

“拿 Mashable 举例,我们是在这个话题之前收集大量数据进行分析,对这个话题进行预测。这个过程中,我们预测的是人的一些行为。所以我认为我们仍然还是需要人的参与的,我们需要作者和视频制作人员为我们提供有意思的数据,或者说他们来观看这些数据,来分享这些数据。在这个过程中,可能这些新的分享会给他们带来一些启发,给他们带来一些兴奋点,这个过程中他们可以创造更新的东西出来。”Robyn 说。

针对算法和大数据过多的干预编辑是否会造成媒体过于以读者的兴趣为导向,Robyn 认为这种情况存在,但最终还是取决于使用工具的人。“你说的这种情况或许在 Facebook 上是存在的,例如在这次美国大选中,你的信息流里几乎只会出现你支持的观点,而其他人的观点是被过滤掉的,我们把这种情况叫做’回响室’(echo chamber)。但 Mashable 是一个面向大量读者的新媒体,我们认为算法不能用这种危险的方式来控制人们能够看到哪些信息,所以我们会尽量做到中立。”

但 Robyn 认为人工智能算法和大数据能为媒体带来的最大帮助是效率的提升。“这几年来媒体公司的日子都不好过了,很多媒体开始大规模裁员。在这种情况下,算法和数据能够帮助编辑部甄选出值得关注的新闻,并让他们集中精力在相关领域生产出更深度的新闻,同时也能让媒体在保持稿件数量的情况下保持质量。”Robyn 说。

订阅更多文章