对话豌豆荚搜索技术负责人李大海:“应用内搜索”到底有多难?

wdj

尽管应用和网站在我们的生活中扮演了相似的角色,但是很多你可以在网站上做的事你却很难在应用上完成。比如,你很难像分享网址那样分享应用里的内容,你也很难通过搜索来查找不同应用里的内容。

被无数应用淹没了的移动互联网,也需要像网站那样被索引起来,使得我们能够更加快捷地在不同的应用间找到自己想要的内容。而实现应用内搜索的其中一个环节,就是Deep Link(深层链接)。Deep Link能够帮助搜索引擎描述怎么展现、打开和处理应用里面的内容。

尽管Deep Link在移动互联网时代仍然被讨论得并不多,但这项技术正在移动应用、广告和商业领域上开始被普遍使用。Quixey的联合创始人兼首席科学家Liron Shapira称,2014年是Deep Link的元年。

豌豆荚是中国最早涉足应用内搜索和Deep Link的公司,PingWest采访了豌豆荚搜索技术负责人李大海来解释豌豆荚的应用内搜索推出以来的状况,以及与Deep Link相关的标准化、局限性等难题。

李大海曾担任过Google中国软件工程师,负责Google核心技术索引小组、云计算国内推广、音乐小组、输入法和Linux产品;并在云云网担任过工程总监,负责微博搜索、社交搜索、搜索架构和基础架构等工作。

PingWest:应用内搜索技术协议上线已经3个月,现在的情况怎么样?你们怎么评价现在的情况?

李大海:3月份是23家,现在已经超过了30家,都是通过我们发布出去的协议接入的。因为这个协议是为了获取内容,具体获取哪些内容,也需要考虑豌豆荚产品的路线图。

总的来说,我们逐步挑一些我们认为更容易被我们豌豆荚接受的门类进行接洽,我们不断的打磨协议,也有细节上的修改,最近新出的一些Facebook Deep Link的协议我们也在跟进,在分析他们协议的合理性方面的内容。如果对合作伙伴有好处,我们是不是也考虑把它们兼容起来。

PingWest:这段时间主要在打磨技术协议?

李大海:我们应该很快会出来一些对应的产品,但是现在还没有正式的发布。我们将会接入应用内搜索的新门类,用户可以搜索到里面的内容,完全和我们视频、电子书不太一样。

PingWest:豌豆荚的Deep Link的技术特点是什么?跟其他家相比有什么异同?

李大海:我们豌豆荚的Deep Link最主要的目标,主要希望有利于合作伙伴把他们的内容接入到豌豆荚里面,能够直接让豌豆荚的用户让更多的移动互联网用户搜索到,基于这个目标,我们定成移动搜索协议,这个协议里面包含了Deep Link的东西。所以我们的特点是基于兼容性好这一目标出发的。其实我们没有重复发明轮子,我们用的都是已经有的技术,而且是被广泛接受的技术。合作伙伴理解和使用这个技术都是比较容易的,这是我们的目标。

我们一直在调研Facebook的协议,主要是想知道这个协议是不是合理,对合作伙伴是不是好用的。我们希望跟不同类型的合作伙伴,能够用他们感到比较舒服的方法合作。如果Facebook的合作协议没有合作伙伴,或者比较少的合作伙伴愿意参考的话,我们也不会考虑。

PingWest:豌豆荚在尽可能兼容不同厂商之间的标准。为什么目前还没有一个统一的标准呢?

李大海:我们回顾移动互联网的发展历史,它不是由某一个军方或者某一个标准组织推出的一个协议让大家去玩。我们传统互联网是这样做的,传统互联网发明了hyperlink以后,就变得宽广起来了,就是以前提的信息高速公路。但是移动互联网兴起得力于Google和苹果智能手机,本身最早就是基于应用。一开始大家关注的都是怎么样能够让手机用户用着舒服,其实信息的流动不是大家一开始考虑的重点。但是所有用户的时间都逐渐转移到手机以后,内容也转到手机上了,这时候内容间的流动和能不能被发现这个事就变得越来越重要了。但是出于一开始手机无线内容自然发展的现状,所有的信息都是在APP里面,是一个信息孤岛,这个限制了无线信息自然的流动。所以现在大家都希望改变这个现状,但是每个厂商都是从自己使用的角度出发,希望解决自己的问题。

我们豌豆荚现在也是这样的,大家都是摸着石头过河,包括Google,Facebook也都是这样的。其实分析大家的协议,可以看出来,都是为了解决自己的问题。像Google提出的APP之所以把手机里面的内容和网页里面的内容结合在一起,因为它处理网页内容已经得心应手了,把它结合在一起,就转化成自己特别熟悉的内容,所以它要这样做。Quixey也是这样的公司,它和Google的想法是一样的。

Facebook本身是一个大平台,它希望在这个平台上,用户可以很容易的跳到其他人分享的应用里面去,而跳过去这件事,其实不管你是安卓,还是iOS,这不应该成为我跳过去的一个障碍,所以它们发布的时候,他们会考虑到跨平台的需求。每家发布的时候为什么这样考虑,其实都是跟自己的应用场景相关的。但是现在缺乏一个国际组织,或者几家大的厂商一起站在全球化的角度,对这个事情有一个全局的规划。

PingWest:在推广Deep Link遇到了什么问题?

李大海:Android开发者在”调起”这件事上,其实是有Google规定的一些规范。早期的时候,所有开发者更关注自己的业务,”调起”只要能工作就好了,不太关注这个事情是不是满足规范,因为这完全是内部的行为。现在的现实,我们有很多开发者,虽然自己的产品体验比较好,但是”调起”这块情况非常糟糕,甚至完全不支持对外部的”调起”,有一些还会刻意的说我就不允许外部”调起”,可能开发的时候就是随意写的。这个会给外部”调起”带来很大的困难,甚至产生很多无形当中的障碍。比较重要的事,让我们所有安卓开发工作者意识到友好支持外部程序的”调起”,其实对每个APP都是有好处的。比如说一个新闻的APP如果能很方便的支持外部“调起”的话,其他人更有可能把内容指向它,它被展现出来的机会更大。在其他应用里面这种场景也是蛮多的,甚至在网页上也会有这种场景。我们豌豆荚做的事,其实只是教育我们的开发者,跟开发者沟通,怎么样做是合乎标准的,怎么做对第三方”调起”有好处。

PingWest:现在不怎么合规的应用多吗?

李大海:真的非常多。

PingWest:大概是什么样一个情况?

李大海:我们做过简单的估算,我们把我们认为最热门的一些应用,都拿出来简单的看了一下,基本上真正友好支持”调起”的应用不会超过20家。但是这个数字是我们一两个月以前的数据。我们也一直推这个事,360,百度也在推这个事。

PingWest:接进来的应用数量跟豌豆荚收录的应用数量相比还非常少,比如像微信这样的应用以及一些工具类应用并不适合接入应用内搜索,你们怎么看?

李大海:不是这样的。对于这件事,因为豌豆荚现在的定位还是移动内容搜索,不是一个移动搜索。坦白来讲,我们从移动内容搜索过渡到移动搜索是需要一个过程的,包括我们对接入数据的积累,我们产品的转变,包括用户的接入程度,等等各方面的事都需要有逐步转变的过程,不会是那么快自然发生的事。

刚才你说的问题,一些应用可能不太适合接入到搜索里面来。我们现在把应用分成两种类型,一种是内容型的,一种是工具型的,当然还有其他的,我们主要从搜索引擎角度来说主要分两种。微信是比较综合的类型,你说朋友圈或者聊天不太适合建索引,也不太会开放的。但是像微信公众帐号只给搜狗用,但是那个东西作为搜索也是有价值的。

PingWest:不管是视频网站还是电子书城,到最后都会形成寡头垄断的局面,到时候他们是否就不需要移动搜索了?

李大海:我觉得主要从搜索引擎角度来看,我们看大规律,总会存在垄断的事,但是有的还是有长尾的事,在app市场,沉下心把某个领域把内容做精,也是可以的。如果把自己的原创做好,对自己来说是无形的价值。在移动互联网时代,移动的内容,如果不是单独挑某个具体的品类,类别,看所有的内容的话,长尾性还是蛮明显的。

而且内容正在逐步往无线端走。我们只要分析最近新开始做内容厂商的行为,很多内容都是在APP里面,网站只是介绍性的,现在这种情况特别多。许多人创业的时候,比如说我做母婴,很多就是APP里面有一个母婴问答。我们网站里面介绍做什么就没了,网站是很苍白的,有价值的都在APP里面,这是新内容的趋势。互联网发展这么多年,不错的内容已经积累出来了。当有新内容来的时候,他们倾向于在移动端访问。在这个趋势下,整个移动互联网内容的价值会越来越大。

在各垂直内容领域,我们不认为会出现一个“超级应用”垄断所有内容,而会是“数个头部应用提供大部分主流内容,其他长尾应用补全所有内容”的样子。事实上,以目前发展已经比较成熟的PC端内容消费市场来看,也没有形成在视频、小说等领域一家独大的局面,因此我们认为移动内容搜索在未来依然是有价值的。

PingWest:这种趋势还会继续下去吗?最近可以感觉到好的新应用已经越来越少了,移动端的发展是不是已经开始走到头了?或者说现在的应用生态圈已经满足移动用户大部分的需求了?

李大海:因为我没有做过相关的调研,我没有数据。我比较关注的事是有没有在长尾内容上精耕细作的小APP。比如说喜欢喝铁观音的人,会不会有专门介绍铁观音的,或者铁观音交流的论坛,专门为这部分忠实粉丝服务,这样的APP可以构成整个移动互联网有价值的内容。但是这样的APP由于是小众不见得出来就可以吸引很多人的眼球。我觉得这个跟互联网发展起来有一大批站长,做各种类型小的个人网站,我觉得蛮有意思。

从移动内容搜索角度来说,有些应用其实不适合做索引,但是我们最终的目标要做移动搜索。移动搜索这件事就不一样了,因为它要把功能组合在一起,一个应用能提供的功能,也是我们搜索的一个点。比如说我要打车去哪个地方?可能第一条结果就是的的打车的接口,打开的按纽就是叫车,然后直接到的的打车,就把你当前的地点和目的地呈现出来了。

PingWest:人们在消费内容的时候,主要有两种模式,一种就是随便看看,还有一种是搜索。在移动端上,用户更加习惯搜索而非随便看看吗?

李大海:我们的观察,移动端用户一开始很不习惯搜索,因为输入是很有障碍的,手机输入法还是比较头疼的事。随着大家在手机上的时间越来越长了,真的有很强的需求,我需要找到一个东西,但是我没有办法,我不想打开电脑,所以大家在网上搜索的场景越来越多。有一个明显的例子,像Google去年的时候,整个全球搜索请求量已经超过传统网页上的访问量,这是很明显的例子,跟我说的上网时间是吻合的。当用户的时间越来越多放在手机上的,这时候用户的需求就会满足了,搜索需求是刚性的,浏览就是没有需求目的的时候就是随便看看,这两个场景是不一样的。

PingWest:你们怎么看待Deep Link的局限性?你们觉得Deep Link可以做到什么程度?

李大海:我个人的想法,无线上App-link,可以让大家无障碍的跨平台,跨设备,可以很方便的交流。我们豌豆荚Deep Link主要涉及的是B2B,B2C那端把细节隐藏给用户了,用户可以用到,但是用户不会明显的感觉到links这样的东西,我们主要关注这方面的东西,很多厂商只关注一端,大家都是从自己的用户出发的。怎么定义一个全面的,能够非常有利于信息和内容在移动互联网流动的标准出来,也是我们关心的事。

订阅更多文章