“中国式”人工智能,起码能修改同音错别字啊

Siri 在 2011 年的发布,引起消费者与业界的一片轰动,不少公司(包括搜狗)纷纷推出自家的语音助手,然而搜狗很快发觉,通用语音助手不是一款能为用户持续带来价值的好产品,便停掉相关项目。只有针对特定场景解决场景里的问题,通过技术-产品-服务的路径,AI 的价值才能得以具象化。

搜狗公司 8 月 3 日正式对外发布的语音交互引擎“知音”,是人工智能落到产品实处的体现。搜狗输入法、搜狗地图、搜狗搜索……其实不少搜狗用户已经在日常中使用到“知音”的服务,这是一项被整合至搜狗全线产品的底层技术,可令语音指令变得更 Smart 。目标是猜透用户接下来说出的每一句话并能迅速准确地作出反馈。

“AI 就像葡萄干面包里的葡萄干。其实想要吃饱主要还是靠面包,技术并不等于产品,同时还要去思考产品对用户的服务是什么。”这是 MIT 人工智能实验室前主管、计算机科学家 Patrick Winston 对 AI 的见解,也是搜狗 CTO 杨洪涛很喜欢引述的一句话。

发布会的现场播放了一段视频,搜狗请第三方机构对比百度度秘、讯飞灵犀以及知音在不同生活场景下的智能语音测试。如你想知道一支股票今天的价格走势,可以这么问:今天大盘怎样?上证指数呢?南宁糖业?

百度与讯飞的产品只能分别对应每次语音的关键词进行检索,最后出来的可能是糖的百科,或者是这家公司的简介。而知音在与用户的多次交互中,已经猜到(或者让你以为它已经猜到)你想知道某家公司今天的股票走势怎样,然后给出“股价xx,涨幅 xx%”的回答。

具体而言,“知音”在语言识别的基础上,应用了语音纠错,知识图谱与多轮对话技术。在语音输入一段文字后,用户可以使用自然语言进行改错,修改成功率高达 80% 。比如用户可通过口语,修改输入错的同音字,用拆字的方式把“张”修改为立早“章”,或者用词组词义的方式把“张”修改为文章的“章”,至少你以后不会迷之尴尬把“章总”认成“张总”了。

同时,“知音”支持更加复杂多轮的交互,可感知用户语音请求背后的真正需求,用更通达人心的表述提供语音服务。比如用户说我要去首都机场,它会问 T1 还是 T2,当用户确定航站楼后,它会问你地点是出发还是到达。

deep learning

官方数据显示,搜狗手机输入法日均语音输入超过 1.4 亿次,日均产生的语料规模是 11.7 万小时。过亿用户为搜狗带来了大量真实有效的商业数据,这是他们开展人工智能研究的底气所在。

但就目前来说,机器与人的对话的互动样本还是太少了。杨洪涛在发布会上坦言,搜狗的语音 AI 研究从 2012 年起步,并于次年开始进行深度学习,做得比较晚。在未来,搜狗智能语音的研究重心会放在后端对人的理解,希望能在语音输入、车载服务、客厅娱乐等垂直领域上作出更深度的优化。

搜索公司天生就有做人工智能的基因和动力,Google、百度皆如此。百度首席科学家吴恩达曾说过,用户、数据和人工智能能形成天然闭环——有一个好产品,你就可以有大量用户;有了大量用户,你就有大量数据;这些大量数据用于人工智能,你的产品就会更好。

搜狗做人工智能这事儿,跟 CEO 王小川的技术偏好也有关系,在 AlphaGo 人机大战那阵子,王小川一直旗帜鲜明地认为人工智能必胜。今年 4 月 22 日,搜狗还宣布捐赠 1.8 亿元给清华大学,联合成立了“清华大学天工智能计算研究院”。2015 年搜狗年收入近 40 亿元,其中有 22% 被用于研发。对比百度,2015 全年营收 663.82 亿元,其中研发投入 15.6% 。

对于科技公司有意识反哺学术研究、并有可能把产研结合的环节打通的这一点,还是相当令人欣喜的。

更多有趣好玩的内容 尽在品玩微信公众号
brand

PingWest品玩移动客户端