PingWest 品玩 1 月 17 日消息,百度正式在北京发布了百度输入法 v8.0,该版本在此前已有的 AI 功能上增加了「语音速记」和「AR 表情」两大全新 AI 功能。大会上,百度输入法宣布,截至目前百度输入法月活用户已达 4 亿,语音输入日流量超过 2.5 亿,接下来百度输入法作为百度 AI 技术的桥头堡,将不断落地全新的 AI 功能,开启全感官输入时代。
百度语音技术部总监高亮上台回顾了百度输入法的技术迭代。在大会上,他宣布百度语音技术的最新突破——Deep Peak 2 模型。该技术全称为「基于 LSTM 和 CTC 的上下文无关音素组合建模」,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升 20%,让机器更轻松适应用户的自然对话。
而现场的主持人华少也即兴挑战了一下采用了最新 Deep Peak 2 模型的百度语音识别技术,华少快速的读出 426 个字,而百度 AI 也在 58 秒内正确识别了华少 426 字的「脱口秀」。
百度输入法负责人蔡玉婷宣布了百度输入法 v8.0 版本的正式上线,该版本在此前已有的 AI 功能上增加了「语音速记」和「AR 表情」两大全新 AI 功能。
「语音速记」使用了「声纹识别」技术,可以支持 2-3 人小型会议场景,可根据声纹自动区别发言人,实现智能化的语音识别。而「AR 表情」功能基于百度领先的人脸识别技术和 AR 技术,用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。而制作出来的 AR 表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。
百度副总裁、AI 技术平台体系(AIG)总负责人王海峰在致辞中表示「8 年前百度就开始布局人工智能,如今我们不仅把最先进的 AI 技术应用到输入法等产品中,更把技术开放出来给合作伙伴和开发者,一起共享这个 AI 时代。」他说,「输入法是百度 AI 技术的桥头堡,未来我们将用更多人工智能技术打造 AI 输入,让输入法更懂你的表达,让 AI 真正改变人们的生活。」
更多精彩请关注我们的微信公众号:PingWest品玩
新闻线索请投稿至:wire@pingwest.com
0 条评论
请「登录」后评论