品玩

科技创新者的每日必读

打开APP
关闭
科大讯飞

靠着这款应用,我手指头都没动一下就写了篇文章

本以为我可以成功体验不用手写文章,没想到...

翔神

发布于 2015年12月27日

科大讯飞出了款app,据说可以实时将录音转换成文字,准确率高达99.42%,比高级速记员准确率高很多。App名字是录音宝,安卓和iOS客户端均已开发下载,测试一下自动转录出文章一篇。录音设备:iPhone6。本人略微大舌头,本着你说方言都能识别我也没露怯。朗读无感情,背景杂声我人为制造,距离手机听筒20cm左右,录音文件如下可自行点击播放收听。

[audio m4a="http://pingwest.com/wp-content/uploads/2015/12/kdxf.m4a"][/audio]

手写:

 

前些天,科大讯飞举行了一场发布会,颇为有趣的是整场发布会的大屏幕显示文字都是用科大讯飞自有的语音技术实时听写转录的,令人惊叹,并且还推出了手机客户端支持实时转录文字,对我们这样的文字工作者堪称福音了,意味着以后采访录了音不需要再回头自己整理成文字,节省了太多精力和时间。于是我自己动手进行了测试,所以这篇文章的错别字从刚刚开始已经和我无关了,是否真正能够达到官方声称的99.42%识别率,相信各位自有判断。

除了现场展示的精确的转录技术,还演示了更为智能的语音交互,让我非常惊叹。解决了语音识别交互中的以下几个问题,主动提问、插话打断、背景知识长时记忆,持续聆听、上下文理解等。并且以使用了科大讯飞最新语音技术的叮咚音箱为例进行展示。下面的过程非常繁琐,我也只是简要的回忆,几乎囊括了语音识别技术常见的障碍。由主持人与叮咚音箱进行交互,首先喊音箱的名字进行唤醒,让它播放张学友的《飞得更高》,叮咚音箱回复主持人,张学友没有唱过《飞得更高》,您是想听汪峰的《飞得更高》还是张学友的其它歌曲。主持人告诉叮咚音箱自己要订一张明天去深圳的票,叮咚音箱会回复您是从北京出发还是从其它地区出发,主持人回复从北京出发,叮咚会回复是选择飞机、火车还是其它方式,主持人回复飞机,叮咚智能推荐了几个班次并且读出来,这个时候主持人打断他,告诉音箱我要坐东方航空,音箱立马停止前面的回答,根据最新的回复进行调整,并且为主持人推荐相应班次,当主持人回复某个班次,音箱会回复你是否确定订票,主持人回复确定订票,音箱告诉主持人需要提供手机号码进行订票,主持人用不知道哪地方言报完了号码,被识别出来了,但是主持人又告诉音箱把几个号段进行修改,立马就修改了,最后问是否确认,最后确认,成功订票。

可能你看到这里会觉得很可怕,但是当我注意到屏幕上出现的一些名词错误,是需要上下文理解才能听写正确的。这便知道,电影中那么智能的AI还是有很长一段时间要走的。

录音宝App录音转录文字如下:

 

前些天科大讯飞举行了一场发布会。颇为有趣的事,陈尚发布会的。万次。都是用大科大讯飞次有了云技术时是天蝎转入的。病人很轻叹。并且还推出了手机客户端。支持十转文字。这个我们这样的文字工作者堪称福音了。意味着以后采访录了音不需要再回头自己成立成文字。接生了太多的精力和时间啊。于是我自己动手进行的测试。所以这篇文字这篇文章呢特别次从刚开始已经和武官了。是否真正能够达到99%点时候二的官方识别率啊。相信各位持有判断啊。

除了县城战时的精确的转入技术海雀。电视了更为智能的语音交互。让我非常惊叹,谢绝了语音识别交互重的一下这个问题。主动提问插话打断。毕竟只是长时期持续零瓶上下文理解的啊。便携仪使用了科大讯飞最新云技术的亭中阴线为例啊。进行交互战事。下面的过程非常繁琐。我也只是简要的恢复。这样的回忆啊?求婚能扩了语音识别技术中创建了障碍。流出是源于叮咚音箱线型销户啊。首先看音箱的名字进行唤醒。让它播放张学友的飞得更高。给农民想恢复主持人。张学友没有成果飞得更高您是想听汪峰的飞得更高。还是张学友的其他歌曲啊。主持人告诉丁冬音箱自己要订一张。明天去深圳的票叮咚一声胡辉说你。是去是从北京出发还是从其它地区书法。主持人恢复从北京出发运动会会回复是选择飞机。货车还是其他方式啊。主持人恢复。飞机叮咚智能推荐了几个班次,并且读出来。这个时候主持人打断他的。告诉你向我要做东方航空。音箱立马停止了前面的回答。根据最新的回复进行调整。并且喂主持人推荐相应的班次。当主持人恢复没个班次。冰箱会恢复你是否确定订票主持人恢复确定订票。您先告诉主持人需要提供手机号码进行订票。

主持人用知道哪题的丰盈豹纹好吗?被成功识别出来。但主持人要告诉影相把那几个号段进行修改。你想立马就进行了纠错修改。最后问是否确认?最后确认成功出票。

可能你看到这里会觉得很可怕但是当我出一到屏幕上。一些民俗错误是需要上下文理解。才能够书写转路去了。我便知道电影说那么吃呢的唉。还有很长的一段时间要走。

当然,科大讯飞也很机智的在录音宝里提供了付费人工转录文字。上周PingWest内容团队每周例会录音我也用了录音宝 App 录音,录音设备几乎放在当事人面前,最后看实时转录文字的结果全部都是“恩恩啊”,不禁让人浮想联翩,我非常认可科大讯飞的技术,所以我可能更多的认为这只是软件没有磨合好,因为之前已经说自己连方言和嘈杂环境均可识别,所以我不会责怪自己大舌头或是背景干扰了。 已卸载,祝好。

封面图片来自站酷海洛创意

下载品玩App,比99.9%的人更先知道关于「科大讯飞」的新故事

下载品玩App

比99.9%的人更先知道关于「科大讯飞」的新故事

iOS版本 Android版本
立即下载
翔神

性格恶劣,胆小认生。

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测