在今天的HAY!17大会上,流利说联合创始人兼首席科学家林晖为大家揭秘了流利说背后的“黑科技”,以及如何打造AI老师用于英语的教育。
林晖认为,要让机器识别语言,就要让机器听录音,而且告诉它这段录音对应的是什么样的语言,对应的是什么样的文字。这里面原始数据和目标对应关系,也称作标注。今天所有的机器要做人类任务的时候,一个很重要的事情是通过训练,通过给有标注的数据来训练机器。
机器能听懂人说话的,需要有很多标注的数据。
中国幅员辽阔,各地教育水平和情况各不相同。这也给中国人说英语带来了严重的口音问题。
在解决这个问题上,林晖表示,这需要通过落地一个产品,用这样的产品来搜集训练机器所需要的数据,流利说就有这样的一款产品,它能教中国人说英语,给出一段文字,让流利说用户读这段英文,流利说引擎给他打分,通过游戏化方式训练口语。通过这样的方式,来搜集带标注的语音数据。
结合收集的海量数据,以及最新的深度学习技术,流利说打造了一个能听懂中国人说英语的语音识别引擎。
今天在中国很多偏远的地方,老师缺编比例非常高。林晖希望流利说把AI老师做出来之后,能够送到教育资源相对缺乏的地区,给这些地方的孩子更公平的教育机会。
据了解,林晖毕业于华盛顿大学取得博士学位,曾任 Google 美国总部研究科学家。他也是语音识别、自然语言处理、深度学习及大数据挖掘算法专家,曾在相关领域发表三十余篇国际论文,拥有多项中国及美国专利。
0 条评论
请「登录」后评论