8月21日至8月25日,北京国际图书博览会(BIBF)期间,《三联生活周刊》旗下新媒体平台——“中读”携手微软晓晓落地个性化语言定制技术。
微软晓晓语言合成服务基于微软 Azure 云的端到端深度神经网络语音模型。不同于以往机器朗读的生硬和刻板,微软晓晓的语气、语音、语调可以实现无限接近真人的效果,满足用户多场景、高质量的语音内容需求。
以往,传统的有声内容制作主要依靠名人、主讲人或者声优的录音,需要发音人录制成千上万句话。所以音频的录制往往需要耗时几个月,成本巨大。声音录制也会受限于人员、时间、环境等因素,无法实现产能最大化,求知者接收优质内容的时间也会随之延迟。
而微软晓晓只需少量的训练数据,就可以训练出一个逼真和自然的人工智能声音,大幅度提高了大量存量内容的转化效率,节约成本,有利于优质内容的高效生产、再生产以及声音知识的优化和传播。
将在中读开设音频节目的《三联生活周刊》资深主笔袁越,谈到了自己录制时的使用感受: “我花15年写了80多万字的《生命八卦》专栏文章。如果在录音棚里把它们一遍又一遍朗读出来,那是要死人的。如果用普通音频软件来读就很容易读成催眠曲。找主播来读又怕处理不当脱离文章原意。这个系统只需很少的训练量就可以模仿我的声音,代替我朗读那些文章,不但准确地表达了原文的意思,而且满足了听众想听到原作者声音的需求。”
0 条评论
请「登录」后评论