品玩11月22日讯,据 Arxiv 页面显示,阿里巴巴近日发布了一款名为Qwen-Audio 的音频语言模型。
该模型旨在通过扩大音频语言预训练范围,涵盖超过30个任务和各种音频类型,如人类语音、自然声音、音乐和歌曲,以实现通用音频理解能力。
研究显示,Qwen-Audio在多样基准任务上实现了显著的性能,无需进行任务特定微调。

阿里巴巴发布音频语言模型Qwen-Audio
2023年11月22日品玩11月22日讯,据 Arxiv 页面显示,阿里巴巴近日发布了一款名为Qwen-Audio 的音频语言模型。
该模型旨在通过扩大音频语言预训练范围,涵盖超过30个任务和各种音频类型,如人类语音、自然声音、音乐和歌曲,以实现通用音频理解能力。
研究显示,Qwen-Audio在多样基准任务上实现了显著的性能,无需进行任务特定微调。
下载品玩App,比99.9%的人更先知道关于「大语言模型」的新故事
下载品玩App
比99.9%的人更先知道关于「大语言模型」的新故事
0 条评论
请「登录」后评论