品玩8月1日讯,据 Huggingface 页面显示,来自韩国科学技术院等机构的研究者近日发表论文,公布一项名为 LP-MusicCaps 的数据集。
LP-MusicCaps 使用大语言模型从大规模标签数据集中人工生成描述语句,其包含约 220 万个字幕和 50 万个音频片段。研究团队利用自然语言处理使用的各种量化评估指标以及人工评估,对大规模音乐字幕数据集进行了系统评估。研究团队还利用该数据集训练了一个基于 transformer 的音乐字幕模型。
论文显示,该方法优于监督基线模型。

韩国研究者发布音乐字幕数据集LP-MusicCaps
2023年8月1日品玩8月1日讯,据 Huggingface 页面显示,来自韩国科学技术院等机构的研究者近日发表论文,公布一项名为 LP-MusicCaps 的数据集。
LP-MusicCaps 使用大语言模型从大规模标签数据集中人工生成描述语句,其包含约 220 万个字幕和 50 万个音频片段。研究团队利用自然语言处理使用的各种量化评估指标以及人工评估,对大规模音乐字幕数据集进行了系统评估。研究团队还利用该数据集训练了一个基于 transformer 的音乐字幕模型。
论文显示,该方法优于监督基线模型。

下载品玩App,比99.9%的人更先知道关于「数据集」的新故事
下载品玩App
比99.9%的人更先知道关于「数据集」的新故事




0 条评论
请「登录」后评论