品玩

科技创新者的每日必读

打开APP
关闭
业界动态

腾讯云登上国际BIRD榜单前三,刷新国内NL2SQL最佳成绩

shuohang

发布于 21小时前

国产Agent进入“NL2SQL全球最难榜单”前三。

7月4日,据国际权威评测基准BIRD-Bench官网消息,腾讯云自研的数据分析智能体TCDataAgent斩获全球第三的成绩,超越IBM、Meta等众多国际厂商,同时也是目前国内在该榜单上排名最高的排名。

来源:BIRD-Bench官网

BIRD-Bench以其严苛性被誉为“NL2SQL全球最难榜单”。它不仅要求系统将自然语言问题(如“找出未通过质检的订单”)准确翻译成SQL语句,更要求生成的SQL在真实、庞大且含“脏数据”的企业级数据库上执行结果精准且运行高效,对模型的深层语义理解和数据库真实内容感知能力提出了极高挑战。

在这个以真实业务数据库为基础的测试中,覆盖金融、医疗、体育等37个行业场景,数据库总容量达33GB,查询问题超过1万条。TCDataAgent在官方不公开数据集的封闭测试环境下,最终获得了75.74分,位居全球第三, 国内第一。

相比于传统NL2SQL方案往往只能依赖有限信息“猜测”用户意图,易因数据结构复杂或语义模糊出错。TCDataAgent登榜的技术创新来源于引入了数据库约束验证机制,能够自动识别并修正SQL中潜在的结构性或语义性错误(如错误连接、冗余条件)。

更重要的是,它紧密结合数据库的真实内容对生成的SQL进行优化,显著提升了用户意图识别的准确率和翻译结果的可靠性。值得一提的是,TCDataAgent还引入了后训练(post-training)技术,通过优先筛选并复用效果最优的SQL样本进行模型迭代训练,有效提升了训练样本的质量和模型学习的稳定性。

腾讯云TCDataAgent在NL2SQL领域的技术研究成果也获得了国际学术界的认可,相关论文已被今年的数据库领域顶级国际会议VLDB接收。论文中的实验表明,TCDataAgent的“数据库内容感知”核心技术模块,可以无缝集成到其他NL2SQL系统中,最高能将查询执行准确率提升18.3%,并在多个主流方法上实现了超过5%的性能提升。

作为腾讯云新一代企业级智能分析Agent,TCDataAgent致力于让用户直接使用自然语言对结构化和非结构化数据进行复杂的数据查询、报表生成和趋势分析等任务,目前已开启内测。

下载品玩App,比99.9%的人更先知道关于「业界动态」的新故事

下载品玩App

比99.9%的人更先知道关于「业界动态」的新故事

iOS版本 Android版本
立即下载
shuohang

这家伙很懒,什么也没留下,却只想留下你!

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测