腾讯云登上国际BIRD榜单前三，刷新国内NL2SQL最佳成绩-品玩

国产Agent进入“NL2SQL全球最难榜单”前三。

7月4日，据国际权威评测基准BIRD-Bench官网消息，腾讯云自研的数据分析智能体TCDataAgent斩获全球第三的成绩，超越IBM、Meta等众多国际厂商，同时也是目前国内在该榜单上排名最高的排名。

来源：BIRD-Bench官网

BIRD-Bench以其严苛性被誉为“NL2SQL全球最难榜单”。它不仅要求系统将自然语言问题（如“找出未通过质检的订单”）准确翻译成SQL语句，更要求生成的SQL在真实、庞大且含“脏数据”的企业级数据库上执行结果精准且运行高效，对模型的深层语义理解和数据库真实内容感知能力提出了极高挑战。

在这个以真实业务数据库为基础的测试中，覆盖金融、医疗、体育等37个行业场景，数据库总容量达33GB，查询问题超过1万条。TCDataAgent在官方不公开数据集的封闭测试环境下，最终获得了75.74分，位居全球第三，国内第一。

相比于传统NL2SQL方案往往只能依赖有限信息“猜测”用户意图，易因数据结构复杂或语义模糊出错。TCDataAgent登榜的技术创新来源于引入了数据库约束验证机制，能够自动识别并修正SQL中潜在的结构性或语义性错误（如错误连接、冗余条件）。

更重要的是，它紧密结合数据库的真实内容对生成的SQL进行优化，显著提升了用户意图识别的准确率和翻译结果的可靠性。值得一提的是，TCDataAgent还引入了后训练（post-training）技术，通过优先筛选并复用效果最优的SQL样本进行模型迭代训练，有效提升了训练样本的质量和模型学习的稳定性。

腾讯云TCDataAgent在NL2SQL领域的技术研究成果也获得了国际学术界的认可，相关论文已被今年的数据库领域顶级国际会议VLDB接收。论文中的实验表明，TCDataAgent的“数据库内容感知”核心技术模块，可以无缝集成到其他NL2SQL系统中，最高能将查询执行准确率提升18.3%，并在多个主流方法上实现了超过5%的性能提升。

作为腾讯云新一代企业级智能分析Agent，TCDataAgent致力于让用户直接使用自然语言对结构化和非结构化数据进行复杂的数据查询、报表生成和趋势分析等任务，目前已开启内测。