首页 > 计算机科学

AutoLink首创自主扩展模式链接,突破大规模Text-to-SQL瓶颈

数据派THU 2026-02-01 17:00
文章摘要
背景:Text-to-SQL任务旨在将自然语言问题转换为SQL查询,但面对包含大量表和列的工业级大规模数据库时,直接将完整数据库模式(Schema)输入大语言模型(LLM)会导致计算成本高、噪声干扰和性能下降。研究目的:为解决大规模数据库中的模式链接(Schema Linking)难题,论文提出AutoLink方法,将模式链接从一次性静态筛选转变为由LLM驱动的智能体进行自主探索和渐进式扩展的过程。结论:AutoLink通过构建交互环境(数据库环境和模式向量存储),让智能体执行探索、检索、验证等动作,逐步构建高召回、低噪声的Schema子集。在Spider 2.0-Lite等基准测试中,AutoLink在严格召回率上显著优于现有方法,同时大幅降低token消耗,展现出更强的可扩展性和鲁棒性,为工业级Text-to-SQL提供了高效实用的解决方案。
AutoLink首创自主扩展模式链接,突破大规模Text-to-SQL瓶颈
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
AutoLink首创自主扩展模式链接,突破大规模Text-to-SQL瓶颈
AutoLink首创自主扩展模式链接,突破大规模Text-to-SQL瓶颈
本文约5300字,建议阅读10分钟本文介绍了 AutoLink 以探索式方法实现大规模数据库高效 Schema 链接。Text-to-SQL(又称 NL2SQL)是一项将用户的自然语言问题自动转换为
10小时前
小心,那些看似聪明的AI,其实眼里只有“补丁”?
小心,那些看似聪明的AI,其实眼里只有“补丁”?
来源:DeepHub IMBA本文约2300字,建议阅读5分钟本文介绍了对抗样本如何轻易欺骗高准确率的图像分类模型,揭示深度学习在安全性上的脆弱本质。下图展示了一个有趣的现象:在法国斗牛犬的图像上添加
10小时前
比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题
比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题
来源:机器之心本文约2500字,建议阅读10分钟在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?一个普遍的解法是「测试时搜索」(Test-time searc
2026-01-31
王琳:逐梦大数据 从探索到融合的蜕变之旅 | 提升之路系列(二)
王琳:逐梦大数据 从探索到融合的蜕变之旅 | 提升之路系列(二)
导读为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学
2026-01-31
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1