← 返回列表

一种自适应规则引导的大语言模型生成SQL系统

申请号: CN202311404243.7
申请人: 之江实验室
申请日期: 2023/10/27

摘要文本

本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。

专利详细信息

项目 内容
专利名称 一种自适应规则引导的大语言模型生成SQL系统
专利类型 发明授权
申请号 CN202311404243.7
申请日 2023/10/27
公告号 CN117131070B
公开日 2024/2/9
IPC主分类号 G06F16/242
权利人 之江实验室
发明人 丁锴; 董日达; 付村; 那崇宁
地址 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼

专利主权项内容

1.一种自适应规则引导的大语言模型生成SQL系统,其特征在于,包括:表结构构建模块、参考规则库构建模块、常用规则库、自适应规则构建模块、规则引导SQL生成模块;所述表结构构建模块用于列名标准化和列名字典构建,所述列名字典构建指将表名、列名和列数据类型合并转换为字典类型数据;所述列名标准化是对数据库中列名、表名的不规范形式进行的规范化处理;所述参考规则库构建模块,用于通过分析SQL生成机制以及SQL语法构建参考规则库,根据SQL生成步骤,所述参考规则库构建模块划分为以下子模块:表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;所述常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;所述自适应规则构建模块用于根据输入的Text查询语句,结合常用规则库,构建与Text查询语句匹配的自适应规则;所述规则引导SQL生成模块的输入为当前查询Text以及所述自适应规则,根据自适应规则,引导大语言模型逐步生成SQL语句;还包括可视化结果展示模块,用于将根据输入的查询语句得到的数据表、各个模块生成的SQL片段、规则引导SQL生成模块生成的完整的SQL进行可视化显示。