一种自适应规则引导的大语言模型生成SQL系统
摘要文本
本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。
申请人信息
- 申请人:之江实验室
- 申请人地址:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 发明人: 之江实验室
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种自适应规则引导的大语言模型生成SQL系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311404243.7 |
| 申请日 | 2023/10/27 |
| 公告号 | CN117131070B |
| 公开日 | 2024/2/9 |
| IPC主分类号 | G06F16/242 |
| 权利人 | 之江实验室 |
| 发明人 | 丁锴; 董日达; 付村; 那崇宁 |
| 地址 | 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼 |
专利主权项内容
1.一种自适应规则引导的大语言模型生成SQL系统,其特征在于,包括:表结构构建模块、参考规则库构建模块、常用规则库、自适应规则构建模块、规则引导SQL生成模块;所述表结构构建模块用于列名标准化和列名字典构建,所述列名字典构建指将表名、列名和列数据类型合并转换为字典类型数据;所述列名标准化是对数据库中列名、表名的不规范形式进行的规范化处理;所述参考规则库构建模块,用于通过分析SQL生成机制以及SQL语法构建参考规则库,根据SQL生成步骤,所述参考规则库构建模块划分为以下子模块:表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;所述常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;所述自适应规则构建模块用于根据输入的Text查询语句,结合常用规则库,构建与Text查询语句匹配的自适应规则;所述规则引导SQL生成模块的输入为当前查询Text以及所述自适应规则,根据自适应规则,引导大语言模型逐步生成SQL语句;还包括可视化结果展示模块,用于将根据输入的查询语句得到的数据表、各个模块生成的SQL片段、规则引导SQL生成模块生成的完整的SQL进行可视化显示。