一种基于大模型的安全编码规范多标融合方法及系统
申请人信息
- 申请人:深圳海云安网络安全技术有限公司
- 申请人地址:518000 广东省深圳市福田区梅林街道孖岭社区凯丰路10号翠林大厦15层1501—1504室
- 发明人: 深圳海云安网络安全技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大模型的安全编码规范多标融合方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410118629.X |
| 申请日 | 2024/1/29 |
| 公告号 | CN117648673A |
| 公开日 | 2024/3/5 |
| IPC主分类号 | G06F18/25 |
| 权利人 | 深圳海云安网络安全技术有限公司 |
| 发明人 | 谢朝海; 齐大伟; 彭波; 雷德诚; 谢朝战 |
| 地址 | 广东省深圳市福田区梅林街道孖岭社区凯丰路10号翠林大厦15层1501—1504室 |
摘要文本
本发明涉及一种基于大模型的安全编码规范多标融合方法及系统,步骤包括:通过采集国家法律法规、标准规范及编码相关规定构建编码多标要求库,采集大量编码规范样本与相应的编码示例构建编码规范库,利用大语言模型对编码多标要求库进行自然语言理解、合并及拆解,形成编码多标要求融合库,通过大语言模型将编码规范库中的编码规范样本与其在编码多标要求融合库中符合的条款进行映射,在编码时,将待分析的代码片段及更新的编码多标要求融合库输入训练好的大语言模型,进行功能模块信息识别,并根据识别的功能模块信息从编码规范库中查询获取高匹配的编码示例,生成参考编码规范样本的提示,及获取其合规性,以实时反馈代码片段的实时合规性。
专利主权项内容
1.一种基于大模型的安全编码规范多标融合方法,其特征在于,步骤包括:采集国家法律法规、标准规范及编码相关规定并构建编码多标要求库;采集大量编码规范样本与相应的编码示例并构建编码规范库,每个编码规范样本对应一个或多个编码示例,其中,编码规范样本包括正确样本和有缺陷样本,正确样本为符合规范的编码示例样本,有缺陷样本为不符合规范的编码示例样本;将预处理后的编码多标要求库提交给大语言模型进行训练,以通过大语言模型对编码多标要求库中的条款进行自然语言理解、合并及拆解,并将经过自然语言理解、合并及拆解处理后的条款进行重新组合,以形成编码多标要求融合库;将编码规范库输入大语言模型进行学习训练,以通过大语言模型将编码规范库中的编码规范样本与其在编码多标要求融合库中符合的条款进行映射;编码时,将待分析的代码片段及更新的编码多标要求融合库输入训练好的大语言模型,以对大预言模型进行重新训练或微调,通过重新训练或微调后的大语言模型对待分析的代码片段进行功能模块信息识别,并根据识别的功能模块信息从编码规范库中查询获取高匹配的编码示例,根据高匹配的编码示例找到相应的编码规范样本,并生成参考编码规范样本的提示,及根据与高匹配的编码示例相应的编码规范样本找到其映射的条款及获取其合规性,以实时反馈待分析的代码片段的实时合规性。。 (来源 马克数据网)