← 返回列表
一种基于Llama2的文本简化方法
摘要文本
本发明公开了一种基于Llama2的文本简化方法,属于深度学习领域,所述基于Llama2的文本简化方法包括以下步骤:基于预设文本形式,构建包含复杂句、简单句、SARI得分的数据集;根据所述数据集,构建融合所述SARI得分的输入模板;基于LoRA方法和所述输入模板对应的输入数和输出数,对Llama模型进行微调;基于调整后的所述Llama模型,构建简化句生成模板并输出简化结果。通过以上步骤,可以保障语言模型在样本数量较少情况下的训练效果。
申请人信息
- 申请人:云南师范大学
- 申请人地址:650500 云南省昆明市呈贡区聚贤街768号
- 发明人: 云南师范大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于Llama2的文本简化方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410225306.0 |
| 申请日 | 2024/2/29 |
| 公告号 | CN117808124A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06N20/00 |
| 权利人 | 云南师范大学 |
| 发明人 | 甘健侯; 李子杰; 陈书雨; 王士进; 刘三女牙; 张桂戌; 郑淑英; 周菊香 |
| 地址 | 云南省昆明市呈贡区吴家营聚贤街768号 |
专利主权项内容
1.一种基于Llama2的文本简化方法,其特征在于,所述基于Llama2的文本简化方法包括以下步骤:基于预设文本形式,构建包含复杂句、简单句、SARI得分的数据集;根据所述数据集,构建融合所述SARI得分的输入模板;基于LoRA方法和所述输入模板对应的输入数和输出数,对Llama模型进行微调;基于调整后的所述Llama模型,构建简化句生成模板并输出简化结果。