← 返回列表

一种基于Llama2的文本简化方法

申请号: CN202410225306.0
申请人: 云南师范大学
申请日期: 2024/2/29

摘要文本

本发明公开了一种基于Llama2的文本简化方法,属于深度学习领域,所述基于Llama2的文本简化方法包括以下步骤:基于预设文本形式,构建包含复杂句、简单句、SARI得分的数据集;根据所述数据集,构建融合所述SARI得分的输入模板;基于LoRA方法和所述输入模板对应的输入数和输出数,对Llama模型进行微调;基于调整后的所述Llama模型,构建简化句生成模板并输出简化结果。通过以上步骤,可以保障语言模型在样本数量较少情况下的训练效果。

专利详细信息

项目 内容
专利名称 一种基于Llama2的文本简化方法
专利类型 发明申请
申请号 CN202410225306.0
申请日 2024/2/29
公告号 CN117808124A
公开日 2024/4/2
IPC主分类号 G06N20/00
权利人 云南师范大学
发明人 甘健侯; 李子杰; 陈书雨; 王士进; 刘三女牙; 张桂戌; 郑淑英; 周菊香
地址 云南省昆明市呈贡区吴家营聚贤街768号

专利主权项内容

1.一种基于Llama2的文本简化方法,其特征在于,所述基于Llama2的文本简化方法包括以下步骤:基于预设文本形式,构建包含复杂句、简单句、SARI得分的数据集;根据所述数据集,构建融合所述SARI得分的输入模板;基于LoRA方法和所述输入模板对应的输入数和输出数,对Llama模型进行微调;基于调整后的所述Llama模型,构建简化句生成模板并输出简化结果。