← 返回列表

反讽识别方法、装置、计算设备及存储介质

申请号: CN202311443301.7
申请人: 人民网股份有限公司
申请日期: 2023/11/1

摘要文本

本发明公开了一种反讽识别方法、装置、计算设备及存储介质,该方法包括:根据各个有标注文本的反讽标签信息,构建各个有标注文本的标准推理结果;根据各个有标注文本及其标准推理结果,对大语言模型进行微调处理,得到目标语言模型;利用目标语言模型对任一无标注文本进行反讽推理处理,根据该无标注文本的反讽推理结果,确定该无标注文本的伪标签信息;根据各个无标注文本及其伪标签信息对中间识别模型进行微调处理,得到目标识别模型;中间识别模型用于提取输入文本的文本表示向量;利用目标识别模型进行文本的反讽识别处理。通过上述方式,实现了基于少量数据的有标注样本数据扩充,提升了模型的反讽识别性能,提升了模型构建的效率。

专利详细信息

项目 内容
专利名称 反讽识别方法、装置、计算设备及存储介质
专利类型 发明申请
申请号 CN202311443301.7
申请日 2023/11/1
公告号 CN117436457A
公开日 2024/1/23
IPC主分类号 G06F40/30
权利人 人民网股份有限公司
发明人 轩占伟; 崔向阳; 仝春艳; 刘松涛; 张凯; 黄涛; 杨松
地址 北京市西城区新街口外大街28号B座234号

专利主权项内容

1.一种反讽识别方法,其特征在于,包括:根据各个有标注文本的反讽标签信息,构建大语言模型对所述各个有标注文本的标准推理结果;根据所述各个有标注文本及其标准推理结果,对所述大语言模型进行微调处理,得到目标语言模型;利用所述目标语言模型对任一无标注文本进行反讽推理处理,根据该无标注文本的反讽推理结果,确定该无标注文本的伪标签信息;根据各个无标注文本及其伪标签信息对中间识别模型进行微调处理,得到目标识别模型;其中,所述中间识别模型用于提取输入文本的文本表示向量;利用所述目标识别模型进行文本的反讽识别处理。。