← 返回列表

一种基于AIGC的相似词判断方法

申请号: CN202311638879.8
申请人: 环球数科集团有限公司
申请日期: 2023/12/4

摘要文本

本发明涉及相似词判断方法的技术领域,具体涉及一种基于AIGC的相似词判断方法,包括以下步骤:控制模块根据文本和文本之间的余弦相似度得出词语和词语之间的余弦相似度,根据相关信息计算第一次判断词语相似因子,根据第一次判断词语相似因子得出第一次判断词语相似信息并传输至通信模块;通信模块将第一次判断词语相似信息传输至用户端。计算第一次判断词语相似信息时考虑到检索得到的文本的误差、文本的解释以及用户的评价指数,从而能提高计算第一次判断词语相似信息的计算精度,提高判断的准确性。。

专利详细信息

项目 内容
专利名称 一种基于AIGC的相似词判断方法
专利类型 发明授权
申请号 CN202311638879.8
申请日 2023/12/4
公告号 CN117371439B
公开日 2024/3/8
IPC主分类号 G06F40/284
权利人 环球数科集团有限公司
发明人 张卫平; 李显阔; 张伟; 王丹; 王晶
地址 广东省深圳市南山区粤海街道高新南九道10号深圳湾科技生态园10栋B座17层01-03号

专利主权项内容

1.一种基于AIGC的相似词判断方法,其特征在于,包括以下步骤:S1:分析模块基于AIGC技术分析得出词语和词语/>之间的语义关联度参考指数、文本和文本/>之间的余弦相似度、文本/>被使用的总次数、文本/>第/>次使用时用户的评价指数、用户得到文本/>对应网站的使用年限、文本/>被使用的总次数、文本/>第/>次使用时用户的评价指数、用户得到文本/>对应网站的使用年限、词语/>和词语/>之间的字数重复指数的信息,并传输至控制模块;其中,文本/>指的是词语/>经过AIGC技术解释得到的文本,文本/>指的是词语/>经过AIGC技术解释得到的文本;S2:控制模块根据文本和文本/>之间的余弦相似度得出词语/>和词语/>之间的余弦相似度,根据上述步骤S1中的相关信息计算第一次判断词语相似因子,根据第一次判断词语相似因子得出第一次判断词语相似信息并传输至通信模块;S3:通信模块将第一次判断词语相似信息传输至用户端;所述控制模块计算第一次判断词语相似因子时,满足以下式子:

;其中,为第一次判断词语相似因子,/>为词语/>和词语/>之间的语义关联度参考指数,/>为词语/>和词语/>之间的余弦相似度,/>为文本/>被使用的总次数,/>为文本/>第/>次使用时用户的评价指数,/>为用户得到文本/>对应网站的使用年限,/>为文本/>被使用的总次数,/>为文本/>第/>次使用时用户的评价指数,/>为用户得到文本/>对应网站的使用年限,/>为词语/>和词语/>之间的字数重复指数;
为文本/>和文本/>之间的余弦相似度;所述控制模块计算第一次判断词语相似信息时,满足以下式子:
;其中,为第一次判断词语相似信息,/>为第一次判断词语相似因子的选择阈值,当时为第一次判断词语相似度低,当/>时为第一次判断词语相似度高;在步骤S1中,分析模块基于AIGC技术分析得出检索词语的相似词时词语/>出现的参考指数、第一常数、检索词语/>的相似词时词语/>的排位、检索词语/>的相似词时词语/>出现的参考指数、检索词语/>的相似词时词语/>的排位、第二常数的信息,并传输至控制模块;在步骤S2中,控制模块根据上述检索词语的相似词时词语/>出现的参考指数、第一常数、检索词语/>的相似词时词语/>的排位、检索词语/>的相似词时词语/>出现的参考指数、检索词语/>的相似词时词语/>的排位、第二常数的信息计算第二次判断词语相似因子,根据第二次判断词语相似因子得出第二次判断词语相似信息并传输至通信模块;在步骤S3中,通信模块将第二次判断词语相似信息传输至用户端;所述控制模块计算第二次判断词语相似因子时,满足以下式子:
;其中,为第二次判断词语相似因子,/>为检索词语/>的相似词时词语/>出现的参考指数,/>为检索词语/>的相似词时词语/>的排位,/>为第一常数,第一常数的取值范围大于检索词语/>的相似词的总个数,/>为检索词语/>的相似词时词语/>出现的参考指数,/>为检索词语/>的相似词时词语/>的排位,/>为第二常数,第二常数的取值范围大于检索词语/>的相似词的总个数;所述控制模块计算第二次判断词语相似信息时,满足以下式子:
;其中,为第二次判断词语相似信息,/>为第二次判断词语相似因子的选择阈值,当时为第二次判断词语相似度高,当/>时为第二次判断词语相似度低。