← 返回列表

基于企业披露报告的创新文本特征构造方法和系统

申请号: CN202311360362.7
申请人: 合肥工业大学
更新日期: 2026-03-09

摘要文本

合肥工业大学取得“一种透气窗帘布”专利技术,本发明提供一种基于企业披露报告的创新文本特征构造方法和系统,涉及本特征挖掘技术领域。本发明基于企业披露报告设计了领域适用的创新文本抽取方法。通过构建特定领域的企业披露报告语料库,基于Word2Vec模型构造了该领域适用的创新词典,实现了对特定领域中披露报告创新文本更准确有效的抽取。这一方法提高了对特定领域披露报告中创新文本抽取的准确性和有效性,有助于更好地理解和利用领域相关信息。同时,通过基于ChatGPT的创新文本推理特征构造方法,可以进一步挖掘基于创新文本所可能获取的推理信息,使最终构造出的多维创新文本特征矩阵对创新信息的表征更加准确、完整。

专利主权项内容

1.一种基于企业披露报告的创新文本特征构造方法,其特征在于,包括:S1、获取目标领域的企业披露报告;S2、基于预设的目标领域创新词典对企业披露报告进行抽取得到创新文本,所述预设的目标领域创新词典通过Word2Vec模型构造;S3、基于所述创新文本获取创新文本特征;所述创新文本特征包括初始特征和推理特征,其中,所述推理特征的获取过程包括:通过ChatGPT获取创新文本的推理文本并提取推理文本的主题特征,去除推理文本中的冗余主题特征,得到推理特征;S4、融合初始特征和推理特征,基于Transformer模型,对各特征效用进行自适应赋权,生成多维创新文本特征矩阵。

专利申请信息

项目 内容
专利名称 基于企业披露报告的创新文本特征构造方法和系统
专利类型 发明申请
申请号 CN202311360362.7
申请日 2023/10/19
公告号 CN117610663A
公开日 2024/2/27
IPC主分类号 G06N5/04
权利人 合肥工业大学
发明人 陈波; 彭思佳; 蒋翠清; 车万留; 王钊; 丁勇
地址 安徽省宣城市宣州区薰化路301号(合肥工业大学宣城校区)