← 返回列表

基于数据重放的可持续金融事件抽取系统及方法

申请号: CN202311500765.7
申请人: 华泰证券股份有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于数据重放的可持续金融事件抽取系统及方法
专利类型 发明申请
申请号 CN202311500765.7
申请日 2023/11/10
公告号 CN117493486A
公开日 2024/2/2
IPC主分类号 G06F16/33
权利人 华泰证券股份有限公司
发明人 叶超; 邵旭; 曾文秋; 朱冰; 王晓玲; 吴苑斌; 潘明慧; 邱震宇; 姜聪聪; 王志承; 杜威; 纪焘
地址 江苏省南京市建邺区江东中路228号

摘要文本

本发明公开了一种基于数据重放的可持续金融事件抽取系统及方法,属于人工智能自然语言处理技术领域,具体为:抽取并解析金融事件,获得金融事件类型和关联的金融数据;对金融数据进行数据增强、绑定、泛化处理,获得增强且泛化的金融数据集并制作训练数据,导入抽取模型获得金融数据的软标签;其中训练数据中标注有硬标签;将软标签、硬标签分别代入知识蒸馏损失函数、交叉熵损失函数计算获得最终损失,并对最终损失采用梯度优化,获得训练参数用于修正抽取模型并基于修正后的抽取模型对后续输入的金融数据,抽取持续性金融事件;本发明将数据增强与知识蒸馏技术相结合,提高系统数据泛化能力;使系统在较小数据量下依然具备旧任务的学习能力。

专利主权项内容

1.一种基于数据重放的可持续金融事件抽取方法,其特征在于,包括:抽取并解析金融事件,获得金融事件类型和关联的金融数据;对金融数据进行数据增强、绑定、泛化处理,获得增强且泛化的金融数据集;基于增强且泛化的金融数据集制作训练数据,并将训练数据导入抽取模型获得金融数据的软标签;其中训练数据中标注有硬标签;将软标签、硬标签分别代入知识蒸馏损失函数、交叉熵损失函数计算获得最终损失,并对最终损失采用梯度优化,获得训练参数;根据训练参数,修正抽取模型;修正后的抽取模型用于根据后续输入的金融数据,抽取持续性的金融事件。 关注微信公众号马克数据网