一种基于电商数据和社交媒体营销内容数据建立内容标签的方法
申请人信息
- 申请人:任拓数据科技(上海)有限公司
- 申请人地址:200040 上海市静安区江场三路250号5楼502室
- 发明人: 任拓数据科技(上海)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于电商数据和社交媒体营销内容数据建立内容标签的方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311478490.1 |
| 申请日 | 2023/11/7 |
| 公告号 | CN117786103A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F16/35 |
| 权利人 | 任拓数据科技(上海)有限公司 |
| 发明人 | 王烨卓; 何建树; 梁婷婷 |
| 地址 | 上海市静安区江场三路250号5楼502室 |
摘要文本
任拓数据科技(上海)有限公司获取“一种透气窗帘布”专利技术,本发明公开一种基于电商数据和社交媒体营销内容数据建立内容标签的方法,属于内容营销领域。针对现有打标签实体抽取结果不准确且效率慢的问题,本发明提供一种基于电商数据和社交媒体营销内容数据建立内容标签的方法,包括构建商品知识图谱;构建内容品类数据库;对内容品类数据库进行信息抽取构建品类内容标签树,按照品类内容标签树将内容品类数据库中的数据进行打标签。本发明对内容品类数据库进行信息抽取时采用RaNER模型识别具象化实体,再利用大语言模型结合信息抽取式prompt和思维链总结式prompt识别抽象化实体,并对多种模型实体抽取的结果进行融合,有效弥补单一模型进行实体抽取识别不准确且实体召回不全的问题,实体抽取准确率高且效率快。
专利主权项内容
1.一种基于电商数据和社交媒体营销内容数据建立内容标签的方法,其特征在于:包括如下步骤:S1:构建商品知识图谱;S2:构建内容品类数据库;获取媒体内容数据库,利用商品知识图谱从媒体内容数据库中筛选出各商品的品类相关的内容数据,构建为内容品类数据库;S3:对内容品类数据库进行信息抽取构建品类内容标签树,按照品类内容标签树将内容品类数据库中的数据进行打标签;其中该步骤具体包括如下步骤:S31:首先使用命名实体识别模型对内容品类数据库进行抽取人物实体、品类实体、品牌实体和商品属性实体;再使用大语言模型结合信息抽取式prompt和思维链总结式prompt对内容品类数据库进行语义识别并抽取人物实体,网络热词实体,用户痛点实体,产品特点实体,适用实体;最后进行实体结果融合得到最终的实体;S32:将最终的实体通过文本向量化模型将实体词转换成词向量;然后通过聚类算法得到若干类词向量;再然后通过大语言模型将每一类中的词归纳为一个或多个标签,利用大语言模型输出的关键词类型,构建树形结构的内容标签树,以及每个标签的关键词;S33:按照品类内容标签树将内容品类数据库中的内容文本进行打标签。