基于大数据挖掘的知识点生成方法及系统
申请人信息
- 申请人:广东信聚丰科技股份有限公司
- 申请人地址:510700 广东省广州市广州高新技术产业开发区香山路17号办公楼308
- 发明人: 广东信聚丰科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于大数据挖掘的知识点生成方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311819594.4 |
| 申请日 | 2023/12/27 |
| 公告号 | CN117473076B |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06F16/335 |
| 权利人 | 广东信聚丰科技股份有限公司 |
| 发明人 | 黎国权; 朱晖 |
| 地址 | 广东省广州市广州高新技术产业开发区香山路17号办公楼308 |
摘要文本
本申请提供的基于大数据挖掘的知识点生成方法及系统,通过综合考虑编辑行为意向和轨迹,能够灵活地生成适应不同学习者需求的课程知识点标注文本块,提供个性化的学习支持。这种基于量化语义表示、编辑行为意向特征和编辑行为轨迹特征的知识点生成方法具有资源节约优势。通过量化语义表示,可以有效地压缩和存储大量的文本信息,减少了对存储资源的需求。同时,利用编辑行为意向特征和编辑行为轨迹特征进行知识点生成,能够精确地针对学习者的需求和行为进行响应,避免了不必要的冗余生成,提高了生成结果的精度和灵活性。
专利主权项内容
1.一种基于大数据挖掘的知识点生成方法,其特征在于,应用于大数据挖掘系统,所述方法包括:在对目标离线学习用户进行学习行为分析得到拟处理课程资源文本时,获得所述目标离线学习用户在所述拟处理课程资源文本中的初始编辑文本块分布数据;基于所述初始编辑文本块分布数据,通过课程知识点生成网络的文本描述挖掘组件进行文本描述挖掘,得到目标文本描述量化语义;其中,目标文本描述量化语义用于反映相应学习内容编辑文本块的文本语义特征;基于所述目标文本描述量化语义,通过所述课程知识点生成网络的行为意向解析组件进行行为意向解析,得到所述目标离线学习用户的每个学习内容编辑文本块的编辑行为意向特征和编辑行为轨迹特征;基于所述编辑行为意向特征和所述编辑行为轨迹特征,通过所述课程知识点生成网络的课程知识点生成组件进行课程知识点生成,得到对应的学习内容编辑文本块的课程知识点标注文本块;其中,所述文本描述挖掘组件包括第一文本描述挖掘分支和第一文本描述拼接分支,所述基于所述初始编辑文本块分布数据,通过课程知识点生成网络的文本描述挖掘组件进行文本描述挖掘,得到目标文本描述量化语义,包括:获得所述初始编辑文本块分布数据的文本描述挖掘信息;基于所述初始编辑文本块分布数据的文本描述挖掘信息,通过所述第一文本描述挖掘分支生成所述拟处理课程资源文本对应的第一文本描述量化语义;通过所述第一文本描述拼接分支将所述拟处理课程资源文本对应的第一文本描述量化语义与上一课程资源文本对应的第一文本描述量化语义进行文本描述拼接,得到所述目标文本描述量化语义,所述上一课程资源文本和所述拟处理课程资源文本处于相同课程资源文本集,在所述课程资源文本集中所述上一课程资源文本在所述拟处理课程资源文本之前且与所述拟处理课程资源文本存在关联;其中,所述课程知识点生成网络对应的原始决策树算法包括基础文本描述挖掘组件、基础行为意向解析组件和基础课程知识点生成组件,所述方法还包括:获得过往离线学习用户在过往课程资源文本中的过往初始编辑文本块分布数据;基于所述过往初始编辑文本块分布数据,通过所述基础文本描述挖掘组件进行文本描述挖掘,得到目标过往文本描述量化语义;基于所述目标过往文本描述量化语义,通过所述基础行为意向解析组件进行行为意向解析,得到所述过往离线学习用户的每个学习内容编辑文本块的过往编辑行为意向特征和过往编辑行为轨迹特征;基于所述过往编辑行为意向特征和所述过往编辑行为轨迹特征,通过所述基础课程知识点生成组件进行课程知识点生成,得到对应的学习内容编辑文本块的过往课程知识点标注文本块;基于所述过往课程知识点标注文本块生成目标算法网络调试评价指标;基于所述目标算法网络调试评价指标对所述原始决策树算法的算法变量进行更新改进,得到所述课程知识点生成网络;其中,所述基于所述过往课程知识点标注文本块生成目标算法网络调试评价指标,包括:基于所述过往课程知识点标注文本块分别生成意向挖掘算法网络调试评价指标、意向更新算法网络调试评价指标和扰动算法网络调试评价指标,所述意向挖掘算法网络调试评价指标用于表征编辑意向挖掘的精度,所述意向更新算法网络调试评价指标用于表征不同课程资源文本之间编辑行为调整的变化系数,所述扰动算法网络调试评价指标用于表征编辑意向挖掘的置信度;基于所述意向挖掘算法网络调试评价指标、所述意向更新算法网络调试评价指标和所述扰动算法网络调试评价指标中至少一种,生成所述目标算法网络调试评价指标。