← 返回列表

基于考点数据分布式总结的智能推荐答题系统

申请号: CN202410033657.1
申请人: 人民卫生电子音像出版社有限公司
申请日期: 2024/1/10

摘要文本

本发明涉及智能推荐答题技术领域,具体为基于考点数据分布式总结的智能推荐答题系统,包括个性考点分析模块和智能推荐模块,其中:个性考点分析模块收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测,智能推荐模块根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,个性考点分析模块再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,用于不断贴近用户的个性化需求。

专利详细信息

项目 内容
专利名称 基于考点数据分布式总结的智能推荐答题系统
专利类型 发明授权
申请号 CN202410033657.1
申请日 2024/1/10
公告号 CN117540108B
公开日 2024/4/2
IPC主分类号 G06F16/9535
权利人 人民卫生电子音像出版社有限公司
发明人 姚念龙; 朱德萍; 张波; 范亚丽
地址 北京市朝阳区潘家园南里19号楼6层

专利主权项内容

1.基于考点数据分布式总结的智能推荐答题系统,其特征在于:包括个性考点分析模块(100)和智能推荐模块(200),其中:所述个性考点分析模块(100)收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测;所述智能推荐模块(200)根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,所述个性考点分析模块(100)再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,用于不断贴近用户的个性化需求;所述个性考点分析模块(100)包括数据采集与处理单元(101)和个性考点分析单元(102),所述数据采集与处理单元(101)通过用户交互界面收集用户的学习数据,学习数据包括不同的数据特征,并将学习数据发送给个性考点分析单元(102);所述个性考点分析单元(102)利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,并将预测结果发送给智能推荐模块(200);所述智能推荐模块(200)包括结果分析单元(201)和匹配学习资源单元(202),所述结果分析单元(201)接收个性考点分析单元(102)发送的预测结果,预测结果包括各个考点的掌握程度得分,根据各个考点的掌握程度确定对应的学习策略;所述匹配学习资源单元(202)根据学习策略中的考点和对应难度的关键字来确定对应的学习资源;所述个性考点分析单元(102)利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,具体包括:利用日志记录收集用户的历史数据,包括数据采集与处理单元(101)收集的数据和用户对考点的掌握程度的数据,并将用户对考点的掌握程度作为目标变量,其余数据作为模型的输入特征,将目标变量和输入特征作为数据集,并划分数据集为训练集和测试集,在训练集上训练随机森林模型,算法将在训练过程中建立多棵决策树,每棵树使用数据集中的不同子样本和特征进行训练;从给定的训练集中随机选择部分样本,针对每个子样本集,随机选择部分特征用于建立决策树;针对每个子样本集和随机选择的特征,建立一个决策树模型,在构建决策树的过程中,采用信息增益指标确定节点的划分方式,直到达到节点中的样本属于同一类别,训练完成;所有的决策树都建立完成后,对数据采集与处理单元(101)发送的数据进行预测,对每棵决策树的预测结果进行求和平均,最终得到随机森林的整体预测结果;所述结果分析单元(201)接收个性考点分析单元(102)发送的预测结果,预测结果包括各个考点的掌握程度得分,根据不同掌握程度的得分大小确定掌握程度等级并确定对应的学习策略,具体包括:对于低掌握程度的考点,推荐单元回顾和基础概念解释;对于中掌握程度的考点,推荐中级难度的练习题和案例分析;对于高掌握程度的考点,引入高级和创新的概念,触发批判性思维和应用知识的挑战题目;所述匹配学习资源单元(202)根据学习策略中的考点和对应难度的关键字来确定对应的学习资源,通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,并根据用户掌握程度匹配相应的难度标签,形成搜索查询的参数,搜索查询利用数据库管理系统;根据查询参数,利用协同过滤在数据库中寻找匹配的学习资源;对学习资源进行排序,形成推荐列表;生成的推荐列表通过应用程序接口返回前端应用,并动态渲染至用户界面;所述匹配学习资源单元(202)通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,具体包括:对输入的学习材料文本进行预处理,包括但不限于文本的分词、去除停用词、词性标注、以及词干提取和词形还原,用于将文本归一化和简化;利用BERT模型对文本进行语义分析,理解单词在不同上下文中的含义,在关键词抽取的上下文中,BERT模型利用语义相似度量,区分关键词和其他语言噪声,确定词汇对于学习材料的重要程度;BERT模型的输出生成候选关键词列表,在此步骤中识别出那些携带文本主要信息的词汇,并生成一个由潜在关键词组成的列表,利用算法词频-逆文档频率算法结合BERT模型的上下文感知特征为每个候选关键词分配一个重要性得分,并根据重要性得分决定最终的关键词。 马 克 数 据 网