一种判别高效用模式挖掘方法、装置、电子设备及介质
摘要文本
珠海大横琴科技发展有限公司取得“一种透气窗帘布”专利技术,本发明实施例提供了一种判别高效用模式挖掘方法、装置、电子设备及介质,包括:获取原始数据库中待挖掘的模式,并采用预设公式计算模式的亲密效用上界,得到对应的计算结果;计算结果包括第一亲密效用上界、第二亲密效用上界和第三亲密效用上界;第二亲密效用上界和第三亲密效用上界基于模式的投影知识库计算确定;根据计算结果,确定针对模式搜索空间的修剪策略;根据修剪策略,从模式中确定判别高效用模式。根据本发明实施例,提出了更紧凑的亲密效用上界,并据此确立新的修剪策略,可以有效修剪搜索空间中更多的不可能模式,能够快速挖掘判别高效用模式。
专利主权项内容
1.一种判别高效用模式挖掘方法,其特征在于,所述方法包括:获取原始数据库中待挖掘的模式,并采用预设公式计算所述模式的亲密效用上界,得到对应的计算结果;所述计算结果包括第一亲密效用上界、第二亲密效用上界和第三亲密效用上界;所述第二亲密效用上界和所述第三亲密效用上界基于所述模式的投影知识库计算确定;根据所述计算结果,确定针对所述模式搜索空间的修剪策略;所述修剪策略包括第一修剪策略、第二修剪策略和第三修剪策略;基于所述第一修剪策略,从所述原始数据库的事务中抽取基于频度亲密度的知识构建全局树结构;其中,所述全局树结构由前缀树和头表组成;遍历所述全局树结构的头表,并在所述头表中的条目满足所述第二修剪策略的情况下,采用所述第二修剪策略对所述原始数据库进行修剪;遍历所述全局树结构对应的投影知识库,并在满足所述第三修剪策略的情况下,采用所述第三修剪策略对所述投影知识库进行修剪;基于修剪后的所述原始数据库和所述投影知识库构建条件树结构,并基于所述条件树结构挖掘得到所述判别高效用模式;其中,所述第一亲密效用上界的计算公式如下:其中,为模式,,;()为的第一亲密效用上界;()为在事务中的知识权重值;为事务的事务数据库;XX = ia1ia2...iak1 ≤ k, 1≤ akkwuXXkwuX, TdXTdTDBTd所述第二亲密效用上界的计算公式如下:其中,为模式,,;()为的第二亲密效用上界;、、...、为包含的基于频度亲密度的知识,;()为在数据库中的效用,以此类推;XX = ia1ia2...iak1 ≤ k, 1≤ aksafubXXK'1K'2K'tX1 ≤ tuK'1K'1所述第三亲密效用上界的计算公式如下:其中,为模式,,;为的某一扩展项;()为及其扩展项的第三亲密效用上界;为包含的基于频度亲密度的知识,()为在数据库中的效用。XX = ia1ia2...iak1 ≤ k, 1≤ akipXlafubXipXipK'qX1 ≤ t;uK'qK'q
专利申请信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种判别高效用模式挖掘方法、装置、电子设备及介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311685490.9 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117407442B |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06F16/2458 |
| 权利人 | 珠海大横琴科技发展有限公司 |
| 发明人 | 郭世明; 魏红强; 陈国华 |
| 地址 | 广东省珠海市横琴新区港澳大道2333号8栋1501办公 |