基于人工智能的数据清理方法和系统
申请人信息
- 申请人:中免日上互联科技有限公司; 中国旅游集团中免股份有限公司
- 申请人地址:201207 上海市浦东新区正定路515号1幢A6库区一层7号仓库辅助用房二层
- 发明人: 中免日上互联科技有限公司; 中国旅游集团中免股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于人工智能的数据清理方法和系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202310712102.5 |
| 申请日 | 2023/6/15 |
| 公告号 | CN116450635B8 |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/215 |
| 权利人 | 中免日上互联网科技有限公司; 中国旅游集团中免股份有限公司 |
| 发明人 | 游子龙 |
| 地址 | 上海市浦东新区正定路515号1幢A6库区一层7号仓库辅助用房二层; |
摘要文本
中免日上互联网科技有限公司; 中国旅游集团中免股份有限公司获取“一种透气窗帘布”专利技术,本发明提供的一种基于人工智能的数据清理方法和系统,该方法包括基于每个待清理聊天群信息中的群用户信息和用户信息确定用户与每个待清理聊天群的关联程度,基于每个待清理聊天群信息中的群聊天记录和用户信息确定每个待清理聊天群的群聊天记录的重要程度,基于用户与每个待清理聊天群的关联程度和每个待清理聊天群的群聊天记录的重要程度确定每个待清理聊天群的重要程度,将小于重要程度阈值所对应的多个清理聊天群的群聊天记录进行删除,将大于重要程度阈值所对应的多个保留聊天群的群聊天记录进行保留,该方法能够快速准确的对群聊天记录进行数据清理。
专利主权项内容
1.一种基于人工智能的数据清理方法,其特征在于,包括:获取用户信息和多个待清理聊天群信息,所述多个待清理聊天群信息中的每个待清理聊天群信息包括群用户信息和群聊天记录;基于所述每个待清理聊天群信息中的群用户信息和所述用户信息使用用户关联程度确定模型确定用户与每个待清理聊天群的关联程度;基于所述每个待清理聊天群信息中的群聊天记录和所述用户信息确定每个待清理聊天群的群聊天记录的重要程度;基于所述用户与每个待清理聊天群的关联程度和所述每个待清理聊天群的群聊天记录的重要程度确定每个待清理聊天群的重要程度;判断所述每个待清理聊天群的重要程度是否大于重要程度阈值;将小于重要程度阈值所对应的多个待清理聊天群作为多个清理聊天群,并将所述多个清理聊天群的群聊天记录进行删除,将大于重要程度阈值所对应的多个待清理聊天群作为多个保留聊天群,并将所述多个保留聊天群的群聊天记录进行保留;所述方法还包括:获取所述多个保留聊天群的群聊天记录中的文字聊天记录和图片聊天记录;基于文字关联程度确定模型确定所述多个保留聊天群的群聊天记录中每一条图片聊天记录与前后N条文字聊天记录的关联程度,其中N为大于1的整数;判断所述每一条图片聊天记录与前后N条文字聊天记录的关联程度是否大于文字关联程度阈值;将小于文字关联程度阈值所对应的图片聊天记录进行删除,将大于文字关联程度阈值所对应的图片聊天记录进行保留。