← 返回列表

面向大模型场景的存储数据和处理数据的方法、相关装置

申请号: CN202311745724.4
申请人: 北京百度网讯科技有限公司
申请日期: 2023/12/18

摘要文本

本公开提供了面向大模型场景的存储数据和处理数据的方法及相关装置,涉及数据处理、数据存储、云平台、云服务、深度学习、大模型、大语言模型等人工智能技术领域。该方法的一具体实施方式包括:响应于接收到待存储至目标数据湖的待存储数据,检测待存储数据的数据类型;响应于数据类型为非结构化数据类型,生成待存储数据的特征向量;将特征向量作为待存储数据的替代,存储至目标数据湖。该实施方式能够提升数据湖的数据支持能力,并扩展数据湖的应用场景。

专利详细信息

项目 内容
专利名称 面向大模型场景的存储数据和处理数据的方法、相关装置
专利类型 发明申请
申请号 CN202311745724.4
申请日 2023/12/18
公告号 CN117743335A
公开日 2024/3/22
IPC主分类号 G06F16/22
权利人 北京百度网讯科技有限公司
发明人 陈伟旭; 李莅; 叶青
地址 北京市海淀区上地十街10号百度大厦2层

专利主权项内容

1.一种面向大模型场景的存储数据方法,包括:响应于接收到待存储至目标数据湖的待存储数据,检测所述待存储数据的数据类型;响应于所述数据类型为非结构化数据类型,生成所述待存储数据的特征向量;将所述特征向量作为所述待存储数据的替代,存储至所述目标数据湖。