数据检索方法、装置、设备及计算机可读介质
申请人信息
- 申请人:珠海格力电器股份有限公司; 珠海联云科技有限公司
- 申请人地址:519070 广东省珠海市珠海横琴新区汇通三路108号办公608
- 发明人: 珠海格力电器股份有限公司; 珠海联云科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 数据检索方法、装置、设备及计算机可读介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311822316.4 |
| 申请日 | 2023/12/27 |
| 公告号 | CN117473071A |
| 公开日 | 2024/1/30 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 珠海格力电器股份有限公司; 珠海联云科技有限公司 |
| 发明人 | 赵鹏辉; 李绍斌; 唐杰; 黄鑫; 史欣宇 |
| 地址 | 广东省珠海市前山金鸡西路六号; 广东省珠海市吉大景山路莲山巷8号601室 |
摘要文本
珠海格力电器股份有限公司; 珠海联云科技有限公司取得“一种透气窗帘布”专利技术,本申请涉及一种数据检索方法、装置、设备及计算机可读介质。该方法包括:获取提问数据;将所述提问数据转换为第一向量;在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的;返回与所述第二向量对应的回答数据作为所述提问数据的回答。本申请利用大语言模型建立目标向量数据库,利用向量数据库允许根据向量距离或相似性快速准确地搜索和检索数据,存储与其想要的领域或行业相关的不同主题、关键字、事实、观点、来源的信息,提高文本检索、语音/视频/图像检索、个性化推荐、智能搜索、智能问答等场景的准确度和速度,解决了大模型回答不准确、回答效率低的技术问题。
专利主权项内容
1.一种数据检索方法,其特征在于,包括:获取提问数据;将所述提问数据转换为第一向量;在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的,所述目标向量数据库包括有所述第二向量和对应的回答数据之间的对应关系;返回与所述第二向量对应的回答数据作为所述提问数据的回答;所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量之前,所述方法还包括按照如下方式基于大语言模型建立所述目标向量数据库:获取目标业务领域的文本数据,其中,所述目标业务领域为所述目标向量数据库面向的应用领域;将所述文本数据进行分词,得到词序列;将每一个所述词序列嵌入到预设长度的向量空间中,得到词向量序列;将所述词向量序列输入到串联的多个transformer块中的第一个transformer块,以通过串联的多个transformer块对所述词向量序列进行特征编码处理;获取最后一个transformer块输出的向量数据作为所述文本数据的语义特征保存到所述目标向量数据库中,并将所述向量数据和文本数据之间的对应关系保存在所述目标向量数据库中,以使提问数据在所述目标向量数据库中匹配到对应的向量数据时,将与所述向量数据对应的文本数据作为所述回答数据进行返回。