← 返回列表

一种细粒度多模态中文大语言模型构建方法及计算机存储介质

申请号: CN202311630540.3
申请人: 深圳若愚科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种细粒度多模态中文大语言模型构建方法及计算机存储介质
专利类型 发明申请
申请号 CN202311630540.3
申请日 2023/12/1
公告号 CN117633707A
公开日 2024/3/1
IPC主分类号 G06F18/25
权利人 深圳若愚科技有限公司
发明人 孙腾
地址 广东省深圳市龙华区大浪街道浪口社区华昌路239号凯豪达工业园39栋306

摘要文本

深圳若愚科技有限公司取得“一种透气窗帘布”专利技术,本申请公开了一种细粒度多模态中文大语言模型构建方法及计算机存储介质,属于计算机领域,所述方法包括:规划细粒度多模态中文大语言模型的架构,细粒度多模态中文大语言模型包括多模态信息提取和融合模块,核心大语言模型以及多模态内容生成模块;本申请由于采用了构建细粒度多模态中文大语言模型包括多模态信息提取和融合模块,核心大语言模型以及多模态内容生成模块,进而实现了由中文大语言模型作为模型系统中枢连接理解和生成两大模块,能够根据用户指令执行一系列多模态内容理解与内容生成任务,与当前多模态大模型技术相对比,有幻视问题少,可扩展功能多,训练成本低,对复杂多模态场景理解深刻等优势。

专利主权项内容

1.一种细粒度多模态中文大语言模型构建方法,其特征在于,包括:S1、规划细粒度多模态中文大语言模型的架构,细粒度多模态中文大语言模型包括多模态信息提取和融合模块,核心大语言模型以及多模态内容生成模块;S2、构建多模态信息提取和融合模块;S3、构建核心大语言模型;S4、构建多模态内容生成模块;S5、训练和调优。