← 返回列表

一种构建医学指令数据集的方法

申请号: CN202410200638.3
申请人: 云南联合视觉科技有限公司
申请日期: 2024/2/23

摘要文本

本发明涉及一种构建医学指令数据集的方法,属于数据处理技术领域。本发明包括步骤:麻醉指令数据的生成;包括:Step1.1、纯文本的获取;Step1.2、设计生成指令数据的prompt模板;Step1.3、根据获取的纯文本和生成指令数据的prompt模板生成指令数据;Step2、指令数据初步的简单清理;Step3、模型评估指令数据;Step3.1、设计评估指令数据的prompt模板;Step3.2、根据清理的指令数据和评估指令数据的prompt模板评估生成的指令数据。本发明能去除低质量的数据,最终得到高质量的医学指令数据。。搜索马 克 数 据 网

专利详细信息

项目 内容
专利名称 一种构建医学指令数据集的方法
专利类型 发明申请
申请号 CN202410200638.3
申请日 2024/2/23
公告号 CN117786414A
公开日 2024/3/29
IPC主分类号 G06F18/214
权利人 云南联合视觉科技有限公司
发明人 王中海; 詹忆冰; 陶大鹏; 林旭; 刘伟锋; 刘宝弟; 李艳鸿; 周博豪
地址 云南省昆明市呈贡区科技信息创新孵化中心A座17楼1701室

专利主权项内容

1.一种构建医学指令数据集的方法,其特征在于:所述方法的具体步骤如下:Step1、麻醉指令数据的生成;包括:Step1.1、纯文本的获取;Step1.2、设计生成指令数据的prompt模板;Step1.3、根据获取的纯文本和生成指令数据的prompt模板生成指令数据;Step2、指令数据初步的简单清理;Step3、模型评估指令数据;Step3.1、设计评估指令数据的prompt模板;Step3.2、根据清理的指令数据和评估指令数据的prompt模板评估生成的指令数据。