临床试验数据处理方法、装置及相关设备
摘要文本
本公开提供了一种临床试验数据处理方法、装置及相关设备,涉及自然语言处理技术领域。该方法包括:获取用于对待评估临床试验机构和/或临床试验项目机构或临床试验项目进行评估的临床试验文本数据;根据临床试验文本数据,构建向量数据库,其中,向量数据库中存储有对临床试验文本数据进行切词处理得到的多个词块的词块向量;将预先确定的多个评估指标的指标向量与向量数据库中各个词块的词块向量进行相似度匹配,并根据相似度匹配结果获取各个评估指标相关的临床试验文本数据;根据各个评估指标以及各个评估指标相关的临床试验文本数据,生成待评估临床试验机构和/或临床试验项目的评估结果。本公开能够提高临床试验数据的处理效率和准确性。
申请人信息
- 申请人:中国中医科学院西苑医院
- 申请人地址:100091 北京市海淀区西苑操场路1号
- 发明人: 中国中医科学院西苑医院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 临床试验数据处理方法、装置及相关设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410059209.9 |
| 申请日 | 2024/1/16 |
| 公告号 | CN117573812B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 中国中医科学院西苑医院 |
| 发明人 | 陆芳; 李庆娜; 邱攀博; 徐济铭; 李高扬; 谭琴 |
| 地址 | 北京市海淀区西苑操场路1号 |
专利主权项内容
1.一种临床试验数据处理方法,其特征在于,包括:获取临床试验文本数据,其中,所述临床试验文本数据为用于对待评估临床试验机构和/或临床试验项目进行评估的文本数据;根据所述临床试验文本数据,构建向量数据库,其中,所述向量数据库中存储有多个词块的词块向量,所述多个词块为对所述临床试验文本数据进行切词处理得到的;将预先确定的多个评估指标的指标向量与所述向量数据库中各个词块的词块向量进行相似度匹配,并根据相似度匹配结果获取各个评估指标相关的临床试验文本数据;根据各个评估指标以及各个评估指标相关的临床试验文本数据,生成所述待评估临床试验机构和/或临床试验项目的评估结果;其中,在将预先确定的多个评估指标的指标向量与所述向量数据库中各个词块的词块向量进行相似度匹配,并根据相似度匹配结果获取各个评估指标相关的临床试验文本数据之前,所述方法还包括:从临床医学文本数据中提取用于对待评估临床试验机构和/或临床试验项目进行评估的至少一个评估指标;根据提取的各个评估指标,生成向用户提问的至少一个问题文本,其中,每个问题文本中包含:多个单词;对每个问题文本中包含的各个单词进行向量化处理,得到每个问题文本中各个单词对应的单词向量;根据每个问题文本中各个单词对应的单词向量,生成每个问题文本对应的向量表示;根据每个问题文本对应的向量表示,确定各个评估指标的指标向量。