← 返回列表

一种基于SNP多态性的单细胞barcode身份识别方法

申请号: CN202311367366.8
申请人: 云准医药科技(广州)有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于SNP多态性的单细胞barcode身份识别方法
专利类型 发明申请
申请号 CN202311367366.8
申请日 2023/10/21
公告号 CN117423382A
公开日 2024/1/19
IPC主分类号 G16B20/20
权利人 云准医药科技(广州)有限公司
发明人 吴声鹏; 杨文哲; 李强; 黄海波
地址 广东省广州市黄埔区广州国际生物岛星汉二路31号自编3栋5层10-11单元

摘要文本

本申请涉及单细胞的混样拆分技术领域,公开了一种基于SNP多态性的单细胞barcode身份识别方法,使用人类的SNP变异位点数据库进行位点的确定进行验证和识别,在本申请中,SNP能很好的在减少实验环节方面的干扰,通过不同人的SNP位点直接在fastq层面识别差异,最终通过位点的差异权重进行身份的识别,很好的降低了人为的干扰,提高多样本的单细胞拆分的准确性。。来源:专利查询网

专利主权项内容

1.一种基于SNP多态性的单细胞barcode身份识别方法,其特征在于,使用人类的SNP变异位点数据库进行位点的确定进行验证和识别;具体包括:S1:通过STAR将原始fastq数据的比对回基因组,通过k-mer标签,在参考基因组上快速定位可能的比对位置,获取比对bam文件;S2:使用samtools的mpileup提取SNP的位点信息,过滤低覆盖度低于20的位点,去除基因型0/1的杂合位点的信息,并计算该位点的基因型0/0和基因型1/1的比例;S3:将基于所述S1和所述S2获取结果与人类的SNP变异位点数据库进行同点位比较,获取权重值weight,其中,PL为人类的SNP变异位点数据库中的基因型0/0、基因型1/0和基因型1/1的质量值,site-number为检测到的所有相同位点的数量,coverage为检测到该位点的覆盖率;S4:获取每一个细胞对应的SNP位点的权重值矩阵,使用sklearn的机器学习的梯度优化算法进行分类,最终获取每一个barcode最可能属于的供体。