一种化学结构式的智能识别方法
摘要文本
本发明公开了一种化学结构式的智能识别方法,本发明将右键选中的图片信息,或者截屏软件提供的图片像素信息,或者手动绘制的结构图片信息结合化学分子图片的固有特征进行图片预处理,然后识别出图片中每个原子的坐标、原子的元素名称或者与原子连接的化学基团名称、不同化学键的类型以及电荷同位素等信息,最后汇总提取的信息生成数据文件,最后在结构式编辑器中将分子的结构绘制并展现出来。
申请人信息
- 申请人:上海鹰谷信息科技有限公司
- 申请人地址:201203 上海市浦东新区中国(上海)自由贸易试验区郭守敬路498号6幢15206-15208, 15210-15212室
- 发明人: 上海鹰谷信息科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种化学结构式的智能识别方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN201711407771.2 |
| 申请日 | 2017年12月22日 |
| 公告号 | CN108062529B |
| 公开日 | 2024年1月12日 |
| IPC主分类号 | G06V30/42 |
| 权利人 | 上海鹰谷信息科技有限公司 |
| 发明人 | 邓光辉; 裴剑锋; 来鲁华; 徐优俊; 胡启万; 孙潭霖; 谢兆同; 陈宇; 孙美建; 王力恒; 晋峰; 李巧; 朱华军; 邓超辉; 许艳 |
| 地址 | 上海市浦东新区中国(上海)自由贸易试验区郭守敬路498号6幢15206-15208, 15210-15212室 |
专利主权项内容
1.一种化学结构式的智能识别方法,其特征在于,包括以下步骤:将含有化学结构式的图片数据转化为字符串并发送到后台;后台接收到字符串后转换为图片,经过识别接口进行识别;将识别出来的数据返回给结构式编辑器,最终得到相应分子的二维结构,并在结构式编辑器中显示;具体步骤是: 1)灰度和二值化; 2)数据优化;采用粗线细化算法将图片中的粗线细化; 3)矢量化和键/节点检测; 4)识别;步骤4)采用简单机器学习模型K近邻,具体步骤如下:4-1)对字符集合进行训练,提取字符的像素特性,然后基于字符像素特性提取化学分子图片中与之相似的字符,从而确定字符;4-2)将识别的字符抠除,对图片中的线进行识别,通过描图会把图片中每一条线给描边描出来;4-3)对描绘边的点进行延伸从而确定图片中每条线的连接点和端点;具体为:直线在二维坐标系统使用函数y=kx + b来表示,其中k为斜率,b为截距,一个描绘边的点是否在这条直线上只要给出x值然后计算出y值,比较两个y值相差多大,如果两个y值相差小于设定阈值,则认为这个点暂时在这条线上,然后再计算这个点和线段之间是否有空隙断开,如果没有断开则认为此点在这条直线上;4-4)对图片中的直线进行识别,然后把识别的直线进行聚类,以及对识别线段的端点进行矫正,从而确定每个位置唯一的连接点和端点。。来源:百度搜索马克数据网