在科学文件(如期刊论文和专利)中,分子结构通常以二维印刷形式描述。然而,这些二维描述并不是机器可读的。由于积压了几十年的印刷品和越来越多的印刷品,对将印刷品描述翻译成机器可读的格式的需求很高,这被称为光学化学结构识别(OCSR)。过去三十年来开发的大多数OCSR系统都采用了基于规则的方法,根据对向量和节点作为键和原子的解释,对描述进行矢量化。在这里,我们提出了一个名为MolMiner的实用软件,它主要是利用最初为语义分割和对象检测开发的深度神经网络来识别文件中的原子和键元素。这些被识别的元素可以通过基于距离的构建算法轻松地连接成一个分子图。MolMiner在四个基准数据集和一个从科学论文中自行收集的外部数据集上表现出最先进的性能。由于MolMiner在现实世界的OCSR任务中表现得同样好,并且有一个友好的界面,因此它是一个对日常应用有用的、有价值的工具。