通过神经网络纳米孔读数处理扩展基于DNA的数据存储系统的分子字母

Kasra S Tabatabaei,Bach Pham,Chao Pan,Jingqian Liu,Shubham Chandak,Spencer A. Shorkey,Alvaro G. Hernandez,Aleksei Aksimentiev,Min Chen,Charles M. Schroeder和Olgica Milenkovic
纳米字母(2022)
doi:10.1021/acs.nanolett.1C04203Bibtex

强调

DNA是一种有希望的下一代数据存储介质,但挑战仍然存在综合成本和记录延迟。在这里,我们描述了DNA数据存储系统的原型,该原型使用了结合天然和化学修饰核苷酸的扩展分子字母。我们的结果表明,MSPA纳米孔可以区分自定义设计的低聚物中自然和化学修饰的核苷酸的不同组合和有序的序列。我们进一步证明了使用神经网络体系结构对扩展字母的单分子测序进行分类,该神经网络结构对牛津纳米孔序列产生的原始电流信号的平均精度超过60%(比随机猜测大于39倍)。分子动力学模拟表明,大多数修饰的核苷酸仅导致DNA双螺旋的轻微扰动。总体而言,扩展的分子字母可能会增加存储密度的近2倍,并有可能减少记录延迟的顺序,从而实现分子记录器的新实现。

抽象的

DNA是一种有希望的下一代数据存储介质,但挑战仍然存在综合成本和记录延迟。在这里,我们描述了DNA数据存储系统的原型,该原型使用了结合天然和化学修饰核苷酸的扩展分子字母。我们的结果表明,MSPA纳米孔可以区分自定义设计的低聚物中自然和化学修饰的核苷酸的不同组合和有序的序列。我们进一步证明了使用神经网络体系结构对扩展字母的单分子测序进行分类,该神经网络结构对牛津纳米孔序列产生的原始电流信号的平均精度超过60%(比随机猜测大于39倍)。分子动力学模拟表明,大多数修饰的核苷酸仅导致DNA双螺旋的轻微扰动。总体而言,扩展的分子字母可能会增加存储密度的近2倍,并有可能减少记录延迟的顺序,从而实现分子记录器的新实现。