南京大学黄硕最新Nat. Nanotechnol.:利用工程化的纳米孔鉴定核苷单磷酸及其表观遗传修饰


一、【导读】

RNA修饰在各种生物学过程的调控中起着至关重要的作用,并与许多人类疾病相关联。然而,直接通过测序鉴定RNA的修饰仍然具有挑战性。纳米孔测序很有前途,但目前的策略因序列解码而复杂化。酶切核苷单磷酸的序列纳米孔鉴定可以同时提供准确的序列和修饰信息。

二、【成果掠影】

南京大学黄硕课题组展示了一种苯硼酸(PBA)修饰的异八聚体耻垢分枝杆菌孔蛋白A纳米孔 (MspA),通过该纳米孔可以直接区分经典核苷、5-甲基胞苷、N6-甲基腺苷、N7-甲基鸟苷、N1-甲基腺苷、肌苷、假尿苷和二氢尿苷的单磷酸盐。机器学习准确率高达0.996。该方法也被应用于microRNA和天然tRNA修饰的定量分析。它适用于检测各种其他核苷或核苷酸衍生物,并可能为RNA表观遗传测序带来新的见解。相关论文以题为:“Identification of nucleoside monophosphates and their epigenetic modifications using an engineered nanopore”发表在Nature Nanotechnology上。

三、【核心创新点】

  • 本工作表明,以外切测序方式对RNA进行测序是一种不同的策略,该策略可以通过纳米孔顺序读取外切核酸酶分解的核苷酸。然而,这需要存在能够明确识别所有核苷酸及其主要修饰的高分辨率纳米孔。
  • 本工作通过报告精度为996的自定义机器学习算法对microRNA和天然tRNA修饰进行定量分析。它适用于检测各种其他核苷或核苷酸衍生物,并可能为RNA表观遗传测序带来新的见解。
  • 本工作表明,该策略原则上适用于检测二磷酸核苷、三磷酸核苷、其他核苷酸修饰、核苷酸糖和核苷药物,只要其结构上仍保留核糖的顺式二醇

四、【数据概览】

  • 使用PBA修饰的MspA识别NMP

为了构建异八聚体MspA,本工作分别定制合成了编码N90C MspA-H6和M2 MspA-D16H6的两个基因。 两个基因同时插入 pETDuet-1共表达载体。由一个单元的N90C MspA-H6和七个单元的M2 MspA-D16H6组成的异八聚体MspA是唯一需要的MspA组装体,简称(N90C)1(M2)7 (图1a)。(N90C)1(M2)7与其他MspA异构体经高分辨凝胶电泳分离后,进行凝胶提取。随后,3-(马来酰亚胺)苯基硼酸(MPBA)与(N90C)1(M2)7的唯一半胱氨酸反应(图1b)。在1.5 M KCl,10 mM MOPS,pH7.0缓冲液中,通过单通道记录,在单分子水平上对该反应进行了实时观察(图1c)。NMPs由核糖、磷酸基团和核基组成,作为RNA的单体单位。由于核糖中存在顺式二醇,NMPs与PBA具有亲和力,可能直接被MspA-PBA检测到。继续施加+200 mV的跨膜电位。以腺嘌呤单核苷酸(AMP)、鸟嘌呤单核苷酸(GMP)、胞嘧啶单核苷酸(CMP)和尿嘧啶单核苷酸(UMP)四种典型的NMP为分析物(图1d)。立即观察到由NMPs引起的连续电阻脉冲(图1d)。然而,M2 MspA测试时没有观察到任何事件,证实位于孔隙收缩处的PBA在NMP传感事件的产生中至关重要。使用MspA-PBA,脱氧核苷单磷酸(dNMP)无法报告任何事件。这是预期的,因为dNMPs没有传感所必需的顺二醇结构。本工作还利用MspA-PBA对CMP、UMP、AMP和GMP进行了同时传感(图1f),根据不同的阻塞特性可以直接鉴定不同的NMP身份。据我们所知,在事件分布上没有任何重叠的典型NMP之间的纳米孔区分度以前从未有过报道。

图1. 使用PBA修饰的MspA区分经典的NMP© 2022 Springer Nature Limited

  • 区分表观遗传NMP

据文献报道,~170个表观遗传学NMPs早已被发现。这些表观遗传NMPs具有极其微小的结构差异,对直接鉴定提出了极大的挑战。当表观遗传NMPs与MspA-PBA结合时,可以通过直接监测纳米孔读出的事件特征来解决这一挑战。这里测试了7中主要的表观遗传NMPs, 他们涵盖了甲基化、脱氨、异构化和还原等修饰类型。它们的碱基组成如图2a所示。表观遗传NMPs事件具有明显不同的阻断幅度。为了充分对比目前测试的所有NMP,在小提琴图中显示了每个NMP的%Ib分布,说明几乎所有的NMP都已经完全可以通过分析其%Ib来区分,尽管UMP和m5C的事件分布仍然存在一定的重叠(图2b)。通过绘制包含11个不同分析物NMP结合事件的% Ib与SD的散点图,生成11个完全独立的事件种群 (图2c)。这证实了这种检测模式可以应用于表观遗传NMPs。然而,以前从未报道过利用纳米孔同时直接区分如此多的核苷酸修饰。

图2. MspA-PBA鉴定的表观遗传NMP© 2022 Springer Nature Limited

  • 通过机器学习识别NMP

本工作建立了一种机器学习算法来自动识别NMPs。整个训练过程包括数据集输入、特征提取和模型建立(图3a)。数据集中的所有事件都有已知的标签。利用MATLAB自动提取每个事件的%Ib和SD,形成特征矩阵。对主流模型进行了评估,它们都显示了令人满意的验证精度,表明输入数据质量较高。具体来说,朴素贝叶斯模型和线性支持向量机(SVM)模型的最高准确率得分为0.996。综合考虑测试集精度,线性SVM模型表现最优。基于线性SVM模型测试集的混淆矩阵结果如图3b所示,其中大部分NMP检测结果的准确率为99%或100%。图3c中还展示了线性SVM模型生成的决策边界图。为了从混合物中显示事件标识,图3d展示了包含来自11个不同NMP的事件的代表性电流曲线。从中可以识别不同的NMP类型,并在曲线的上方标注机器学习预测的相应标签。这有效的帮助了实际测量场景中不同NMP的自动纳米孔识别

图3. 机器学习辅助NMP识别© 2022 Springer Nature Limited

  • 甲基化microRNA中检测表观遗传NMP

我们进一步试图对RNA中表观遗传NMP直接检测(图4a)。通过S1核酸酶处理,RNA首先被酶分解成NMP,然后被MspA-PBA传感。观察到的纳米孔事件由先前训练的机器学习模型识别。应用了两种已知甲基化位点的microRNA,包括hsa-miR-21和hsa-miR-17。具体而言,hsa-miR-21在位置9处含有m5C,hsa-miR-17在位置13处含有m6C。没有任何酶处理,hsa-miR-21和hsa-miR-17被MspA-PBA传感时仅观察到具有深浅不一振幅的毛刺事件,表明这种传感机制对模板RNA本身不敏感。为减少甘油对S1核酸酶原液的干扰,采用超滤法对S1核酸酶进行预处理,去除甘油。然后用预处理后的S1核酸酶在23℃下消化microRNA 4 h 。从凝胶电泳结果来看,两种microRNA均被彻底分解。酶处理产物经超滤除去S1核酸酶。在纳米孔检测中,将hsa-miR-21酶切产物加入cis中,终浓度为100 ng μl-1。图4b显示了一个具有代表性的电流曲线,其中观察到许多NMP结合事件,表明MspA-PBA很好地检测到了生成的NMP。使用机器学习算法对事件进行识别,所获得的NMP组成与序列完全一致。为了检验其通用性,hsa-miR-17也has进行了相同的检验。图4d展示了hsa-miR-17酶切产物中具有代表性的传感事件。散点图结果显示5个NMP事件分布,分别对应CMP、UMP、AMP、GMP和m6A (图4e),与hsa-miR-17的序列组成一致。定量分析显示,m6A位点个数为1.08,表明hsa-miR-17中仅存在1个m6A位点,也与预期相符

图4. 检测RNA的表观遗传修饰© 2022 Springer Nature Limited

  • 从酵母tRNAPhe中检测表观遗传NMP

转运RNA (tRNA)是一种低分子量RNA,用于连接mRNA序列和氨基酸序列。成熟的tRNA还包含丰富的化学修饰。据报道,已在tRNA中发现了90多种类型的修饰。因此,它是评估MspA-PBA在鉴定天然样品表观遗传修饰中性能的理想RNA。啤酒酵母苯丙氨酸特异性 tRNA(酵母tRNAPhe)被用作模型RNA以测试其可行性。MspA-PBA原则上可检测到m2G,m22G、T和Y的单磷酸酯,有望观察到新的事件簇。但是,由于缺乏相应的纯化合物来产生用于训练的事件,相应的纳米孔事件是可检测的但无法识别的。缺少顺式二元醇的Cm和Gm原则上是MspA-PBA无法检测的。tRNAPhe首先在23°C下用S1核酸酶处理15 h,得到NMPs。根据凝胶电泳结果,证实tRNAPhe已被彻底分解(图5b)。将酶处理产物超滤膜去除S1核酸酶,并用于后续的纳米孔检测。

酵母tRNAPhe的修饰图谱结果如图5c所示。成功检测出D、ψ、m5C、m7G和m1A,与前期训练结果和文献报道一致。观察到少量m6A事件,可能是来自背景事件。定量分析表明,酵母tRNAPhe中NMP相对组成为17.53 GMP、16.36 AMP、16.19 CMP、12.06 UMP、3.24ψ、2.17 D、1.53 m5C、0.40 m7G、0.37 m1A、0.11 m6A和0.04 I,与实际值相符(图5d)。还进行了三个独立试验,得出了相同的结论,证实了这项技术的重复性。酵母tRNAPhe消化产物中含有事件的代表性电流曲线如图5e所示。上述结果很好的验证了MspA-PBA从天然RNA中检测NMPs及其表观遗传修饰的能力

图5. 酵母tRNAPhe表观遗传修饰的定量检测© 2022 Springer Nature Limited

五、【成果启示】

据报道,含有唯一PBA的异八聚体MspA能传感NMPs。十一种类型的NMP是完全区分的,效果远优于α-HL或固态纳米孔。本工作构建了机器学习算法,报告了0.996的精度。唯一的限制是,当前的传感策略无法检测核糖修饰的NMPs,如Cm和Gm。与质谱相比,我们的方法提供了更高的分辨率,特别是在区分RNA位置异构体方面。因此,它更适用于混合和天然样品的RNA修饰检测,无需耦合任何色谱分离技术和复杂的数据解释。该传感策略也被应用于鉴定天然RNA样品中酶切的NMPs,表明利用酶偶联的MspA-PBA进行外切测序的可行性。虽然没有论证,但这种策略原则上适用于传感核苷二磷酸盐类、核苷三磷酸、其他核苷酸修饰、核苷酸糖和核苷类药物,只要核糖的顺式二醇仍然保留。

第一作者:王玉琴, 张善雨, 贾文东

通讯作者:黄硕

通讯单位:南京大学

论文doi:

https://doi.org/10.1038/s41565-022-01169-2

六、【团队介绍】

本课题组隶属于南京大学化学化工学院生命分析化学国家重点实验室、南京大学化学和生物医药创新研究院,主要研究方向为单分子生物传感器件和单分子生物物理,同时兼顾面向理解生命过程的化学本质的基础研究和具有实用意义的新型医疗诊断器件的研发。课题组PI黄硕教授长期从事单分子生物物理和单分子纳米孔测序技术的新仪器,新方法研究,先后师从于Stuart Lindsay 教授(亚利桑那州立大学教授,Agilent 公司Molecular Imaging创始人) 和Hagan Bayley教授 (牛津大学教授,英国皇家科学院院士,Oxford Nanopore创始人)并在Nature Nanotechnology, Angewandte Chemie International Edition, Chemical Science, Nano Letters, Journal of Physical Chemistry C, Nanotechnology等高水平期刊发表多篇论文,其中以第一作者身份发表Nature Nanotechnology杂志两篇,并有国际授权专利2项,均转让于国际知名企业。于2015年7月加盟南京大学生命分析化学国家重点实验室开展独立课题研究。自2015年7月入职南京大学,拥有独立实验室2间,细胞间1间,约计160平。现有博士后1人,博士研究生8人,硕士研究生5人,本科生1人,共计14名学生,经过六年多的实验室建设,已完成实验室的仪器搭建及团队的组建工作,科研工作有序开展。 近一年来共计发表高水平论文达17篇,其中包括Nature Nanotechnology 1篇、JACS 2篇、Angewandte Chemie 3篇、Nature Communications 2篇、Nano Lett 2篇、ACS Nano 1篇等。获得国家级重大人才工程A类(青年项目)、国家自然基金、江苏省“双创人才”项目、江苏省“双创团队”项目、江苏省“杰出青年”基金、中央高校基本业务费等经费资助。

七、【团队在该领域的工作汇总】

本课题组在发展过程中逐渐形成四个主要的研究方向,包括纳米孔测序、单分子化学、生物大分子结构解析和纳米孔成像。

在纳米孔测序方向,本课题组提出了一种新型且通用的纳米孔测序方法即错位测序方法(Nanopore-Induced Phase-Shift Sequencing,NIPSS)。利用生物纳米孔测序体系中的错位效应,首次实现了针对非天然核酸FANA(Chem. Sci., 2019, 10, 3110),miRNA(iScience, 2020, 23, 100916)和多肽的直接测序(Nano Lett., 2021, 21, 6703–6710)。其中, 多肽的纳米孔测序方法亦获得了《科技日报》的专访报道,在国内外获得了广泛的关注。

针对大分子的结构解析,本课题组巧妙利用MspA纳米孔一头大一头小的结构特点,以“半阻孔”检测策略回避了改造整体结构宽大的生物纳米孔的需要,对RNA(Nat. Commun., 2021, 12, 3368)和多种蛋白质(Angew. Chem. Int. Ed., 2021, 60, 23863–23870; JACS, 2022,144, 757–768)实现了单分子分析。

在单分子化学方向,本课题组首次通过改造内腔结构更加锥形的MspA纳米孔实现了纳米孔单分子化学检测性质的大幅优化,提出了采用MspA纳米孔单分子反应器的新方向(Nat. Commun., 2019, 10, 5668; Chem. Sci., 2020, 11, 879-887)。进而采用核酸工程替代蛋白质工程,提出了一个全新的纳米孔单分子反应器构建策略,并将该技术命名为Programmable Nano Reactor for Stochastic Sensing(PNRSS)(Nat. Commun., 2021, 12, 5811),可以实现孔道内任意化学反应的构建。通过更深度的蛋白质改造,本课题组实现了世界首个异质MspA的构建,进而实现了核酸表观遗传学修饰(Nat. Nanotechnol. 2022, DOI:10.1038/s41565-022-01169-2)、单糖(Angew. Chem. Int. Ed., 2022,DOI:10.1002/anie.202203769)和糖醇 (JACS, 2022, DOI: 10.1021/jacs.2c04595) 的单分子检测。

本课题组以光替代电的思路,通过检测荧光标记扩散驱动的过孔钙离子流,开创了首个无需电极的纳米孔单分子分析技术(DiffusiOptoPhysiology,DOP),并且成功运用于小分子,有机高聚物,生物大分子的单分子检测,将单分子检测成本降低至10元(Sci. Adv., 2019, 5, eaar3309)。

  1. 相关优质文献推荐
  2. Wang, Y.#; Zhang, S.#; Jia, W. #; Fan, P.; Wang, L.; Li, X.; Chen, J.; Cao, Z.; Du, X.; Liu, Y.; Wang, K.; Hu, C.; Zhang, J.; Hu, J., Zhang, P.; Chen, H.-Y.; Huang, S.*, Identification of nucleoside monophosphates and their epigenetic modifications using an engineered nanopore.  Nature Nanotechnology 2022, DOI:10.1038/s41565-022-01169-2
  3. Liu, Y.#; Zhang, S.#; Wang, Y.; Wang, L.; Cao, Z.; Sun, W.; Fan, P.; Zhang, P.; Chen, H.-Y.; Huang, S.*, Nanopore identification of alditol epimers and their application in rapid analysis of alditol-containing drinks and healthcare products.Journal of the American Chemical Society 2022, DOI: 10.1021/jacs.2c04595.
  4. Liu, Y.; Wang, K.; Wang, Y.; Yan, S.; Du, X.; Zhang, P.; Chen, H.-Y.;Huang, S.* Machine Learning assisted simultaneous structural profiling of differently charged proteins in a Mycobacterium smegmatis porin A (MspA) electroosmotic trap. Journal of the American Chemical Society 2022,144(2), 757–768
  5. Zhang, S.#; Cao, Z.#; Fan, P.#; Wang, Y.; Jia, W.; Wang, L.; Wang, K.; Liu, Y.; Du, X.; Hu, C.; Zhang, P.; Chen, H.-Y.; Huang, S.*A Nanopore-Based Saccharide Sensor. Angewandte Chemie International Edition 2022DOI:10.1002/anie.202203769
  6. Jia, W.; Hu, C.; Wang, Y.; Gu, Y.; Qian, G.; Du, X.; Wang, L.; Liu, Y.; Cao, J.; Zhang, S.; Yan, S.; Zhang, P.; Ma, J.; Chen, H.-Y.; Huang, S.*, Programmable Nano-Reactors for Stochastic Sensing. Nature Communications 2021.12(1), 5811 
  7. Yan, S.#; Wang, L.#; Wang, Y.; Cao, Z.; Zhang, S.; Du, X.; Fan, P.; Zhang, P.; Chen, H.-Y.; Huang, S.*, Non-binary Encoded Nucleic Acid Barcodes Directly Readable by a Nanopore. Angewandte Chemie International Edition 2022,61 (20), e202116482.
  8. Wang, Y.; Wang, Y.; Du, X.; Yan, S.; Zhang, P.; Chen, H.-Y.*Huang, S.*. Electrode-free nanopore sensing by DiffusiOptoPhysiology, Science Advances 2019, 5(9), eaar3309.
  9. Cao, J.; Jia, W.; Zhang, J.; Xu, X.; Yan, S.; Wang, Y.; Zhang, P.; Chen, H.-Y.; Huang, S.*Giant single molecule chemistry events observed from a tetrachloroaurate(III) embedded Mycobacterium smegmatis porin A nanopore,  Nature Communications 2019, 10(1), 5668.
  10. Wang, Y.#; Guan, X. #; Zhang, S.; Liu, Y.; Wang, S.; Fan, P.; Du, X.; Yan, S.; Zhang, P.; Chen, H.-Y.; Li, W. *; Zhang, D. *Huang, S.* Structural-profiling of low molecular weight RNAs by nanopore trapping/translocation using Mycobacterium smegmatis porin A, Nature Communications 2021, 12(1), 3368.
  11. Liu, Y.; Pan, T.; Wang, K.; Wang, Y.; Yan, S.; Wang, L.; Zhang, S.; Du, X.; Jia, W.; Zhang, P.; Chen, H.-Y.; Huang, S.*Allosteric Switching of Calmodulin in a Mycobacterium smegmatis porin A (MspA) Nanopore-Trap. Angewandte Chemie International Edition 2021, 60(44), 23863–23870
  12. Wang, Y.#; Patil, K. M. #; Yan, S.; Zhang, P.; Guo, W.; Wang, Y.; Chen, H.-Y.; Gillingham, D. *Huang, S.* Nanopore Sequencing Accurately Identifies the Mutagenic DNA Lesion O6-Carboxymethyl Guanine and Reveals Its Behavior in Replication, Angewandte Chemie International Edition 2019, 58(25), 8432-8436.
  13. Jia, W.; Hu, C.; Wang, Y.; Liu, Y.; Wang, L.; Zhang, S.; Zhu, Q.; Gu, Y.; Zhang, P.; Ma, J.; Chen, H.-Y.; Huang, S*. Identification of Single-Molecule Catecholamine Enantiomers Using a Programmable Nanopore, ACS Nano 2022, 16(4): 6615-6624.
  14. Yan, S.; Zhang, J.; Wang, Y.; Guo, W.; Zhang, S.; Liu, Y.; Cao, J.; Wang, Y.; Wang, L.; Ma, F.; Zhang, P.; Chen, H.-Y.; Huang, S.*Single Molecule Ratcheting Motion of Peptides in a Mycobacterium smegmatis Porin A (MspA) Nanopore, Nano Letters 2021, 21(15), 6703-6710.
  15. Zhang, J.#; Wang, Y. #; Wang, Y.; Zhang, P.; Chen, H.-Y.; Huang, S.*, Discrimination between different DNA lesions by monitoring single molecule polymerase stalling kinetics during nanopore sequencing. Nano Letters 2022,22(13), 5561–5569
分享到