蛋白质组学最新进展、应用及挑战

导读:本文将分享蛋白质组学的最新进展及其更广泛的潜在影响。

蛋白质组学是当前生物制药发展非常迅速的热门领域之一,研究蛋白质组学不但能够加深对支持跨细胞、组织和整个生物体的生物状态分子过程的理解,还能够帮助包括人类、动物和植物生物学、个性化医学和法医学在内的各个科学研究领域快速发展。这些研发收益在很大程度上都要归功于蛋白质组学技术、数据处理能力和数据共享的进步。在本文中,我们将与世界各地的蛋白质组学权威专家一起,共同探讨蛋白质组学的最新进展及其更广泛的潜在影响。


一、蛋白质组学关键技术发展


01

质谱蛋白质组学


蛋白质组学研究采用的分析技术大致分为低通量和高通量两类。几十年来,质谱(MS)一直是在高通量分析中最广泛使用的“金标准”。从历史上看,基于质谱的蛋白质组学面临的一项关键问题就是敏感性和特异性,不过近年来,质谱技术的格局发生了翻天覆地的变化。供应商推出了具有高速度、灵敏度和特异性功能的质谱仪器,科学家们现在也可以凭借这些新型仪器更加深入研究蛋白质组学。


诺和诺德基金会蛋白质研究中心蛋白质组学项目的研究主任和组长Matthias Mann教授在被问及质谱蛋白质组学的突破时,特别强调了Aebersold实验室率在数据独立采集(DIA)方面的进展。与其姊妹技术数据相关分析(DDA)不同的是,DIA在第二个循环(MS2)中将串联MS(MS1)第一个循环中产生的所有前体离子分解,这也为研究人员提供了更好的无偏分析能力、更大的蛋白质组覆盖率和更高的再现性。近年来,在蛋白质组学研究,特别是在肿瘤学领域,使用基于DIA质谱的频率也一直在持续增长。此外,DIA技术还在神经科学蛋白质组学领域取得了积极进展,包括发现了阿尔茨海默病的相关信息。


02

基于适体的蛋白质组学


虽然质谱技术多年来一直在蛋白质组学研究领域占据主导地位,但最近出现的“第二代”蛋白质组学平台则是利用基于适体开发的新型技术。约翰霍普金斯大学医学院研究员Benjamin Orsburn博士也表示,尽管LC-MS在蛋白质组学领域已经垄断了几十年,但现在的情况显然已不再如此。


适体是一种短的单链(ss)DNA分子,能够进行独特的匹配确认,选择性地与生物靶标结合。在生物标志物发现等领域,该技术具有特异性和选择性等优势,因此要优于受到动态范围限制的MS蛋白质组学。此前,研究人员基于适体的蛋白质组学对来自Framingham心脏研究中的1895名女性进行了研究,以便确定心脏重塑和心力衰竭事件的生物标志物。试验结果显示,17种蛋白质被发现与超声心动图特征相关,6种蛋白质与心力衰竭事件相关,利用遗传变异数据的进一步分析也进一步支持了这些发现。


Orsburn表示,与LC-MS技术相比,适体技术的使用将更少受到细胞中绝对蛋白质拷贝数的影响。然而,在能够识别更高百分比的蛋白质组之前,质谱蛋白质组学目前可能仍然将会是首选方法,而基于适体的技术通常会做为补充和辅助方法。最近,有研究人员提出的理想蛋白质测序平台,采用了条形码DNA适体来识别肽的末端氨基酸,连接到下一代测序芯片可能会成为折衷方案。Orsburn对此称该领域的全部研发潜力仍需要一定的时间才能实现。


二、人工智能和蛋白质组学


01

人工智能和药物发现蛋白质组学


人工智能(AI)在蛋白质组学中的应用已经深刻改变了药物发现领域的研发工作。对研发人员来说,深入了解特定蛋白质如何以及为何能够相互作用,对于推进细胞生物学、开发新药和确定药物引发治疗和副作用的机制至关重要,然而这绝非易事。美国麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Octavian-Eugen Ganea表示,为了掌握互相作用的蛋白质如何相互连接,必须通过人工或计算机手段尝试所有可能的连接组合,以便找到最合理的连接组合,而如果不借助人工智能单纯使用人工进行,将会是一个非常耗时的过程。


目前已有多种商业化的蛋白质对接方法可供选择,但它们都依赖于候选采样、模板和预计算网格的特定任务特征,而这些因素都会增加额外的计算时间。麻省理工学院Ganea团队最近发表了一种新的深度学习模型EquiDock,采用了两种蛋白质的3D结构,并能直接识别哪些区域可能会发生相互作用。EquiDock模型能够从约41000个蛋白质结构中捕获复杂的对接模式,使用了具有数千个参数的几何约束模型,这些参数能够动态地在计算过程中自动调整。


训练完成后,EquiDock模型将与其他四个现有的对接软件进行交叉比较,并且能够在一到五秒内预测最终的蛋白质复合物,速度比现有软件快80至500倍。Ganea表示,药物副作用的快速计算扫描是非常必要的,能够显著减少搜索范围,否则即便整合了全球的人工试验资源,也无法取得满意的结果。他强调称,将EquiDock模型与其他蛋白质结构预测模型相结合,将有望进一步帮助其在药物设计、蛋白质工程、抗体生成和作用机制研究等方面的应用。


02

人工智能和质谱蛋白质组学


基于人工智能的方法还将帮助研究人员从获得的数据中获得更多的研发见解。质谱实验需要数据库搜索或光谱库匹配来识别特定的蛋白质。整个过程不但特别耗费时间,而且某些蛋白质还可能会被错误识别或遗漏,对于依赖于通过DDA分析生成光谱库的DIA质谱技术来说,这些弊端似乎更加难以避免。为此,研发人员现在已经建立了多种能够预测光谱和肽特性的深度学习方法,包括但不限于Prosit、DeepMass和DeepDIA,预计此举能够优化DIA方法的预测光谱库,使蛋白质组学领域朝着更好的方向发展。


03

人工智能和非质谱蛋白质组学


人工智能还能够辅助非质谱蛋白质组学的发展,这一领域对于理解以缠结、聚集的蛋白质为特征的病理学(如阿尔茨海默病)是不可或缺的。该领域采用的关键方法包括显微镜和Förster共振能量转移(FRET),研发过程需要大量时间和足够的专业知识对大型数据集进行分析解释。为了克服这一数据难题,由Nikos Hatzakis教授领导的诺和诺德基金会蛋白质研究中心的研究人员最近创建了DeepFRET模型。


DeepFRET是一种人工智能的机器学习算法,可以自动识别蛋白质运动模式,在几秒钟内对数据集进行分类(如果完全人工进行则通常需要几天的时间)。蛋白质组学中人工智能的未来发展还要求人工智能平台必须遵守相关的标准、数据报告和共享方面实现跨组的同步。最近发布的关于在蛋白质组学和代谢组学中进行和报告机器学习的数据、优化、模型、评估(DOME)建议,可能将有助于重塑该领域未来的发展方向。


三、法医学和蛋白质组学


蛋白质组学更广泛的应用也受益于前面讨论的技术进步,例如在20世纪后期的“DNA革命”极大地促进了法医学的发展,而现在的蛋白质组学似乎有望产生类似的影响。对此,基于蛋白质的人类鉴定技术发明者、加州大学博士Glendon Parker表示,总的来说,蛋白质组学目前对法医学的影响是有限的,这归因于技术、法律、财务和文化因素,然而在刑事调查和起诉中采用和纳入新方法将会成为根本性的驱动力。


Parker补充说,蛋白质组学具有其独特的内在优势,比如蛋白质比DNA更稳定,并且能够像DNA一样可以包含特定的身份识别信息。在DNA核酸被降解的情况下,可以使用蛋白质组学用于识别体液、性别、种族,并使用肌肉、骨骼和分解液样本估计大致的死亡时间。Parker强调称,虽然在法医学中真正实施蛋白质组学一直以来都存在一定的挑战,但在未来蛋白质组学有可能显著改变法医证据的处理和分析方式。在短期内,该领域能够辅助DNA技术用于DNA难以提供明确证据的法医领域。


四、蛋白质组学的挑战和未来展望


01

亟待开放共享、加强全球合作


目前,蛋白质组学领域面临的最大限制是技术的复杂性,需要研发人员在蛋白质组学冗长的工作流程中熟练地操作复杂技术和专业软件。虽然蛋白质组学在灵敏度和速度方面已经取得了飞速进步,研究成果也取得了相应的进展,但在背后都付出了巨大的代价。


Johnston表示,严格执行、深度覆盖的质谱实验,特别是那些针对复杂的生物样品上的试验研究,需要大量的质谱分析时间,因此研发人员必须要在研发成本、覆盖范围和样本数量之间不断进行利弊权衡。这也是当前限制蛋白质组学更广泛应用的难题之一,Parker也强调称这些困境限制了技术创新,导致大量具有发展前途的新兴技术(包括蛋白质组学),最终没有得到充分利用。


在过去的十年里,蛋白质组学领域中倡导开放、共享、合作的呼声越来越高。目前已经出现了增加可访问性和可持续性的具体举措,比如欧洲蛋白质组学基础设施联盟(EPIC-XS)就联合了一些欧洲领先的实验室和科学家,倡议将各种技术、专业知识和试验数据进行汇集共享。共享的资源也不仅限于基于质谱的蛋白质组学,KTH访问站点的细胞分析设施还开放了基于抗体的成像方面的专业知识。


02

推进临床应用困难重重


在蛋白质组学正式被确定为临床支柱之前仍有多项关键性挑战需要克服,而这些挑战具体取决于临床蛋白质组学中的特定应用。Mann表示,如果要在临床中大规模使用,基于质谱的蛋白质组学需要变得更加强大和易于使用,尽管许多研发团队已经试图通过转向高流量色谱系统来实现这一目标,但目前的成果并不理想,因为此举会导致灵敏度受到影响。


目前,虽然分析技术一定程度上提高了深入挖掘蛋白质组的能力,但产生的数据量也在同步增长,这也为蛋白质组学的临床应用带来了额外的瓶颈,包括如何对大量数据进行处理,以及如何在大规模数据集的基础上制定生物学和临床假设。此外,为了全面了解人类健康和疾病,蛋白质组学数据通常必须与其他组学对应物相结合使用,如代谢组学、基因组学和转录组学。


除此之外,伦理方面的问题也被视为蛋白质组学进军临床的挑战之一。蛋白质组学分析可以提供原始诊断之外的信息,临床医生将如何处理这些数据仍存在监管空白。虽然可以从此前的临床基因组学的临床实施中吸取一定教训,但蛋白质组学领域是一个完全不同的情况,因此在制定监管框架和指南时很难直接套用此前的标准。


不过,尽管目前存在多种局限性,但权威专家对该领域的未来充满信心,Mann指出,质谱检测技术将凭借其固有的特异性在临床应用中持续发展。


药智.png


责任编辑:琉璃

 

声明:本文系药智网转载内容,版权归原作者所有,转载目的在于传递更多信息,并不代表本平台观点。如涉及作品内容、版权和其它问题,请与本网站留言联系,我们将在第一时间删除内容!


热门评论
请先 登录 再做评论~
发布

Copyright © 2010-2022 药智网YAOZH.COM All Rights Reserved.   工信部备案号:渝ICP备10200070号-3

渝公网安备 50010802001068号

投诉热线: (023) 6262 8397

邮箱: tousu@yaozh.com

QQ: 236960938