我们已经更新了隐私政策为了更清楚我们如何使用您的个人数据。

我们使用cookie为您提供更好的体验。你可以阅读我们的饼干政策这里。

广告
蛋白质组学管道的关键发展
列表

蛋白质组学管道的关键发展

蛋白质组学管道的关键发展
列表

蛋白质组学管道的关键发展

通过分析蛋白质,蛋白质组学从生物学上讲,蛋白质组学直接进入细胞作用的沟渠。鉴于蛋白质组学数据的实时性质,可以在某个时间点提供特定细胞,组织或系统的快照,1高通量蛋白质组学已被证明在生物,生物医学和临床研究中非常受欢迎。蛋白质组学技术的快速进步使科学家有能力以前所未有的规模探索蛋白质及其在复杂样品中的修饰(在分辨率和覆盖范围内增加的样本和复制数量更高)。1

但是,这些进步在存储,管理和可重复分析蛋白质组学数据泛滥的方面也对研究人员构成了重大挑战。高通量基因组和转录组分析已越来越依赖于复杂的分析管道框架,该框架包括以特定序列串在一起的多个软件工具,以形成自动分析工作流程以用于特定任务。1,2蛋白质组学领域至少直到最近才是这种情况,因为大多数分析通常是在本地工作站上执行的,或者使用“黑匣子”在线工具进行了。

在这里,我们描述了蛋白质组学管道开发和部署的最新主要进步,旨在应对大规模蛋白质组学最前沿的一些核心挑战。

1.云计算,软件工程和生物信息学的民主化


尽管云计算彻底改变了业务和其他几个领域,但学术界尚未利用其提供的众多优势。3学术机构仍主要使用内部系统,例如高性能计算(HPC)群集,需要大型,前前的资本支出。另一方面,云计算几乎不需要前期的成本,并且用户仅针对虚拟化基础架构而经常收费。

在蛋白质组学方面,云计算通过为实验室提供用于开发和实施其蛋白质组学管道的大规模计算资源的潜力,无论其位置或IT专业知识如何。3云资源可用于应对蛋白质组学分析中固有的计算强度任务,以大大减少分析时间和计算负担。

除了节省成本和时间外,云计算的许多额外好处还包括:

•减少开发和维护工作量
•提高可重复性
•改进的版本控制
•提高容差
•减少延迟
•更轻松地共享数据和软件
•增强的安全性
•敏捷发展的潜力
•无服务器计算的潜力
•在增加负载下扩大规模的能力

访问软件工程将进一步使通才生物信息学家和生物学家的访问权限;但是,这一途径尚未得到充分探索。2为了促进软件工程师与生物信息学家之间的合作,诸如Docker有人建议提供一种理想的跨界技术,以创建容器(以下进一步讨论),其中生物信息学管道可以由生物信息学家和生物学家开发,测试和实施。这Dockerfile随着每个管道的发展,可以轻松地对软件工程师和科学家之间的简单文本文档进行修改,更新和共享。诸如Docker和Kubernetes还可以简化从本地部署到云部署的软件和管道的迁移。3

2.软件容器


从历史上看,计算蛋白质组学一直以台式软件和在线工具为主,该工具阻碍了HPC簇和云环境中的高通量分析。1,4此外,其中许多工具都是专有的封闭源解决方案,这些解决方案使用专有数据格式,并且只能在特定的操作系统或供应商硬件上运行。这对可再现和可扩展的蛋白质组学研究构成了巨大的挑战。在过去的十年中,开源解决方案已开始逐渐出现。但是,这通常以增加技术复杂性为代价,需要科学家通常没有的计算技能。在不同的计算环境中(例如本地工作站,HPC群集和云)中的工具通常需要不同的安装过程,具有不同的软件依赖性,并且可能使用不同的文件格式,这使情况更加复杂。

软件容器提供了一种解决方案,以简化生物信息学软件的分布和快速部署,并将工具组合到功能强大的分析管道中。1容器通过提供一种将所需软件及其依赖项隔离到可以稳定地部署在各种计算环境中的单位的方法来实现这一目标。容器可以将管道分析任务分解为孤立的单元,这些单元可以通过同时增加运行的容器数量来扩展。一旦建立了特定工具的容器,就可以通过将其存放在在线容器注册表中轻松分发。在那里,容器可以直接执行封闭的软件,而无需任何其他安装,并且可以在不同的操作系统上执行相同的容器。

近年来,在生物信息学中使用软件容器的使用迅速增加。2017年10月,Françaisde Bioinformatique(IFB),欧洲生物信息学研究所(EBI)和Elixir Tools平台在巴黎组织了一项“黑客马拉松”,以合并一个名为的容器平台生物构因。BioContainers基于Github社区平台内的流行框架Conda,Docker和奇异性,任何人都可以贡献。4,5诸如生物构因德斯等平台,并在某种程度上Bioconda(2015年发布),以一种格式提供数千种工具,使用户能够在不同的计算环境中执行管道,而无需安装和软件依赖性的复杂性。1用户可以轻松地用使用不同技术或编程语言创建的组件替换独立组件。此外,Bioconda和BioContainers提供了软件版本管理,这有助于随着时间的推移可再现数据分析。

3.工作流程系统


尽管软件容器简化了生物信息学工具的安装和部署,但科学家仍然承担着结合这些工具以创建可以在不同体系结构上运行的蛋白质组学分析管道的复杂任务。1为了解决这个问题,已经开发了各种工作流程系统。工作流程系统是一种软件,允许设置工具执行的顺序和并行步骤,以使其可以在不同的环境(例如本地计算机,容器,HPC簇和云)中执行。在过去的十年中,几个开源工作流环境已经开始出现,两个最受欢迎的工作流环境正在星系NextFlow。希望软件容器和工作流程系统的组合能使蛋白质组学管道更可重现,可扩展和访问,甚至是在复杂的IT基础架构和命令行环境中没有专业知识的科学家。

4.“带上自己的数据”(BYOD)


理想情况下,所有科学家,而不是仅仅是生物信息学家和软件工程师都应轻松使用生物信息学管道。为了满足希望在生物信息学分析中拥有自治的生物学家的需求,例如荷兰Techcentre for Life SciencesIFB正在提供密集的培训课程,以使科学家拥有开发自定义综合蛋白质组学管道的知识和技能(称为BYOD原理)。IFB培训课程的第一届会议于2019年2月举行,所有教学材料均为免费提供。这些课程有望成为朝这个方向进一步推动的迹象。

5.正在进行的长生不老药项目基准蛋白质组学管道


该领域的蛋白质组学方法和技术进步的普及使蛋白质组学分析工具和管道的数量激增。可以理解的是,这对于该领域的研究人员来说可能是压倒性的,并导致管道输出质量的可变质量和在蛋白质组学领域内缺乏协调。6-8长生不老药是一个由23个欧洲国家组成的政府间组织惠康基因组校园。这支生活科学家和计算机科学家团队已经组装,以帮助协调数据库,软件工具和培训材料等生命科学资源,并帮助研究人员就最佳实践达成共识。他们目前正在运行实施研究这旨在基准基准蛋白质组学管道,并确定符合确保可重现发现所需的高标准的管道。同样,近二十年来,蛋白质组学标准倡议人类蛋白质组组织一直在开发和促进蛋白质组学数据表示的软件工具和社区标准,以促进数据比较,交换和验证,包括有关蛋白质组学实验(MIAPE)指南的最低信息的持续更新,作为蛋白质组学技术已经发展了。9

6.蛋白质组学管道比较和实验室协调的NIST参考材料


美国国家标准研究所为政府,学术界和行业进行的各种类型的物理和化学测量方法开发参考材料。他们目前正在通过开发人体组织的标准参考材料来扩大质谱文库和肽质谱文库的产品,以进行蛋白质组学实验。10这将实现实验室和蛋白质组学技术之间的基准测试和协调,以及蛋白质组织管道的正面比较。

参考

1. Perez-Riverol Y,MorenoP。使用生物易体和工作流动机的蛋白质组学和代谢组学中的可扩展数据分析。蛋白质组学。2020; 20:1900147。doi:10.1002/pmic.201900147

2. Lawlor B,Sleator Rd。生物信息学的民主化:软件工程的观点。Qugascience。2020; 9(6):GIAA063。doi:10.1093/gigascience/giaa063

3. Cole BS,Moore JH。11个用于使用云计算来架构生物医学信息学工作流程的快速提示。PLOS Comput Biol。2018; 14(3):E1005994。doi:10.1371/journal.pcbi.1005994

4. Gruening B,Sallou O,Moreno P等。针对生物信息学软件的包装和容器化的建议[版本2;同行评审:2批准,1批准了预订]。F1000 Research。2019; 7(Elixir):742。doi:10.12688/f1000research.15140.2

5. Da Veiga Leprevost F,GrüningBA,Alves Aflitos S等。Biocontainers:用于软件标准化的开源和社区驱动框架。生物信息学。2017; 33(16):2580-2582。doi:10.1093/bioinformactics/btx192

6. Thomas SN,Zhang H.靶向蛋白质组学测定,以验证全球蛋白质组学见解。专家Rev蛋白质组学。2016; 13(10):897-899。doi:10.1080/14789450.2016.1229601

7. Prasad B,Achour B,Artursson P等。在转化药理学研究中采用定量液相色谱量质谱蛋白质组学达成共识:白皮书。Clin Pharmacol Ther。2019; 106(3):525-543。doi:10.1002/cpt.1537

8. Tsiamis V,Ienasescu H,Gabrielaitis D,Palmblad M,SchwämmleV,Ison J.蛋白质组学一千和一千件软件:科学工具制造商的故事。J蛋白质组res。2019; 18(10):3580-3585。doi:10.1021/acs.jproteome.9b00219

9. Deutsch EW,Orchard S,Binz PA等。蛋白质组学标准倡议:十五年的进步和未来工作。J蛋白质组res。2017; 16(12):4288-4298。doi:10.1021/acs.jproteome.7b00370

10. Davis WC,Kilpatrick LE,Ellisor DL,Neely BA。人肝参考材料适合蛋白质组学应用的表征。SCI数据。2019; 6:324。doi:10.1038/S41597-019-0336-7
广告