使用图书馆的方法增加深度和蛋白质组分析的准确性

行业的洞察力

发表:2023年2月2日

| 克里斯•亚当斯力量Daltonics

信贷:PublicDomainPictures Pixabay

想要一个免费的PDF版本的这个行业洞察力?

完成下面的表格,我们将电子邮件您的PDF版本“利用图书馆的方法增加深度和蛋白质组分析的准确性”

名字*

姓*

电子邮件地址*

国家*

公司类型*

工作职能*

你愿意接受进一步的电子邮件通信技术网络吗?捷克葡萄牙直播

听与

喋喋不休地说

0:00

注册免费听这篇文章

谢谢你！听这篇文章使用上面的球员。✖

阅读时间:

蛋白质组学领域的目标是推进技术和策略用于识别和量化蛋白质在蛋白质组和推进经济和科学领域中扮演着关键角色,因为他们服务的三个主要功能。在制药行业,大多数是由蛋白质生物制药产品;在医学、蛋白质的分子诊断异常可能导致小说通过深入描述这些异常治疗干预措施;最终,蛋白质是细胞机制的副产品——他们感兴趣的一个分子在许多其他行业。¹

分析蛋白质或蛋白质组是一个挑战然而,随着广泛使用的技术没有提供足够的数据来确定蛋白质组。即使等技术质谱分析(女士),液相色谱法(LC)做出最重要的贡献,数据仍然有限。这部分是因为分析的挑战,如样品损失和生物活性(蛋白表达)样本之间的差异存在,使其难以检测和量化蛋白质和多肽。为了规避这一问题,研究人员使用其他方法,如生物信息学分析,最优化分析、数学建模、识别和量化这些蛋白质。

本文探讨了图书馆如何在定量蛋白质组学方法可以提高检测系统的灵敏度和准确性。

挑战在蛋白质组分析

通常,蛋白质组学分析是使用已经使用酶消化分解蛋白质(自底向上、猎枪和middle-down蛋白质组学)。¹在这种情况下很难从这些技术生成的数据集转化为有形的肽谱匹配(psm),用于识别不同的多肽和蛋白质存在于蛋白质组。

甚至可用的数据往往是不完整的肽酶消化和净化过程中丢失或无法被检测系统,导致几个缺口数据集。反过来,这导致序列覆盖率不足,影响报道这些肽的结构和功能分析。²重要的是要注意,蛋白质组的复杂性也影响数据生成过程由于随机肽检测,这减少了采样深度。³多步分馏和猎枪蛋白质组学方法可以帮助克服这些问题,但他们可能会增加样本之间的差异,很难区分各种proteoforms。⁴

也有一些其他的挑战,包括无法衡量low-abundance蛋白质由于缺乏高度敏感的仪器,数据传输,处理时间和健壮的数据库搜索算法的必要性。肽的损失是一种常见的问题,是一个迫切需要的仪器可以识别多肽与信心,即使在最微不足道的浓度,防止重大浪费时间和资源。所有这些因素也会增加错误发现率(罗斯福)的这些技术,固井需要一种更健壮的和准确的过程。

此外,需要高吞吐量和商业化还需要为肽分析分析工作流程的标准化。例如,现在可以分析成千上万的基因同时在更短的时间内使用这种方法——要求需要一个蛋白质组学领域。^2,5

解决数据分析的瓶颈

解决数据分析瓶颈的一个方法是连接检测系统与实时分析处理整个工作流的软件,包括量化。并行实时搜索引擎(pas)是一个增强的数据库搜索与检测系统平台,可以集成像女士允许同时检测多肽样品处理(图1)。

的主要目的是识别多肽样品使用建立算法⁶辅以机器学习模型统计检测肽的碰撞截面(CCS)值与数据出现在其数据库中。CCS价值指的是形状、大小和电荷的离子气相,以及每个肽都有一个特定的CCS值在给定的电荷状态,该模型比较值与实验数据来确定肽的身份。困离子迁移谱法(蒂姆)技术分析了每个分析物的样品和生成一个CCS值,这个值可以持续测量分析物的内在属性。这个特性使得该技术高度可再生的,添加一层蛋白质组学的标准化。

图1:CCS-enabled数据库搜索包括TIMScore作为一个额外的维度。信贷:力量Daltonics。

通常,传统搜索算法依赖于前体和碎片离子谱来确定最适合的,并在此基础上,分配一个概率得分。输出表明,结果只有一个,尽管略微有可能是一个更好的选择,表明即使只有一个PSM——许多其他PSM可供结果。缺乏一个强大的搜索功能增加了罗斯福的随着时间的推移,同时减少这样的数据库搜索结果的可靠性。

或者不是,这个问题是可以避免的模型使用胰蛋白酶的大量训练和磷酸化肽,包括双重、三重、四倍地指控这些缩氨酸,因为它们是最普遍的形式的转录后修饰(天车)和有很强的生物学意义。它能够准确地识别其主要氨基酸的肽序列通过测量CSS预测和实验值之间的偏差。这种方法有95%的准确性水平对胰蛋白酶的肽和92%的置信水平磷酸化胰蛋白酶的肽(图2)。

图2:散点图的预测离子流动(CCS)值machine-learned胰蛋白酶的模型和实验派生值(A)和磷酸化肽(B)。力量Daltonics。

当分析师完成肽来看,得分与机器学习算法可以在部署生成预测CCS值。相关性得分为五个最佳适合生成每个频谱预测基于预测和衡量CCS值之间的比较。肽维度可以在三维与二维矢量化non-CCS-enabled算法,罗斯福率达到1%。此功能增加信心的结果可以实现更深层次的分析深度,确定更多的多肽(图3)。

图3:序列对胰蛋白酶的磷酸化肽TIMScore部署时增加了一倍,表明分析深度高于标准技术可用。⁷信贷:力量Daltonics。

改进的序列覆盖率和蛋白质的敏感性

为了提高整个肽分析工作流程,需要一个集成的解决方案,结合了数据生成和数据处理能力,减少时间分析和提高结果的准确性。不是可以结合数据分析技术如data-independent收购(DIA)增加深度和定量精度的额外的碎片离子的分离空间或复杂的前兆。⁸

2019年的一项研究中引入了一个新软件,DIA-NN,利用深层神经网络使用interference-correction区分真正的信号肽和噪音的策略。在典型DIA-MS分析,每个前体产生多个色谱由于碎片离子生成的数量。作为co-fragmenting前体往往干扰信号肽,可以不准确产生的色谱或太嘈杂的分析。DIA-NN软件使用peptide-centric方法相匹配的带注释的前体及其分散离子色谱。在这种情况下,软件首先产生消极控制基于输入(通过光谱库或提供在网上分析蛋白质的序列)和识别假定的洗脱峰这些控件。计算73峰分数和确定最佳人选峰对于每一个前兆,生成一个分数峰值,允许准确识别这些前兆和肽。³

DIA方法方法是进一步适应包括平行accumulation-serial碎片(PASEF),导致dia-PASEF方法,利用数据从蒂姆斯设备肽离子迁移尺寸允许分化的信号,通常co-fragmented。⁹它导致一个灵敏度的提高2至5倍叠加前体离子隔离离子迁移率的窗户尺寸,增加了工作周期。研究发现,它增加了蛋白质组学一项研究可以量化5200年深度69%蛋白质从10 ng希拉肽分离的95分钟nanoflow梯度和在另一个,5000 200 ng使用4.8分钟分离蛋白与标准蛋白质组学平台。这种方法可以检测到11700蛋白质在单跑了100分钟nanoflow梯度对复杂混合物。⁷

结论

蛋白质组学领域的扩张的知识由于最近的技术进步。然而,十年前的方法被认为是黄金标准不一定提供整个画面。例如,在大多数蛋白质组学分析,它可以检测蛋白质,洞察肽的种类组成,并了解这些蛋白质的结构和功能方面。即便如此,它是具有挑战性的地图的真实生物蛋白质自分析深度相对较低。

与新技术结合使用女士和图书馆的方法检测和分析过程,可以实现更大的深度剖析。它也避免了需要手工数据分析这些工具使用run-and-done方法同时分析生成的数据。反过来,它允许科学家获得更全面的了解宪法的样品在较短的时间内,以更大的准确性。未来部署的蛋白质分析方法在医学领域有着重要意义,生物技术和蛋白质组学。

引用

Batiston WP、Carrilho大肠的重要性和挑战分析化学蛋白质组学分析。布拉兹J肛门化学。2021;8 (31):51 - 73。doi:10.30744 / brjac.2179 - 3425. - rv - 64 - 2020
Snapkov我Chernigovskaya M Sinitcyn P, Le Quy K, Nyman助教,Greiff诉质量进步和挑战spectrometry-based抗体体验的分析。生物科技趋势》。40 2022;(4):463 - 481。doi:10.1016 / j.tibtech.2021.08.006
Demichev V, Messner CB、Vernardis SI Lilley KS, Ralser DIA-NN:神经网络和干扰校正使蛋白质组覆盖率高吞吐量。Nat方法。17 (1):2020;41-44 . .doi:10.1038 / s41592 - 019 - 0638 - x
Pauwels J, Gevaert k .质量spectrometry-based临床蛋白质组学——复兴。专家加速蛋白质组学。2021;18 (6):411 - 414。doi:10.1080 / 14789450.2021.1950536
坎贝尔M。在蛋白质组学5个关键挑战,专家告诉。捷克葡萄牙直播技术网络。//www.qianliexian123.com/proteomics/lists/5 -关键挑战-蛋白质组学-所-告诉- - -专家- 321774。7月16日,2019年出版。2022年11月3日通过。
徐T,公园SK, Venable JD, et al . ProLuCID:改进SEQUEST-like算法增强的敏感性和特异性。蛋白质组学杂志》上。2015;129 (3);- 24。doi:10.1016 / j.jprot.2015.07.001
常Ogata K, CH, Ishihama y磷酸化对肽的碰撞截面的影响离子在离子迁移谱法。质量范围(东京)。2021;10 (1):A0093-A0093。doi:10.5702 / massspectrometry.A0093
Demichev V, Szyrwiel L F,等人dia-PASEF使用FragPipe和DIA-NN深蛋白质组学数据分析样本数量较低。Nat Commun。2022;13 (1):3944。doi:10.1038 / s41467 - 022 - 31492 - 0
Meier F,作为广告,弗兰克·米等人diaPASEF:平行accumulation-serial碎片结合data-independent收购。Nat方法。2020;17 (12)1229 - 1236。doi:10.1038 / s41592 - 020 - 00998 - 0