我们已经更新了隐私政策为了更清楚我们如何使用您的个人数据。

我们使用cookie为您提供更好的体验。你可以阅读我们的饼干政策这里。

广告

RNA-Seq:基础,应用和协议


想要本文的免费PDF版本吗?

填写下面的表格,我们将向您发送PDF版本的电子邮件“ RNA-Seq:基础,应用和协议”

捷克葡萄牙直播技术网络有限公司需要您提供给我们的联系信息,以与您联系有关我们的产品和服务。您可以随时退订这些通信。有关如何取消订阅以及我们的隐私惯例和保护隐私的承诺的信息,请查看我们隐私政策

阅读时间:

什么是RNA-Seq?


RNA-seq(RNA-sequencing)是一种可以使用样品中RNA的数量和序列的技术下一代测序(NGS)。它分析了转录组,表明我们DNA中编码的哪些基因在多大程度上打开或关闭。在这里,我们研究了为什么RNA-Seq有用,技术的工作原理以及当今常用的基本协议。1


RNA-Seq的应用是什么?


RNA-Seq让我们调查and discover the transcriptome, the total cellular content of RNAs including mRNA, rRNA and tRNA. Understanding the transcriptome is key if we are to connect the information in our genome with its functional protein expression. RNA-seq can tell us which genes are turned on in a cell, what their level of转录是,在什么时候被激活或关闭。2这使科学家可以更深入地了解细胞的生物学,并评估可能表明疾病的变化。使用RNA-seq的一些最流行的技术是转录分析,单核苷酸多态性(SNP)识别,即3RNA编辑和差异基因表达分析。4


This can give researchers vital information about the function of genes. For example, the transcriptome can highlight all the tissues in which a gene of unknown function is turned on, which might indicate what its role is. It also captures information about alternative splicing events (Figure 1), which produce different transcripts from one single gene sequence. These events would not be picked up by DNA sequencing. It can also identify转录后修改在mRNA处理期间发生的,例如聚腺苷酸化和5'限。2

图像解释了在对齐参考基因组时,RNA短读数如何通过内含子拆分。

Figure 1:RNA-Seq数据使用的简短读取mRNA,该mRNA不含内含子非编码DNA。然后必须将这些读取与参考基因组对齐。


How does RNA-seq work?


Early RNA-seq techniques used Sanger sequencing technology, a technique that although innovative at the time was also low-throughput and costly. It is only recently, with the advent and proliferation ofNGS技术,我们是否能够充分利用RNA-Seq的潜力。5


RNA-Seq工作流有多个步骤,可以大致总结为:

  1. RNA提取
  2. Reverse transcription into cDNA
  3. Adapted ligation
  4. 放大
  5. 测序


Once you have obtained your RNA sample for analysis, the first step in the technique involves converting the population of RNA to be sequenced into complimentary DNA (cDNA) fragments (a cDNA library). This is done by reverse transcription and allows the RNA to be put into an NGS workflow. The cDNA is then fragmented, and adapters are added to each end of the fragments. These adapters contain functional elements which permit sequencing, for example, the amplification element (which facilitates clonal amplification of the fragments) and the primary sequencing priming site. Following processes of amplification, size selection, clean-up and quality checking, the cDNA library is then analyzed by NGS, producing short sequences that correspond to all or part of the fragment from which it was derived. The depth to which the library is sequenced varies depending on the purpose for which the output data will be used for. Sequencing may follow either single-end or paired-end sequencing methods. Single-read sequencing is a cheaper and faster technique (for reference, about 1% of the cost of Sanger sequencing) that sequences the cDNA fragments from just one end. Paired-end methods sequence from both ends and are therefore more expensive6,7但是在后续数据重建方面提供了优势。

A further choice must be made between strand-specific and non-strand-specific protocols. The former method means the information about which DNA strand was transcribed is retained. The value of extra information obtained from strand-specific protocols make them the favorable option.


这些读物将在工作流程结束时有数百万美元,然后可以与参考基因组对齐或组装de novo产生跨转录组的RNA序列图。8

RNA-Seq vs微阵列:为什么RNA-Seq被认为是优越的


RNA-Seq被广泛认为优于其他技术,例如微阵列杂交。RNA-Seq备受尊敬的身份有几个原因:


不t limited to genomic sequences –
unlike hybridization-based approaches, which may require species-specific probes, RNA-seq can detect transcripts from organisms with previously undetermined genomic sequences. This makes it fundamentally superior for the detection of novel transcripts, SNPs or other alterations.9,10


低背景信号 -
RNA-Seq中使用的cDNA序列可以映射到基因组上的靶向区域,从而易于去除实验噪声。此外,在RNA-Seq实验中,跨杂交或不合标准杂交的问题(可能会困扰微阵列实验)不是问题。


更量化 -
相对于阵列上检测到的其他信号,微阵列数据仅作为值显示,而RNA-Seq数据是可量化的。RNA-Seq还避免了微阵列在检测非常高或非常低转录水平的问题上存在的问题。


RNA-seq的工作流程

Figure 2:RNA-seq的工作流程


RNA-seq协议


实验计划


Preparation prior to starting your RNA-seq experiment is essential. Questions to answer before starting include:11


•您正在使用哪种RNA纯化方法?

•您需要什么阅读深度?

•您将使用哪个平台?

• Is there a reference genome available and which will you use?

•您如何评估RNA的质量?

•您需要丰富目标RNA吗?

•您会将RNA编码吗?

•我有足够的生物学和技术复制吗?

•单端还是配对的测序?

•您将使用什么读取长度?

•我想保留特定于链的信息吗?


cDNA库制备


考虑这些要点后,您可以开始准备cDNA库。这将需要碎片碎片,添加平台特异性的“适配器序列”和cDNA的扩增,但是确切的过程将非常特定于此阶段使用的平台。对于链特异性方案,cDNA的扩增涉及逆转录酶介导的第一线合成,然后进行DNA聚合酶介导的第二链合成。11,12还可以添加条形码,即启用多路复用,因此可以在一次运行中测序许多样品。在图书馆准备阶段结束时量化图书馆以确保协议已成功并检查库的质量和集中度以实现最佳测序性能是有益的。


cDNA测序


准备库后,您可以使用所选的测序平台将cDNA库对所需的深度和需求进行排序。产生笔录数据后,您可以将数据映射到参考基因组或组装de novo如果没有参考。剪接变体和修改的存在可能使对齐过程变得复杂,并且所使用的参考基因组的选择也会改变这个阶段的难度。在此阶段,诸如Star之类的软件包以及Picard或Qualimap等质量控制工具也很有用。13 从头除了已经知道的那些人之外,组装还将允许发现新颖的成绩单。


RNA-seq数据分析


在对齐阶段之后,您可以专注于分析您的数据。Sailfish,RSEM和BITSEQ等工具13将帮助您量化转录水平,而量化剪接基因的MISO等工具可用于更专业的分析。14这些工具有一个库,阅读评论和综述是找到合适的研究工具的最佳方法。


总而言之,现代RNA-Seq已被确定为微阵列的优越选择,并且暂时可能仍然是首选选择。

Challenges of RNA-seq


在过去的十年左右的时间里,RNA-Seq领域取得了重大进展。相关成本显着降低,而吞吐量增加,序列保真度远远优于NGS技术的早期迭代,并且数据分析工具和管道的可用性大大提高。但是,在考虑RNA-seq实验时,科学家仍有许多挑战要牢记。这些包括:


隔离足够高质量RNA- 虽然RNA-seq分析的样本数量需求已大大减少,但仍然重要的是要确保您能够获得足够的RNA来满足所有分析要求,包括必要时重复。同样重要的是要记住,尽管您可以隔离总RNA,具体取决于您的实验性问题,但您可能只有测序分数其中(通常是信使RNA(mRNA)),进一步减少了样品数量。这也必须具有高质量和纯度,因为较差的样本可能导致效果不佳,或者在某些情况下图书馆准备方案中的失败。可以使用RNA的质量和浓度来确定紫外可见光谱。Unlike DNA, RNA degrades rapidly so it important to treat samples with care at all stages of isolation and purification. Degradation may not be uniform, hindering the comparison of transcription levels between genes. Low-level transcripts may be lost from the sequenced population altogether.


样品集的影响- 在库准备之前(不使用条形码)在图书馆准备之前进行汇总样品可以减少测序工作和成本,或者在样本数量非常有限的情况下启用测序。但是,重要的是在数据分析期间考虑到这一点,其中一个这样的池认为是一种生物学重复,但是并非有很多样本用于构成池。合并样品之间的变化会导致误导性结果和统计问题因此,在实验设计过程中应考虑可能的含义。


Trading-off sequencing depth against sample number- 在一次测序中完成尽可能多的样本以减少成本和机器时间似乎很有吸引力。但是,这是有代价的。越多的样品多路复用,对于每个样品中的每个样品的读取就会越少。随着读取深度的减少,对于获得的序列的可靠性而存在不确定性。测序技术仍然远非完美,并且在阅读中犯了错误。因此,重要的是要找到获得足够的读取深度以使获得的测序数据的质量和忠诚度和最大化测序能力以确保确保的质量和保真度之间的甜蜜点很重要。足够的生物学重复可以分析以提供有意义的数据。


参考


1. Wang Z,Gerstein M和Snyder M. RNA-Seq:转录组学的革命性工具。纳特。基因牧师,2009; 10(1),57-63。doi:10.1038/nrg2484

2. Ozsolak F, & Milos PM. RNA sequencing: advances, challenges and opportunities.纳特。基因牧师,2011;12(2),87–98。doi:10.1038/nrg2934

3. Bakhtiarizadeh先生,Alamouti AA。基于RNA-Seq的遗传变异发现为控制绵羊尾部的脂肪沉积提供了新的见解。Sci代表10,13525(2020)。doi:10.1038/S41598-020-70527-8

4. Han Y, Gao S, Muegge K, Zhang W, & Zhou B. Advanced applications of RNA sequencing and challenges.生物知识。生物。见解,2015; 9(Suppl 1),29-46。doi:10.4137/BBI.S28991

5. Schuster SC。下一代测序改变了当今的生物学。纳特。方法, 2008;5(1), 16–18. doi:10.1038/nmeth1156

6. JP Sulzberger哥伦比亚基因组中心。基因组测序:定义实验。哥伦比亚系统生物学。https://systemsbiology.columbia.edu/genome-sequencing-defining-your-comperiment。2021年8月24日访问。

7. Functional genomics II. EMBL-EBI.https://www.ebi.ac.uk/training/online/courses/functional-genomics-ii-common-common-technologies-and-data-analysis-methods/rna-sequencing/performing-performing-a-a-a-rna-seq-eqperiment/设计注意事项/。2021年9月6日访问。

8. Zhao S,Zhang Y,Gordon W等。比较滞留和非链的RNA-SEQ转录组分析和基因重叠的研究。BMC Genomics,2015; 16(1)。doi:10.1186/s12864-015-1876-7

9. Zhao S,Fung-Leung W-P,Bittner A,NGO K和Liu X.活化T细胞的转录组分析中RNA-Seq和微阵列的比较。PLOS ONE,2014; 9(1),E78644。doi:10.1371/journal.pone.0078644

10. Rao MS,Van Vleet TR,Ciurlionis R等。RNA-SEQ和微阵列基因表达平台的比较,用于对短期大鼠毒性研究的肝脏评估。Front. Genet。2019; 9:636。doi:10.3389/fgene.2018.00636

11。Kukurba KR, Montgomery SB. RNA sequencing and analysis.冷泉亨布尔。2015; 2015(11):951-969。doi:10.1101/pdb.top084970

12.俄勒冈大学的Cresko实验室。RNA-Seqlopedia。俄勒冈大学。https://rnaseq.uoregon.edu/#library-prep-stranded-libraries。2021年8月24日访问。

13. Conesa A,Madrigal P,Tarazona S等。RNA-seq数据分析的最佳实践调查。基因组生物。,2016; 17。doi:10。1186/s13059-016-0881-8

14. Katz Y,Wang ET,Airoldi EM和Burge CB。RNA测序实验的分析和设计,用于鉴定同工型调节。纳特。方法,2010; 7(12),1009–1015。doi:10.1038/nmeth.1528

Meet the Author
Ruairi J Mackenzie
Ruairi J Mackenzie
高级科学作家
广告