綜述丨環狀RNA鑑定與定量的方法與挑戰

Mondo 科學 更新 2024-01-30

眾所周知,在全基因組的大量物種中發現了許多由外顯子反向剪接產生的環狀RNA(circRNA)。 雖然它們大多是一些低表達水平的circRNA,但一些表達相對豐富的circRNA可以在各種生物過程中發揮調控作用。

與線性RNA的共線性順序剪接相比,環狀RNA具有非共線性反向剪接(BSJ)特性。 環狀RNA主要與同源線性RNA共表達,並且序列幾乎完全重疊,因此在全基因組範圍內對環狀RNA進行精確注釋和定量一直具有挑戰性。

為此,楊力,復旦大學生物醫藥研究院特聘研究員trends in genetics(if=11.821)發表了一篇題為“全基因組環狀RNA鑑定和定量的方法和挑戰”的綜述,討論了circRNA的不同純化和富集策略、不同的測序方法以及全基因組circRNA分析的相應計算方法,強調了使用不同策略時準確定量circRNAs對交叉樣本比較的重要性。

1. 用於circRNA分析的不同富集方法和測序平台

早期的全轉錄組學研究方法是通過富集 Oligo(DT) 微珠的多聚腺苷酸化 [Poly(A)+] RNA(稱為poly(a)+ rna-seq(圖1B),但它不能用於大規模識別環狀轉錄本,因此只能通過其他環狀RNA富集策略來實現。 一方面,通過收集與Oligo(dt)無關的片段並進一步消耗冗餘RNA,可以提取非多聚腺苷酸化的[poly(a)-] RNA進行深度測序它被稱為poly(a)-RNA-seq(圖 1b)。 另一方面,對同時含有 poly(a)+ 和 poly(a)- 的轉錄本進行深度測序稱為 rRNA 消除,然後進行深度測序ribo-rna-seq(圖 1b)。 這兩種方法都可用於分析circRNA和內含子環狀RNA(cIRNAs),並檢測大約10倍以上的BSJ讀長(圖1D),以及用於將環狀RNA與其同源線性RNA進行比較。 此外,在RNase R處理後的深度測序中,circRNA和cirRNA可以顯著富集和沉默,術語:rnaser rna-seq(圖 1b)。 近年來興起oxford nanopore等長讀長測序平台還能夠鑑定和分析circRNA(圖1B)。

在通過RNAsR處理的短讀長和長讀長測序資料集中,可以檢測到的BSJ讀長數是非RNAser處理的3至10倍(圖1D)。 由於RNAse R處理消除了由於反式剪接和逆轉錄酶模板切換引起的假陽性,因此它已被廣泛用於circRNA的驗證。

圖1 用於circRNA分析的不同富集方法和測序平台。

2. CircRNA鑑定和分析方法

幾乎所有用於可靠注釋circRNA的計算流程都遵循乙個統一的原則:識別與BSJ一致的測序讀數。 迄今為止,已經開發了十幾種計算方法用於分析短讀長RNA-seq資料集中的circRNA,這些計算方法可以簡單地分為兩類,具體取決於如何識別與BSJ對齊的reads:基於融合讀取(Fusion 讀取,圖 2a)。並基於偽參考基因組(偽參考,圖2b)。

基於融合讀長的方法直接將測序讀數與基因組參考序列對齊,然後以非線性方式檢測融合(或嵌合)讀數,常用的代表***包括:Circexplorer3 Clear、DCC 和 Mapsplice等。 此外,一些軟體已經開發出獨特的策略來重新發現含有未注釋外顯子的環狀RNA,例如CircExplorer3使用StringTie或Cufflinks等工具組裝新的轉錄本,而CIRI2和Find Circ使用剪接訊號、剪接位點距離和其他幾個因素來實現類似的目標(圖2C)。

基於偽參考基因組的方法需要在比對前基於已有的基因注釋資料初步構建偽BSJ參考。 例如:刀和NCLSScan以及其他用於識別與偽BSJ參考對齊的讀數的軟體(圖2C)。 為了消除潛在的假陽性,這些管道通常首先將reads與基因組和轉錄組參考注釋匹配,然後與偽BSJ參考注釋匹配(圖2B)。 由於它們依賴於已知的基因注釋,因此基於偽參比的方法可能不適合circRNA的從頭發現。

也有人認為,使用多種工具檢測circRNA可以提供更準確的結果,從而出現了結合各種工具的新軟體。 例如circcompara2整合了 CircExplorer2、Find Circ 和 Ciri,而circrnawrap整合多達 8 種 circRNA 檢測工具和多種 circRNA 分析工具。

除短讀長測序外,還報道了四種型別的長讀長測序資料分析工具(圖2D)。 其中,Ciri-Long、Cirfl-Seq 和 Isocirc 需要滾動環逆轉錄(rcrt)或滾環放大(rca)過程,然後確定迴圈一致的序列(ccs)或一致的序列。 然而,CircNick-LRS 跳過 RCRT 或 RCA 步驟,直接執行 CircRNA 的長讀長測序。 與短讀長測序相比,長讀長測序在檢測全長circRNA和鑑定異構體方面具有明顯的優勢,但存在成本高、錯誤率高等缺點。

圖 2 呼叫 BSJ 來注釋讀段的 circRNA。

3. circRNA定量和跨樣本比較的挑戰

根據circrna BSJ讀段識別比對的統一原理,BSJ比對讀長的原始數量自然用於定量circRNA。 然而,由於不同的資料集和研究通常採用不同的測序深度,因此使用 BSJ 比較的絕對讀長數進行跨樣本比較可能會產生偏差。 例如,隨著從同一HLF Ribo-RNA-Seq資料集中隨機提取的20 M至150 M讀數的測序深度增加,高表達circRNA的數量增加,測序深度也隨之增加(圖3A,左)。 隨著測序深度的增加,可以鑑定出更多表達水平較低的circRNA(圖3A,右)。

此外,不同的純化和富集策略也會影響測量的bsj比對讀長的數量,例如有或沒有RNase R處理的資料集,並且不同RNase R處理條件下的資料集在定量circRNA及其在樣品之間的比較時可能存在偏差。

最後,同樣重要的是,在評估circRNA表達時應考慮線性RNA表達,因為circRNA及其同源線性RNA共存於同一基因組位點。 環狀RNA的功能研究可能會被高度表達的線性RNA同型所掩蓋,因為它們的序列幾乎完全重疊。 另外環狀RNA表達與同源線性RNA的直接比較是困難的,不僅因為它們的序列相似,還因為用於定量環狀RNA和線性RNA的策略是不同的。為了解決這個問題,研究報道了使用 CircExplorer3 clear、Ciri2、Ciriquant 和 DCC 軟體對 BSJ 比對讀長和共線性外顯子到外顯子連線讀數進行定量,以評估環狀或線性 RNA 表達水平(圖 3C)。 以同源線性RNA的表達為背景,可以選擇高表達環狀RNA和低表達線性RNA,用於後續的功能研究。

然而除少數外,絕大多數circRNA的豐度遠低於其同源線性RNA並展示了一種使用高表達線性RNA的有用方法,以確保功能性circRNA的表徵。

圖3 環狀RNA的全基因組定量。

在過去的十年中,各種(環狀)RNA富集策略和測序技術已被用於實現circRNA的全基因組表徵。 然而,全基因組範圍內準確鑑定circRNA仍然具有挑戰性。 此外,如何在單細胞水平上高效、精確地分析環狀RNA也是乙個挑戰。

全基因組環狀RNA分析及其精確定量的複雜性源於具有重疊序列的環狀和線性RNA轉錄本的共表達。 不同的轉錄組富集策略、測序技術和計算方法有助於 circRNA 的鑑定和跨樣本比較,以檢查它們在各種生物環境中的功能作用。 因此,進一步開發專為環狀RNA設計的創新技術將使我們能夠更深入地了解這些具有獨特環狀結構的迷人非編碼RNA分子,並評估它們在診斷和**中的潛在應用。

引用

ma xk, zhai sn, yang l. approaches and challenges in genome-wide circular rna identification and quantification. trends genet. 2023

相關問題答案

    撰寫護理研究文獻綜述的 10 條簡單規則

    文獻綜述在大多數科學領域都有很大的需求。他們的需求源於不斷發展的科學 例如,與年相比,年Web of Science上的瘧疾 肥胖症和生物多樣性分別增加了倍 倍和倍 鑑於如此多的 不能指望科學家詳細研究每篇與他們的興趣相關的新 文章 因此,依靠對近期文獻的定期總結既有利又必要。儘管對科學家的認可主要...