編輯 |紫。
空間轉錄組學 (ST) 技術檢測單個細胞中的 mRNA 表達,同時保留其二維 (2D) 空間坐標,使研究人員能夠研究轉錄組在組織中的空間分布;然而,對多個 ST 切片進行聯合分析並將它們對齊以構建三維 (3D) 組織堆疊仍然是乙個挑戰。
近日,來自中國科學技術大學、合肥國家科學中心和北京生命科學研究所(NIBS)的研究團隊提出了一種用於ST資料分析的深度習空間架構表示(SPACEL)。 SpaceL 由 Spoint、Splane 和 Scube 三個模組組成,涵蓋 ST 資料的三個分析任務。
與來自不同組織的模擬和真實 ST 資料集以及 ST 技術的 19 種最新方法進行比較表明,SPACEL 在細胞型別反卷積、空間域識別和 3D 比對方面優於其他方法,從而證明 SPACEL 是 ST 資料處理和分析的有價值的整合工具包。
該研究題為“SpaceL: Deep Learning-Based Characterization of Spatial Transcriptome Architectures”,於2024年11月22日發表在Nature Communications上。
空間轉錄組學(ST)技術原則上使研究人員能夠檢查整個轉錄組在組織學切片中的空間分布,大大提高了我們對器官結構和疾病微環境的理解。 實驗性ST技術分為兩大類,可以i)以單細胞解像度檢測部分轉錄組的表達,或ii)在沒有單細胞解像度的情況下檢測整個轉錄組。
目前ST技術快速發展和應用的趨勢表明,在可預見的未來,科學和醫學研究將產生大量來自不同組織(和條件)的ST切片。 因此,迫切需要能夠快速、高效地實現多個ST切片資料整合分析的計算工具。
準確識別多個切片的功能空間域並重建組織的 3D 結構為各種實際應用中的重大生物學發現提供了寶貴的機會。 總體而言,對於存在重大缺陷的 ST 資料集來說,結構化組織的堆疊 3D 對齊仍然是乙個重大挑戰。
在這裡,研究人員開發了SpaceL,乙個基於深度習的工具包。 SpaceL 由三個模組組成:Spoint 嵌入乙個多層感知器,其中包含乙個概率模型,用於對單個 ST 切片中每個點的細胞型別組成進行反卷積;Splane採用圖卷積網路方法和對抗性習演算法來識別跨多個ST切片的轉錄組和空間一致的空間域;Scube 會自動轉換連續切片的空間坐標系並將它們堆疊在一起,以構建組織的 3D 結構。
圖 1:spacel 過程。 (*為了確保SpaceL的魯棒性,研究人員進行了廣泛的實驗,以評估其在各種超引數設定下的效能。 結果表明,與其他最先進的方法相比,Spoint、Splane 和 Scube 對超引數變化表現出卓越的魯棒性,強調了 SpaceL 在不同實驗設定中提供可靠和一致結果的有效性。
研究人員使用 SpaceL 分析了 11 個 ST 資料集,其中包括使用 10x Visium、StarMap、Merfish、Stereo-Seq 和 Spatial Transcriptomics 技術獲取的 156 個切片。 SpaceL在所有三種分析任務中都優於其他最先進的方法,因此代表了意法半導體資料處理和分析的有價值的整合工具包。
在 11 種反卷積方法中,Spoint 產生了最高的平均 PCC SSIM 值 (= 0.)。73/0.69)和最低平均RMSE JSD值(=0.)。05/0.41)。此外,基準研究中定義的準確度得分 (AS) 用於評估每種方法的效能:平均 AS ( = 093)顯著高於其他方法(as = 0.)。24-0.82)。
圖 2:使用 SPOINT 和其他反卷積方法對點進行單元型反卷積。 (*使用 Spoint 對細胞型別進行反卷積後,應用 Splane 來識別上述 DLPFC 資料集的 ST 切片的空間域。 結果表明,聯合分析方案提高了Splane空間識別的準確率。
圖 3:從 DLPFC 的 12 個 10x visium 切片中鑑定出空間域。 (*緊接著,測試了Splane在識別疾病切片空間域方面的效能。 結果表明,Splane能夠識別腫瘤系統多個部分的一致腫瘤區域和邊界。
圖 4:來自三個不同資料集的 11 個乳腺癌 ST 切片的聯合分析。 (*研究人員還開發了SpaceL的Scube模組來構建和研究給定組織的3D架構。 SpaceL 的 Scube 模組在模擬(Starmap)和真實世界(Merfish 和 Stereo-Seq)資料集對齊和 3D 架構構建方面都優於 Staligner 和 Paste。
圖 5:小鼠大腦連續 ST 切片的 3D 對齊。 (*為了突出SpaceL的整合性,研究人員應用了乙個完全整合的工作流程來分析小鼠全腦ST資料。 研究表明,SpaceL 可以成為分析多個 ST 切片的有效整合工具包。
*鏈結: