2月28日,白宮發布最新訊息,**拜登正式簽署《關於防止受關注國獲取大量美國公民敏感個人資料及美國相關資料的行政命令-**》,限制中國、俄羅斯、伊朗等六個“受關注國”及其相關實體訪問和使用美國公民的“敏感資料”,**, 包括基因組資料、生物特徵資料、個人健康資料、地理位置資料、財務資料和特定型別的個人身份資訊。以及與**相關的敏感資料。據悉,這是美國歷史上首次禁止向中國傳輸資料。 特別是,在拜登列舉的“敏感資料”案例中,生物技術領域堪稱“受災最嚴重領域”。
其實早在2020年,我們的陶博士就對這個問題做了假設,今天再看,還是覺得有道理的。 文章不僅闡述了NCBI的具體卡點,還介紹了國內的替代平台,現在再次發表這篇文章可能會給你更多的啟發。
觀點。 (1)慣用且不可替代的NCBI是非美國分子生物學研究人員頭上的達摩克利斯之劍。
2)被“卡在脖子上”不僅是技術,也是認知方法。
3)我們不僅要期待國家重大專案,更要努力拯救自己。
4)乙個好的生物資訊學分析平台是為生物學家準備的,而不是為分析師準備的。
什麼是“卡脖子”技術。
2018年以來,中國有識之士通過各種渠道發聲,表明“我國”有很多東西沒有力量。 其中科技總編輯劉亞東的聲音最為有名,詳情可參考以下
1.中國被困在哪些技術上?
2.2019年底,總理主持召開了全國傑出青年科學家科學研討會。
可以看出,“卡脖子”技術有幾個特點,如下
1)技術具有長期積累的特點,不可能一蹴而就。
2)具有多學科的滲透性,這不僅需要非常先進的特殊專業能力,而且需要在製造和維護等許多配套領域進行開發。
3)行業“認知”的壟斷,國內可能有類似的技術或方法,但使用者無法付費。
在我看來,生物資訊學領域知名的NCBI**,其實就是“卡脖子”技術。 不知道從哪裡開始,NCBI在大陸使用時經常抽搐,404期間學生的研究進展。。。。
但是沒有正式發布的技術,而“資料庫管理系統”是最接近的選擇——它絕對低估了這個平台的重要性,令人心碎!
分析NCBI的優勢。
NCBI是各類生物研究者的重要資料資源,功能我就不贅述了,如果你不清楚的話可以看:NCBI功能介紹。 自 2005 年我第一次使用 NCBI 以來,已經過去了 15 年,我見證了各種修訂和公升級,以及被納入 Google。 而且由於工作的性質,我幾乎用完了所有的功能,所以應該算是高階使用者。
核心優勢分析——
NCBI國際頂尖的資料分析能力和資料整合管理能力出乎意料地令人難以置信——是不是和我們用的特別相似!
1. 實用性
1)文獻搜尋:在當今沒有Google Scholar的世界裡,PubMed是雨天久違的一縷陽光。
2)BLAST:我覺得只要你是乙個有正規學術背景的研究人員,給你乙個DNA序列,你想知道它是什麼,第一選擇永遠是登入ncbi-blast找到答案。
3)作為提交教程最詳細的平台,GenBank、SRA、GEO仍然是上傳原始資料的首選。
2. 許可權
1)嚴謹的評審機制:除了不斷公升級、孤注一擲的機器標定過程(越來越智慧型,AlphaGo是否被應用於生命科學幾乎是值得懷疑的);最後還有人工檢查,對於每乙個提交給Genbank的序列,都有非常資深的序列專家來檢查,相信:只要Sanger序列、小基因組等人都提交了,就會留下不可磨滅的印象。
2)頻繁的更新和修改:以前的教科書說NCBI的預設是每2個月更新一次資料庫,但近年來,這個頻率肯定增加了。除了更新之外,現有資料也經常被修改,特別是對於有爭議的物種。
3)攻克關鍵生物通訊領域的明珠:序列比較。
如果有人在生物資訊學領域做了幾個大問題,那麼序列比對絕對可以排在前十名。 而NCBI幾十年來一直在更新BLAST,效能和準確性不在乎,光是這種精神就已經讓人倒在地上了
NCBI工作人員的專業性無話可說,輕率!
3. “大資料”公司
如果NCBI是一家純粹的商業公司,是不是很符合傑克馬父親經常嘮叨的“資料公司”。 可怕的是,這家公司積累資料的時間比阿里巴巴要長得多
國內替代平台。
當然,NCBI不能壟斷它,除了國際上的EMBL和DDBJ之外,國內也有類似的平台,其中最著名的是CNDB(和中科院的NGDC()
1. 國家基因庫CNDB
華大基因技術團隊深度參與的CNDB無疑是最接近NCBI的平台,在很多方面可能會想得更遠,規劃得更好。 例如,除了遺傳資源的儲存和納入外,還有書寫功能(合成生物學)。
強大,目前國內有越來越多的科學家將他們的原始資料上傳到CNDB。 然而,經過幾年的推廣,只有少數“精英”科學家參與,而知道資料庫和**的普通使用者數量仍然非常少。
我認為它有高冷只有生物資訊圈的人才會同意,從其最簡單的爆炸功能可以看出,與NCBI和CNDB BLAST介面相比:
哪個對生物學研究人員有好處?
答案是顯而易見的!
無論NCBI是否具有前期客戶教育的優勢,CNDB介面更適合NGS大規模資料分析的使用者,而這樣的使用者仍然是少數。
個人理解——
1.此功能是日常使用最頻繁的工具,需要更符合使用者體驗。
2.這應該不會太難,畢竟,你不需要從頭開始編寫乙個爆炸比較軟體。
這種不友好的使用的最大原因是專案負責人是“高通量資料分析師”,他只做過NGS,而不是生物學研究人員。 前者受限於對業務工作流的理解,以雲計算和雲平台的思想,做出“世代排序”的產品。
當然,目前這種狀態還有另外乙個原因——
類似的功能完全是公益,NCBI由美國資助**,而CNDB仍有自籌資金的壓力,因此刻意不貼近人民以降低運營成本。
2. 中國科學院-國家基因組資料庫NGDC
我個人很少用這個資料庫,看到介面和ncbi很像,功能網路非常大,有興趣可以試試玩。 我沒有任何具體的想法......
國內平台的敵人。
生物行業的人都知道NCBI對生物研究的重要性,更不用說專家和領導者了,他們的遠見和智慧不需要像我這樣的凡人質疑。 現在和不久的將來,中美在各個行業的對抗將繼續公升級,很明顯,不僅僅是在晶元領域。 當NCBI有一天禁止中國IP位址時,研究生必須在以下州......
那麼,既然有國內平台,為什麼推廣這麼難呢? 按照優先順序順序,從高到低,我列出了國內平台的敵人——
1)使用者。沒錯,使用者是現在最大的敵人!
中國人需要相信國產,如果你不相信其他中國產品,那就自己做乙個專業的平台,自己用吧!
使用國內平台的人多了,NCBI自然卡不住!
2)時間。今天,川普**已經斷絕了與世衛組織的聯絡,同時限制了中國留學生的數量,明天可能會重新封鎖NCBI等資料庫,對吧?! 所以我們剩下的時間不多了。
3)專業人才的投入。
雖然兩個平台的國內替代已經做得很好,但背後的公司或平台並不是乙個全職的資料庫團隊,他們自己的主題和KPI等長期規劃可以分配精力和團隊資源來持續開展這個專案——不得而知。
因此與其把希望寄託在別人的平台上,不如自己做!
4)硬體投資。
以上都是軟體,對生物資料庫的硬體和資金要求也非常高,否則NCBI就不需要依賴谷歌了。
如果中央管理的國家生物資料庫更加困難,那麼做好單一物種或特定領域的資料庫,是拯救國家的最佳選擇!
注:以上內容僅代表個人觀點!
無論是基礎科學的基石(資料、資料庫)還是生物技術,越來越明顯的是,它將成為中美之間下一輪爭端的焦點,未來我們該如何應對? 這對我們的科研人員來說是乙個全新的挑戰。