研究進展

北京基因組所發(fā)布癌癥單細胞表達圖譜數(shù)據(jù)庫CancerSCEM

日期: 2021-12-03

|  來源: 北京基因組研究所 【字號:

  近日,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數(shù)據(jù)中心開發(fā)的癌癥單細胞表達圖譜數(shù)據(jù)庫(CancerSCEM)上線。該研究成果以CancerSCEM: a database of single-cell expression map across various human cancers為題在國際學術期刊Nucleic Acid Research在線發(fā)表。

  單細胞分辨率的全轉(zhuǎn)錄組測序技術(scRNA-seq)具有研究細胞異質(zhì)性的顯著優(yōu)勢,已成為研究腫瘤微環(huán)境、癌癥發(fā)病機制、轉(zhuǎn)移與侵襲以及各類癌癥治療與診斷不可或缺的手段。截至2021年11月,PubMed已有超過1300個癌癥相關的單細胞轉(zhuǎn)錄組學研究,極大提升了人們對人類癌癥發(fā)生發(fā)展的理解,推動了癌癥臨床診斷與治療的進程。大規(guī)模癌癥scRNA-seq數(shù)據(jù)在過去十年中呈現(xiàn)爆炸式增長,迫切需要對這些數(shù)據(jù)進行規(guī)范化整合與處理,對各類癌癥的腫瘤微環(huán)境進行深入挖掘與比較分析。為應對這一需求,該研究團隊開發(fā)了CancerSCEM數(shù)據(jù)庫。

  CancerSCEM 1.0版本整合分析了208個癌癥scRNA-seq數(shù)據(jù)集,涵蓋肺腺癌(LUAD)、結(jié)腸直腸癌(CRC)、惡性膠質(zhì)瘤(GBM)等在內(nèi)的20種人類癌癥類型。通過標準化分析流程處理,獲得了精確的細胞類型注釋信息。在此基礎上,團隊還開展了一系列附加分析,包括不同細胞類型間基因差異表達分析(可為新型標志物篩選提供參考)、細胞表面受體-配體基因?qū)Ρ磉_譜、樣本內(nèi)細胞互作網(wǎng)絡構建等,可為用戶提供更加豐富的腫瘤微環(huán)境相關信息,并開展了基于TCGA表達數(shù)據(jù)與臨床信息的生存分析。

  數(shù)據(jù)庫為用戶提供瀏覽、多重檢索、在線分析及下載等服務功能,用戶可采用首頁快速檢索、詞云及精確檢索等途徑查詢感興趣的癌癥單細胞數(shù)據(jù)集或樣本。如點擊詞云里的基因名“HLA-A”或通過搜索框輸入,均可觸發(fā)數(shù)據(jù)庫查詢功能,并實時獲得目標基因的詳細信息及其在單細胞層面與細胞群體(組織)層面的表達分布信息。為方便臨床相關用戶的使用,團隊共審編獲得36個常用免疫檢查點分子(如PDCD1、CTLA4、LAG3、HMGB1),并提供專門的搜索列表,以幫助各類癌癥的臨床免疫治療研究尋找更優(yōu)的治療靶點。

  數(shù)據(jù)庫還配備了一個交互式綜合在線分析平臺,共集成2個分析模塊與7個分析功能。通過基因分析模塊,用戶可開展4個方面的實時分析及可視化展示:樣本內(nèi)目標基因的整體表達概況;樣本內(nèi)基因在不同細胞類型間的表達比較;基因表達相關性計算及篩選;208個樣本中單細胞或bulk層面的基因表達比較。通過樣本分析模塊,用戶可進行樣本間細胞組成比較、樣本內(nèi)細胞互作網(wǎng)絡構建以及基于TCGA的生存分析。該分析平臺將為用戶開展個性化的癌癥scRNA-seq數(shù)據(jù)挖掘提供友好的增值服務。

  該研究工作得到中科院戰(zhàn)略性先導科技專項、國家自然科學基金、國家重點研發(fā)計劃等項目資助。

  論文鏈接 

CancerSCEM數(shù)據(jù)庫在線分析平臺的7個分析功能展示

附件: