北京基因組所發(fā)布更新版表觀基因組關(guān)聯(lián)研究開放平臺(tái)EWAS Open Platform
| 來(lái)源: 北京基因組研究所 【字號(hào):大 中 小】
近日,由中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心)國(guó)家基因組科學(xué)數(shù)據(jù)中心(NGDC)開發(fā)的表觀基因組關(guān)聯(lián)研究資源開放平臺(tái)EWAS Open Platform正式上線。該研究成果以EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study為題在Nucleic Acids Research上在線發(fā)表。
隨著表觀基因組關(guān)聯(lián)研究(EWAS)的爆炸式增長(zhǎng),出現(xiàn)了大量EWAS學(xué)術(shù)論文,積累了海量EWAS相關(guān)數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化整合,并從已發(fā)表論文中提取和挖掘表觀關(guān)聯(lián)知識(shí),對(duì)于系統(tǒng)的表征和研究不同實(shí)驗(yàn)條件下的甲基化狀態(tài)、探索與各種性狀相關(guān)的表觀遺傳分子機(jī)制具有重要意義。NGDC在2019年和2020年先后開發(fā)了基于高質(zhì)量的人工審編EWAS知識(shí)庫(kù)(EWAS Atlas)和存儲(chǔ)了海量標(biāo)準(zhǔn)化DNA甲基化芯片數(shù)據(jù)的EWAS數(shù)據(jù)庫(kù)(EWAS Data Hub)。
為了提供從數(shù)據(jù)瀏覽與下載、在線分析與可視化到知識(shí)解釋與驗(yàn)證的全面系統(tǒng)的資源和服務(wù),NGDC研究團(tuán)隊(duì)在不斷整合和更新中心已有EWAS資源基礎(chǔ)上,構(gòu)建了表觀組關(guān)聯(lián)研究資源開放平臺(tái)(EWAS Open Platform)。EWAS Open Platform包括標(biāo)準(zhǔn)化的數(shù)據(jù)信息庫(kù) (EWAS Data Hub)、人工信息提取的知識(shí)庫(kù)(EWAS Atlas)和表觀-特征關(guān)聯(lián)在線工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115852個(gè)樣本的DNA甲基化芯片數(shù)據(jù)和對(duì)應(yīng)的元數(shù)據(jù),并統(tǒng)一采用GMQN方法進(jìn)行標(biāo)準(zhǔn)化。同時(shí),EWAS Data Hub利用海量高質(zhì)量DNA甲基化芯片數(shù)據(jù)和標(biāo)準(zhǔn)化元數(shù)據(jù)的優(yōu)勢(shì),為485512個(gè)探針和36397個(gè)基因提供了一系列重要的評(píng)估值(包括組織特異性、年齡相關(guān)性、性別差異和種族特異性)和不同背景下的參考DNA甲基化圖譜;EWAS Atlas共整合了910篇文獻(xiàn)中報(bào)道的617018個(gè)高質(zhì)量的甲基化與表型關(guān)聯(lián),涉及618種表型和3385個(gè)隊(duì)列;EWAS Toolkit利用EWAS Atlas和EWAS Data Hub提供的高質(zhì)量的甲基化與表型關(guān)聯(lián)知識(shí)和標(biāo)準(zhǔn)化的DNA甲基化芯片數(shù)據(jù),為用戶提供多種在線分析和可視化工具,包括富集分析、注釋、知識(shí)圖譜可視化等。
該研究得到了中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)、國(guó)家重點(diǎn)研發(fā)計(jì)劃、中科院關(guān)鍵技術(shù)人才等項(xiàng)目資助。
EWAS Open Platform數(shù)據(jù)處理流程示意圖
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000016