遺傳發(fā)育所通過(guò)創(chuàng)新蛋白聚類方法開發(fā)新型堿基編輯工具
| 來(lái)源: 遺傳與發(fā)育生物學(xué)研究所 【字號(hào):大 中 小】
中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組開創(chuàng)性地運(yùn)用AI輔助結(jié)構(gòu)預(yù)測(cè),建立起基于三級(jí)結(jié)構(gòu)的蛋白聚類方法,并擴(kuò)展為全新的脫氨酶挖掘體系,開發(fā)了一系列具有中國(guó)自主知識(shí)產(chǎn)權(quán)的新型堿基編輯工具。該工作為蛋白功能分析、新功能元件挖掘提供了全新策略。新研發(fā)的堿基編輯系統(tǒng)具有我國(guó)自主知識(shí)產(chǎn)權(quán)的精準(zhǔn)基因編輯技術(shù)(已申請(qǐng)PCT發(fā)明專利)。6月27日,相關(guān)研究成果發(fā)表在《細(xì)胞》上。?
蛋白質(zhì)是生命活動(dòng)的主要承擔(dān)者。對(duì)蛋白質(zhì)進(jìn)行功能聚類,是探索其參與的生理過(guò)程、設(shè)計(jì)新型蛋白質(zhì)等的重要手段。現(xiàn)有的方法主要基于氨基酸一級(jí)序列的相似性對(duì)蛋白質(zhì)進(jìn)行聚類分析,并以此推斷其功能和演化關(guān)系。然而,蛋白質(zhì)功能由其三維空間結(jié)構(gòu)決定,開發(fā)基于三維結(jié)構(gòu)的高通量蛋白質(zhì)聚類方法,將為蛋白質(zhì)功能研究提供更直接、可靠的手段,并推動(dòng)未知蛋白質(zhì)的功能挖掘。?
堿基編輯系統(tǒng)可以實(shí)現(xiàn)單核苷酸精度的DNA或RNA精準(zhǔn)編輯,是基因功能研究、疾病治療、生物育種的變革性技術(shù)。然而,現(xiàn)有堿基編輯系統(tǒng)的核心元件脫氨酶來(lái)源于單一家族,導(dǎo)致堿基編輯仍有諸多局限,編輯尚難以滿足多元化的應(yīng)用需求。因此,創(chuàng)新地挖掘新型脫氨酶,開發(fā)適用于不同應(yīng)用場(chǎng)景的新型堿基編輯工具顯得尤為重要。?
為解決上述問(wèn)題,高彩霞研究組創(chuàng)新性地運(yùn)用AI輔助的大規(guī)模蛋白結(jié)構(gòu)預(yù)測(cè),建立起全新的基于三級(jí)結(jié)構(gòu)的高通量蛋白聚類方法,實(shí)現(xiàn)了脫氨酶功能結(jié)構(gòu)的深入挖掘,鑒定到完全區(qū)別于已知脫氨工具酶的全新底盤元件,并開發(fā)了一系列具有我國(guó)自主知識(shí)產(chǎn)權(quán)的新型堿基編輯工具。?
研究人員通過(guò)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型AlphaFold2對(duì)具有代表性的脫氨功能序列進(jìn)行批量三維結(jié)構(gòu)預(yù)測(cè),進(jìn)一步創(chuàng)新性地開展了基于三維結(jié)構(gòu)的蛋白質(zhì)多重比對(duì)與聚類,將潛在的脫氨酶劃分為20個(gè)不同的分支。除已報(bào)道的APOBEC/AID胞嘧啶脫氨酶外,研究檢測(cè)到5個(gè)結(jié)構(gòu)、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究對(duì)具有類DddA(Double-stranded DNA deaminase toxin A-like)脫氨結(jié)構(gòu)域的蛋白進(jìn)行進(jìn)一步結(jié)構(gòu)聚類和功能驗(yàn)證發(fā)現(xiàn),除以前推測(cè)的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含了大量只具有單鏈DNA脫氨活性的蛋白,這顛覆了之前對(duì)該類蛋白功能的認(rèn)知。上述研究表明,當(dāng)?shù)鞍准系男蛄型葱暂^低且功能多樣時(shí),相比于傳統(tǒng)的基于氨基酸一級(jí)序列的聚類方法,通過(guò)AI輔助的蛋白質(zhì)結(jié)構(gòu)聚類能夠得到更準(zhǔn)確的結(jié)果。因此,該方法為蛋白質(zhì)功能分析和挖掘提供了高效、可靠的新策略。?
科研人員基于上述進(jìn)一步聚類的結(jié)果,全新鑒定到45個(gè)單鏈胞嘧啶脫氨酶(Sdd)和13個(gè)雙鏈胞嘧啶脫氨酶(Ddd)。這些脫氨酶是目前唯一全部來(lái)自于原核生物(細(xì)菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員均來(lái)自真核生物(主要包括人、哺乳動(dòng)物或魚類)。研究人員基于這些脫氨酶開發(fā)了一系列新型堿基編輯系統(tǒng),并在動(dòng)、植物細(xì)胞中進(jìn)行測(cè)試。結(jié)果表明,新開發(fā)的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統(tǒng)克服了常規(guī)編輯器對(duì)GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統(tǒng)展現(xiàn)出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統(tǒng)則展現(xiàn)出了極高的特異性,幾乎檢測(cè)不到脫靶事件。研究進(jìn)一步通過(guò)蛋白理性設(shè)計(jì)和功能驗(yàn)證,開發(fā)了新型的可被單個(gè)腺相關(guān)病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細(xì)胞系中獲得高達(dá)43.1%的編輯效率,解決了常規(guī)堿基編輯器過(guò)大而無(wú)法被腺病毒包被遞送的難題。此外,針對(duì)大豆中長(zhǎng)期存在堿基編輯效率低下的問(wèn)題,該團(tuán)隊(duì)新開發(fā)了Sdd7-CBE系統(tǒng),在154株大豆陽(yáng)性苗中獲得了34株穩(wěn)定編輯的植株,編輯效率高達(dá)22.1%。該研究突破了現(xiàn)有脫氨酶的應(yīng)用瓶頸,展現(xiàn)出新型堿基編輯系統(tǒng)在醫(yī)學(xué)和農(nóng)業(yè)方面的廣闊應(yīng)用前景。?
研究工作得到國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃和中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)等的支持。?
基于AI輔助的蛋白結(jié)構(gòu)聚類挖掘脫氨酶并開發(fā)具有新特性的堿基編輯系統(tǒng)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000016