科學(xué)家發(fā)布材料合成大語(yǔ)言模型MatChat
| 來(lái)源: 【字號(hào):大 中 小】
材料合成路徑預(yù)測(cè)是物質(zhì)科學(xué)領(lǐng)域的重要課題。近年來(lái),大語(yǔ)言模型的崛起以及預(yù)訓(xùn)練-微調(diào)方法的應(yīng)用,使得通用大語(yǔ)言模型的理解能力在各垂直領(lǐng)域展現(xiàn)出潛力,但在材料領(lǐng)域缺乏相關(guān)的應(yīng)用和研究。
近期,中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心人工智能部和物理研究所SF10組合作,通過(guò)使用來(lái)自400多萬(wàn)篇論文中提取的35675個(gè)無(wú)機(jī)材料固相反應(yīng)合成過(guò)程,將數(shù)據(jù)處理為13878條高可信度的合成路徑描述數(shù)據(jù),并對(duì)開源大語(yǔ)言模型LLaMA2-7B進(jìn)行微調(diào)訓(xùn)練,研發(fā)了專注于無(wú)機(jī)材料合成路徑預(yù)測(cè)任務(wù)的大語(yǔ)言模型——MatChat(http://chat.aicnic.cn/onchat)。目前,該模型已上線運(yùn)行并開放使用。
該模型基本具備材料合成領(lǐng)域知識(shí)的生成和推理能力。經(jīng)實(shí)驗(yàn)驗(yàn)證,該模型在預(yù)測(cè)合成復(fù)雜的無(wú)機(jī)材料時(shí),具備超過(guò)ChatGPT的性能表現(xiàn)。受限于數(shù)據(jù)集的數(shù)量和質(zhì)量,該成果仍需要更多的語(yǔ)料以滿足不同材料設(shè)計(jì)的需求,但展現(xiàn)出大模型在材料領(lǐng)域的創(chuàng)新潛力和應(yīng)用空間,為材料研究和創(chuàng)新帶來(lái)了新的啟發(fā)和思路。
相關(guān)研究成果發(fā)表在《中國(guó)物理B》(Chinese Physics B)上。研究工作得到中國(guó)科學(xué)院網(wǎng)信專項(xiàng)應(yīng)用示范項(xiàng)目的支持。
MatChat模型部署平臺(tái)對(duì)話實(shí)例
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000016