上海AI實(shí)驗(yàn)室開源發(fā)布科學(xué)大模型“浦科化學(xué)”(上海浦科投資控股有限公司)
1月26日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)開源發(fā)布首個(gè)科學(xué)大模型浦科化學(xué)(ChemLLM),拓展了大模型助力科學(xué)研究的探索路徑。
基于書生·浦語2.0強(qiáng)大的基座模型能力,浦科化學(xué)通過注入海量化學(xué)專業(yè)數(shù)據(jù),使大模型獲得了理解和處理化學(xué)相關(guān)專業(yè)任務(wù)的知識(shí)與能力。同時(shí),研究人員發(fā)現(xiàn),隨著化學(xué)能力的獲得,大模型的數(shù)理學(xué)科及推理能力也得到增強(qiáng)。
浦科化學(xué)現(xiàn)已開源,并提供免費(fèi)商用。
開源鏈接:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
專注核心:化學(xué)知識(shí)注入,專業(yè)能力突出
為了評(píng)估浦科化學(xué)的專業(yè)能力,上海AI實(shí)驗(yàn)室的研究人員對(duì)其在三種相關(guān)任務(wù)上的表現(xiàn)進(jìn)行了測(cè)試:分子名稱轉(zhuǎn)換、分子性質(zhì)預(yù)測(cè)和反應(yīng)產(chǎn)物預(yù)測(cè)——這些任務(wù)分別涉及化學(xué)物質(zhì)的表示、性質(zhì)和轉(zhuǎn)化,是化學(xué)研究的基礎(chǔ)和核心。
分子名稱轉(zhuǎn)換方面,要求模型能夠在不同分子表示方式之間進(jìn)行準(zhǔn)確轉(zhuǎn)換,如SMILES、IUPAC名稱、分子式等;
分子性質(zhì)預(yù)測(cè)方面,要求模型能根據(jù)分子的結(jié)構(gòu)和組成,預(yù)測(cè)其化學(xué)性質(zhì),如沸點(diǎn)、密度、溶解度等;
反應(yīng)產(chǎn)物預(yù)測(cè)方面,要求模型能根據(jù)給定的反應(yīng)物和反應(yīng)條件預(yù)測(cè)反應(yīng)產(chǎn)物的結(jié)構(gòu)。
測(cè)試結(jié)果顯示,浦科化學(xué)在這三項(xiàng)任務(wù)上均表現(xiàn)出色,分別獲得22.0、49.0和7.0的分?jǐn)?shù),遠(yuǎn)超過其他同規(guī)模模型的水平,并超越了GPT-3.5,證明浦科化學(xué)在理解和處理化學(xué)知識(shí)方面具備強(qiáng)大能力。
依托書生·浦語2.0基座模型優(yōu)秀的多語言能力,浦科化學(xué)在經(jīng)過專業(yè)化學(xué)知識(shí)訓(xùn)練后,還具備了優(yōu)秀的化學(xué)專業(yè)中英文翻譯能力,可幫助化學(xué)研究者跨越語言障礙,準(zhǔn)確地翻譯化學(xué)文獻(xiàn)中的專有名詞,獲取更多的化學(xué)知識(shí)。
下圖展示了浦科化學(xué)翻譯的一篇2024年1月16日發(fā)表在《自然·化學(xué)》雜志上論文的摘要。
在專業(yè)化學(xué)知識(shí)訓(xùn)練之外,浦科化學(xué)也進(jìn)行了初高中知識(shí)的學(xué)習(xí)。在回答初高中化學(xué)題目時(shí),不僅能給出答案,還能給出具體的解釋,下圖展示了例子:
齊頭并進(jìn):邏輯推理增強(qiáng),泛理科能力涌現(xiàn)
專項(xiàng)能力的增強(qiáng),是否以犧牲其他能力為代價(jià)?實(shí)踐證明,浦科化學(xué)不僅在化學(xué)領(lǐng)域表現(xiàn)出色,其在數(shù)學(xué)、物理及推理等方面能力均得到增強(qiáng)。
研究人員使用MMLU(大規(guī)模多任務(wù)語言理解數(shù)據(jù)集)作為測(cè)試集來評(píng)估浦科化學(xué)在通用場(chǎng)景下的性能,對(duì)語言模型的多項(xiàng)任務(wù)能力進(jìn)行測(cè)試評(píng)估,并將浦科化學(xué)與其他同等規(guī)模的模型進(jìn)行比較,以評(píng)估化學(xué)訓(xùn)練數(shù)據(jù)對(duì)基礎(chǔ)模型的影響。
評(píng)測(cè)結(jié)果顯示,浦科化學(xué)在大學(xué)化學(xué)任務(wù)上得分為47.0,超越了所有其他模型,這體現(xiàn)了它在回答化學(xué)問題及處理復(fù)雜化學(xué)任務(wù)的能力。研究人員發(fā)現(xiàn),盡管沒有對(duì)浦科化學(xué)進(jìn)行數(shù)學(xué)和物理學(xué)科的訓(xùn)練,
有趣的是,浦科化學(xué)在道德場(chǎng)景、人文科學(xué)類、社會(huì)科學(xué)類等分項(xiàng)任務(wù)上也展現(xiàn)了優(yōu)異的平均性能,這說明,對(duì)大模型進(jìn)行專業(yè)某個(gè)學(xué)科的知識(shí)訓(xùn)練,不僅不會(huì)讓大模型“分心”,反而有助于其道德水平及一般任務(wù)水平的提升。
舉一反三:擴(kuò)展大模型應(yīng)用,助推科研新范式
對(duì)大語言模型進(jìn)行化學(xué)專項(xiàng)訓(xùn)練,不僅擴(kuò)展了大模型的應(yīng)用空間,更為AI for Science相關(guān)研究開啟了新的探索路徑。
上海AI for Science團(tuán)隊(duì)面向化學(xué)、物理、生命、地球等科學(xué)領(lǐng)域,通過深入研究各學(xué)科基礎(chǔ)理論,結(jié)合最新人工智能理論,探索AI驅(qū)動(dòng)重大科學(xué)問題的研究范式,加速人工智能在化學(xué)、藥物研發(fā)、新材料、氣象等領(lǐng)域的滲透與落地,賦能各行業(yè)發(fā)展。其中,AI for Chemistry方面的研究以語言模型為核心,通過大模型連接智能化實(shí)驗(yàn)設(shè)備,全方位提升實(shí)驗(yàn)效率,從而實(shí)現(xiàn)化學(xué)研究的自動(dòng)化和智能化。相關(guān)研究范式的創(chuàng)新,將助推科學(xué)發(fā)現(xiàn)速度,實(shí)現(xiàn)更大的社會(huì)效益。
未來,基于浦科化學(xué)模型,人工智能可為化學(xué)研究提供智能化輔助,如化學(xué)合成路徑規(guī)劃、化學(xué)反應(yīng)條件優(yōu)化、實(shí)驗(yàn)結(jié)果自動(dòng)化分析等,從而提升化學(xué)研究的效率和質(zhì)量。