近日,深圳研究生院新材料學(xué)院長聘副教授莫凡洋團(tuán)隊(duì)在柱層析分離技術(shù)領(lǐng)域取得重要進(jìn)展。研究團(tuán)隊(duì)通過結(jié)合自動(dòng)化實(shí)驗(yàn)與機(jī)器學(xué)習(xí)方法,成功開發(fā)出柱層析分離條件的智能預(yù)測模型。柱層析作為有機(jī)化學(xué)實(shí)驗(yàn)室最常用的分離純化手段、有機(jī)合成工作者的基本實(shí)驗(yàn)技能,其分離條件的確定——如層析柱規(guī)格、上樣方式、流動(dòng)相選擇、產(chǎn)品接收技巧等——需要實(shí)驗(yàn)人員富有經(jīng)驗(yàn)。然而相關(guān)經(jīng)驗(yàn)的積累通常需要長周期的培養(yǎng)與反復(fù)實(shí)踐,其形成的認(rèn)知體系深度綁定于特定實(shí)驗(yàn)系統(tǒng)與研究者個(gè)體,呈現(xiàn)個(gè)體差異大、難以標(biāo)準(zhǔn)化、知識傳遞升級乏力的實(shí)際,嚴(yán)重遲滯了該項(xiàng)技術(shù)創(chuàng)新的迭代速率。
自動(dòng)化與機(jī)器學(xué)習(xí)結(jié)合建立柱層析預(yù)測模型
針對以上問題,研究團(tuán)隊(duì)開展柱層析機(jī)器學(xué)習(xí)預(yù)測模型研究。首先構(gòu)建了自動(dòng)化實(shí)驗(yàn)平臺,系統(tǒng)采集了218種有機(jī)化合物在6365次柱層析實(shí)驗(yàn)中的保留體積數(shù)據(jù),建立了標(biāo)準(zhǔn)化數(shù)據(jù)集。該數(shù)據(jù)集不僅包含詳細(xì)的分子結(jié)構(gòu)特征,還整合了洗脫劑比例、上樣質(zhì)量、層析柱規(guī)格等關(guān)鍵實(shí)驗(yàn)參數(shù)。這一標(biāo)準(zhǔn)化數(shù)據(jù)采集方式,可將傳統(tǒng)依賴經(jīng)驗(yàn)的分離過程轉(zhuǎn)化為可量化分析的科學(xué)問題。
特征工程
基于這些實(shí)驗(yàn)數(shù)據(jù),研究團(tuán)隊(duì)開發(fā)了分位數(shù)幾何增強(qiáng)圖神經(jīng)網(wǎng)絡(luò)(QGeoGNN)模型。該模型通過構(gòu)建原子-鍵圖(GraphG)和鍵-角圖(GraphH)雙重圖表征,實(shí)現(xiàn)了對分子三維結(jié)構(gòu)特征和實(shí)驗(yàn)條件的協(xié)同建模。其中,原子-鍵圖精確描述了分子的拓?fù)浣Y(jié)構(gòu),而鍵-角圖則有效捕捉了分子的空間構(gòu)型特征。研究還創(chuàng)新性地將實(shí)驗(yàn)參數(shù)嵌入圖神經(jīng)網(wǎng)絡(luò)的邊特征,使模型能夠同時(shí)考慮分子特性和實(shí)驗(yàn)條件的影響。實(shí)驗(yàn)驗(yàn)證表明,該模型對保留體積的預(yù)測決定系數(shù)R2超過0.9,顯著優(yōu)于傳統(tǒng)經(jīng)驗(yàn)方法。此外,模型采用的分位數(shù)學(xué)習(xí)技術(shù)還能提供預(yù)測結(jié)果的置信區(qū)間,為實(shí)驗(yàn)設(shè)計(jì)提供更多參考信息。
不同算法訓(xùn)練結(jié)果對比
在實(shí)際應(yīng)用驗(yàn)證中,研究團(tuán)隊(duì)選取了包括Claisen重排反應(yīng)、鈀催化偶聯(lián)反應(yīng)、氰基加成反應(yīng)等在內(nèi)的多類經(jīng)典有機(jī)反應(yīng)體系進(jìn)行系統(tǒng)測試。結(jié)果顯示,該智能預(yù)測系統(tǒng)對不同規(guī)格層析柱(4g—40g)和多種溶劑體系(如石油醚/乙酸乙酯、二氯甲烷/甲醇等)均表現(xiàn)出良好的適用性。研究提出的分離概率(Sp)指標(biāo)能夠定量評估特定條件下混合物的分離效果,為實(shí)驗(yàn)設(shè)計(jì)提供了可靠的量化依據(jù)。通過
核磁共振驗(yàn)證,由模型預(yù)測的分離條件所得產(chǎn)物純度均達(dá)到預(yù)期標(biāo)準(zhǔn)。前述研究結(jié)論充分證明了開發(fā)的智能預(yù)測模型在化學(xué)研究中的實(shí)用價(jià)值。
實(shí)驗(yàn)驗(yàn)證
這項(xiàng)研究不僅為有機(jī)合成中的純化工藝優(yōu)化提供了新的技術(shù)手段,也為人工智能在化學(xué)領(lǐng)域的應(yīng)用開辟了新方向。相關(guān)數(shù)據(jù)集和模型代碼已在GitHub平臺開源,旨在為后續(xù)研究深化與拓展提供便利。
相關(guān)成果以“Intelligent Column Chromatography Prediction Model Based on Automation and Machine Learning”為題,于2025年5月29日在線發(fā)表于Cell Press旗下化學(xué)領(lǐng)域旗艦期刊Chem。論文通訊作者是莫凡洋,第一作者是課題組博士生吳文超。該工作以人工智能驅(qū)動(dòng)有機(jī)合成化學(xué)基礎(chǔ)學(xué)科領(lǐng)域的純化優(yōu)化問題為研究主題,這一“標(biāo)準(zhǔn)化數(shù)據(jù)集建設(shè)-預(yù)測模型開發(fā)-合成化學(xué)體系實(shí)際應(yīng)用驗(yàn)證”的研究工作體現(xiàn)了新材料學(xué)院AI4S交叉研究的階段性成果。