目前,AI在新藥研發(fā)的多個細(xì)分領(lǐng)域已經(jīng)有了非常廣泛的應(yīng)用,如靶點(diǎn)篩選,分子設(shè)計,活性預(yù)測等。早在50年前,在藥物分子的合成領(lǐng)域,諾貝爾獎得主E.J.Corey就開始嘗試用計算機(jī)技術(shù)輔助進(jìn)行逆合成路線設(shè)計,但受限于當(dāng)時的軟硬件條件,并沒有取得廣泛的應(yīng)用。
近年來,多個AI輔助逆合成產(chǎn)品被研發(fā)出來,并逐漸被應(yīng)用于制藥領(lǐng)域。但迄今為止,尚未有公開的測試報道將AI的路線設(shè)計能力與有經(jīng)驗(yàn)的人類化學(xué)家進(jìn)行對比分析。
近期,智化科技研發(fā)的ChemAIRS逆合成系統(tǒng)與上海已錸生物科技的化學(xué)家進(jìn)行了一場人機(jī)對比測評,從合成難度、合成思路、合成步驟數(shù)、路線合理性等角度對結(jié)果進(jìn)行綜合評定,對ChemAIRS合成路線設(shè)計與人工合成設(shè)計的案例進(jìn)行全面分析。
人機(jī)測評展示
這次測評選取22個有機(jī)分子(不含手性),分子合成難度接近藥物化學(xué)家實(shí)際工作中遇到的分子復(fù)雜度,路線合成總步數(shù)從8步到14步不等。由16名平均具備10年合成經(jīng)驗(yàn)的化學(xué)家來完成人工的路線設(shè)計,且設(shè)計過程可借助其他查詢工具以及參考資料。
與此同時,ChemAIRS也對這22個分子進(jìn)行批量路線設(shè)計,并從每個分子的路線結(jié)果中選出2條路線作測評打分。打分規(guī)則參考了合成思路合理性,合成步驟數(shù),路線反應(yīng)可行性等指標(biāo),打分時對化學(xué)家設(shè)計的路線和機(jī)器路線進(jìn)行混淆,以保證評分的公平性。
合成路線設(shè)計速度對比
基于設(shè)計合成路線的速度評定結(jié)果,化學(xué)家設(shè)計合成路線所花費(fèi)時間都在2小時以內(nèi),平均時間為1.5小時左右,AI計算路線平均總時間為8.7分鐘,第一條路線找到的時間平均為2分鐘,AI會給出多條路線,并能夠按照合成路線難易和總步數(shù)排序。從路線設(shè)計速度上AI算法接近化學(xué)家的10倍。
合成路線的可行性打分對比
由6名資深化學(xué)家評委對22個分子的化學(xué)家/AI合成路線進(jìn)行評分??尚械穆肪€應(yīng)該在6分以上,最高10分?;瘜W(xué)家得分和AI得分的對比顯示,在10個例子中,AI路線的分?jǐn)?shù)與化學(xué)家的分?jǐn)?shù)比較接近(差距在0.5分以內(nèi))。在7個例子中,化學(xué)家平均分?jǐn)?shù)較高,在5個例子中AI設(shè)計的路線平均分?jǐn)?shù)較高。整體在68%的例子中,AI與化學(xué)家相比做到了持平或更好。
合成路線的多樣性對比
測試團(tuán)隊(duì)也統(tǒng)計了AI路線的不同合成策略數(shù)量,設(shè)計不同策略的合成路線對化學(xué)家來說難度較大。但在實(shí)際工作中,經(jīng)常會出現(xiàn)由于某關(guān)鍵步驟的失敗而需要改變合成策略的情況。在本次測評中,AI在數(shù)分鐘內(nèi)給到了5-20條不等的路線??梢詮南聢D看到,在這些路線中,每個分子平均能有2-6種不同的合成策略,包含不同的關(guān)鍵步驟和關(guān)鍵中間體,幫助化學(xué)家快速找到成功率更高的方法和最經(jīng)濟(jì)易得的起始物料。
測試團(tuán)隊(duì)從22個測試分子選取了3個分子作為展示,驗(yàn)證AI算法合成路線可行性與化學(xué)家相近甚至更優(yōu)。以TM1為例,在構(gòu)建咪唑環(huán)的反應(yīng)中,化學(xué)家在第六步用原甲酸三乙酯先構(gòu)建咪唑環(huán),進(jìn)而對咪唑環(huán)先后碘化和偶聯(lián)反應(yīng)。在AI合成路線中,則是在第五步中使用芳香醛與二氨基底物直接一步實(shí)現(xiàn)芳基取代的咪唑環(huán)的構(gòu)建,AI路線的合成步驟更加的簡短高效。
在TM2的合成中,兩條路線均有咪唑環(huán)構(gòu)建的關(guān)鍵步驟。在化學(xué)家的路線中,第二步和第三步先后實(shí)現(xiàn)咪唑環(huán)構(gòu)建和后續(xù)的溴代,相比之下, AI合成路線則在第二步就采用了更加簡短高效的方法一步實(shí)現(xiàn)了碘取代的咪唑環(huán)的構(gòu)建。除此之外,兩條路線在整體上除了合成關(guān)鍵中間體的次序有差異外,可行性和策略都較為一致。
在TM3中,有一個七元氧環(huán)需要構(gòu)建,化學(xué)家先通過傅克反應(yīng)并在后續(xù)的官能團(tuán)轉(zhuǎn)化得到七元氧環(huán),但是第二步的傅克反應(yīng)可能會存在位點(diǎn)選擇性問題,這樣勢必會對后續(xù)的分離和鑒定造成影響;而在AI合成路線中,則是在第四步完成雙醇化合物的合成,并在第五步通過Mitsunobo反應(yīng)完成七元氧環(huán)的構(gòu)建,并且不存在選擇性問題,且其他合成步驟也不存在可行性問題。AI路線評分優(yōu)于人工合成路線。
人機(jī)測評結(jié)論
從對路線設(shè)計速度,可行性和多樣性測評結(jié)果可以看出,當(dāng)前ChemAIRS的路線設(shè)計能力非常接近于10年合成經(jīng)驗(yàn)的化學(xué)家,而設(shè)計速度和策略多樣性方面則超過了有經(jīng)驗(yàn)的化學(xué)家,且將路線設(shè)計的速度提升10倍左右,在68%的情況下能夠更快的設(shè)計出類似或者更好的路線,并使23%的路線質(zhì)量得到提升。同時算法還能夠給出化學(xué)家2-6種不同的合成策略做參考,為找到更好,更經(jīng)濟(jì)的路線提供設(shè)計思路,解決困難目標(biāo)分子的合成問題。
以ChemAIRS為代表的逆合成系統(tǒng)并不能替代化學(xué)家,特別是針對某些比較新穎的結(jié)構(gòu),AI還不能代替化學(xué)家去進(jìn)行創(chuàng)新性的思考。但它作為化學(xué)家設(shè)計路線的重要工具,可實(shí)現(xiàn)增強(qiáng)人類智能的目的,就像汽車讓人更快一樣。相信化學(xué)家將能夠在這類工具的幫助下能夠更高效,更輕松的設(shè)計出更好,更經(jīng)濟(jì)環(huán)保的合成路線。
注:由于本次內(nèi)部測評的分子數(shù)量有限,結(jié)果并不具備統(tǒng)計意義,期待未來能夠針對此領(lǐng)域進(jìn)行更深入全面的測試研究。
點(diǎn)擊閱讀原文或識別二維碼可參與測試ChemAIRS逆合成系統(tǒng)(活動時間:2022/5/1-2022/7/31)。
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認(rèn)同其觀點(diǎn)或證實(shí)其描述。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn