AI+化工 人工智能正在解放化學(xué)家的雙手
發(fā)布:安陽(yáng)化學(xué)工業(yè)集團(tuán)有限責(zé)任公司瀏覽:16390次
近日,香山科學(xué)會(huì)議聚焦綠色生態(tài)與化學(xué)化工,除了各種前沿化學(xué)化工技術(shù)之外,人工智能在該領(lǐng)域的應(yīng)用成為被關(guān)注的新議題。
“合成化學(xué)過(guò)程中的變數(shù)太多確實(shí)給通量制備和通量反應(yīng)條件篩選增加了難度。但是在大數(shù)據(jù)與人工智能時(shí)代,這樣的狀況將會(huì)大大改變?!敝锌圃荷虾;瘜W(xué)研究所副所長(zhǎng)馬大為在會(huì)議上介紹,人工智能有望助力合成化學(xué)研究邁上新的臺(tái)階。
“勞動(dòng)密集型”將成過(guò)去
“在合成領(lǐng)域,合成化學(xué)家在上個(gè)世紀(jì)號(hào)稱給予足夠的學(xué)生和經(jīng)費(fèi)資助,可以合成任何復(fù)雜的小分子。但是直到今天,無(wú)論是新藥開(kāi)發(fā)還是新材料發(fā)展,人們發(fā)現(xiàn)過(guò)程的決速步驟往往還是化合物的合成?!瘪R大為介紹。
馬大為解釋說(shuō),這是因?yàn)?,盡管化合物性質(zhì)的評(píng)估大部分已進(jìn)入通量篩選階段,但化學(xué)合成仍然停留在手工操作階段。
在化學(xué)合成領(lǐng)域,由于不同化學(xué)反應(yīng)條件下的無(wú)窮變化,研究人員設(shè)計(jì)化學(xué)合成路線基本上還是依靠手工——在藥物分子合成領(lǐng)域尤其突出。這讓化學(xué)合成更像一種“勞動(dòng)密集型”工作。
但在人工智能時(shí)代,這種狀況將逐漸成為過(guò)去?;诖髷?shù)據(jù)與人工智能的計(jì)算機(jī)程序在輔助研究人員進(jìn)行化學(xué)合成路線設(shè)計(jì)方面開(kāi)始變得越來(lái)越成熟實(shí)用。
去年4月,一個(gè)德國(guó)研究團(tuán)隊(duì)在《自然》期刊發(fā)表論文稱,他們可以憑借人工智能系統(tǒng)以很快的速率進(jìn)行化學(xué)合成分析,這將大大提升科研人員研發(fā)新藥和其他化合物的效率。
根據(jù)這篇論文的內(nèi)容,研究人員利用人工智能系統(tǒng)設(shè)計(jì)一個(gè)分子的合成路線,只需要5秒鐘。馬大為感嘆說(shuō),人工去設(shè)計(jì)的話,5秒鐘都來(lái)不及把分子結(jié)構(gòu)看清楚,5分鐘都不一定能把分子設(shè)計(jì)出來(lái)。
南京大學(xué)化學(xué)化工學(xué)院副教授李承輝了解到人工智能算法推薦分子的合成路線后,獲得不少啟發(fā)。他目前也在考慮如何用人工智能幫助他做化學(xué)研究。
李承輝前不久發(fā)現(xiàn)一種新的分子內(nèi)成環(huán)反應(yīng),希望了解這種反應(yīng)是否在其他分子內(nèi)也存在。按照以前的研究方式,他的工作量會(huì)非常大。因?yàn)橐獧z測(cè)這種反應(yīng)是否具有普適性,需要用不同的分子做大量的實(shí)驗(yàn)才行?!叭绻腥斯ぶ悄艿膸椭?,可以有針對(duì)性地去做這件事?!?李承輝說(shuō)。
開(kāi)始扮演得力助手
“小通量的反應(yīng)條件篩選設(shè)備已經(jīng)在一些公司和大學(xué)變成常規(guī)武器,大通量的大型反應(yīng)矩陣機(jī)器人已經(jīng)誕生?!瘪R大為認(rèn)為,這些設(shè)備的普及化有可能為將來(lái)的合成化學(xué)研究帶來(lái)巨大變化,在很大程度上解放了合成化學(xué)家的雙手,讓研究人員花更多的時(shí)間進(jìn)行數(shù)據(jù)分析和反應(yīng)的頂層設(shè)計(jì)。
馬大為在接受科技日?qǐng)?bào)記者采訪時(shí)介紹,人工智能程序用于預(yù)測(cè)普通的化學(xué)小分子合成路線已趨于成熟。即使一些復(fù)雜的小分子比如藥物分子,由于結(jié)構(gòu)單元比較單一,合成反應(yīng)并不是很多,人工智能程序可以直接輔助設(shè)計(jì)出合成路線。這對(duì)于初級(jí)的研究人員而言,會(huì)提供很大幫助。
“現(xiàn)在做藥物合成研究,假如知道一個(gè)藥物分子的結(jié)構(gòu),人工智能系統(tǒng)可以根據(jù)它的結(jié)構(gòu)分析出很多種合成路線,并且推薦一個(gè)路線?!崩畛休x說(shuō),如果是以前,這樣的研究需要非常有經(jīng)驗(yàn)的化學(xué)專家才能實(shí)現(xiàn),但是將來(lái)在人工智能的幫助下,從事無(wú)機(jī)化學(xué)的研究人員也可以做到。
而在合成結(jié)構(gòu)比較復(fù)雜的目標(biāo)分子時(shí),比如需要20多個(gè)步驟才能合成出來(lái)的天然界存在的復(fù)雜分子,人工智能程序可以預(yù)測(cè)出很多條不同的路線。
“研究人員可能只能想出20多個(gè)合成路線,而這些程序可能會(huì)提供上百條可能的合成路線,這對(duì)于研究人員來(lái)說(shuō)非常有幫助,因?yàn)橛行┞肪€可能從未想過(guò)?!瘪R大為說(shuō)。
馬大為告訴科技日?qǐng)?bào)記者,根據(jù)人工智能程序提供的預(yù)測(cè)路線,有經(jīng)驗(yàn)的研究人員可以從中判斷出哪些路線是好的,哪些是有提示意義的,進(jìn)而幫助研究人員思考一些問(wèn)題。這可以為化學(xué)合成提供更多的機(jī)會(huì)。因?yàn)楦鶕?jù)人工智能程序的提示,再加上人腦進(jìn)一步深度思考,可能會(huì)設(shè)計(jì)出更好的化學(xué)合成路線。
未來(lái)只需“照藥開(kāi)方”
馬大為認(rèn)為,上述變化對(duì)化學(xué)合成來(lái)說(shuō),意義非常重大。因?yàn)閷?lái)人工智能程序可能像“傻瓜機(jī)”一樣,科研人員在進(jìn)行化學(xué)合成時(shí)只需按照它的推薦“照藥開(kāi)方”。
過(guò)去,了解一個(gè)化學(xué)反應(yīng)條件是否可行,是不斷試錯(cuò)的過(guò)程。需要人工一個(gè)一個(gè)去測(cè)試,包含大量的重復(fù)性勞動(dòng)。如今,可以利用人工智能對(duì)化學(xué)反應(yīng)數(shù)據(jù)進(jìn)行快速檢測(cè),然后在機(jī)器上進(jìn)行通量的反應(yīng)條件測(cè)試,整個(gè)系統(tǒng)可以做上千個(gè)反應(yīng)條件的測(cè)試。換成人工,一個(gè)實(shí)驗(yàn)室里每天做20個(gè)化學(xué)反應(yīng)測(cè)試已經(jīng)很不錯(cuò)了。
馬大為告訴科技日?qǐng)?bào)記者,一些大型制藥公司已經(jīng)將人工智能用于輔助設(shè)計(jì)化學(xué)合成路線,成為此類技術(shù)的用戶。除了藥物研發(fā),新材料研發(fā)等包含化合物合成的領(lǐng)域都可利用人工智能進(jìn)行化學(xué)合成路線推薦。
“將來(lái),合成以往不存在的分子像蓋房子一樣,先讓人工智能把藍(lán)圖描繪出來(lái),研究人員只要按著藍(lán)圖去搭建行?!瘪R大為說(shuō)。
李承輝也認(rèn)為,人工智能在化學(xué)領(lǐng)域?qū)⒋笥锌蔀?。在他看?lái),未來(lái)化學(xué)領(lǐng)域的人工智能應(yīng)用將像人工智能醫(yī)生一樣,它能夠掌握和消化海量合成方法、合成路線、材料結(jié)構(gòu)和性能等,科研人員做化學(xué)合成研究時(shí),它可以幫助分析和解決很多問(wèn)題。
不過(guò)總的來(lái)說(shuō),人工智能扮演的角色仍是輔助性的。它可以將化學(xué)研究人員從繁重的手工勞動(dòng)中解放出來(lái),并為他們的研究提供一些參考和借鑒。但其推薦的結(jié)果也需要研究人員利用專業(yè)知識(shí)和經(jīng)驗(yàn)去判斷,哪些是真正可行的。
此外,人工智能推薦化學(xué)合成路線目前仍處于模型機(jī)階段。馬大為認(rèn)為,化學(xué)研究人員需要不斷地為人工智能提供一些創(chuàng)新策略,推動(dòng)人工智能系統(tǒng)不斷優(yōu)化,后者再反過(guò)來(lái)推動(dòng)化學(xué)研究人員進(jìn)行更深入的研究。
相關(guān)鏈接
人工智能機(jī)器人助力快速發(fā)現(xiàn)新分子
早在去年,英國(guó)格拉斯哥大學(xué)的化學(xué)家們已經(jīng)討論了如何訓(xùn)練一個(gè)人工智能化學(xué)合成機(jī)器人來(lái)自動(dòng)探索大量的化學(xué)反應(yīng)。
這種“自我驅(qū)動(dòng)”的系統(tǒng)以機(jī)器學(xué)習(xí)算法為基礎(chǔ),可以發(fā)現(xiàn)新的反應(yīng)和分子,允許利用數(shù)字化學(xué)數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)定位感興趣的新分子,而不是局限于一個(gè)已知的數(shù)據(jù)庫(kù)和常規(guī)的合成規(guī)則。其結(jié)果可能降低發(fā)現(xiàn)新的藥物分子、新化學(xué)產(chǎn)品(包括材料)、聚合物及用于高科技應(yīng)用(如成像)分子的成本。
研究小組通過(guò)使用18種不同的起始化學(xué)物質(zhì)的組合來(lái)模擬大約1000種反應(yīng),展示了該系統(tǒng)的潛力。在探索了大約100種的可能反應(yīng)后,機(jī)器人能夠以超過(guò)80%的準(zhǔn)確率預(yù)測(cè)出哪些初始化學(xué)物質(zhì)的組合應(yīng)該被探索以產(chǎn)生新的反應(yīng)和分子。通過(guò)探索這些反應(yīng),他們發(fā)現(xiàn)了一系列以前不為人知的新分子和反應(yīng)。研究人員發(fā)現(xiàn)了4個(gè)新反應(yīng),其中一個(gè)反應(yīng)被歸入已知獨(dú)特反應(yīng)的前1%。
研究者表示,這種方法是化學(xué)數(shù)字化的關(guān)鍵一步,它將允許對(duì)化學(xué)空間(chemical space)進(jìn)行實(shí)時(shí)檢索,從而幫助新藥物的發(fā)現(xiàn),并削減成本,節(jié)省時(shí)間,提高安全性,減少浪費(fèi),幫助化學(xué)進(jìn)入一個(gè)新的數(shù)字時(shí)代?!究萍既?qǐng)?bào)】