用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

如果科學家們能夠了解電子在分子中的活動,那麼他們就能夠預測一切事物的行為,包括實驗藥物與高溫超導體。

作者 | 吳彤

編輯 | 陳彩嫻

「AI+X」愈發如火如荼。

最近,權威學術媒介 QuantaMagazine 發表了一篇文章,介紹了 DeepMind 在內的許多研究團隊正使用機器學習演算法攻破物理領域的一個著名難題——密度泛函理論。

他們企圖透過機器學習演算法來尋找第三級密度泛函的方程式,找出人類無法用數學描述的電子行為,從而突破電子在分子中的活動細節。這對藥物發現、超導研究與奇異材料的研究意義重大。

在科學家們看來,這是一項重要的、振奮人心的研究,因為密度泛函理論是一個經典的量子力學理論,而從密度泛函出發,他們有望在分子與化學等相關領域取得重大突破,實現人工智慧跨界共舞的又一傳說。

那麼,機器學習演算法與物理如何能共舞呢?我們來看看 QuantaMagazine 的要點介紹。

1

密度泛函理論是什麼?

密度泛函理論的英文名為「Density Functional Theory」,簡稱

「DFT」

,始於1960年代,是一種研究多電子體系下電子結構的方法,在物理與化學上有廣泛的應用,尤其用來研究分子和凝聚態性質,是凝聚態物理計算材料學和計算化學領域最常用的方法之一。

這樣說似乎還有點抽象。舉一些形象的例子:

眾所周知,近年來超算出奇蹟。而2018年美國超級計算機叢集的三大應用,排名第一的便是密度泛函,其次才是夸克和其他亞原子粒子的研究,氣候模擬也只能排第三。

更往前一點,2014年10月,Nature整理出100篇有史以來引用數量最高的研究論文,其中有12篇論文都與密度泛函理論有關。這是 Nature 當時的描述是:

「我們地球世界中的一切事物都取決於電子的運動——因此,DFT 就是一切的基礎。」

圖注:密度泛函理論揭示了電子在分子(如2,3-(S,S)-二甲基環氧乙烷)中的活動

幾十年來,研究人員利用 DFT 對事物進行預測:2014年,化學家 Christopher H Hendon 等人用 DFT 理論量化物種常見的咖啡酸、咖啡因與代表性風味成分丁香酚的熱力學結合能,由此掌握了咖啡味道形成的奧妙;2017年,天文學家又用 DFT 理論預測木星核心的稠度,相關論文發表在了頂刊《Geophysical Research Letters》上。

英國牛津大學的材料物理學家 Feliciano Giustino 評價:「本質上,DFT 是一種使不可能的數學變得簡單的近似。」

要透過考慮每個電子和每個原子核如何與每個電子和原子核相互作用來研究矽晶體中的電子行為,研究人員需要分析 16 萬億 (1021) TB 的資料,這遠遠超出了任何人的處理能力。而計算機將 DFT 的資料需求減少到只有幾百 KB,完全在標準膝上型電腦的容量範圍內。這昭示了計算機科學與DFT的合作基礎。

另一方面,DFT 為科學家們提供了一條捷徑,可以預測電子的去向,進而預測原子、分子和其他披著電子的物體將如何行動。長期以來,物理學家和化學家一直利用深厚的物理專業知識來使他們的方程式更好地反映所有電子共有的複雜活動。

瞭解電子就是了解它們構成的原子、分子和材料。自 1920 年代歐文·薛定諤發表他的同名方程(「薛定諤波動方程」)以來,物理學家已經徹底理解了電子。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

圖注:薛定諤波動方程

但在分析大量電子時,薛定諤方程幾乎毫無用處,原因就在於電子比粒子更多團。它們在空間中擴散,以多種方式與其他電子重疊並相互擠壓。隨著電子數量的增加,使用薛定諤波動方程來解釋所有電子之間的不斷接觸的難度也呈指數級增長。

來自加州大學伯克利分校的凝聚態物理學家傑弗裡·尼頓 (Jeffrey Neaton) 便提出這樣的觀點:「即使是隻有幾個粒子,你也需要用更多的磁碟空間才能把波函式寫入硬碟。」

2

從DFT到通用密度泛函

多年來,密度泛函理論的強大吸引著無數研究者躬身其中。在他們當中,我們不得不提到1998年獲得諾貝爾化學獎的物理學家 Walter Kohn。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

圖注:Walter Kohn

Walter Kohn 出生於奧地利維也納,1945年獲數學和物理學學士學位,1946年於多倫多大學獲應用數學碩士學位,1948年在哈佛大學獲博士學位。曾任哈佛大學物理系教員,卡內基-梅隆大學(CMU)助教和教授,加利大學聖地亞哥分校物理系教授、系主任,1979年到加利大學聖巴巴拉分校先後任理論物理所所長和物理系教授。

1964 年,他與另一位物理學家 Pierre Hohenberg 找到了一種方法,證明透過將分子的電子粘在一起,形成一些點更厚、一些點更薄的液體,就可以完美地捕捉到分子的每一個方面。這種電子液體(electron soup)的密度包含分子複雜波函式的所有資訊,使物理學家實現了對電子進行單獨的、原先以為絕無可能完成的任務。非常了不起。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

圖注:研究人員使用基於密度泛函理論的工具來預測 DNA 鹼基對周圍的電子在被鐳射脈衝擊中時如何反應。

Hohenberg 和 Kohn 證明了存在一個強大的主方程,即「通用密度泛函」。該方程將以「電子液體」為例計算其能量,引導物理學家採用能量最低且最自然的電子排列。從這個角度看,通用密度泛函具有很強的普遍性,原則上可以描述從矽磚到水分子的所有系統。

唯一的問題是沒有人知道這個方程式是什麼樣的。

很快,1965年,Kohn和另一位物理學家 Lu Jeu Sham 首次寫出了可用的密度泛函方程式。在這個過程中,他們知道,

想要寫出捕捉電子行為所有

微妙表現的精確函式難度極高,

因此他們將難題一分為二:一半是已知部分,它提供了一組只能平均感知彼此的電子的能量;一半是未知部分,比如拜占庭量子效應和非區域性相互作用產生的多餘能量,統一放進一個被稱為交換和相關函式的容差係數中。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://journals。aps。org/pr/abstract/10。1103/PhysRev。140。A1133

目前,Kohn對DFT的兩篇研究論文分別在Nature的這100篇論文中排名第34位和第39位。Kohn意識到,

他可以透過假設每個電子對所有其他(不是單個的)電子的反應,以模糊的平均值來計算系統的屬性,比如它的最低能態。

原則上,數學是簡單明瞭的;系統的行為就像一個連續的流體,其密度隨點而變化。這一理論也因此得名。

這個方法將我們對通用泛函的未知降到了最低。在接下來的幾十年裡,科學家們基於 Kohn 和Sham 的工作,採用越來越聰明的方法來估計容差係數,從而使得密度泛函成為理解電子的實用方法。

在實際應用中,研究人員使用這個方法來預測原子捕獲或釋放電子、分子振動的方式(比如好奇號探測器用來尋找火星上的生命跡象)、晶格中原子的排列、 聲音在材料中等等。1998年,Kohn還憑藉該理論的廣泛應用贏得了諾貝爾化學獎。

3

用AI尋找通用泛函的近似值

研究人員要求更高的 DFT 精確度,就必須考慮到泛函交換和相關項的無關性,打磨函式的細節,使它更符合通用密度泛函。

尋找更通用的泛函方程,尤其是泛函方程的近似值,成為「DFT 狂熱者」的新目標。

天普大學的物理學家約翰·珀杜(John Perdew)是這方面的先驅者。他將通向通用泛函的道路描述為「在梯子上攀爬」。在每個梯級上,物理學家都在函式中新增新成分。最簡單的成分就是每個位置的「電子燉菜」(electron stew)的厚度。在下一個梯級上,泛函還考慮了從一個地方到另一個地方的厚度變化速度,從而使這項研究更加精確。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

圖注:John Perdew

Perdew 的策略核心是使用了物理推理,從而保證通用泛函的近似值一定會遵守某些數學屬性,即所謂的「精確約束」。越高的階梯要滿足越多的約束條件,因此研究人員就必須更努力地尋找滿足所有這些約束條件的方程。

Perdew 的團隊於 1999 年開始處理混合六種成分的第三級泛函。2015年,他們年釋出了當時最先進的名為「SCAN 」的泛函。這是他的第八次嘗試,也是泛函第一次符合與第三級相關的所有 17 條已知約束。SCAN 適用於分子和固體領域,已證明是迄今為止發現的通用泛函最強大的近似之一。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://arxiv。org/abs/1511。01089

「第三級函式的可能性非常大。弄清楚什麼是重要的,什麼是有效的,需要時間。」Perdew談道。

這時,機器學習就派上了用場。

4

機器學習入場

當 Perdew 基於物理直覺改進密度泛函時,一場革命正在醞釀:

演算法能否找出人類無法用數學描述的電子行為的模式?

2012 年,來自美國UC Irvine大學的 Kieron Burke 及團隊首次嘗試將機器學習應用於一組簡化的電子。他所提出的一維原型驅使了他和其他研究者思考能夠採用機器學習演算法來尋找密度函式。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://journals。aps。org/prl/abstract/10。1103/PhysRevLett。108。253002

2021年初,Burke團隊又取得了突破:他與合作者為一個玩具問題建立了一個神經網路,採用了一個此前大多數工作都會忽略的方法來跟蹤密度誤差和能量誤差。相關工作發表在了《Physical Review Letters》上。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://journals。aps。org/prl/abstract/10。1103/PhysRevLett。126。036401

盧森堡大學的理論化學家 Alexandre Tkatchenko 說:“要獲得既能提供密度又能提供能量的泛函,需要一個非常靈活的架構,單純依靠人腦寫出一個函式式是很難的。”

石溪大學的 Fernández-Serra 也是研究將機器學習演算法用於尋找泛函的學者之一。她使用類似的策略設計了一個神經網路,研究一系列分子和能量,並尋找服從大多數已知約束的第三級函式,本質上就是使用一臺機器來追溯 Perdew 的足跡。

正如她和Sebastian Dick在 2021年秋季《Physical Review B》中報道的一樣,由此產生的交換和相關函式在預測不熟悉分子的能量方面比SCAN高出了大約10%,但這輕微的增益表明Perdew的研究已經接近於第三級泛函的天花板。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

https://journals。aps。org/prb/abstract/10。1103/PhysRevB。104。L161109

「物理直覺幾乎耗盡了人類所能達到的所有智慧。在不使用機器學習的情況下,Perdew的泛函研究真的是盡善盡美。」Fernández-Serra 評論。

5

DeepMind「盯上」DFT

但是想要爬得更高,就需要更復雜的輸入,以及能夠理解這些輸入的演算法。

DeepMind 的理論化學家阿隆·科恩 (Aron Cohen) 也對尋找更通用的泛函方程十分感興趣。為了深入理論量子化學的抽象觀點,他隨身帶著一個3d列印的藍色玩具,形似幸運餅乾,彎曲描繪出了一個泛函函式的確切形狀。它僅適用於最簡單的系統描述,比如任意兩個原子間共享的兩個電子的資訊,但也時刻提醒著 Cohen:這個世界上可能存在一種能夠處理任意數量電子和原子的通用泛函。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

圖注:這個玩具函式描述了任意兩個原子之間共享的兩個電子。球軸承表示能量最低的排列、傾斜模型則會改變原子。

DFT 研究的主要目標之一是找到該通用泛函的

更準確的近似值。

眾所周知,DeepMind在研究出圍棋系統Go之後,便一直在尋找新的挑戰,尤其將目光集中在了「科學機器學習」的問題上。於是,Cohen便提議研究 DFT,此前他也花了數年時間研究簡單系統的精確泛函,但這些系統並不足以反映現實的世界。

回顧科恩的研究歷程,DFT 的一個核心弱點大大阻礙Cohen:

電流密度泛函通常會過多地塗抹電子。

這個問題在不平衡的系統中尤其明顯。電子應該主要聚集在一個分子上,但 DFT 偏偏將電子汁均勻地分佈在兩個分子上。當這種連帶問題出現在化學反應中時,DFT 就無法為粒子合併和分離提供正確的能量,即使是像氫原子這種簡單的情況也是如此。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

為了設計下一代函式,Cohen和DeepMind團隊選擇不再糾結於滿足一長串的物理原則。相反,他們依賴大量的資料,首先從資料庫中搜索出數千個已知能量的分子(使用薛定諤方程或類似方法以高成本計算),然後再使用超級計算機來處理數百個額外分子的能量(其中許多分子需要幾天的時間來計算)。

當研究小組收集了詳盡的分子樣本時,Cohen和其他化學家再決定如何構造這些泛函。

他們找到了一種萬能的方法:當以一種方式計算某一函式的80%的能量,再以另一種方式計算剩下的20%的能量時,就會出現一個最佳點。這一方法是研究人員經過多年的反覆試驗找到的,用來估計部分交換和相關函式。

長期以來,研究人員一直猶豫下一步是不是讓分子周圍的點按照80/20的比例隨點變化,但目前還沒有人能完全成功做到這一點。

1998年 Burke 在其發表於 ACS 期刊的“Exchange-Correlation Energy Density from Viral Theorem” 中介紹了這種型別的函式。但是,他說:“人們可能已經在100篇論文中嘗試應用這種形式的函式,但他們還沒有創造出每個人都能用的東西。也許這對一個人來說太難了。”

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://pubs。acs。org/doi/10。1021/jp980950v

憑藉大量的樣本分子和DeepMind團隊的機器學習專業知識,該團隊所提出的神經網路能夠訓練出一種靈活的第四級函式——DM21 ,可以比SCAN和其他頂級競爭對手更好地估計各種分子的能量,因為它能更準確地定位電子,更好地描述它們的自旋。據介紹,他們所提出的泛函是第一個能夠處理化學鍵斷裂和形成的通用泛函。去年12月9日,該工作發表在了《Science》上。

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓

論文連結:https://www。science。org/doi/10。1126/science。abj6511

但不可否認,DM21 也有一個明顯的缺點,就是隻訓練了元素週期表的前三行分子,儘管資料更豐富,但也意味著它學到的電子行為可能無法轉移到金屬原子或固體材料上,而這兩者卻對於分析銅基高溫超導體系列至關重要。目前,這兩個領域的通用泛函細節還在用 SCAN 和其他泛函做逼近。

6

結語

目前,機器學習在科學領域的「輔助」才剛剛嶄露頭角。AI 演算法能為科學研究帶來多大的突破,仍是一個未知數。

但正如 QuantaMagazine所評價,Fernández-Serra 和 DeepMind 等團隊對新泛函的研究已經表明,機器學習可以成為探索通用密度泛函新領域的強大工具,尤其是分子和化學的相關領域。

Tkatchenko評價,機器學習有助於調整化學空間,使泛函儘可能高效。

不過,改進後的化學泛函是否能有效揭示從原子到材料等事物的通用特徵,還有待觀察。

Perdew 便表示,他會繼續尋找新的直觀特性,以進一步完善傳統研究路徑。但他可能不會在機器學習方面投入大量時間,「因為儘管機器可以學習,但它們還不能向我們解釋它們學到了什麼。」

但 Cohen 認為已經可以從 DM21 中看到可能成為未來近似值的持久元素的通用特徵,無論這些特徵是由人類大腦生成的、還是由神經網路生成的。

「函式是十分複雜的,所以對它進行任何嘗試都是好的。理想情況下,我們希望將它們都統一起來。」Cohen說。

參考連結:

1。https://www。quantamagazine。org/quantum-complexity-tamed-by-machine-learning-20220207/

2。https://pubmed。ncbi。nlm。nih。gov/24802110/

3。https://agupubs。onlinelibrary。wiley。com/doi/full/10。1002/2017GL073160

4。https://www。nature。com/news/the-top-100-papers-1。16224

用機器學習演算法解決密度泛函問題?若成功,藥物發現、超導研究有望更上一層樓