機器學習模型可以快速,計算機化準確地估計與分子反應性有關的學課現出關鍵化學參數。創建能夠自學化學結構如何決定分子基本特性的上表色計算機,然后使用該知識預測新型分子的計算機化特性可以幫助設計更清潔的能源和工業系統。
KAUST研究人員開發了一種機器學習模型,學課現出該模型可以分析碳氫化合物分子的上表色結構并準確預測一種稱為生成焓的特性。在評估此屬性時,計算機化該模型已經比傳統方法做出了更好的學課現出預測,并且其準確性只會隨著收集更多數據供模型學習而提高。上表色
博士學位的計算機化KiranYalamanchi說:“關于分子特性的數據,例如形成的學課現出焓,對于工程師建模化學反應的上表色動力學機理或能量流至關重要。”負責研究的ManiSarathy研究小組的學生。Yalamanchi說:“碳氫燃料的動力學機制對于發動機設計和化學反應堆的開發和優化非常重要。”
生成動力學機理建模所需的大量熱力學數據通常使用稱為組加和法的方法,這種方法的準確性有限。Yalamanchi說:“組可加性是在20世紀中葉開發的,在過去的幾十年中,數據科學領域取得了長足的進步。”
因此,Yalamanchi和Sarathy與KAUST的計算機科學家XinGao接觸,將機器學習應用于該問題。“我們的初步研究給出了非常有希望的結果,”Yalamanchi說。“這種潛力幫助我們通過生成熱力學數據推動融合機器學習。”
機器學習提供了一種獲取形成數據焓的方法(通過實驗測量或使用高精度但緩慢的量子化學計算為少量分子計算),然后外推到更大范圍的分子。
機器學習程序分析了分子結構及其形成焓的“訓練”數據集。然后,它使用檢測到的模式來預測以前從未見過的分子形成的焓。
事實證明,機器學習比傳統的小組可加性方法要準確得多。Yalamanchi說:“與傳統方法相比,使用機器學習方法可以更好地估計化學物種形成的焓。”
例如,盡管傳統的基團可加性可以對具有線性結構的簡單分子做出相對較好的預測,但對于更復雜的分子(例如在其結構中包含碳環的分子),其準確性會降低。Yalamanchi補充說:“與傳統的基團可加性相比,我們在形成焓的估計中看到的改進更為顯著,”Yalamanchi補充說。
薩拉西說:“研究結果表明,機器學習將成為該領域越來越重要的工具。”他補充說:“從分子描述子準確預測重要的熱力學性質的能力是開發用于預測更復雜的化學現象的全自動算法的重要一步,”
該團隊現在正在運行高精度量子化學計算,以擴展機器學習模型的訓練數據集。薩拉西說:“通過這種方式,我們正在開發一種混合的第一性原理人工智能框架,以更準確地預測許多物理化學性質。”