「Google 加強版」:科學家創造化學腦
西北大學科學家將 250 年的有機化學知識連結到一個巨大的電腦網路 -- 化學加強型 Google。這個「不朽的化學家」將永遠不會退休或帶走它的知識,它反而會持續學習、成長與分享。
十年的打造時間,這套軟體將藥物分子與其它重要化合物的合成最佳化,將冗長(且昂貴)的化合物合成合併成短小且更經濟的路徑,並且確認可能成為化學武器的可疑化學配方。
我領悟到,如果我們能將所有已知的化學化合物及其間的反應連結成一個巨大的網路,我們不僅能創造出一個新的化學方法儲存庫,還能夠創造出一個全新的知識平台,在此,每一個曾進行過的化學反應以及每一種曾被製造出來的化合物將成為一個集體的(collective)「化學腦」, Bartosz A. Grzybowski 表示,他領導這項研究。用於 Google 或電信網路的類似演算法能用來搜尋與分析這個化學腦。
稱為「Chematica」,這個網路包含大約 700 萬種化學成份,由相似反應數量(similar number of reactions)所連結。有一族搜尋與分析此網路的演算法,讓化學家坐在他或她的電腦前就能輕易存取這個浩瀚的化學知識大全(compendium)。且當愈來愈多資料與演算法加入其知識庫時,此系統能從經驗中學習。
這套系統的細節與證明於 8/6 以連續三篇論文的形態,發表在當期的 Angewandte Chemie 期刊中。
Grzybowski 是這三篇論文的資深作者。他是 Weinberg 藝術與科學學院與 McCormick 工程與應用科學學院的 Kenneth Burgess 物理化學暨化學系統工程學教授。
在一篇題為「Parallel Optimization of Synthetic Pathways Within the Network of Organic Chemistry(在有機化學網路中,合成路徑的平行最佳化)」的 Angewandte 論文中,研究者所展示的演算法,能尋找導致藥物分子與其它業界重要化學物質的最佳合成法。
我們編寫演算法的方式,允許我們在幾分之一秒內搜尋數十億種化學合成法,導致想要的分子, Grzybowski 說。這相當重要,因為就算離想要達成的目標只有幾個合成階段,可能的合成方法都能如天文數字般龐大,而且很明顯地,超越任何人類化學家的搜尋能力。
Chematica 能測試與評估每種可能的、存在的合成方法,而不是只有化學家特別感興趣的那幾種。在這種模式下,演算法能找到製造所需化學物質的真正最佳方法。
該軟體已用於業界設置中,Grzybowski 說,為公司產品設計出更經濟的合成方法。合成方法能在各種限制下被最佳化,例如:避免讓反應涉及對環境有害的化合物。利用 Chematica 軟體,這樣的「綠化學」最佳化只要滑鼠點一點就成了。
另一個重要的應用領域是將合成路徑縮短成所謂的「一鍋(one-pot,譯註:pot 除了鍋的意思外,亦指坩堝)」反應。有機化學的聖杯之一便是設計出某些方法,在其中所有的起始物(starting materials)一開始就能夠結合,然後整個過程能在一鍋內完成 -- 非常類似煮一鍋燉肉 -- 一路成為最終產物。
西北大學的研究者在一篇題為「Rewiring Chemistry: Algorithmic Discovery and Experimental Validation of One-Pot Reactions in the Network of Organic Chemistry(改寫化學:在有機化學網路中,以演算法探索一鍋反應暨實驗性驗證)」的論文中,詳述這如何能辦到。
化學家們教導他們的網路大約 86,000 種化學規則,那檢查 -- 當然,在幾分之一秒內 -- 一系列的個別反應是否能被合併成「一鍋程序」。有三十種一鍋合成的預測經過檢驗與完整驗證。每種合成的進行一如預期且有絕佳產出。
在一個醒目的例子中,Grzybowski 及其團隊利用一鍋法合成出一種抗氣喘藥。這種藥一般需要經過四種連續的化學合成與純化步驟。
我們的演算法告訴我們這些步驟可以合併成一個步驟,我們自然會很好奇地在一個長頸瓶中檢查它, Grzybowski 說。我們進行這個一鍋反應,並在絕佳產出中獲得此藥,成本是個別步驟所累積的零頭。
第三種應用領域是運用 Chematica 網路方法來預測並監控會導致化學武器的合成。這在題為「Chemical Network Algorithms for the Risk Assessment and Management of Chemical Threats(用於化學威脅之風險評估與管理的化學網路演算法)」的 Angewandte 論文中報告。
至此,我們現在有這種獨特能力來審查所有可能的合成策略,我們亦能確認那些,一個潛在的恐怖份子能用來製造神經毒氣、爆裂物或其他毒劑的東西, Grzybowski 說。
來自博奕論(game theory)的那些演算法首先被用來確認那些最難被聯邦政府偵測的策略 -- 物質的運用,例如:食鹽、淨化劑(clarifiers,亦指離心機)、穀物酒精(grain alcohol)與肥料,這些隨便都能從本地便利商店購得。如此例中,結合了這些看似無害的化學物質的特徵,會舉紅旗。
這種策略與政府用來監控、管理個別物質的當前方法非常不同,Grzybowski 說。Chematica 能用來監測那些湊在一起就會變得很可疑的化學物質的模式,而不是監測個別化合物。Grzybowski 目前與聯邦政府合作,以實作這種軟體。
Chematica 現正被商業化。我們之所以選這個名字, Grzybowski 說,是因為網路將以 Mathematica(一種數學軟體)在科學運算中所進行的方式來對付化學。我們方法將加速化學合成設計與探索並將大幅優化合成實行。