材料科學(xué)借力人工智能,打造億萬(wàn)材料數(shù)據(jù)庫(kù)

時(shí)間:2016-05-13 17:30來源:和訊名家 作者:王杰
點(diǎn)擊:

    機(jī)器學(xué)習(xí)技術(shù)有望能夠?qū)崿F(xiàn)材料科學(xué)的變革。

    這是所有最極客的視頻的強(qiáng)大競(jìng)爭(zhēng)者:一部屏幕滾動(dòng)播放著一行行數(shù)字與符號(hào)的智能手機(jī)。但是,每當(dāng)參觀者駐足俯瞰日內(nèi)瓦湖的辦公室,Nicola Marzari總會(huì)迫不及待地向他們展示。“這是我的手機(jī),”他說,“從2010年開始,它實(shí)時(shí)計(jì)算著硅的電子結(jié)構(gòu)!”。
 來自瑞士洛桑的瑞士聯(lián)邦理工學(xué)院(EPFL)的物理學(xué)家Marzari解釋到,他的手機(jī),僅花費(fèi)40秒就能完成曾經(jīng)超級(jí)電腦耗費(fèi)數(shù)小時(shí)才能完成的任務(wù)量子力學(xué)計(jì)算。這一壯舉不僅顯示了過去十年間計(jì)算方式的進(jìn)步;也向我們展示了運(yùn)算方法改變材料科學(xué)研究道路的可能性。
 Marzari拋開以往開發(fā)新材料的方法——靠運(yùn)氣誤打誤撞發(fā)現(xiàn)新材料,而后在實(shí)驗(yàn)室里煞費(fèi)苦心地測(cè)量性能——他與志同道合的同伴一起,利用計(jì)算機(jī)建模和機(jī)器學(xué)習(xí)技術(shù)生成數(shù)以萬(wàn)計(jì)的備選材料庫(kù)。即使是實(shí)驗(yàn)失敗,實(shí)驗(yàn)數(shù)據(jù)也能提供有用的信息。
 盡管備選材料中有許多完全基于假設(shè),但工程師已開始進(jìn)行縮減。通過找尋預(yù)期屬性,針對(duì)特定的應(yīng)用來篩選有合成和檢測(cè)的價(jià)值的材料。例如,它們能否作為導(dǎo)體或絕緣體,能否用作磁鐵以及能夠承受多大的壓力和溫度。
 加州大學(xué)伯克利分校的材料科學(xué)家,材料科學(xué)領(lǐng)域的先驅(qū)Ceder表示,他們希望以上做法可以實(shí)現(xiàn)材料科學(xué)研究的速度與效率的巨大飛躍。“對(duì)于現(xiàn)存材料的屬性,我們大概只了解其中的1%,”由此指向了磷酸鐵鋰的例子:這種化合物首次合成于20世紀(jì)30年代,但直到1996年才被公認(rèn)為有望替代未來鋰離子電池的材料。“而在這之前,沒人測(cè)量過它的電壓。”Ceder說到。

  迄今,世界上至少有三個(gè)主要的材料數(shù)據(jù)庫(kù),各包含幾萬(wàn)或幾十萬(wàn)的化合物。Marzari計(jì)劃將在今年晚些時(shí)候推出洛桑的材料云計(jì)劃,這受到越來越廣泛的關(guān)注。

  在倫敦帝國(guó)學(xué)院擔(dān)任副院長(zhǎng)的材料學(xué)家Neil Alford,不隸屬于任何一個(gè)數(shù)據(jù)庫(kù),他指出:“現(xiàn)在,實(shí)驗(yàn)者所想與理論所能及真正地融合在一起。”

  盡管已經(jīng)提出了設(shè)想,但是從計(jì)算機(jī)預(yù)測(cè)過渡到現(xiàn)實(shí)世界的技術(shù),卻還有很長(zhǎng)一段路要走,F(xiàn)有數(shù)據(jù)庫(kù)還沒能收納所有已知材料,更別說所有可能性材料。

  以數(shù)據(jù)驅(qū)動(dòng)的研究對(duì)某些材料有效,對(duì)另外一些材料卻無用。此外,即使我們?cè)陔娔X上篩選出某一有趣材料,后續(xù)合成工作也要耗時(shí)數(shù)年。“我們總是擅長(zhǎng)設(shè)想,卻無法付諸實(shí)踐。”Ceder說。

  盡管如此,研究人員堅(jiān)信有著大量化合物的寶藏等待他們?nèi)ネ诰颍鼈兡軌蜷_啟電力、能源、機(jī)器人、醫(yī)療保健和交通運(yùn)輸領(lǐng)域的創(chuàng)新時(shí)代。芝加哥的伊利諾斯州大學(xué)的計(jì)算材料科學(xué)家Giulia Galli表示:“我們正在共同拼湊這塊巨大的拼圖,當(dāng)每個(gè)部位都正確歸位后,對(duì)材料的預(yù)測(cè)就會(huì)成為現(xiàn)實(shí)。”

  基因組啟發(fā)

  21世紀(jì)初,在劍橋麻省理工學(xué)院的Ceder受到當(dāng)時(shí)的人類基因組計(jì)劃的啟發(fā),想到了以數(shù)據(jù)驅(qū)動(dòng)的高通量材料科學(xué)研究方法。“就其本身而言,人類基因組不是新的治療方法的秘訣。”他說,“但是它為醫(yī)學(xué)提供了數(shù)量驚人的基礎(chǔ)性定量信息。”

  他猜想,或許材料學(xué)家可以借鑒遺傳學(xué)家的做法。或許,材料學(xué)家可以用DNA堿基對(duì)的生物信息編碼方式,對(duì)各種化合物進(jìn)行編碼,進(jìn)而確定“材料基因組”?

  他猜想,如果以上設(shè)想實(shí)現(xiàn),那么編碼必須在組成所給材料的原子與電子中,以及它們的晶體結(jié)構(gòu)中。2003年,Ceder和他的團(tuán)隊(duì)首次展示量子力學(xué)計(jì)算數(shù)據(jù)庫(kù)如何預(yù)測(cè)金屬合金的可能性晶體結(jié)構(gòu),這是新材料研發(fā)領(lǐng)域邁出的關(guān)鍵一步。

  過去,就算對(duì)于超級(jí)計(jì)算機(jī)來說,這樣的計(jì)算既困難又耗費(fèi)時(shí)間。機(jī)器要經(jīng)歷大量嘗試,歷經(jīng)數(shù)次失敗才能找到“基態(tài)”:一種能量最低且受力均衡的電子排布以及晶體結(jié)構(gòu)。

  2003年,Ceder團(tuán)隊(duì)在論文中指出了一條捷徑。研究人員計(jì)算了一個(gè)小型二元合金庫(kù)里的常見晶體結(jié)構(gòu)的能量,然后設(shè)計(jì)出一套機(jī)器學(xué)習(xí)算法,從庫(kù)中提取模型,預(yù)測(cè)新型合金的最可能基態(tài)。算法十分有效,大大縮減了計(jì)算時(shí)長(zhǎng)。

  Stefano Curtarolo說:“那篇論文介紹了建設(shè)材料屬性公用庫(kù),利用數(shù)據(jù)填補(bǔ)缺失部分的設(shè)想。”同年,他離開研究小組,在北卡羅來納州達(dá)勒姆市杜克大學(xué)創(chuàng)辦了自己的實(shí)驗(yàn)室。隨后,那一設(shè)想催生了兩個(gè)獨(dú)立項(xiàng)目。

  2006年,Ceder在麻省理工啟動(dòng)了材料基因組計(jì)劃,采用算法的改進(jìn)版本來預(yù)估電動(dòng)汽車電池的鋰基材料。到2010年,該項(xiàng)目已包含了近兩萬(wàn)種備選化合物。“我們從現(xiàn)有材料入手,修改它們的晶體結(jié)構(gòu)——改動(dòng)這里或那里的元素并計(jì)算結(jié)果。”Ceder團(tuán)隊(duì)的前成員 Kristin Persson說到。2008年,她搬到加利福利亞洲的勞倫斯伯克利國(guó)家實(shí)驗(yàn)室后,仍繼續(xù)跟進(jìn)項(xiàng)目。

  與此同時(shí),Curtarolo在杜克大學(xué)設(shè)立了材料基因組中心,專注研究金屬合金。同來自猶他州普羅沃楊百翰大學(xué)、猶他州和以色列內(nèi)蓋夫的核研究中心的研究人員一起,Curtarolo最終將2003年的算法和庫(kù)發(fā)展為AFLOW,一套能夠計(jì)算已知晶體結(jié)構(gòu)并自動(dòng)預(yù)測(cè)新型結(jié)構(gòu)的系統(tǒng)。

  初始研究團(tuán)隊(duì)外的研究者也對(duì)高通量計(jì)算感興趣。其中一個(gè)是化學(xué)工程師Jens Nørskov,在丹麥技術(shù)學(xué)院期間,他用這種計(jì)算來研究催化劑,將水分解為氫氣和氧氣。后來,他擔(dān)任加利福利亞斯坦福大學(xué)研究催化劑計(jì)算的SUNCAT中心的主任,并拓展了該項(xiàng)研究。另一個(gè)是Marzari,他是Quantum Espresso開發(fā)團(tuán)隊(duì)中的一員,該項(xiàng)目研究量子機(jī)器運(yùn)算,于2009年啟動(dòng)。

  材料基因組

  盡管如此,直到2011年7月,白宮宣布了數(shù)百萬(wàn)元的材料基因組計(jì)劃(MGI),材料科學(xué)才成為主流。“白宮的官員了解Ceder的研究后,非常激動(dòng),”來自標(biāo)準(zhǔn)與技術(shù)的美國(guó)全國(guó)學(xué)院的材料科學(xué)家和MGI執(zhí)行秘書James Warren說到。“人們普遍認(rèn)識(shí)到計(jì)算機(jī)模擬已發(fā)展到了對(duì)創(chuàng)新與制造產(chǎn)生實(shí)際影響的階段,這是令人稱道的盛況。”

  自2011起,該倡議已投資逾250多萬(wàn)美元,用于軟件工具、收集和報(bào)告實(shí)驗(yàn)數(shù)據(jù)的標(biāo)準(zhǔn)化方法、主要大學(xué)的計(jì)算材料科學(xué)中心、校際合作以及具體應(yīng)用研究。至于這項(xiàng)投資對(duì)科學(xué)起了多大推動(dòng)作用,我們尚不得知。Ceder表示:“這一舉措獲益頗豐,但也出現(xiàn)了一些偏差,有些團(tuán)隊(duì)開始稱自己的研究為這為那,然而這些與研究并沒有什么聯(lián)系。”

  不過,可以確定的一點(diǎn)是,MGI旨在幫助Ceder和其他研究者實(shí)現(xiàn)材料屬性在線數(shù)據(jù)庫(kù)的愿景。2011年底,受白宮要求,Ceder和Persson將他們的材料基因組計(jì)劃改為材料計(jì)劃,放棄了“基因組”標(biāo)簽,以避免與國(guó)家工作混淆。次年,在杜克大學(xué)期間研究的軟件基礎(chǔ)上,Curtarolo推出了自己的數(shù)據(jù)庫(kù)——AFLOWlib。

  2013年,伊利諾伊州埃文斯頓西北大學(xué)的研究人員Chris Wolverton推出了開放量子材料數(shù)據(jù)庫(kù)(OQMD)。他說:“我們借鑒了材料計(jì)劃和AFLOWlib的總體思路,但我們的軟件和數(shù)據(jù)是自產(chǎn)自銷。”

  這三個(gè)數(shù)據(jù)庫(kù)共享從無機(jī)晶體結(jié)構(gòu)數(shù)據(jù)庫(kù)獲取的近五萬(wàn)種核心已知材料數(shù)據(jù)。這些數(shù)據(jù)都已經(jīng)至少在實(shí)驗(yàn)室和論文中出現(xiàn)過一次,但其電力和磁力性能從未得到完整測(cè)試;它們是新材料得以產(chǎn)生的起點(diǎn)。

  三個(gè)數(shù)據(jù)庫(kù)的不同之處在于它們包含的假設(shè)材料。材料計(jì)劃數(shù)據(jù)相對(duì)較少,約15000個(gè)從Ceder和Persson的鋰電池研究中得出的計(jì)算結(jié)構(gòu),“只有確定了計(jì)算結(jié)果的準(zhǔn)確性和研究可行性,我們才會(huì)將材料收入庫(kù)中。”Persson說。

  另外的13萬(wàn)左右條結(jié)構(gòu)由明尼蘇達(dá)的明尼阿波利斯大學(xué)的納米多孔材料基因組中心預(yù)測(cè)得出。后者關(guān)注沸石和金屬有機(jī)框架:晶體結(jié)構(gòu)中帶有規(guī)律性重復(fù)小孔的海綿狀材料,可以捕及氣體分子,儲(chǔ)存甲烷或二氧化碳。

  AFLOWlib是最大的數(shù)據(jù)庫(kù),擁有超過一百萬(wàn)的不同材料和一億左右的性能屬性。Curtarolo表示,那時(shí)因?yàn)樗舶藬?shù)以萬(wàn)記的假設(shè)材料,其中許多在現(xiàn)實(shí)世界中一轉(zhuǎn)眼的功夫就消失了。“但是當(dāng)你嘗試去預(yù)測(cè)如何制造某一金屬,功夫總不負(fù)有心人。”

  例如,他正利用AFLOWlib的數(shù)據(jù)研究為什么一些合金可以合成金屬玻璃(一種金屬形式,其無序微觀結(jié)構(gòu)賦予了該金屬特殊的電磁屬性)。研究結(jié)果顯示,玻璃形成劑的優(yōu)劣之分在于不穩(wěn)定晶體結(jié)構(gòu)的數(shù)量和能量,這些晶體結(jié)構(gòu)和“基態(tài)”在合金冷卻過程中“完成”。

  Wolverton的QQMD包含大約40萬(wàn)假想材料,它們由自然普遍發(fā)現(xiàn)的一系列晶體結(jié)構(gòu)計(jì)算得出。Wolverton的團(tuán)隊(duì)幾乎選用了元素周期表的每一個(gè)部分,來“裝飾”這些材料。

  QQMD涵蓋了大量的鈣鈦礦——這種晶體常常展示出引人注目的性能,如超導(dǎo)以及用于太陽(yáng)能電池開發(fā)的微電子。顧名思義,該項(xiàng)目最具開放性:用戶可以在電腦上下載整個(gè)數(shù)據(jù)庫(kù),而不僅僅是個(gè)人研究結(jié)果。

  以上數(shù)據(jù)庫(kù)都還處于建設(shè)階段,管理者仍然要耗費(fèi)大量時(shí)間添進(jìn)更多的化合物、完善計(jì)算;他們承認(rèn),目前的計(jì)算遠(yuǎn)不夠完善。

  數(shù)據(jù)庫(kù)中的代碼善于預(yù)估晶體結(jié)構(gòu)的穩(wěn)定與否,但卻無法很好地預(yù)估晶體結(jié)構(gòu)如何吸收光或者導(dǎo)電性能;因此,常常會(huì)制造出類似半導(dǎo)體的非金屬。Marzari指出,即使是在計(jì)算材料科學(xué)發(fā)展最好的領(lǐng)域——電池材料,也存在半伏的平均誤差。

  失之毫厘,謬以千里。Curtarolo表示:“事實(shí)上,有些誤差來源于理論本身:我們永遠(yuǎn)無法糾正它們。”

  各個(gè)團(tuán)隊(duì)都在改進(jìn)自身的技術(shù),調(diào)整計(jì)算法并修改系統(tǒng)性誤差。但同時(shí),他們和其他團(tuán)隊(duì)的用戶已經(jīng)利用數(shù)據(jù)開始了實(shí)驗(yàn)。材料計(jì)劃已經(jīng)確定了幾個(gè)具有前景的陰極材料,可能比用于鋰電池中的現(xiàn)存材料要好;他們還發(fā)現(xiàn)了能夠提升太陽(yáng)能電池捕光和產(chǎn)能效率的金屬氧化物。

  今年早些時(shí)候,來自都柏林三一學(xué)校的研究人員使用 AFLOWlib里的數(shù)據(jù)預(yù)估20種哈勒斯合金,一種可用于傳感器和電腦儲(chǔ)存器的磁鐵。他們成功合成了其中的兩種合金,并表示二者的磁性屬性與預(yù)估值非常接近。

  延伸至歐洲地區(qū)

  材料基因組學(xué)已經(jīng)走向了歐洲地區(qū),盡管它的名稱有所變化。例如,瑞士創(chuàng)造了MARVEL,一個(gè)計(jì)算材料科學(xué)組織,以洛桑聯(lián)邦理工學(xué)院為首,以Marzari為領(lǐng)導(dǎo)者。

  有了新的計(jì)算平臺(tái),Marzari創(chuàng)建了名為材料云的數(shù)據(jù)庫(kù)。他用該數(shù)據(jù)庫(kù)檢索由單層原子或分子構(gòu)成的“二維”材料,如石墨。這類材料既可以用于納米電子,又可用于醫(yī)學(xué)裝置。

  為了找到好的備選材料,Marzari對(duì)超過15萬(wàn)已知材料進(jìn)行了所謂的“計(jì)算剝皮”:計(jì)算從一個(gè)普通晶體表面分離一層需要多大的能量。今年晚些時(shí)候,數(shù)據(jù)庫(kù)將對(duì)外公布,Marzari預(yù)測(cè)到那時(shí)初步運(yùn)算已經(jīng)涵蓋了1500種可能性“二維”結(jié)構(gòu),并在后續(xù)的實(shí)驗(yàn)中進(jìn)行檢驗(yàn)。

  計(jì)算化學(xué)家Berend Smit建立了另一個(gè)洛桑聯(lián)邦理工學(xué)院中心,聳立在距錫安幾千公里外的阿爾卑斯山脈上。該中心致力于研發(fā)算法,預(yù)估數(shù)以萬(wàn)計(jì)的納米多孔沸石和金屬有機(jī)框架。此外,還有衍生自面部識(shí)別技術(shù)的算法,用于掃描一定的孔狀形狀,然后尋找最佳備選材料,吸收化石燃料工廠煙囪排放的二氧化碳。

  Smit的工作還揭示了材料基因組的缺點(diǎn)。許多研究者希望納米多孔材料打造空間更小儲(chǔ)甲烷量更大的汽車水箱。然而,在掃描了逾65萬(wàn)計(jì)算材料后,Smit團(tuán)隊(duì)發(fā)現(xiàn)大部分優(yōu)秀材料早已存在。新材料僅僅有些許進(jìn)步,而美國(guó)機(jī)構(gòu)設(shè)定的能源目標(biāo)——實(shí)現(xiàn)甲烷儲(chǔ)存的重大技術(shù)進(jìn)步,也就顯得不現(xiàn)實(shí)。

  正如以上例子一樣耐人尋味,材料基因組學(xué)在實(shí)現(xiàn)自身的承諾前,還需要克服許多困難。其中最大的困難就是,計(jì)算機(jī)建模還無法找出制作有趣新材料的方法,更別說質(zhì)量問題了。

  “我們一直在提出關(guān)于新物質(zhì)的有趣設(shè)想,”Ceder說。“這些設(shè)想,有時(shí)候兩周就實(shí)現(xiàn)了。而有時(shí),就算進(jìn)行了6個(gè)月研究,我們也沒有絲毫頭緒,我們甚至不知道方向是否正確,亦或是可行性有多少。”

  Ceder和Curtarolo都在嘗試改進(jìn)機(jī)器學(xué)習(xí)算法,從已知制造過程中提取規(guī)則,指導(dǎo)化合物的合成。

  另一個(gè)限制是,材料基因組一直用于工程師所稱的功能性材料中,即能在任務(wù)中發(fā)揮作用的化合物,如在太陽(yáng)能電池中吸收光線。但是該技術(shù)并不能很好地用于研究結(jié)構(gòu)性材料,如鋼,如飛機(jī)機(jī)翼、橋梁或發(fā)動(dòng)機(jī)。這是因?yàn)橹T如彈性和硬度的機(jī)器屬性取決于生產(chǎn)過程,而這是量子力學(xué)代碼不能描述的。

  即使對(duì)于功能性材料,現(xiàn)行的計(jì)算機(jī)代碼只適用于完美的晶體結(jié)構(gòu),而這只是材料領(lǐng)域的一小部分。Galli表示:“未來,最有趣的材料可能是由微觀層面的創(chuàng)造性組裝而成。”可能是納米顆;蚴钱愘|(zhì)材料晶體的組裝。要預(yù)估這些材料,Galli補(bǔ)充到:“你需要立即計(jì)算出許多屬性,系統(tǒng)如何在及時(shí)地在特定溫度在衍生。”方法有許多,“但是將其運(yùn)用于高通量研究,計(jì)算成本仍舊十分高昂。”

  短期而言,實(shí)驗(yàn)中更多的數(shù)據(jù)交換,可以更好地檢驗(yàn)計(jì)算結(jié)果并加以完善。目前,Ceder正與麻省理工的團(tuán)隊(duì)一起研究新型軟件,通過閱讀材料科學(xué)實(shí)驗(yàn)論文,自動(dòng)以標(biāo)準(zhǔn)格式提供晶體結(jié)構(gòu)的相關(guān)信息。“我們計(jì)劃在未來幾個(gè)月,將這些數(shù)據(jù)加入材料計(jì)劃中。”

  長(zhǎng)期而言,摩爾定律將會(huì)起到一定作用:隨著計(jì)算能力不斷提高,一些目前計(jì)算機(jī)無法實(shí)現(xiàn)的技術(shù)很快將會(huì)變得可行。

  Marzari表示:“我們已經(jīng)走出計(jì)算材料科學(xué)的手工時(shí)代,并進(jìn)入了產(chǎn)業(yè)化階段,F(xiàn)在,我們可以創(chuàng)建模擬裝配鏈,并將它們投入使用,以一種全新的方式探索問題。”目前市場(chǎng)上海沒有計(jì)算預(yù)估材料。Galli說:“但十年后呢?我相信那時(shí)就會(huì)有很多了。”
 

(責(zé)任編輯:王杰)
文章標(biāo)簽:
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與中國(guó)電池聯(lián)盟無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
凡本網(wǎng)注明 “來源:XXX(非中國(guó)電池聯(lián)盟)”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)谝恢軆?nèi)進(jìn)行,以便我們及時(shí)處理。
QQ:503204601
郵箱:cbcu@cbcu.com.cn
猜你喜歡
專題
相關(guān)新聞
本月熱點(diǎn)
歡迎投稿
聯(lián)系人:王女士
Email:cbcu#cbcu.com.cn
發(fā)送郵件時(shí)用@替換#
電話:010-53100736
在線投稿
企業(yè)微信號(hào)
微信公眾號(hào)