2024年計算化學公社舉辦的計算化學程序和DFT泛函的流行程度投票結果
2024年計算化學公社舉辦的計算化學程序和DFT泛函的流行程度投票結果
Results of the Computational Chemistry Commune 2024 poll on the popularity of computational chemistry programs and DFT functionals
文/Sobereva@北京科音 2024-May-5
0 前言
2024年4月4號,在北京科音建立的人氣最高、專業性最強的綜合性計算化學論壇“計算化學公社”(http://bbs.keinsci.com)上開展了為期一個月的五項投票:
你最常用的做量子化學計算的DFT泛函投票(http://bbs.keinsci.com/thread-44387-1-1.html)
你最常用的做第一性原理計算的DFT泛函投票(http://bbs.keinsci.com/thread-44391-1-1.html)
你最常用的量子化學程序投票(http://bbs.keinsci.com/thread-44388-1-1.html)
你最常用的分子動力學程序投票(http://bbs.keinsci.com/thread-44389-1-1.html)
你最常用的第一性原理程序投票(http://bbs.keinsci.com/thread-44390-1-1.html)
現對投票結果進行總結和簡單評論。未來預計每三年重新開展一次投票。要強調的是,這個投票只是體現流行程度,和方法/程序的好壞并沒直接關系。本投票結果主要反映中國的計算化學領域的專業、內行群體的情況,不反映業余/外行群體的情況。本次投票的結果也有助于業余/外行研究者正確認清什么才是主流,減少被他人忽悠、聽信歪曲說辭誤入歧途的概率。
上一次的投票于2021年舉行,當時的結果和很多相關評論見下文:
2021年計算化學公社論壇“你最常用的計算化學程序和DFT泛函”投票結果統計
http://www.shanxitv.org/599(http://bbs.keinsci.com/thread-23482-1-1.html)
1 你最常用的做量子化學計算的DFT泛函投票
本次可投的泛函有43種,帶不帶色散校正算同一種泛函。在2021年的投票條目基礎上有所增減,特別是增加了雙雜化泛函,明顯幾乎不會有人用的泛函沒納入可投范圍。投票范疇僅限做量子化學計算的情況,不包含第一性原理計算的情況。關系特別近的,比如M05-2X和M06-2X、wB97X和wB97XD和wB97X-D3、SCAN和r2SCAN、revDSD-PBEP86-D3(BJ)和DSD-PBEP86-D3(BJ)等等當做同一個泛函來計。此次投票者共713人。本投票每個人最多選6項,且所投的泛函必須占平時全部研究工作的5%以上。按照得票率(票數除以總投票人數)繪制的圖如下。為了避免條目過多,只把得票前30名的列出。此圖中諸如某泛函對應50%就代表有50%的人平時較多使用此泛函,后文的統計圖同理。
總的來說本年度的投票結果和2021年時沒太大變化,前六名的順次沒有改變,還是依次為B3LYP、(M05/M06)-2X、PBE0、wB97X-(/D/D3)、PBE、CAM-B3LYP老幾樣,各自有各自的用處(參看我對2021年投票結果的評論http://www.shanxitv.org/599,這里不再贅述)。它們的得票率的相對比例也基本沒變,也就是量化領域里用處相對有限的PBE的比例有一定降低,以后肯定還得跌。2021年時候的第7名M06雖然得票率如今還是5%左右,但排名已下滑到第10,被wB97M-V、SCAN/r2-SCAN、PWPB95-D3(BJ)所超過。M06在我來看用處著實不大,雖然計算過渡金屬配合物體系有一定用處,但PBE0-D3(BJ)/D4多數情況是更好的選擇,而且M06還有后繼者MN15可用。wB97M-V的得票率從2018年的3.1%提升到了如今的10%,已經算是增幅很快了,再過3年統計時肯定還會增高。此泛函在國內量化研究者中一定程度的流行,很大程度在于在計算化學公社論壇和思想家公社QQ群的討論中時常被提及、在《簡談量子化學計算中DFT泛函的選擇》(http://www.shanxitv.org/272)博文中和我在北京科音基礎(中級)量子化學培訓班(http://www.keinsci.com/workshop/KBQC_content.html)中的推薦、被免費的ORCA程序支持。提出時間不算很長的純泛函SCAN及其改進版r2SCAN現在得票率能到6%著實不容易,2021年時得票率還不到1%,這主要在于有越來越多的程序已經支持此泛函,而且綜合素質整體強于更早的經典泛函PBE,因而在純泛函范疇內能有重要的位置。
2021年投票的時候沒納入雙雜化泛函,這次得票率超過1%的雙雜化泛函的排名順序是PWPB95-D3(BJ)(5.9%) > (rev)DSD-PBEP86-D3(BJ)(3.1%) > B2PLYP-D3(BJ) (2.7%) > ωB97X-2-D3(BJ) (2.0%)。PWPB95-D3(BJ)和(rev)DSD-PBEP86-D3(BJ)能在國內用戶中變得流行和上述wB97M-V的情況很類似。本身這倆泛函各有長處,有流行開來的必然性。PWPB95-D3(BJ)比較robust,算過渡金屬配合物能量問題較好,能在ORCA里用;而revDSD-PBEP86-D3(BJ)算主族體系反應能、勢壘以及弱相互作用能都是雙雜化里頂尖的,而且在Gaussian里通過《Gaussian中非內置的理論方法和泛函的用法》(http://www.shanxitv.org/344)我介紹的方法能直接用。此外,ORCA中DSD-PBEP86適合算TDDFT和NMR目的也是其加分項。這倆泛函現在流行度能超過經典且最早提出的雙雜化泛函B2PLYP是其應得的。
BLYP這次的排名降幅很大,從第10名已跌到第22名,本身這個泛函如今鮮有用武之地。BLYP一般也就算算主族體系,在Gaussian里用這個明顯不如用B3LYP,耗時也持平,而以前在ORCA里用這個搭配def2-SVP結合RIJ加速做有機體系幾何優化速度效率高是個用處,以前我在《大體系弱相互作用計算的解決之道》(http://www.shanxitv.org/214)里也提過,但如今也不如改用B97-3c來跑。
2 你最常用的做第一性原理計算的DFT泛函投票
可投的泛函有26種,帶不帶色散校正算同一種泛函。此投票在2021年沒有,是本次新加的。此次投票者共442人。本投票每個人最多選6項,且所投的泛函必須占平時全部研究工作的5%以上。結果如下,零票的未顯示
96年提出的PBE至今仍穩居第1的位置,如同B3LYP在量子化學領域的地位,而且和第二名相差更懸殊。PBE能有這樣的地位是必然的,PBE提出年代早、被程序支持得極為廣泛,計算便宜,有豐富的專門為其搞的贗勢,幾何優化和分子動力學目的大多數時候夠用(加色散校正后又拓寬了其普適性),而且在基態能量相關問題方面依然有使用價值而且沒被已流行的其它純泛函甩開特別多(這和B3LYP在量子化學領域的情況截然不同,B3LYP算能量早過時了,很難再發得出去文章,見http://bbs.keinsci.com/thread-12773-1-1.html)。B3LYP在這次投票里得了第2,令我有點意外,大概率是很多人不好好看投票帖子的說明,誤把量子化學研究用的泛函也在此進行投票了。PBE0能排第3不意外,需要一個HF成分適當的雜化泛函做TDDFT/TDDFPT算激發態、算強相關體系的問題時經常用得著。HSE06流行度排得上第4主要來自于其計算帶隙、能帶方面公認很好,以及晶胞參數優化方面表現不錯。PBEsol是優化晶體結構、晶胞參數的好把式,而且還是便宜的純泛函,能排到第5很正常。M06-2X能排第6令我有點意外,一方面必定是有人誤當成量子化學計算的情況來投,另一方面是計算主族晶體/液體相關的化學反應、吸附的相關能量問題必定有一些人在用。SCAN/r2SCAN已經有一定流行度,由于在文獻中出現頻率越來越高,在未來的流行度必定也會逐漸提升,但流行度超越PBE在可預見的未來還不太可能,畢竟對于大量PBE就已經表現得夠用的范疇,作為更貴但沒帶來顯著優勢的meta-GGA的SCAN/r2SCAN不可能顯著侵占這方面的市場。第一性原理領域里用BLYP的人我不很理解是什么心態。revPBE和與之相似的RPBE能有一定流行度在于算化學吸附方面不錯,被不少人用。第一性原理方面的泛函投票中CAM-B3LYP顯得遠不如量子化學領域里來得流行,估計用這個的大部分都是CP2K用戶用來算激發態和UV-Vis譜方面,只占投票的少量群體。算化學吸附很好的BEEF-vdW和算物理吸附很好的optB88-vdW能有一定票數不算意外。純泛函中矮子里拔將軍算帶隙往往可以接受的HLE17在本次投票中獲得了一點流行度,略意外的是算帶隙整體更好些的純泛函mBJ反倒在這次投票中顯得無人問津,可能是前者在CP2K里能直接用而后者不能所致。作為PBE后繼提出來的知名的TPSS流行度那么低有點令我意外,倒也確實實際用處不太大,現在又有了理論上以及實際整體表現得更好的r2SCAN。PW91雖然在文獻里出現得很多,但這次得票率相當低,畢竟實際中有PBE就基本沒有更老的PW91能派上用場的時候。B97M-rV能有少量票數,主要在于算熱力學量方面在純泛函里是表現得較突出的。
3 你最常用的量子化學程序投票
可投程序有29種,投票者共679人。本投票每個人最多選三項,且所投的程序必須占平時全部研究工作的10%以上。按照得票率繪制的圖如下,只顯示了得票前20名的
前三位和2021年投票的結果一樣,還是Gaussian > ORCA > xtb,Gaussian依然是約90%的量子化學研究者日常必用的程序,穩穩占據主導位置。而ORCA和xtb的得票率比2021年時都有了約10%增長,這是意料之中的。實際上這三個程序也是我自己最常用的:xtb拿來快速預優化和結合molclus(http://www.keinsci.com/research/molclus.html)做構象搜索的初篩,Gaussian做基于DFT的opt、freq、掃描、IRC等涉及幾何變化的任務以及算一些屬性(NMR、超極化率等),ORCA算高精度單點。這三個程序的流行度遠遠甩開了其它程序,一方面是它們比較容易安裝和使用,一方面各有各的獨特優勢,有被大量使用的剛性原因。而且它們把大部分量子化學計算的應用領域都給覆蓋了,對于日常應用性研究來說其它程序難以有和它們競爭的顯著空間。Dmol3、ADF、Q-Chem、Turbomole這四個商業程序日子愈發不好過。在量化計算方面沒有長處還巨貴的Dmol3的用戶越來越少,從2021年的6.2%已經進一步萎縮到了4.3%,以后肯定還會明顯進一步萎縮。ADF從2021年時候的僅僅2.2%進一步萎縮到了1.5%。Q-Chem從2021年的3.0%萎縮到了1.0%。Turbomole從2021年的1.6%萎縮到了1.0%。以GPU加速為賣點的TeraChem更不幸,2021年時候還有1人投票,今年變成了0人。
4 你最常用的第一性原理程序投票
可投程序有25種,投票者共565人。本投票每個人最多選三項,且所投的程序必須占平時全部研究工作的10%以上。按照得票率繪制的圖如下(0票的沒顯示)
根據這次投票的結果可見,至少在計算化學公社論壇里,CP2K的流行程度已經趕超了VASP。這令我90%程度感到意外,但也有10%程度感覺是在情理之中。由于Multiwfn在2021年開始提供了極其易用的創建CP2K輸入文件的功能(http://www.shanxitv.org/587),我后來又對此功能反復打磨并在Multiwfn中提供了對CP2K繪制DOS、能帶、STM、電子激發、成鍵分析等許多功能,再加上2023年3月、2023年10月和2024年3月開辦了三期北京科音CP2K第一性原理計算培訓班(http://www.keinsci.com/workshop/KFP_content.html)非常全面系統講解了CP2K的使用,無疑令中國的CP2K用戶猛增。但即便我已預料CP2K的得票率肯定會遠高于2021年時候的33.3%,但也沒預料到這次居然能達到60.9%,直接翻了將近一倍,甚至把一直霸占流行度榜首的VASP給擠下去了。由于免費且十分高效的CP2K的用戶還在不斷激增,而且CP2K更新很快,不斷完善和發展新功能,Multiwfn在未來還會給其提供更多的相關分析處理功能,CP2K的位置在以后無疑還會更加牢固。相比之下,VASP的流行度從2021年投票時候的65.8%降到了現在的58.1%。由于現在有非常強大的競爭者CP2K,而且CP2K不具備的一些功能還有免費的Quantum ESPRESSO能用來平替VASP,售價較昂貴且算大體系速度遠不如CP2K的VASP在未來的前景不樂觀。以前很多人一提到第一性原理計算就言必稱VASP,以后就不再是如此了。除了CP2K的流行度猛增外,其它程序的流行度都普遍出現了下降,如CASTEP和Dmol3分別從2021年的19.0%和9.3%下降到了13.8%和6.4%。Wien2k今年更是連一票都沒有,而2021年時還有3票。那些程序流行度百分比減少,一方面是它們的票數大多數確實有一定減少,用戶發現有更理想或免費的程序可用,另一方面原因應當是有很多通過CP2K程序開始入手第一性原理計算的人加入了投票,他們只對CP2K的得票率有貢獻而間接地拉低了其它程序的得票率。
5 你最常用的分子動力學程序投票
可投程序有18種,投票者共551人。本投票每個人最多選三項,且所投的程序必須占平時全部研究工作的10%以上。按照得票率繪制的圖如下
GROMACS依舊是用戶數的龍頭老大,而且流行度從2021年投票時的69.3%還進一步略微提升到了71.3%,得票數大約等于其它所有程序用戶數之和,和曾經的情況一樣。第2、3位依然分別是Lammps和AMBER。Lammps和OpenMM得票率略漲,而AMBER、Forcite和NAMD的流行度都有較多降幅,GULP、DL_POLY和CHARMM更是快跌沒了。