談談量子化學中基組的選擇
談談量子化學中基組的選擇
文/Sobereva @北京科音
First release: 2016-Jun-16 Last update: 2023-May-3
0 前言
量子化學中基組的選擇是一門藝術,富有研究經驗和量化理論直覺的研究者能夠對所研究的問題、體系、要求的精度選擇出性價比最高的基組,而初學者則幾乎總是基組選得不合適,輕則糟蹋計算資源,重則結果不準確乃至根本沒法用。本文目的是提供基組選用的一般性指導意見,但本文并不會把基組系統性地介紹一遍。想對基組有全面系統的了解,非常推薦參加筆者講授的初級、基礎量子化學培訓班(見北京科音官網www.keinsci.com的“科研培訓”欄目)。自學的話看《基組入門資料小合集》(http://bbs.keinsci.com/thread-2190-1-1.html)。本文不怎么涉及贗勢基組的選擇問題,因為贗勢基組的選擇筆者另有其它文章:《談談贗勢基組的選用》(http://www.shanxitv.org/373)。
該用什么基組?琢磨這個問題前必須先明確以下要素,綜合判斷。問高手用什么基組的時候提供的以下信息越充分,高手也能給你越確切的答案(經常有人問我算個某某某分子,用什么基組,這根本沒法準確回答)
a)算什么體系,多少原子、都有什么元素
b)算什么問題
c)要求多高精度、用什么理論方法
d)能利用的計算資源如何(尤其是核數)、能接受最多多長的計算耗時
e)用什么程序
本文第1節先說通常怎么選擇基組,第2節再對某些類型的問題專門給出選擇建議。本文給出的基組選擇建議是對于最常用的Gaussian而言的。本文提到的很多基組在Gaussian中沒有自帶,需要自行到BSE(https://www.basissetexchange.org)基組數據庫等地方去拷定義。
以下文章如果沒看過建議看看,本文會涉及其中的內容:
談談彌散函數和“月份”基組
http://sobereva.com/119
給ahlrichs的def2系列基組加彌散的方法
http://sobereva.com/340
在線基組和贗勢數據庫一覽
http://sobereva.com/309
談談能量的基組外推
http://sobereva.com/172
詳解Gaussian中混合基組、自定義基組和贗勢基組的輸入
http://sobereva.com/60
在贗勢下做波函數分析的一些說明
http://sobereva.com/156
淺談為什么優化和振動分析不需要用大基組
http://sobereva.com/387
有些讀者讀完本文后,跟我說,我看某某某文獻,用的基組怎么和你推薦的不一樣啊?怎么你說不能xxx,但我看到文獻里就是xxx了。我這里非常負責任地說:80%以上文獻里用的基組要么不合理,導致結果爛;要么用的基組不是最劃算的,造成了計算量的無謂的增加。別以為發出去的文章都是內行高手、對基組非常了解的人寫的和審的。凡是文獻里和本文內容有沖突的,一律以本文為準。
1 一般問題的基組選擇
1.1 不同方法計算時基組選用的差異
注意,不同方法對基組的要求是截然不同的,體現在以下兩點:
(1)對基函數角動量和zeta數的依賴性:
普通泛函的DFT及HF計算(下文直接說“DFT”時指代這兩種情況)不需要太多高角動量基函數,而s、p角動量基函數對改進結果意義明顯更大。因此對比如B3LYP,用3-zeta基組6-311G*相對于2-zeta基組6-31G*改進明顯,而6-311G(3df,2pd)比6-311G(2d,p)耗時高得多卻不會有什么改進。有些人居然用6-31G(2df,p)這種基組做DFT計算,顯然極為荒誕,連3-zeta還沒達到,亟待改善的地方不改善,卻把計算量增加對DFT結果影響較小的f極化上,一看就非常缺乏理論知識。
而后HF、雙雜化泛函、多參考方法(下文直接說“后HF方法”時指代這三種情況)對基組要求較高,在DFT的基礎上還需要靠較多高角動量基函數才能充分描述電子動態相關作用。所以,對于CCSD(T)等高級別后HF方法用缺乏充分高角動量基函數的6-311G**真是鮮花插在牛糞上,用高級后HF方法至少從def2-TZVP起步,即便低級后HF方法如MP2也得至少def-TZVP起步。
MCSCF方法的重點不在于描述電子動態相關而是靜態相關,對基組要求和DFT要求相同。
(2)耗時與基函數和GTF(高斯型函數)數目的關系:
DFT計算的耗時絕大部分用在雙電子積分計算上,而雙電子積分形式上正比于GTF數目的四次方,因此,體系的GTF數是最直接影響DFT計算耗時的。
后HF計算的耗時主要取決于基函數數目(也和體系電子數有關),因為這直接決定Slater行列式或組態函數的數目,以及AO->MO積分變換的花費,而在SCF迭代過程的雙電子積分上的花費則相對次要。
鑒于此,在基函數數目相同情況下,通常GTF數越少的基組用在DFT上越吃香,比如Pople、def2、pcseg這些片段收縮基組屬于此情況。Dunning相關一致性基組(cc-pVnZ系列)屬于半廣義收縮,GTF數目相對較多,且此基組本身也是給后HF電子相關計算而優化參數的,所以用在DFT上性價比較低(例如用cc-pVTZ就明顯不如def2-TZVPP用合適),但很適合用在后HF計算上。
1.2 一般問題的基組選用建議
對于非雙雜化泛函的DFT計算,根據精度要求,一般問題基組選用建議如下。符號對應于同一檔內基組尺寸關系。
笑話級別:STO-3G (極小基)
玩具級別:3-21G (最爛2-zeta基組)
最低可接受級別: def2-SV(P) ≈ 6-31G* < def2-SVP ≈ 6-31G** ≈ pcseg-1 (2-zeta基組)
還行級別:6-311G** < def-TZVP (一般3-zeta基組)
理想級別: def2-TZVP < def2-TZVPP ≈ pcseg-2 (高檔3-zeta基組)
無敵: def2-QZVP ≈ pcseg-3 (4-zeta基組。給DFT用很浪費)
對于后HF、雙雜化泛函、多參考方法計算,根據精度要求,一般問題基組選用建議如下。
最低可接受級別: def-TZVP (一般3-zeta基組)
較好級別: cc-pVTZ ≈ def2-TZVPP (高檔3-zeta基組)
高精度計算: cc-pVQZ ≈ def2-QZVPP (4-zeta基組)
無敵: cc-pV5Z (5-zeta基組。很浪費且極昂貴,一般通過TZ→QZ CBS外推來達到這個檔次)
上面說的“最低可接受級別”絕對不是指無腦地用這個級別就能拿來發文章!這就類似于穿褲衩和破背心上街,雖然不至于被警察抓走,但像樣點的店都進不去。
學術界現在有共識認為Pople系列基組構建得不是很理想。對于3-zeta及以上檔次的基組,對于DFT計算,強烈建議在同等基組尺寸下使用def/def2、pcseg系列基組代替Pople系列基組,以在差不多耗時的情況下獲得更高精度。而對于后HF計算,Pople基組更是極差的選擇,強烈不建議用!Pople基組超過6-311+G(d,p)大小的版本基本沒有實用價值,因為總有性價比高得多的其它基組可以用。
單點能計算、幾何優化(包括優化到過渡態)、振動分析是最常見的任務類型。幾何優化和振動分析對基組的敏感度遠低于單點能的計算,而這些任務的耗時又遠高于單點計算,所以幾何優化絕對用不著大基組,諸如用6-31G**這樣偏小的基組一般就可以,至多用到6-311G**或def-TZVP這樣中等尺寸基組也就夠了,用諸如def2-TZVP這樣檔次的基組已經屬于明顯浪費;等優化完,算單點能的時候再把基組提升一、兩個檔,是明智的做法。這屬于量子化學研究者的最基本常識,完全不必擔心有哪個內行人會對此有質疑,詳見《淺談為什么優化和振動分析不需要用大基組》(http://www.shanxitv.org/387)。產生IRC、優化過渡態對基組的要求與優化極小點相同,而且這三個任務用的基組應統一。
對于需要彌散函數的情況勿忘加彌散函數!什么情況該加在前述的《談談彌散函數和“月份”基組》中已經明確說了,后文也有提到。
2 對不同任務基組的選擇
2.1 激發態計算
對激發能、電子光譜計算(吸收、熒光、ECD光譜),適合用的基組在《亂談激發態的計算方法》(http://sobereva.com/265)當中已經寫了,這里不再累述。
2.2 弱相互作用
用什么基組和弱相互作用類型有一定關系。弱相互作用本質分為兩大類:
色散作用:pi-pi堆積、范德華吸引
靜電吸引主導,少量色散吸引參與:氫鍵、二氫鍵、鹵鍵、pi-氫鍵、碳鍵、硫鍵、磷鍵等
色散作用起的比重越大,越需要彌散函數、考慮BSSE問題。
弱相互作用能計算的基組建議:
底限:對DFT用6-31+G**或ma-def2-SVP;對后HF用jun-cc-pVDZ
還成:對DFT用6-311+G**;對后HF用may-cc-pVTZ
不錯:對DFT用ma-def2-TZVP;對后HF用jun-cc-pVTZ
較理想:jul-cc-pVTZ
極理想:aug-cc-pVQZ
完美:CBS
對于色散作用占主導的弱相互作用,如果計算能力尚有余裕,相互作用能計算時建議用counterpoise方式處理BSSE問題,所耗時間會是復合物單點計算時間的兩倍多。
含弱相互作用體系的幾何優化的基組建議:
色散主導的弱相互作用:may-cc-pVTZ足夠理想,6-311+G**一般夠用,6-311G**或def-TZVP也能接受
靜電主導的弱相互作用:def-TZVP足夠理想,6-31G**或def2-SVP也可以接受
2.3 NMR計算
算NMR強烈建議用pcSseg系列基組(JCTC,11,132),專門給NMR計算優化。pcSseg-1只比6-31G**大一丁點,NMR計算結果卻和比它大得多的def2-TZVP、cc-pVTZ差不多,已經算是頗理想了。pcSseg-0大小和3-21G相仿佛,精度雖明顯不如pcSseg-1,但是卻比6-31G**整體還好一點。如果計算量還有富余可以提升到pcSseg-2,不過比pcSseg-1大不少但結果改進有限,不算很劃算。如果非要用常見的基組算NMR,可以用def2-TZVP,算不動就降到def2-SVP。IGLO-II算NMR也不錯,不過推薦程度低于pcSseg系列。不建議用pople系列基組算NMR,非要用起碼得6-311G(2d,p)。
如果研究NMR峰的分裂需要算自旋-自旋耦合常數J,算這個絕對不能用一般的基組,必須用專用的在內核附近有很緊的(指數很大的)基函數的基組才行。強烈建議用pcJ系列,用其中pcJ-1結果就很不錯了。IGLO-III基組也很適合計算J。
一些人在NMR計算時加彌散,這是愚蠢的。加彌散對NMR的計算精度幾乎無任何改進。
算NMR、J值時,被考察的原子絕對不能用贗勢基組,否則根本沒法表現內層電子對外磁場的屏蔽。但對相鄰原子用贗勢基組則完全沒關系。
2.4 勢壘計算
勢壘計算的基組按照1.2節推薦的就可以。如果已用到了較好3-zeta級別基組,計算量還有富裕,想用來進一步提升精度,那么建議加上最低程度的彌散(對重原子加s,p角動量的彌散),會令結果有定量改進。值得一提的是def2系列加彌散對勢壘計算結果的改進沒有pople基組那么大。
算勢壘不要在2-zeta基組上加彌散,把加彌散的精力用在增加zeta數上會令精度明顯提升得更多。
2.5 偶極矩、極化率、超極化率
偶極矩、極化率、第一超極化率分別是能量對外電場的一階、二階、三階導數,不了解的話看《使用Multiwfn分析Gaussian的極化率、第極化率的輸出》(http://sobereva.com/231)。算這三個必須帶彌散函數,否則結果爛得根本沒法用。而且隨著導數階數的增加,對彌散函數要求越來越高。
算偶極矩:用def2-TZVPD的話在基組層面就沒什么誤差了,用aug-cc-pVTZ也很好但昂貴得多。如果def2-TZVPD用不動就降到aug-cc-pVDZ,如果還算不動就降到def2-SVPD,還算不動就干脆放棄或者用ORCA程序開RI來算。Pople基組算偶極矩極爛,絕對不能用。
算極化率:根據筆者的測試(待發表),對此問題最劃算的基組從小到大排序為ZPOL, jul-cc-pVDZ, aug-cc-pVDZ, POL, aug-cc-pVTZ(-f,-d), LPol-ds。其中ZPOL、POL、LPol-ds都是Sadlej提出的,參見《各種Sadlej基組的Gaussian格式的定義》(http://sobereva.com/345)。其中aug-cc-pVTZ(-f,-d)是把aug-cc-pVTZ的重原子的f極化和輕原子的d極化砍掉得到的。另外,雖然諸如def2-SVPD這樣def2系列基組帶D后綴的基組也是給極化率計算優化的,但是在我的測試中不如上述基組劃算,但如果想用也可以。如果用到贗勢,建議用LFK贗勢基組,是在SBKJC贗勢基組基礎上修改得到的,以使得極化率計算精度和全電子POL基組相仿佛。
算第一超極化率:根據筆者的測試(待發表),對此問題最劃算的基組從小到大排序為aug-cc-pVDZ, POL, aug-cc-pVTZ(-f,-d), LPol-ds, LPol-fs。微型體系極高精度第一超極化率計算可以用t-aug-cc-pVTZ或aug-pcseg-3,二者大小相近,基函數數目約為LPol-ds的兩倍。如果你不會產生t-aug-cc-pVTZ的定義,可以用這個工具《給基組以even-tempered方式增加彌散函數的工具adddiffuse》(http://sobereva.com/347)。
2.8 振動頻率以及與振動有關的譜的計算
對于計算分子振動頻率、紅外光譜、VCD譜,對大體系,這類任務基組用6-31G*其實就夠了,最多用到def-TZVP也足矣,不能再提高了,再提高純屬白浪費時間。通常來說都這類任務都是基于諧振近似算的,一般都要用頻率校正因子來修正諧振近似和理論方法的系統性誤差,見《談談諧振頻率校正因子》(http://sobereva.com/221)。經過頻率校正因子修正后,用小基組、中等基組、大基組其實結果根本沒什么差別。用大基組算這類任務都是菜鳥所為。
雖然Raman、ROA譜也是振動譜,但是計算它們需要有彌散函數才能得到較好結果。因為它們在計算時都要涉及極化率對振動坐標的導數,而極化率要算準是需要有彌散函數的。J. Chem. Theory Comput., 7, 3323 (2011)提出計算Raman、ROA的兩步方法,在優化和振動分析時不用彌散函數(低至6-31G*高至def-TZVP就夠),但是計算極化率導數的時候再考慮彌散函數(建議>= aug-cc-pVDZ),這樣比整個過程都用彌散函數更便宜而且精度沒什么損失。Gaussian支持這種兩步方法。(由于ROA、Raman是振動譜,所以也應考慮頻率校正因子)
2.9 全電子相對論計算
全電子相對論計算要用到DKH、ZORA、X2C等考慮相對論效應的哈密頓,此時必須要用專門給相對論計算優化收縮方式的基組,比如cc-pVnZ-DK系列、SARC等等,或者索性用完全沒收縮的基組如UGBS。哪些可以用在此文開頭簡單提及了《在贗勢下做波函數分析的一些說明》(http://sobereva.com/156)。1.2節提到的那些普通基組絕對不能拿來做全電子相對論計算。
一些初學者對全電子相對論計算一無所知,居然用了贗勢基組還用諸如DKH2相對論哈密頓,此時結果完全錯誤!用相對論哈密頓時必須是全電子基組。
不過,如果不考慮相對論效應中的標量部分而只考慮旋軌耦合部分的話可以照常用普通全電子基組和贗勢。
2.10 波函數分析
對于基于實空間函數的波函數分析,比如討論電子密度、ELF、靜電勢,做AIM、RDG分析之類的,基組用6-31G*一般就足夠得到定性正確的結果,用到6-311G**或def-TZVP就已經綽綽有余了,如果是陰離子體系再加層s,p角動量彌散函數也足夠了,再增大基組沒什么用處,因為這些實空間函數隨基組增大很快就會收斂。NBO分析對基組的要求與此相同。加彌散函數對實空間函數的分布幾乎沒有任何影響,因此加了只會白浪費計算時間,但也不會令結果更糟。
對于CDA分析、Mayer鍵級、Wiberg鍵級、Mulliken分析、SCPA分析,還有Multiwfn里基于Mulliken/SCPA繪制PDOS、OPDOS圖之類的直接基于基函數做的分析,基組用大了不會改進結果,6-311G**下的結果絕不代表比6-31G**下的更好。若把基組繼續提升到4-zeta,結果只會變差。如果基組帶了彌散函數,那么結果根本沒法用!根本沒法用!根本沒法用!(很重要所以說三遍)絕對不能用帶有彌散函數的基組做這些分析,因為彌散函數完全沒有化學意義,因此直接基于基函數來劃分原子空間的這些方法結果會一塌糊涂。我無數次看到文獻中,包括一些IF很高的期刊的文獻中居然帶著彌散函數做這些分析,作者完全沒有波函數分析的常識。關于彌散函數對這些分析帶來的害處,看筆者曾經寫的《原子電荷計算方法的對比》(http://www.whxb.pku.edu.cn/CN/abstract/abstract27818.shtml)、《廣義化的電荷分解分析(GCDA)方法》(http://dx.doi.org/10.12677/japc.2015.44013)、《分子軌道成分的計算》(化學學報,69,2393)。
做波函數分析如果涉及到贗勢,一定要用小核贗勢,這里有詳述:《在贗勢下做波函數分析的一些說明》(http://sobereva.com/156)
2.11 溶劑化能(溶解自由能)
利用隱式溶劑模型算溶劑化能一定要使用溶劑模型專門參數化的級別,比如SMD參數化最好的級別是M05-2X/6-31G*,所以建議在M05-2X/6-31G*級別結合SMD算溶解自由能。而基組用得更大,比如aug-cc-pVTZ,結果只會變糟。關于這點在此文有詳述:《談談隱式溶劑模型下溶解自由能和體系自由能的計算》(http://sobereva.com/327)。
2.12 周期性計算
對于Gaussian、Crystal這樣基于高斯基函數的程序,算孤立體系常用的6-31G**基組也適合有機周期性體系計算。但很多專門給分子計算的基組不宜直接用在周期性計算上,如6-311G*計算Si。因為這些基組往往有指數較小的呈一定彌散特征的基函數,對于描述原子軌道的尾巴特征有益,但在周期性體系中并不需要描述這點,還可能造成數值問題,故需要將這些基函數的指數人為調大或去掉。一些基組有冗余的基函數也應適當去掉。本身帶彌散函數的基組更是絕對不能用于周期性計算的,否則麻煩極多。
適合周期性計算的高斯函數基組可以從Crystal網站獲得,但需要改格式:https://www.crystal.unito.it/basis_sets.html。其中的pob-TZVP是基于def2-TZVP修改的適合固體計算的版本,比用其它的3-zeta基組可以得到更好結果。后來2019年提出的pob-DZVP-rev2和pob-TZVP-rev2在SCF穩定性上比pob初代有了很大提升,而且改進了晶格常數計算結果。pob系列基組也可以從這里獲得定義:https://www.chemiebn.uni-bonn.de/pctc/mulliken-center/software/ssc_basis/basis。
2.13 超精細耦合
Fermi contact是超精細耦合常數的主要來源,需要算原子核處的自旋密度,建議用專為DFT計算超精細耦合優化的EPR-II、EPR-III基組(Gaussian內置,僅對H, B, C, N, O, F有定義),或適合計算核自旋-核自旋耦合常數的IGLO-III、pc-J系列基組計算。這類基組都有比較緊的s函數,能夠比較好地描述原子核處的自旋密度。
2.14 顯式相關計算
應當用專門給顯式相關計算優化的基組,最知名的是cc-pVnZ-F12系列。
2.15 涉及到密度擬合加速的計算
一般建議用有專門配套的密度擬合基組的基組,諸如def2系列。而沒有配套的密度擬合基組的基組,如pople系列,使用密度擬合計算時就得讓程序自動產生密度擬合基組,這樣產生的比標配的耗時會更高,因此加速效果沒那么好。借用相似級別或更高級別的基組的密度擬合基組也可以,但終究不完美。關于密度擬合加速詳見《大體系弱相互作用計算的解決之道》(http://sobereva.com/214)。
3 基組相關的若干問題
3.1 什么時候用贗勢?
贗勢的主要用處在于:(1)將化學上不感興趣的內層電子以等效的勢場描述,從而不需要將內層電子顯式地表達出來,大大節約了計算量 (2)可以等效地體現標量相對論效應。從第四周期相對論效應開始顯現,但不考慮也問題不大;而對第五周期及之后相對論效應是不可忽視的,不考慮甚至結果定性錯誤。
贗勢和贗勢基組是搭配使用的。一般來說,從第四周期開始就推薦使用贗勢基組,這樣不僅顯著節約了耗時,還可以等效納入相對論效應改進結果(前提是使用的是相對論贗勢RECP,即當初擬合贗勢時已考慮了相對論效應)。有興趣可以看《贗勢的函數形式以及在量子化學程序中定義的方式》(http://sobereva.com/188)和前述的《在贗勢下做波函數分析的一些說明》,贗勢基組的選擇在前述的《談談贗勢基組的選用》中有詳細討論。
3.2 基組包含哪些元素?
只有極少數基組,如UGBS、WTBS是幾乎覆蓋整個周期表的,大多數基組只對周期表中的一部分有定義。基組定義了哪些元素,可以自行去BSE網站上,點擊相應基組查看。
3.3 CBS是啥意思?
CBS=complete basis set(完備基組)。用CBS相當于用了無窮大基組,此時基組不完備性導致的結果誤差為0。文獻中經常有CCSD(T)/CBS這種寫法,當然實際計算用的基組不可能無窮大,CBS下的結果是通過有限大小基組下的結果外推來達到的,具體見前述的《談談能量的基組外推》。
3.4 基組怎么獲得?
由于絕大多數量子化學程序用的基函數都是高斯函數,數學形式是一致的,因此高斯函數基組可以在任何基于高斯函數的量化程序中使用。基本上所有量子化學程序都有自己的基組庫,包含主流的基組,可以直接使用。
但是內置的基組往往不夠全面,往往需要從其它地方獲得基組定義來在程序中使用。可以從其它程序基組庫中借來,或者根據基組原文獻中的數據自行手寫,或者從一些基組開發者的網站上獲取。最常規的獲得外部基組的做法是通過BSE基組數據庫,這是基組最全的公開的基組數據庫(極個別基組對于個別元素的數據可能有錯誤)。詳見前述的《在線基組和贗勢數據庫一覽》。
3.5 關于混合基組
混合基組是指計算時有的原子用某種基組,而有的原子用另一種基組。適當使用混合基組可以令計算耗時大為降低,而精度損失不多,建議大家充分利用這種做法。例如,計算一個大體系的化學反應過程,反應部分只涉及其中一個區域,那么可以只給這個區域的原子用大基組(如def2-TZVP)而其余部分用中/小基組(如6-31G*乃至3-21G)。再比如,若體系有的地方局部帶大量的負電荷,那么沒必要對整個體系所有原子都加彌散函數,只給那部分的原子加上彌散函數就足夠了。計算配合物時通常給過渡金屬原子用贗勢基組而輕原子用全電子基組,這實際上也屬于使用了混合基組。
Gaussian中用混合基組的方法見前述的《詳解Gaussian中混合基組、自定義基組和贗勢基組的輸入》。
3.6 BSSE問題
高斯函數基組實際用的時候基本上都是以原子為中心的,某原子帶的基函數會侵入到它附近原子的空間內,這導致通過整體減片段來求能量差的時候會有BSSE(基組重疊誤差)問題,算相互作用能的時候會高估作用強度。解決BSSE問題有counterpoise、gcp等方法,特別強調一下用counterpoise的時候只適合在計算能量的時候,強烈不建議在優化和振動分析的時候使用,否則無解析導數,對大體系慢得吐血,且一般也帶來不了什么可察覺得到的改進。詳見《談談BSSE校正與Gaussian對它的處理》(http://sobereva.com/46)。
3.7 給氫加不加極化函數、加不加彌散函數?
和氫關系密切的計算,比如計算氫鍵、氫轉移反應、質子化能、氫的NMR譜等等才很有必要給氫加極化函數,其它情況不給氫加極化也不會帶來多大誤差。
給氫加彌散函數通常來說意義很低,在《談談彌散函數和“月份”基組》(http://sobereva.com/119)中特意專門做了說明,這里不再累述。
3.8 哪些任務用的基組必須一致?
很多初學者,道聽途說網上一些亂七八糟說法,對概念稀里糊涂,經常問某某計算用的基組是否必須得和優化用的基組一致之類。實際上,只有走IRC、做振動分析的時候用的級別(顯然包括所用的基組)必須和幾何優化(包括優化過渡態)時候的一致,除此之外,任何常見的任務之間都絕對不要求所用基組一致!!!
3.9 關于Pople系列基組加極化函數
Pople系列基組的一個特點是自定義強,對6-31G和6-311G后面極化函數加多少、加什么角動量的可以自己隨意控制,對重原子可以是d,df,2d,2df,3d,3df,3d2f,對輕原子可以是p,pd,2p,2pd,3p,3pd,3p2d。很多人亂加,不注意各角動量的平衡性,比如說按這個順序逐漸增加試圖改進結果是合適的:(d,p) (2d,p) (2df,2p) (2df,2pd) (3d2f,2pd) (3d2f,3p2d)。但是如果使用諸如(3d,3p2d),就很不合適了,對重原子d極化都那么多了怎么一個f都沒有?而且氫的極化給那么多,重原子的極化顯得也偏少。另外,對6-31G這個2-zeta基組,給個(d,p)或至多(2d,p)也就夠了,如果用6-31G(2df,2pd)就很蠢了,把閑資源用在加那么多極化函數上帶給結果的改進遠遠不如先把基組升到3-zeta!
另外,pople基組主要適合做粗鄙或中庸的HF/DFT計算,哪怕一般精度的后HF都不適合pople基組(適合用dunning相關一致性基組)。6-31G*、6-31G**、6-311G**這樣的對DFT可以用,但是再想提高精度,那就強烈不建議用pople基組了,自行給它增加更多的極化函數遠不如直接用人家專門搭配好的基組(def2、pc系列)。比如def2-TZVP和6-311G(2df,2p)耗時相仿佛,用前者明顯比用后者結果更好。
順便再說一下,6-31G、6-311G不加極化函數根本沒法用!6-31G*相比6-31G、6-311G*相比6-311G精度一個天上一個地下,雖然加了極化耗時高了些,但這是超劃算的。頻繁看到初學者居然直接就敢用兀禿兀禿的6-31G、6-311G,明顯是不懂極化函數有多么必不可少。用6-31G、6-311G暴露出研究者在基組選用常識上的極度無知,如果確實連6-31G*都用不起,索性降到3-21G,這體現出因計算能力不足而迫不得已,并不丟人。
3.10 亂用彌散函數的問題
什么時候該用彌散函數在前述的《談談彌散函數和“月份”基組》當中專門說了,本文前面也提到了很多次什么時候該加什么時候不該加彌散函數。老夫長期在網上回答計算化學問題,看到別人亂用彌散函數的情形真是太多太多了。再次強調一下,如果你已經仔細看過上文以及《談談彌散函數和“月份”基組》了,碰到一個問題不確定該不該加彌散函數,那么答案就是:別加彌散函數!!!根據灑家網上長期答疑經驗,不該加彌散函數的時候加了彌散函數的情況,比該加彌散函數卻沒加的情況多至少10倍!
不該加彌散函數的時候加彌散幾乎對結果完全沒改進,還導致許多問題,尤其是計算量暴增、難收斂。要知道,同樣是加一層sp基函數,如果加的是彌散函數,遠比增加一級zeta數耗時多得多!即曰,對重原子,相對于6-31G*,增大到6-31+G*的耗時顯著高于增大到6-311G*(體系越大這個現象越明顯)。因為彌散函數指數小,延展范圍廣,量化程序不容易靠積分屏蔽(integral screening)策略來忽略掉對結果貢獻很小的積分來節約計算量,而且本身彌散函數也容易導致收斂需要更多圈數。而對于不是非得有彌散函數不可的情況,6-311G*比6-31+G*結果好到不知哪里去了。即便是對于彌散函數較有用的問題,比如色散主導的弱相互作用體系優化,考慮到計算量以及任務類型,我也推薦用6-311G*而非6-31+G*,因為前者本身此時結果也不比后者差,雖然它沒有彌散函數,但是3-zeta最外層本身就體現出一點彌散的特征,也基本夠了,而且3-zeta對價層電子的描述準確度也比2-zeta充分得多。
此外,對于后HF方法,亂加彌散函數,還不知道用足夠的高角動量極化函數,結果更是荒誕的!JACS,128,9342(2006)里專門報道過,用MP2優化苯,用諸如6-31++G*、6-311+G*、6-311++G**等,優化后的平面結構的苯居然有虛頻,換句話說,在這樣的級別下苯的極小點結構是彎的!在http://bbs.keinsci.com/thread-12653-1-1.html這個帖子里,有人用MP2/6-311++G**結合SDD去優化碘代乙炔,結果沒虛頻的結構竟是彎的,也是類似原因。可見缺乏計算級別選用常識的話,連看似最簡單的問題都可能給出完全錯誤的結果。