談談贗勢基組的選用

談談贗勢基組的選用

First release: 2017-Apr-18 Last update: 2022-Nov-12

1 前言

“算xxx元素該用什么贗勢基組”是網上最常問的問題之一，本文說說該怎么選用贗勢基組。本文主要面向Gaussian用戶的情況，其它程序用戶可以擇情借鑒。看本文之前一定要非常仔細看《談談量子化學中基組的選擇》（http://www.shanxitv.org/336），本文假定讀者已經充分理解了那篇文章所講的全部內容。如果你特別著急做計算，連把本文完整讀完的耐心都沒有，那就直接看第4節。

筆者之前還寫過其它與贗勢、贗勢基組有關的文章。凡是以下文章里已講過的內容在本文基本不會再重復，如果對贗勢一點都不了解的話一定要先看看。
贗勢的函數形式以及在量子化學程序中定義的方式（http://www.shanxitv.org/188）
在贗勢下做波函數分析的一些說明（http://www.shanxitv.org/156）
詳解Gaussian中混合基組、自定義基組和贗勢基組的輸入（http://www.shanxitv.org/60）

以下兩篇文章與贗勢基組也有關，若感興趣可以看看
在線基組和贗勢數據庫一覽（http://www.shanxitv.org/309）
用NWChem做SODFT在DFT計算中考慮旋軌耦合效應（http://www.shanxitv.org/368）

2 什么時候該用贗勢基組？

先看看使用贗勢基組計算帶來的好處：
(1)計算時不需要直接考慮內層電子，使計算量大幅降低，而且序號越靠后的元素這一點體現得越明顯。用贗勢基組計算一個很重原子，其省下來的計算量往往相當于全電子基組計算幾個輕原子。
(2)相對論效應從第四周期（H,He是第一周期，下同）開始值得關注，但不考慮也問題不大，從第五周期開始則是絕對不能忽略。相對論效應主要來自于內層電子。擬合贗勢的時候如果已考慮相對論效應，即使用相對論贗勢，則基于贗勢計算的時候就可以把相對論效應等效地體現出來，免得用DKH等方法考慮相對論效應了（用DKH等不僅導致額外增加耗時，多數程序還不支持其解析導數，導致做優化等任務極為困難）。

用贗勢基組計算也有一些壞處：
(1)由于內層電子沒有明確表達，有可能影響計算精度。這一點看你具體用什么贗勢和贗勢基組以及計算哪些元素了，不能一概而論。對同一系列贗勢，大核版本由于這個問題更明顯，故精度大多不如小核版本好。
(2)導致直接依賴于內核電子的性質無法計算。對于使用了贗勢的原子，就沒法計算其NMR、超精細耦合、內核電子激發等依賴于內層電子的量了（不過對其它原子還是可以計算的）。
(3)內層電子的缺失可能有礙一些波函數分析，但也有辦法避免，詳見《在贗勢下做波函數分析的一些說明》中的討論。

了解了以上信息，什么時候該用贗勢基組心里就應該有數了。

前三周期元素：強烈不建議用贗勢基組，因為此時使用贗勢帶來的上述兩條優點很不明顯，而帶來的那些壞處卻是實實在在的。而且贗勢對前三周期可用的贗勢基組比較有限，可選余地很小。
第四周期元素：用不用贗勢基組皆可。一般我還是推薦用贗勢基組，因為此時它帶來的兩條優點已經開始顯現了，贗勢基組可選擇余地此時也多了。如果體系中只有很少量第四周期元素，比如配合物當中的過渡金屬，并且想在寫輸入文件時省事或者希望所有元素用的基組都統一，那么都用全電子基組也完全可以。如果體系中有大量第四周期元素，比如計算較大的過渡金屬團簇，那么強烈建議用贗勢基組，耗時會節約甚巨。
第五周期及之后的元素：除非有特殊原因必須用全電子基組，否則強烈建議用贗勢基組，它帶來的那兩條好處已經重要到必不可少。

3 常用的幾種贗勢基組

一般計算用得到的贗勢基組就下面四類。除下面介紹的，在文獻里還容易看到CRENB和SBKJC贗勢，但如今用得都不多，CRENB雖然覆蓋周期表很全面但是精度不算多好，SBKJC主要也就是GAMESS-US用戶才用，因為是其唯一自帶的贗勢，并沒什么特別的優點。所以這倆贗勢后文不提。還有個LFK贗勢基組是在SBKJC對前六個周期主族（除Ga、In、Tl）的定義基礎上增加彌散和極化函數使計算極化率達到較好精度，如果需要贗勢下計算極化率可以考慮。

3.1 Lanl系列贗勢+標配贗勢基組

Lanl (Los Alamos National Laboratory)是Hay和Wadt在上世紀80年代提出的很常用的一種贗勢。對第四周期元素并未考慮相對論效應，對更重的元素都考慮了相對論效應。

對s族和過渡金屬，Lanl1是大核贗勢，Lanl2是小核贗勢。對p族二者等價，是大核贗勢。都有MB（極小基）和DZ（雙分裂價基）兩種配套的贗勢基組，最常用的是Lanl2DZ。Lanl2DZdp是Lanl2DZ基礎上加了層p彌散和d極化。lanl1以及MB都精度太爛，絕對不要用。

2008年提出了Lanl2TZ，是對Lanl2DZ重新進行收縮得到，算是準3-zeta基組。Lanl2TZ+是對第一周期金屬增加一層d彌散。Lanl2TZ(f)是對過渡金屬增加一層f極化。
Lanl08是對于過渡金屬和主族元素在Lanl2DZ基礎上都徹底去收縮化。Lanl08+是在Lanl08基礎上對于第一周期過渡金屬加上d彌散。Lanl08(d)和Lanl08(f)分別是在Lanl08基礎上對主族和過渡金屬加上d和f極化。

Lanl2DZ目前包含前六個周期絕大部分元素，鑭系只支持La自己，錒系只支持U、Np、Pu。其它變體支持的元素明顯沒有Lanl2DZ廣泛，具體支持哪些元素可以在BSE網站（https://www.basissetexchange.org）上查。

Lanl2DZ曾被用得非常廣泛，即便是現在還用得很多。但筆者強烈不推薦用Lanl2DZ，因為在如今看來其精度明顯偏低。如今算過渡金屬起碼lanl2TZ，其實比Lanl2DZ貴不了多少而精度大有改善，如果計算資源還富裕則建議升到Lanl2TZ(f)。對于主族，lanl2DZ也同樣不理想，又沒極化又是大核贗勢，如今起碼用lanl08，條件稍好點就建議用lanl08(d)。

3.2 Stuttgart贗勢+標配贗勢基組

對于過渡金屬和主族的大部分元素都是大核和小核版本都有，是計算鑭系和錒系的不二之選，對于其它元素也都比較不錯。此系列贗勢幾乎涵蓋整個周期表，甚至120號元素都有。精度較好，可靠度高，不斷在發展和完善。Gaussian等程序自帶的以及BSE上的Stuttgart贗勢及其標配的贗勢基組既不新也不全，如果比較講究的話，建議去其作者官網上下載定義：http://www.tc.uni-koeln.de/PP/clickpse.en.html。

Stuttgart官網上的每種元素往往有許多不同贗勢版本，其命名在前面提過的《詳解Gaussian中混合基組、自定義基組和贗勢基組的輸入》里有一些介紹，WB和DF結尾的都是考慮相對論效應的。每種贗勢有時候還提供了不同的標配的贗勢基組，情況相當復雜，不同元素情況還不一樣，三兩句話說不清楚。這里只說Gaussian的情況。當你在Gaussian里直接用SDD關鍵詞使用自帶的Stuttgart贗勢+配套基組時，其特征以及與Lanl系列贗勢基組的大小對應關系如下
Sc~Ni：MDF小核贗勢，有f極化函數。尺寸略大于Lanl2TZ(f)
Cu、Zn及第二、三周期過渡金屬元素：MWB小核贗勢，無f極化函數。尺寸略大于Lanl2TZ
主族：對s和p族分別是小核和大核MWB贗勢，無d極化函數，尺寸介于Lanl2DZ與Lanl08之間
Stuttgart作者主頁上的上面提到的這些過渡金屬的贗勢的配套基組都有2f,1g極化函數（因此昂貴很多），其它元素的贗勢基組定義和Gaussian直接用SDD關鍵詞時多數情況一致。

lanl2DZ的精度明顯遜于Gaussian里直接寫SDD時的情況。對過渡金屬Lanl2TZ(f)和SDD精度相仿佛，對主族lanl08和SDD精度相仿佛。

如果沒特殊情況，用Stuttgart贗勢基組時就在Gaussian里寫SDD就行了，有必要特殊考慮的主要也就兩種情況：
(1)計算稀土元素的團簇，用默認的Stuttgart小核贗勢耗時太高，SCF收斂比用大核贗勢也往往困難得多得多，這時候需要換成大核版本。對于d族過渡金屬只有小核版本，所以沒得選，ds族倒是也有大核的，不過意義不大
(2)計算主族時，為了結果更好，或者能更好地做波函數分析，可改用小核版本（沒內置，需要自行到Stuttgart網站上下）。

3.3 cc-pVnZ-PP系列贗勢基組

上述lanl贗勢基組和Stuttgart贗勢基組（指Gaussian自帶的版本）對于DFT計算是很合適的，但對于后HF計算，尤其是CCSD(T)這樣高檔次后HF方法就顯得比較low了。

cc-pVnZ-PP (n=D,T,Q,5)系列是Dunning相關一致性基組的贗勢版本，是最適合后HF計算的贗勢基組，很適合搭配cc-pVnZ給輕原子使用。結合的是Stuttgart小核MDF贗勢。此系列在不斷完善中，目前對從Cu到Rn的d,ds,p族元素、從K開始的堿金屬、從Ca開始的堿土金屬、Th/Pa/U有定義。其中有些在BSE上查不到，在作者的主頁上可以下載最新最全版本：http://tyr0.chem.wsu.edu/~kipeters/basis.html。由于此系列贗勢基組高角動量函數多，收縮度高，用在DFT計算上較昂貴，不值得。

cc-pVnZ-PP標準的帶彌散函數的版本是aug-cc-pVnZ-PP，讀過《談談彌散函數和“月份”基組》（http://www.shanxitv.org/119）一文的人肯定知道，aug包含的大量高角動量彌散函數意義不大。對于aug-cc-pVnZ-PP系列，也完全可以簡化成月份基組的版本來節約時間。

另外還有SDB-cc-pVnZ-PP (n=T,Q)系列贗勢基組，結合Stuttgart大核MWB贗勢，力圖達到全電子cc-pVnZ (n=T,Q)的質量。僅對于Ga~Kr和In~Xe有定義。精度略遜于cc-pVnZ-PP，但由于是大核所以更便宜。

3.4 def2系列贗勢基組

def2系列基組從def2-SV(P)、def2-SVP、def2-TZVP、def2-TZVPP、def2-QZVP、def2-QZVPP精度逐級增高。對前四周期是全電子基組，從第五周期開始是贗勢基組，結合的是Stuttgart小核贗勢。def2系列一大優點是除了錒系以及最后一個周期外覆蓋了周期表所有元素，因此對絕大多數體系可以只用def2而無需用混合基組。此系列基組既適合DFT也適合后HF計算，但對于后者起碼得用def2-TZVP。Gaussian直接內置了def2系列，不過其鑭系的定義沒有內置（至少對于G16 B.01而言仍是如此），鑭系的定義得從BSE或Turbomole基組庫（http://www.cosmologic-services.de/basis-sets/basissets.php）里獲得。

def2系列贗勢基組雖沒有標配的彌散函數，但需要彌散函數時可以按此文方式很容易地加上：《給ahlrichs的def2系列基組加彌散的方法》（http://www.shanxitv.org/340）。

搞def2的Weigend等人還搞了dhf系列贗勢基組，只包含第五、六周期，主要是把def2對s、d族元素用的Stuttgart贗勢從MWB改為了MDF并重新優化了贗勢基組，使得精度有一定提升，并且dhf原文中的數據表明dhf系列比同級別cc-pVnZ-PP結果更好。不過dhf沒有被Gaussian等主流程序內置，得去Turbomole基組庫里拷定義。

def2之前還有def系列基組，同樣從第五周期開始是贗勢基組。除def2目前支持的元素外還多定義了錒系，但是對鑭系錒系只有SVP和TZVP兩個級別，而且大小基本一樣。

cc-pVnZ-PP系列、def2/dhf系列贗勢基組都是基于Stuttgart贗勢，比起Stuttgart贗勢標配的贗勢基組的關鍵好處就是基組選擇余地大，可以根據自己要求的精度來選。

4 贗勢基組的選擇建議

本文一開始提到的，也是初學者老問的“算xxx元素該用什么贗勢基組”這個問題，根本就是個unanswerable的問題，提供的前提太少！要算的元素只是要被考慮的諸多因素之一而已。假設只是計算常規問題，比如幾何優化、振動分析、計算反應能量/勢壘、價層電子激發之類，那么根據你的計算條件的好壞（顯然也要考慮體系大小、有多少原子要用贗勢基組），以及所用的理論方法，贗勢基組有以下推薦。當然，推薦的贗勢基組能用的前提是它對你要算的元素有定義，哪些贗勢基組能用于哪些元素前面介紹過了。

DFT計算：
計算條件差：Lanl2DZ
計算條件一般：過渡金屬用lanl2TZ，主族用lanl08(d)
計算條件不錯：過渡金屬用lanl2TZ(f)或SDD，主族用lanl08(d)
計算條件很好：def2-TZVP
計算條件無限好：def2-QZVP（DFT計算用QZ級別其實很浪費）

后HF或多參考方法計算（對于cc-pVnZ-PP不支持的元素只能用def2了）：
計算條件奇差無比：cc-pVDZ-PP或def2-SVP
計算條件一般：過渡金屬用Lanl2TZ(f)或SDD，主族用lanl08(d)
計算條件不錯：cc-pVTZ-PP或def2-TZVPP
計算條件很好：cc-pVQZ-PP或def2-QZVPP
def2對第四周期還是全電子基組，cc-pVnZ-PP從Cu才開始有定義。因此后HF計算時非要對Cu之前的用贗勢基組的話那就只能靠lanl或SDD了。

提示1：對前三周期不要用贗勢基組。并且能接受的基組底限是6-31G*。
提示2：做波函數分析時一定要用小核贗勢。
提示3：鑭系可以用Stuttgart贗勢+標配基組也可以用def2系列贗勢基組。錒系一般用Stuttgart贗勢+標配基組或def-TZVP贗勢基組，對Th、Pa、U也可以用cc-pVnZ-PP系列。

如果研究的問題需要基組含有彌散函數才能描述好（見《談談彌散函數和“月份”基組》），贗勢基組顯然必須帶彌散函數。cc-pVnZ-PP前面帶上aug即可，def2怎么加彌散前面也說了，lanl系列贗勢基組直接也有帶彌散的版本。而對于SDD標配的贗勢基組，可自行用even-tempered方式加彌散（在《給ahlrichs的def2系列基組加彌散的方法》里面說過怎么做）或者把lanl的帶彌散版本的彌散函數借過來也可以。

5 關于計算配合物時贗勢基組與全電子基組的匹配問題

老有人問計算過渡金屬配合物時配體原子用xxx全電子基組，過渡金屬原子用yyy贗勢基組合不合適，匹配不匹配什么的。我感覺很多人對匹配問題太敏感了，純粹想多了。在我看來，如果按照基組的價層分裂數（zeta）來劃分，給過渡金屬用的贗勢基組的檔次約等于配體的全電子基組，或者前者比后者高一個檔，都是完全可以的。比如說，DFT計算二茂鐵，可以Fe用lanl2TZ(f)或SDD，茂環原子用6-31G*或者6-311G*。我主張過渡金屬用的贗勢基組的檔次比配體更高一點，畢竟過渡金屬在配合物里面占的比例通常極少，基組大點不至于耗時增加多少，而它又處在體系的中心地位，重要性最高，所以給過渡金屬用好點的贗勢基組，是明顯的好鋼用在刀刃上的行為。因此，比如Fe用較爛的lanl2DZ，而茂環用較好的TZVP就嚴重不合理了，明顯主次不分。不過，我也不建議過渡金屬用的贗勢基組高過輕原子太多，比如算個順鉑，Pt用def2-TZVPP，配體用6-31G*，這差距就過于懸殊，配體的爛基組就成為了制約計算精度的嚴重瓶頸（而且這種基組尺寸的嚴重不平衡，對于Mulliken等直接基于基函數做的波函數分析也有不良影響）。