談談學量子化學如何正確地入門
PS: 如果你是從零起步的初學者,想入門量子化學,那么恭喜你,看到此文章時,你終于找到正軌了!
筆者認為量化入門一定要按照正確、合理的順序,循序漸進。要從簡單到復雜,從構建整體的知識框架并會用最常用的量化程序算最基本的任務開始,再到逐漸了解更多理論、深化對理論的理解以及掌握更多計算技巧和程序的使用。在這個過程中,參加合適的培訓、看合適的資料尤為關鍵。參加不適合自己當前程度的培訓、看不適合自己當前水平的書,不僅沒什么益處,花很多時間也學不到自己當前需要的知識,反倒會有嚴重的害處,就是會接觸到各種復雜的概念、術語、公式,自己事先又沒有足夠能夠理解它們的基礎知識,就會被這些東西搞暈,甚至胡思亂想,把五花八門不相干的概念瞎攪合在一起。
有兩類初學者,他們是極度危險的:
第一類初學者:決心要把量化的理論學明白,還打算把涉及到的各種公式推導全都搞透,想等徹底學明白了才肯研究實際問題。甚至有些人,在學量化理論前,還覺先得把數學、物理再好好學一遍,否則覺得心里沒底。這類初學者,除非迷途知返,否則后果是,輕則把導師惹怒(課題遲遲沒進展,都不知道人整天在干什么),重則延期畢業。因為這種方式入門的周期實在太漫長,而且空學一堆理論不實際上陣算算具體問題,就只會紙上談兵、不知哪些知識重要哪些不重要、哪些有用哪些沒用,而且也沒法通過實踐加深對理論的理解。而且費勁巴拉把一大堆數學推導什么的好不容易都弄明白了,在之后自己的研究中它們又完全派不上任何直接的用場(除非是專門搞基礎性理論方法研究的),后果就是很快會把它們忘記,搞懂它們花的精力幾乎全都白費了。這些初學者一定要意識到學習的時間成本問題,時間不是無限的,畢業、文章等各種現實壓力在眼前,沒有時間讓你無限制地悠哉悠哉地慢慢啃理論。量化歷史悠久,博大精深,深坑無數,很多理論方法對于應用性計算來說,實際上只要正確地知道個大概便足夠,如果無論用到什么理論都非要深究一番,那真是在有限的時間內什么也干不成了。比如十分流行的M06-2X泛函,知道它的一些關鍵性特點(Truhlar組08年搞的、是meta-雜化泛函、對有機體系進行參數化、對積分格點略敏感、算熱化學數據/弱相互作用等問題優秀...),然后放心用它就夠了,若是非要把原文看明白,然后發現看不明白又去看DFT專著,然后為了加深對泛函的理解又買本《泛函分析》啃,那得猴年馬月才能開展研究。
第二類初學者:這類初學者嚴重忽視理論基礎的重要性,什么都不懂上來就看網上零七八碎的信息來用量化程序做計算。前面說了在初學階段花過度時間用在啃理論是不對的,但是量化上的常識知識不能不知道!沒有常識就能算出合理、有價值、能用來發表的數據才怪!很多初學者,嚴重缺乏基本常識,犯各種低級錯誤,令高手感到莫名其妙、匪夷所思的各種小白問題基本都是這類初學者問的。這些初學者的思路、對被研究的問題的看法往往都還處在民科階段,寫出來的關鍵詞令人無語,諸如用熱力學組合方法的時候還寫基組名。而且網上(除了計算化學公社和思想家公社群外)凈是烏七八糟誤人子弟的量化方面的討論,還有各種錯誤百出的資料(大多數是中文的)。這些初學者看了這些內容,會學一身壞毛病、獲得嚴重錯誤的知識經驗,乃至陷入泥沼不能自拔,諸如到處用IOp(5/13=1)、靠加大循環次數上限妄圖解決不收斂、明明程序支持解析頻率非要加個=numer用數值的。總之這類初學者的下場就是,會計算、能算出來數據,但絕大多數的計算都是白費功夫、糟蹋計算資源,高手能用不足他們的1/10甚至1/100的計算量算出合理、有意義得多的結果。
綜上所述,在量化入門過程中,理論知識和運用實際程序計算,二者是相輔相成的,切不可彼此脫離。沒有常識級別的理論知識,算就是瞎算;不用量化程序計算具體問題,一方面完成不了科研任務,另一方面也無法深化對理論方法的認識。
那么,如何以最正確的入門途徑踏入量化研究領域?分兩種情況,一是有條件能參加北京科音量化培訓的情況,二是沒條件只能自學的情況:
一 參加培訓
參加筆者講授的北京科音自然科學研究中心(www.keinsci.com)開辦的不同檔次的量子化學培訓,這是入門和提高最好最快的途徑,沒有之一,而且比起通過任何其它方式,哪怕還是最順利、沒繞彎路的情況,長進速度都能快最少10倍以上。自學過程慢也就罷了,更麻煩的是看五花八門的資料過程中往往還會被錯誤的信息誤導,并且很難形成正確的知識框架。
北京科音的量子化學培訓從2015年起開辦,共分為三個班:初級班、基礎班、高級班,內容難度、深度依次增加。每年三個班都會在北京開辦,培訓的預告在北京科音的首頁上可以看到,每次培訓前大概一個月左右會在主頁上發正式通知。歷屆培訓的記錄可以在北京科音官網的“科研培訓”中看到,在計算化學公社論壇還可以看到學員們參加歷屆培訓的感想:http://bbs.keinsci.com/forum-43-1.html。培訓開辦目的是讓廣大量化工作者最大程度受益,所以培訓費用僅有其它機構平均培訓費用的不到一半,而對培訓質量的要求則是最高級別、最苛刻的,這使得每次培訓都贏得了學員們熱烈的反響,場場爆滿(通常培訓報名正式通知公布后不到一刻鐘就會報滿一百多人而提前截止報名)。有很多學員甚至從澳大利亞、美國、德國、沙特阿拉伯、韓國、加拿大、以色列等國專程回國慕名參加。北京科音舉辦的量子化學培訓班已經成為了中國年輕一代量子化學研究者的搖籃,截止到2022年已經有好幾千人參加過。學員從零基礎開始,參加初級班后可以成為中鳥,經過一段時間研究實踐后,再參加基礎班后可以成為老鳥(對于悟性好的,把基礎班所講知識完全吃透就達到高手程度了)。如果對量化頗有興趣,感覺仍學有余力,或者想獲得研究更深層、更多問題的能力,那么再參加高級班,就可以達到大俠的程度。
這些培訓的下一屆舉辦時間見北京科音官網首頁的預告欄。等不及下一次培訓者,不方便到場參加者,或者報名沒搶上者,也可以購買往屆培訓紙質講義+全程錄音+電子資料自學,詳見下面給出的相應培訓班的介紹頁面鏈接。
下面分別介紹北京科音的初級、基礎和高級量子化學班的特點和定位:
初級量化班:
初級班時長為4天,從2016年12月開始辦第一屆,每年辦三屆左右,截止到2021年10月已經舉辦過多達16屆。這個班專門針對廣大從零基礎開始入門的量化研究者,還有那些接觸過一點量化計算,但頭腦里稀里糊涂,各種常見任務都不能確保正確完成的人。這個班也適合那些實驗化學工作者,他們需要學習量化計算來輔助自己的實驗,但不打算也沒時間精力把量化計算學得很精通。參加過此培訓后,學員就可以不犯錯地順利完成各種常見量化計算任務,如幾何優化、找過渡態、計算熱力學量、勢能面掃描、算NMR/紅外/拉曼/UV-Vis譜等等,而且也會學會所有最最基礎的量化理論知識,確保有足夠的常識。初級班是精心設計的給初學者入門的最佳捷徑,對于那些剛開始搞量化的,身邊又沒真正懂行的人教,上過初級量化班后一定會感覺這個班真是太難得了。也確實,參加此培訓后的學員們整體反響極好。順帶一說的是,其實科音最初沒有初級班,起初基礎班是面向零基礎的,當年第一屆的時候是4天、大概800頁左右ppt。但為了學員能學到更多知識,基礎班的內容不斷豐富、擴充,如今已經成為6+3.5天(現場+視頻)、2600多頁ppt的規模了,可以用extremely comprehensive來形容!這也導致許多零基礎以及接受知識能力偏弱的學員感到壓力很大,很多都沒聽懂,所以后來分化出來初級班來專門面向零基礎、初級學員。初級班的ppt控制在800頁左右,相對于基礎班,凡是那些重要度不是特別高、即便不學也不至于導致無法對一般體系的一般類型問題做合理計算的內容全都被砍掉,而且專門考慮到初學者的接受能力以及他們常犯的問題追加了不少專門的內容。初級班不僅把問題掰開了揉碎了慢慢講,還留出時間輔導學員上機操作,以確保每一個學員都能掌握全部所講內容、能親自算相應問題,基本不會有聽不懂的地方。
參加過初級班之后,如果覺得學的知識已經足夠用了,那么就沒必要再參加基礎班。如果上初級班后,又自己做了一陣子量化計算,感覺初級班知識都掌握得很好了,對量化計算又有興趣,想學得更多、掌握更多知識技巧,使自己能運用量化方法更好、更快地研究更多問題,那么強烈推薦繼續參加基礎班。為了系統性,基礎班有1/4左右的內容和初級班有重疊,但重疊的部分會講得較快,參加過初級班的學員正好當做是鞏固和復習。
初級量化班講授的詳細內容介紹見:http://www.keinsci.com/workshop/KEQC_content.html。
值得一提的是,有些學校開設了量子化學課,但如果量化課是那種講一堆老掉牙理論的那種,哪怕你考試得了滿分,量化也可能還屬于零基礎狀態。如果是那種有點實例的量化課,由于學校里開的那種課講得一般都非常淺,涉及的東西很少,內容不系統,所以只是參加過那種課的程度,參加初級班也是極度重要和有幫助的。
基礎量化班:
基礎量化班等同于量化中級班。這個班內容超超超級豐富,時間為6天現場+29個小時的視頻(折合6+3.5天),總共70多個小時,ppt多達超過2600頁!培訓把所有常見量化問題的原理和計算方法全都照顧到了,是其它地方很難學到的。許多主題,比如(超)極化率計算、弱相互作用計算、分子力學與ONIOM、周期性計算、反應速率計算、MOPAC的使用等等都是初級班里沒有的,而且對于初級班已有的主題,比如量化的理論基礎、基組、幾何優化、找過渡態、熱力學量的計算等等,會講得明顯更深入、更全面,傳授更多高級的經驗技巧。基礎量化班由淺入深講得很系統,也很明白,只要課前預習,課上仔細聽,再加上回去反復復習講義N遍,能力不錯的學員是能完全消化的,并可以達到理論功底扎實、計算操作上爐火純青的程度。但是基礎班有一定難度,而且信息量巨大,根據之前的培訓經驗,零基礎的學員肯定跟不上,接受能力差的也就能吸收、領會所講內容的1/3甚至更少。另外,基礎班信息量大而時間相對有限,所以講得較快,且雖然提供了大量實例和練習,但沒時間對那些很初級的操作做過多演示和手把手解決學員操作上的問題。基礎班最理想的學員,或者說能從基礎班中獲益最大、學個痛快的,是那些已經做過一段時間量化計算,并且對量化計算真正有興趣的學員。很多基礎班講的東西確實也得是親自做過量化的人才懂得多么重要,聽了才會豁然開朗或產生強烈共鳴,而此時零基礎的學員可能都完全搞不懂臺上在講什么。
總之,零基礎的學員和基礎薄弱的學員一定要從初級班起步,能起飛了,再去考慮飛得更高更遠,循序漸進,學習效率才是最高的。知識絕不是一下子學得越多越好,否則就像狼吞虎咽時會被噎住。有很多東西雖然重要,比如靜態相關是計算電子結構復雜體系必知的概念,自旋污染對開殼層體系也是很重要的概念,配分函數是徹底搞明白熱力學量是怎么計算出來的關鍵,但像這些概念,一下子灌輸給零基礎和基礎薄弱的學員不僅沒讓他們學到更多,反倒容易使他們被搞糊涂,最麻煩的是容易把不相關的概念瞎聯想到一起進而產生出各種莫名其妙的問題,限于他們的當前知識基礎和理解能力講又很難講給他們明白。所以參加培訓一定要選擇適合自己當前水平的,否則只會事倍功半。
如果你不知道目前的水平是否適合參加基礎班,可以做這個自測題:《初級量子化學培訓自測題-基組部分》(http://bbs.keinsci.com/thread-5426-1-1.html)。如果大多數都不會,說明還沒達到能參加基礎班的水平。
基礎量化班講授的詳細內容介紹見:http://www.keinsci.com/workshop/KBQC_content.html。
高級量化班:
高級量化班是給那些能力比較強,想研究更高階層的問題的人開設的。也適合那些單純對量化有濃厚興趣且參加過基礎班的學員。高級量化班和基礎班沒有任何重復,講的都是高級理論方法、小眾向內容,比如CASSCF、多參考微擾、顯式相關計算、量子蒙特卡羅、基于片段加速量化計算、從頭算動力學、振動耦合的考慮、搜索勢能面極小交叉點、光化學問題研究、能量分解、旋軌耦合的計算等等等等。而且牽扯到ORCA、GAMESS-US、MRCC、NWChem、Dalton等初級和基礎班沒涉及的量化程序的部分功能的使用。講授內容看:http://www.keinsci.com/workshop/KAQC_content.html。簡單歸納一下,三個量化培訓班之間是以下關系:
此外,北京科音每年都舉辦“量子化學波函數分析與Multiwfn程序培訓班”,為時5天(另贈送14小時的補充視頻,故相當于5+1.5天)。初級/基礎/高級量化班側重于講授怎么算,而波函數分析培訓則重在講授怎么分析。波函數分析用處極大,對應用性量子化學研究是絕對必不可少的!充分掌握波函數分析,明顯能讓研究的分析、討論部分深入、充實得多,令文章顯著增光添彩,大幅提升發表的文章的檔次。筆者開發的Multiwfn是實現波函數分析最強大的程序,被Nature、Science、JACS、Angew、PNAS等諸多頂尖刊物的文章使用,目前用戶已遍80多個國家,被SCI文章引用超過10000次!Multiwfn的一些相關介紹見《Multiwfn FAQ》(http://www.shanxitv.org/452)和《Multiwfn波函數分析程序的意義、功能與用途》(http://www.shanxitv.org/184)。Multiwfn程序不光是用于波函數分析上,對于最淺層次的量化研究也特別有用,比如可以快速方便地看軌道、繪制各種光譜圖,所以在量化初級、基礎班當中也會穿插著使用,但全面、系統、深入詳細的講解還是留在波函數分析培訓班里。波函數分析與Multiwfn程序培訓班的詳細講授內容見 http://www.keinsci.com/workshop/WFN_content.html。
北京科音每年還舉辦CP2K第一性原理計算培訓班,介紹見http://www.keinsci.com/workshop/KFP_content.html。量子化學和第一性原理都是使用基于量子力學的理論方法來研究化學問題,但前者主要研究的是孤立體系(分子、團簇),而后者主要研究的是周期性體系(特別是固體與表面),這兩個領域的研究對象是完全互補的,適用的程序、涉及的概念也有極大的不同。參加量子化學培訓班后再參加CP2K第一性原理計算培訓班,將使你的研究能力、眼界擴展一倍以上,因此非常推薦有機會參加。
北京科音每年也舉辦分子動力學與GROMACS培訓班。分子動力學和量化都是計算化學的最重要組成的部分,搞量化的人,即便是不專門做動力學的,參加這個班開闊眼界、了解動力學計算的基本過程和基本思想,對未來也是很有好處的,能激發靈感、深化對計算化學的理解,偶爾碰到必須通過動力學才能解決的問題也不發愁了。北京科音分子動力學與GROMACS培訓班的詳細講授內容見 http://www.keinsci.com/workshop/KGMX_content.html。
經常有人咨詢北京科音辦的培訓的一些問題,常見的在此進行了統一解答:《北京科音辦的培訓班FAQ》(http://bbs.keinsci.com/thread-5098-1-1.html),可以看看是否其中也有自己想問的問題。如果你是微信用戶,擔心忘看通知而錯過北京科音的培訓,那么十分建議訂閱北京科音微信公眾號,只要搜索"北京科音"即可找到。
大家務必注意,如今社會上虛假、騙錢、山寨培訓多如牛毛,參加了這種培訓,不僅學不到什么東西,還白花了時間和金錢,所以一定要謹慎辨別。強烈建議參考:《辨別虛假坑錢科研培訓的關鍵九點》(http://www.shanxitv.org/339)。社會上還有些雖然是正規機構辦的培訓,但是質量真是奇差無比,和山寨培訓本質沒有任何兩樣,參加這種培訓沒有任何益處,白費時間白費錢,例如看此貼里幾位學員曝光的一個培訓真相:http://bbs.keinsci.com/thread-20785-1-1.html。參加某些機構的培訓甚至還可能學到一大堆錯誤的東西,看過這個帖子你就能清楚體會到我為什么這么說了:http://bbs.keinsci.com/thread-21551-1-1.html。
二 自學
如果因為種種原因,沒機會參加北京科音辦的培訓,那只能自學。周圍的人,即便有懂行的,基本也沒可能會系統地教你,必須靠自己摸索。雖然這樣入門速度比參加培訓慢得多得多得多,但只要按照如下我說的,至少入門過程中不會走向歪門邪道、被誤導。(1) 看Levine的Quantum Chemistry。網上有第7版可以下載,市面上能買到第6版影印版,大同小異,看哪個版本都可以。這本書對于專門搞量化理論的人來說只是初級水平,而對搞應用性計算的人,看完此書后基礎知識方面勉強夠了。此書寫得很好,很系統,公式推導很易懂(只要高數能及格的人看著就沒壓力),量化常見概念也都有解釋。但是,不要以為光讀了這本書就算入門了,這本書不告訴你怎么結合Gaussian等主流程序算實際問題,不會用量化解決基本問題就還稱不上入門。另外,此書對于廣大量子化學初學者入門的一個很大問題就是鋪墊太多,前半本書都在講量子力學,可能都看累了、完全失去興趣了,結果連HF還沒明白是什么意思。所以,這本書,如果你有充裕的學習時間,慢慢從頭到尾看完是很好的,但如果沒那么多時間,別試圖把此書都從頭到尾細致啃完、習題都做了一遍才開始算實際問題。
(2) 看Exploring Chemistry With Electronic Structure Methods。這是Gaussian官方的書,專門講怎么用Gaussian算各種具體實際化學問題,給了很多例子,對于初學者學習Gaussian使用實屬難得。此書雖然也講了點理論,但講得很少,即便對于應用性量化研究的人也完全不夠用。一定要看第二版,切勿看最新的第三版。第三版相對于第二版徹底重寫,但是反倒更差,里面有很多誤導性的東西,不少地方數據錯誤或缺乏邏輯,而且有用的例子更少,廢話(而且是那種真正意義上的廢話并不是有助于初學者理解問題的廢話)還特別多。第二版bug不多,寫得質量不錯,可惜年代久遠(1996年),書里用的計算級別在現在看來大多已經太低或過時了,但至少沒有誤人子弟或者科學、邏輯方面的問題。要注意,切勿以為把exploring這本書看了、都搞明白了,Gaussian就能用得順利、游刃有余了,大多數在實際計算中必知的關鍵性的知識、技巧,在這書里沒有強調或者根本都沒提及,不懂這些的話在實際研究中經常會被卡住或者犯錯,比如究竟應該如何合理有效地解決不收斂以及不該有的虛頻,這些重要內容有的會在筆者的博文中介紹,但全面學習的機會只有在科音的培訓中。
值得一說的是,如果你已經參加過科音的基礎量化培訓班了,就完全沒必要再看Exploring這本書了,因為培訓中講的內容比書里全面豐富得太多太多了,制作幻燈片的時候筆者也已經把無數本計算化學書籍里有價值的內容都提煉并體現到其中了。但Levine那本書,參加過基礎班之后只要有時間一定要系統地看看,可以加深對量子力學方面的認識,而書里有的量化部分的內容在基礎班里都有,看的時候也可以順便再回憶鞏固一下。
(3) 看筆者的blog思想家公社的門口(http://www.shanxitv.org)里頭界面右邊的量子化學分類里面的文章。筆者寫過幾百篇和量子化學相關的博文,寫得都十分用心(筆者用寫論文的態度寫帖子),涵蓋面非常廣,講解非常細致。有很多博文對初學者很有益,但也有的博文可能初學者只能看懂部分或完全看不懂。
注意:此博客的文章皆為筆者(sobereva)原創,而且筆者經常更新過往文章的內容以令文章與時俱進。此博客有大量文章,被很多人未經授權胡亂轉載到了別處去,筆者表示譴責。千萬別在www.shanxitv.org和bbs.keinsci.com以外的地方(比如小*蟲、他人的博客、百度文庫)看筆者的文章!因為其它地方看到的都是老舊的而且格式/圖片被轉載者搞得亂七八糟的版本!(這兩個地方首頁都有搜索框,想找筆者寫的某篇文章,只要一搜就有)
(4) 在思想家公社QQ群(群號看http://www.shanxitv.org上方的公告)里關注大家的討論。這是筆者建立并管理的國內人氣最高、人數最多的計算化學討論群,1號、2號和3號群成員總計達9000人(長期爆滿。已經踢過的長期不發言的人加起來都已經好幾千人了),加入這個群對新人們來說算是找到組織了。每天群里都會有大量討論,低、中、高檔次問題都有。加入之后一定不要僅在自己提問的時候才看群消息,一定要每天都看群里的討論,能看懂多少看多少。雖然這種方式學習并不系統,但經過長時間熏陶,水平能提高不少。
(5) 計算化學公社論壇(http://bbs.keinsci.com)。這是北京科音自然科學研究中心旗下的高水平計算化學論壇,由筆者創立和管理。毫不夸張地說,此論壇已經是全世界范圍內人氣最高的計算化學交流論壇,甚至很多外國人都通過Google翻譯看此論壇上的帖子。此論壇有高度的學術純粹性,并且堅決抵制水貼,筆者每天都花大量時間精力回復論壇上的巨量問題和打理論壇。這個論壇從2014年10月開始運行,到2021年3月,已經有約15萬個帖子、超過兩萬六千名注冊用戶了,有大量極具價值的討論。筆者在此論壇上發過的帖子已經達三萬個。計算化學研究者應保持每天都看這個論壇新帖的習慣,量化版以往的帖子也都強烈建議在有空的時候一點點看完,能看懂多少看懂多少,特別是置頂的“簡單量化問題答疑專貼”(http://bbs.keinsci.com/thread-806-1-1.html),對初學者更是非常有益。另外,碰到計算化學問題時,在發帖求助前,應當優先想到使用計算化學公社論壇首頁Google框進行搜索。計算化學公社論壇已有的帖子是巨大的計算化學資源寶庫,不是很冷門的問題大多都能從中搜到有關的帖子
在計算化學公社和思想家公社QQ群里每天筆者都會回復大量問題,日均好幾十個。在這兩個地方看到的討論可以很放心,因為如果有人給出錯誤的回復,筆者只要看見一定會將之訂正以免誤導初學者。作為初學者,一定一定一定不要輕信網上其它任何地方的亂七八糟的和量子化學、計算化學相關的討論,尤其是中文的,可以很負責地說那些討論當中90%以上的都是錯的、誤人子弟的,很多人自己還是菜鳥程度就隨便回復別人問題,各種以訛傳訛。那些缺乏高手把關的地方的討論,初學者看多了不僅學不到有用的,反倒會對理論、概念產生錯誤的理解,在程序使用上學一身壞毛病,各種瞎用關鍵詞。
不僅是網上的中文討論不可輕信,網上的各種亂七八糟的中文教程、幻燈片之類的資料絕大多數也都是包含各種錯誤,甚至有的滿篇都是錯的。入門階段,根本別去看那些是最安全的(至少等你已經有一定水平了,有了基本分辨能力了再去看)。在計算化學公社論壇里下的資料都是放心、可信的,我是不會讓有誤人子弟的資料出現在論壇里的。
另外,市面上有不少中文的量化、計算化學的書。市面上所有這種書我基本都買過一本,買來不是為了閱讀,就是單純想看看書寫得怎么樣。整體感覺中文的這類書分三種:(1)照本宣科型。這類書的作者往往自己量化水平都沒多深就寫書,東抄西抄,根本沒自己的東西,內容也都是老一套,大同小異,從量子力學開始講,講一大堆,然后講HF、微擾等等。和主流、實際計算相關的東西在這種書里根本找不到。這種書根本別看,純屬浪費時間,也就適合在高校里當那種走形式的量化課的教材用。你如果真想極為系統地從量子力學開始慢慢學起直接看Levine的書就完了,何必看這些低水平的書籍。(2)有水平的理論書籍。比如徐的三大本就是這種。這種書有的號稱是給新人看的,但實際上是開玩笑,初學者看了只會云里霧里、暈頭轉向,對量子化學產生無限的厭惡和恐懼。(3)實例教程型。有些書里講一點基礎理論,同時給了一些計算化學的例子,看似很適合初學者,有點exploring那書的感覺,但寫得真是差遠了。這些書理論部分就那么一丁點還寫得不明不白,內容很不系統、全面,例子和練習給得很少而且往往也不怎么樣,對初學者起不到由淺入深的啟發、引導性,有的書里的例子甚至直接就是從exploring那本書里抄來的!(而科音的量化培訓里面的例子、練習都是很用心設計的,都是原創的)有的這類書更是錯誤百出,尤其是講基組的部分,可謂是重災區,幾乎就沒多少中文書這里講得是對的。我之前給一個初學者回答問題時發現,他看的某中文書居然把Pople基組加彌散和加極化函數的方式都搞混了。所以,想看實例、教程這類書的人,直接看exploring第二版就得了,至少看完此書之前別看其它的這類書。
簡而言之,量化初學者別看市面上任何中文量化書,至少是目前來說,是真的沒有適合初學者入門的。不過,筆者未來會寫一本量化書,將會打破量化初學者無書可用的局面。
順帶一提,一些初學者,明明四六級考得分不低,卻在科研上畏懼英文,死活不愿意看英文經典的資料,非要看一些很爛的中文的資料。實際上,看中文資料,雖然語言理解上障礙更低,看似更容易閱讀,但中文資料質量和英文的相比普遍相差甚遠,在理解內容上需要突破的障礙、花得時間要多得多!所以,初學者非要看中文資料的這種做法是絕對劃不來的!學術性的英文資料句式就那么些,生詞也沒多少,多看看很快就掌握那些常見生詞了,閱讀難度哪有四六級閱讀理解高。更何況,發表英文論文,不得寫成英文?用計算化學程序,不得看英文的輸出和手冊?不鍛煉科技方面的英文水平,在搞科研上會受到極大的阻力。這個坎是早晚必須要克服(除非你的研究最終目的就是水一兩篇中文文章勉強畢業)。
下面說一些其它值得說的問題:
前面說過,量化入門光學理論絕對不行,一定要結合具體程序算算實際問題。第一個用的量化程序,在我來看一定是Gaussian才行。Gaussian的輸入文件是所有主流量化程序里最簡單的,功能是最全面的,常用的功能運算速度都很好,完全可以滿足95%以上的應用性量化研究者的需要,地位如同量化界的Windows。而GAMESS-US、molcas之類那些更復雜、更學術的量化程序則類似于Linux。讓一個鼠標都沒摸過的人一上來就用Linux哪行?Gaussian都不會用的初學者去學那些輸入文件更難寫、程序結構更復雜、對使用者理論知識要求更高的程序,要么一點也學不懂,要么花了很大力氣才只會用那些程序算很簡單的問題,而這些時間如果用在學Gaussian上,早就玩得很轉,能開展實際工作了。而且,其它量化程序的用戶數目遠遠少于Gaussian,相關的學習資源少得多,遇到問題得到別人回答的幾率也低得多。目前量化程序是什么格局,從此文可以了解:《2018年度計算化學公社杯最常用的量子化學程序和DFT泛函投票結果統計》(http://www.shanxitv.org/420)、《2021年計算化學公社論壇“你最常用的計算化學程序和DFT泛函”投票結果統計》(http://www.shanxitv.org/599),文中也包括我對目前一些量化程序的評價。值得一提的是,目前市場上有幾種騙傻子的,帶圖形界面的商業味特別濃的量化程序,如果有代理商向你推銷,大家千萬別買!那幾個程序功能又弱、又不靈活,還賣得巨貴(比Gaussian貴幾倍甚至更多),根本不值那價錢,就仗著有個湊湊合合的圖形界面忽悠想做量化計算的外行購買,特別黑心。用那種程序容易被搞量化的同行瞧不起。
很多初學者不注重系統性學習知識(參加培訓或看基礎性的書),就知道看文獻,以為文獻看多了就會搞研究了,這是大錯特錯!文獻根本不可能由淺入深系統地對知識進行講解,那些講解也不可能作為文章發表。看一大堆文獻得到的只是一堆零零散散的知識碎片,沒有基礎性的知識根本不可能理解它們、將它們正確關聯到一起形成正確的知識體系。雖然也有不少計算方法的綜述類文獻,但也不可能從最基本的、考慮到零基礎的人的接受能力和知識背景去從頭細致地慢慢講。起步階段的人,我建議少看文獻多學基礎知識,等入了門有能力上手做計算了,再看一部分和實際研究主題有關的文獻和比較淺顯易懂的理論方法類的綜述。類似地,光是整天看網上的討論,也不可能獲得系統性的知識,只能一知半解地了解一些零散的概念,學一些零碎的計算技巧。關注計算化學公社和思想家公社QQ群里的討論、答疑對提高水平很有益,但終究只能起到補充作用,搞量化計算所需的關鍵性的基礎必須要通過前面提過的正規途徑來學。
很多初學者一個特別壞的毛病是唯文獻是從、文獻里說什么就是什么,甚至都感覺到文獻里的做法有不合理之處,也不假思索地盲從文獻的做法。正所謂盡信書不如無書,盡信文獻不如無文獻。很多文獻里的東西都是錯的,一些明顯的錯誤以及不合理的做法甚至于出現在IF很高的期刊中(連JACS也一樣)。牽扯到理論計算的文章那么多,哪可能所有文章的作者、審稿人同時都是相應領域的專家,而且審稿人還都認真負責仔細評審?我特別反感的一個情況就是,有些初學者的計算方式明顯是錯的、用的計算級別明顯是不合理的,給他指正,似乎還不服氣,告訴我說“xxx文獻里就是那么算的”。那些國際知名的很經典、很有名的基礎性書籍或者專著,特別是那些出了好幾版的書、作者在領域內名氣很大水平很高的人寫的書,存在錯誤的幾率較低,初學者看這些書的時候即便盲信往往也沒太大問題(但如果書的年代較早,里面有些觀點是過時的。尤其是涉及到計算級別選擇的問題,絕對不要看10年前的書)。而文獻里,特別是那些水準不明的人寫的,有錯的幾率那可太高了,盲目效仿文獻注定要吃大虧。一個典型例子就是這篇JACS文章:https://pubs.acs.org/doi/10.1021/jacs.8b04642,對一個小分子居然用MP2/STO-3G掃描勢能面,用HF/3-21G找過渡態,稍微有點最基本常識的量子化學研究者都知道這是極度荒誕的,簡直是反面教材。初學這要是效仿這篇文章用的計算級別算自己的體系,碰到稍微懂一點量子化學的審稿人,文章都會100%被打回去。別人文章發出去了那純粹是因為人家運氣超級好,多個審稿人里恰好一個量化領域的專業審稿人都沒有,或者審稿人正巧是其熟人。
要知道搞量化的分為兩派,一派是搞理論方法、算法的,由于難度高、門檻高,所以只占很小部分,而絕大部分都是搞應用性計算的。這兩類研究者所需的理論知識 層次是截然不同的。搞理論方法的需要掌握很深的知識,還必須會編程,搞量化應用的人在入門時切不能向這些人看齊,看的書不能是給這些人寫的書。
量子化學學習和研究過程中需要充分利用搜索引擎。搜研究文章一定要用Google學術,搜其它類型的科研相關的東西一定要用Google搜索,Google可以說是筆者科研過程中的左膀右臂。這里重點強調一點:千萬別用百毒!百毒是搜什么的?那是用來搜娛樂八卦、有害、坑爹、低級趣味信息的,這么low的東西怎么能用來搜索學術信息?在筆者來看,百毒搜索是幾乎最下作、最沒素質、最唯利是圖的公司搞的最糟糕的搜索引擎,搜索出的信息質量極差,對你最有價值的信息多數情況搜不到,反倒是垃圾、無意義、低水平的信息的權重賊老高,占滿了搜索呈現頁面,往往你得翻好幾頁才能找到點靠譜的信息,筆者對此體會太深了。而且,除了計算化學公社論壇、思想家公社blog等地方外,富有價值的量化方面的資料大部分是外文的,百毒這種東西連中文的學術方面的信息都搜不利落,用它試圖搜索出對你有用的外文資料那更是天方夜譚。根本甭指望百毒對你的科研工作能有什么幫助,它純粹是在浪費你的時間,越用百毒科研水平越低,而勤用Google才能令你登山更高臺階。千萬別在高水平的討論群和論壇說什么“我用百毒搜了xxx”、“百毒一下”,這一定會遭被群嘲。搜索學術信息,百毒至多至多給本科生用,而研究生及以上的人還用百毒這么弱智的東西只會被同行笑話。百毒百科那種水準低劣的東西更是千萬別信,對科研工作者只會產生嚴重誤導;而相對的,英文wiki上的信息則質量整體較高,多數是真正內行人用心寫的,很少有嚴重誤導性的內容,因此看百科必須去英文wiki上看(中文wiki質量和英文wiki比還差一大截)。另外,還有那個百毒學術,就是個Google學術的赤果果的山寨品,做得奇爛,品質和Google學術比差了十萬八千里,對科研工作有害無益。當然,由于特殊情況,在大陸Google搜索和Google學術是沒法直接訪問的,但是作為科研工作者,總得具備點特殊的上網知識吧。更別說什么“我沒法用Google”、“Google打不開”于是就自取其辱,棄明投暗而改用百毒,明明可用的鏡像隨便一找就一大把。
關于編程。有些初學者誤以為搞量化還必須得學編程,這明顯不對。對于搞應用性研究的人,至少在入門階段,完全用不著編程,懂理論常識會用Gaussian算常見問題即可。但是鼓勵有空的時候學學shell編程寫腳本,這對研究大批量分子、或者大量同類問題的時候能節省巨額操作上的勞力,而且提取數據這種事靠腳本來做還免得人工處理時候犯糊涂給搞錯。shell編程其實很簡單,學幾個小時就能解決很大問題,典型例子可以看看比如《使用Gaussian時的幾個實用腳本和命令》(http://www.shanxitv.org/258),在《詳談Multiwfn的命令行方式運行和批量運行的方法》(http://www.shanxitv.org/612)里有腳本編寫深入淺出的相關知識介紹。
做量子化學計算終究還是要有一些基本化學直覺和高等化學常識的,但是有很多人本科不是化學出身的,這些人如果以后長期做量化研究,我覺得最好還是找機會補一補化學系本科期間會學到的最重要的知識,這樣更容易更有效率地獲得更有意義的研究結果。我覺得值得補的是:普通化學、結構化學、無機化學、有機化學、物理化學、生物化學、儀器分析。其中普通化學和結構化學是必須看的,其它的根據實際研究需要來選擇性地看,并不需要看得精通,也不必做題,只要懂得基本概念就行了。至于看什么書,普通化學一定看北大的那本《普通化學原理》,結構化學一定看周公度的《結構化學基礎》。其它的看什么無所謂,不用看太深的,個人認為無機化學看吳國慶寫的那本就不錯。有機化學不用看邢其毅那種偏深的,找本比較淺的看就夠了,比如我本科時候用的是尹冬冬寫的有機化學就還可以。物理化學書里最經典的是Atkin或Levine寫的,國內有影印版,內容廣度非常高(國外的物理化學和國內的物理化學不同,前者把結構化學和其它一些化學分支的部分知識都納入了),如果能通篇看下來最好,但非常厚,大抵很多人也沒時間看完,時間有限的人自己在書店里隨便找一本感覺寫得清楚易懂的就行。
初學者少不了一堆問題要問,但是很多初學者在提問時候習慣、方式很不好,甚至造成回復者的反感。關于提問要注意的內容在此文都說了,強烈建議看看:《在網上求助計算化學問題時的注意事項》(http://www.shanxitv.org/79)和《在網上求助計算化學問題的時候必須把問題描述得詳細、具體、準確、清楚》(http://www.shanxitv.org/620)。其中我尤為想強調的有幾點:(1)提問時候必須禮貌 (2)一定不要用大字號,這和公共場合扯著嗓門喊話一樣沒素質 (3)提問時候一定要把問題闡述清楚、準確,不要試探性地提問 (4)能自己解決的就一定不要問,好好看手冊、用Google搜索,否則獨立解決問題的能力很難有長進。
有些人可能自己懶得學、懶得算,或者懼怕做計算,或者由于計算經驗不夠需要他人幫助,想找他人代算。一定要注意,隨隨便便就找代算,別坑慘的幾率超過80%!關于這點我專門寫了篇文章,強烈建議一讀:《談談我對計算化學代算的看法》(http://www.shanxitv.org/505)。如果實在自己不會算,應當找內行合作,而絕對不是花錢去社會上找人代算!
老有些初學者喜歡自己做測試,通過測試選擇在計算時最恰當的方法,然而這種行為往往都是沒有絲毫意義的無用功,在內行人眼里還會被笑話。關于這點我專門寫過一個博文《談談量子化學研究中什么樣的benchmark才有意義》(http://www.shanxitv.org/554),非常建議仔細看看。
附:學習量子化學計算必看的博文
前面提到過,自學量子化學要大量看www.shanxitv.org里的博文,但是我知道,對新人來說,把那里面所有量化相關文章在短時間內看完是不現實的,因此這里我把其中對量化計算初學者最最最重要、非看不可的博文整理了出來,缺乏文中的知識的話很難不犯低級錯誤地開展計算。注意這些博文只是涉及各種零碎的主題,零基礎初學者光是看這些是無法從頭系統性學習的,一次性系統地學明白的最好最快途徑是參加前述的北京科音的量子化學培訓。
? 必須看:
Gaussian的安裝方法及運行時的相關問題 http://www.shanxitv.org/439
簡談量子化學計算中DFT泛函的選擇 http://www.shanxitv.org/272
談談量子化學中基組的選擇 http://www.shanxitv.org/336
談談贗勢基組的選用 http://www.shanxitv.org/373
談談彌散函數和“月份”基組 http://www.shanxitv.org/119
詳解Gaussian中混合基組、自定義基組和贗勢基組的輸入 http://www.shanxitv.org/60
談談該從Gaussian輸出文件中的什么地方讀電子能量 http://www.shanxitv.org/488
解決SCF不收斂問題的方法 http://www.shanxitv.org/61
量子化學計算中幫助幾何優化收斂的常用方法 http://www.shanxitv.org/164
常見的多余的和被濫用的Gaussian關鍵詞 http://www.shanxitv.org/331
使用Multiwfn觀看分子軌道 http://www.shanxitv.org/269
在Gaussian中計算IRC的方法和常見問題 http://www.shanxitv.org/400
談談如何又好又快地計算NMR化學位移 http://www.shanxitv.org/354
使用Multiwfn繪制NMR譜 http://www.shanxitv.org/565
revTPSS泛函結合pcSseg-1基組是計算NMR很好的選擇 http://www.shanxitv.org/623
談談隱式溶劑模型下溶解自由能和體系自由能的計算 http://www.shanxitv.org/327
Gaussian中用TDDFT計算激發態和吸收、熒光、磷光光譜的方法 http://www.shanxitv.org/314
Gaussian中幾何優化收斂后Freq時出現NO或虛頻的原因和解決方法 http://www.shanxitv.org/278
使用Multiwfn繪制紅外、拉曼、UV-Vis、ECD、VCD和ROA光譜圖 http://www.shanxitv.org/224
淺談為什么優化和振動分析不需要用大基組 http://www.shanxitv.org/387
使用Shermo結合量子化學程序計算分子的各種熱力學數據示例 http://www.shanxitv.org/552
談談諧振頻率校正因子 http://www.shanxitv.org/221
在Gaussian中做限制性優化的方法 http://www.shanxitv.org/404
簡談Gaussian里找過渡態的關鍵詞opt=TS和QST2、3 http://www.shanxitv.org/460
詳談使用Gaussian做勢能面掃描 http://www.shanxitv.org/474
談談原子間是否成鍵的判斷問題 http://www.shanxitv.org/414
正確地認識分子的能隙(gap)、HOMO和LUMO http://www.shanxitv.org/543
? 看完以上內容之后應當繼續看以下內容,對一般性研究都非常重要:
Multiwfn入門tips(http://www.shanxitv.org/167)(Multiwfn是量子化學應用性研究離不開的重要程序)
Multiwfn FAQ http://www.shanxitv.org/452
Multiwfn波函數分析程序的意義、功能與用途 http://www.shanxitv.org/184
Multiwfn支持的電子激發分析方法一覽 http://www.shanxitv.org/437
Multiwfn支持的分析化學鍵的方法一覽 http://www.shanxitv.org/471
使用Gaussian時的幾個實用腳本和命令 http://www.shanxitv.org/258
談談Gaussian中的對稱性與nosymm關鍵詞的使用 http://www.shanxitv.org/297
計算化學中的一些常見不良寫法和用詞 http://www.shanxitv.org/298
量子化學研究中切換泛函應當注意的問題 http://www.shanxitv.org/415
談談溫度、壓力、同位素設定對量子化學計算結果產生的影響 http://www.shanxitv.org/423
Gaussian中有用的IOp一覽 http://www.shanxitv.org/93
Gaussian的Link、IOp與非標準計算路徑 http://www.shanxitv.org/57
過渡態、反應路徑的計算方法及相關問題 http://www.shanxitv.org/44
基于過渡態理論計算反應速率常數的Excel表格 http://www.shanxitv.org/310
使用Multiwfn繪制構象權重平均的光譜 http://www.shanxitv.org/383
亂談激發態的計算方法 http://www.shanxitv.org/265
根據Boltzmann分布計算分子不同構象所占比例 http://www.shanxitv.org/165
談談軌道成份的計算方法 http://www.shanxitv.org/131
談談片段組合波函數與自旋極化單重態 http://www.shanxitv.org/82
各種后HF方法精度簡單橫測 http://www.shanxitv.org/378
計算化學購機配置推薦 http://www.shanxitv.org/444
寫計算化學文章時引用理論方法、基組、程序時應注意的問題 http://www.shanxitv.org/370
詳談Multiwfn產生ORCA量子化學程序的輸入文件的功能 http://www.shanxitv.org/490
2018年度計算化學公社杯最常用的量子化學程序和DFT泛函投票結果統計 http://www.shanxitv.org/420
2021年計算化學公社論壇“你最常用的計算化學程序和DFT泛函”投票結果統計 http://www.shanxitv.org/599
談談如何通過勢壘判斷反應是否容易發生 http://www.shanxitv.org/506
一鍵把所有gjf文件轉成xyz文件、把所有Gaussian輸出文件轉成gjf文件的腳本 http://www.shanxitv.org/530
Gaussian中非內置的理論方法和泛函的用法 http://www.shanxitv.org/344
談談量子化學研究中什么樣的benchmark才有意義 http://www.shanxitv.org/554
實驗測定分子結構的方法以及將實驗結構用于量子化學計算需要注意的問題 http://www.shanxitv.org/569
談談不同量子化學程序計算結果的差異問題 http://www.shanxitv.org/573
使用Gaussian做鑭系金屬配合物的量子化學計算 http://www.shanxitv.org/581
? 如果你需要研究弱相互作用,以下文章非常建議看
亂談DFT-D http://www.shanxitv.org/83
DFT-D色散校正的使用 http://www.shanxitv.org/210
DFT-D4色散校正的簡介與使用 http://www.shanxitv.org/464
談談“計算時是否需要加DFT-D3色散校正?” http://www.shanxitv.org/413
談談BSSE校正與Gaussian對它的處理 http://www.shanxitv.org/46
Multiwfn支持的弱相互作用的分析方法概覽 http://www.shanxitv.org/252
大體系弱相互作用計算的解決之道 http://www.shanxitv.org/214
計算分子內氫鍵鍵能的幾種方法 http://www.shanxitv.org/522
透徹認識氫鍵本質、簡單可靠地估計氫鍵強度:一篇2019年JCC上的重要研究文章介紹 http://www.shanxitv.org/513
全面探究18碳環獨特的分子間相互作用與pi-pi堆積特征 http://www.shanxitv.org/572
使用量子化學程序基于簇模型計算金屬表面吸附問題 http://www.shanxitv.org/540
18碳環(cyclo[18]carbon)與石墨烯的相互作用:基于簇模型的研究一例 http://www.shanxitv.org/615
要善用簇模型,不要盲目用ONIOM算蛋白質-小分子相互作用問題 http://www.shanxitv.org/597
在ORCA中做counterpoise校正并計算分子間結合能的例子 http://www.shanxitv.org/542
? 如果你計算的分子有高度柔性,需要做構象搜索,或者研究分子復合物,需要做構型搜索,務必看
molclus主頁:http://www.keinsci.com/research/molclus.html
使用molclus程序做團簇構型搜索和分子構象搜索
http://bbs.keinsci.com/thread-577-1-1.html
gentor:掃描方式做分子構象搜索的便捷工具
http://bbs.keinsci.com/thread-2388-1-1.html
genmer:生成團簇初始構型結合molclus做團簇結構搜索的超便捷工具
http://bbs.keinsci.com/thread-2369-1-1.html
將Confab或Frog2與Molclus聯用對有機體系做構象搜索
http://bbs.keinsci.com/thread-20063-1-1.html
使用Molclus結合xtb做的動力學模擬對瑞德西韋(Remdesivir)做構象搜索
http://bbs.keinsci.com/thread-16255-1-1.html