淘寶上購買的雙路EPYC 7R32 96核服務器的使用感受和雜談
淘寶上購買的雙路EPYC 7R32 96核服務器的使用感受和雜談
文/Sobereva@北京科音 2022-Oct-13
1 前言
五年前我曾寫過《淘寶店購買雙路2696v3服務器的過程、使用感受和雜談》(http://bbs.keinsci.com/thread-6310-1-1.html),當時購買的雙路XEON 2696v3 36核機子筆者一直在用,但在如今性能已經比較過時了,特別是跑大體系長時間的AIMD很吃力。于是在2022年9月末筆者入了臺96核(物理核心)的雙路AMD EPYC 7R32服務器,性價比極高,在本文就談談使用感受和一些相關經驗。并且借本文的機會,在文末再次勸讀者盡量不買“大品牌”服務器。
2 配置和價格
我在大約近一年的《計算化學購機配置推薦》(http://www.shanxitv.org/444)里一直推薦的頂級雙路服務器配置是雙路XEON 8375C,很多人看了這博文后也都買了并感到滿意。本來筆者原本也打算入這個配置,但近期8375C漲價不少(也許和我這博文的推薦有一定關系,導致8375C賣得快),在高性能CPU范疇內其性價比已經不是首選。筆者在反復謹慎對比和斟酌后,最終決定入比較冷門的7R32。
EPYC 7R32的知名度不高,這是給亞馬遜特供的CPU。屬于EPYC二代(Roma核心),有48個物理核心,96個邏輯核心,支持八通道DDR4-3200。基礎頻率為2.8GHz,是EPYC二代中>=48核產品中基礎頻率最高的。關HT時全核滿載時我實測穩定在3.3GHz。其功耗是EPYC二代中最高的,TDP為280W。
在淘寶上有個北京的老字號賣組裝服務器的淘寶店有現成的雙路7R32服務器,基礎配置原價22000,筆者做了如下改動:
(1)把標配的單條DDR4-2666 16GB內存改成了16條32GB鎂光DDR4-2666,加了8800。用16條是為了用滿兩個CPU的總共16條內存通道,配較大的512GB內存是考慮到以后跑DLPNO-CCSD(T)等耗內存高任務的時候能用盡可能多的核并行。7R32最高支持DDR4-3200,但標配內存改成16條32GB DDR4-3200則要加12600,相當于DDR4-2666提升到DDR4-3200需多花3800元,筆者認為不值得,而且對于筆者常用的計算程序和任務來說DDR4-2666的內存帶寬大多數時候不至于構成瓶頸。
(2)硬盤從標配的三星256GB M.2固態換成了三星PM9A1 2TB M.2(PCI-E 4.0)固態,加了1300。筆者把原先筆記本淘汰下來的影馳500GB SATA3固態用來裝系統和程序,而PM9A1純粹用來當讀寫臨時文件的苦力盤,寫入量榨干了也沒關系。選擇PM9A1是因為其讀寫速度是目前市售的固態硬盤中最快之一,選擇較大的2TB是考慮到后HF任務相當耗硬盤,特別是并行核數很多時用ORCA跑DLPNO-CCSD(T)、DLPNO-STEOM-CCSD的情況。愛折騰的話也可以考慮淘寶上U.2的Intel、三星等牌子的工包或拆機的企業級固態硬盤,4TB的都不太貴,寫入量上限比消費級的大得多,不過水有點深。另外,如果讀者需要儲存大量數據,以及許多人共用,建議再入個希捷8TB企業級機械硬盤,1250元(筆者是把以前2*2696v3機子上的希捷4TB企業級機械硬盤挪到了新機子上)。
(3)電源標配的是廉價的長城1300W,長城電源由于其廉價也是很多淘寶上服務器商家的標配。雖然也不能把諸如此類低端牌子的所有型號一棒子打死(有些型號素質還不錯,用起來也沒啥問題),但筆者始終對這些牌子持鄙夷態度,而且在電源上圖便宜是很不明智的(電源是服務器所有部件里最容易壞的之一),所以換成了海韻FOCUS GX1000(額定1000W),為此多加了500元。海韻是口碑最好的電源品牌之一,筆者之前雙路2696v3原配的臺達650W電源用了幾年壞掉后也是替換的GX1000,感覺良好。而且GX1000還有個好處是長度很短(14cm),這使得在機箱下方能夠有空間加裝風扇,見后文。額定1000W的電源對于雙路7R32綽綽有余,絕對沒必要用1300W的浪費錢。值得一提,如果讀者之后有加裝高端GPU諸如RTX4090做GPU加速計算的可能,可以用海韻或振華1600W的電源。
最終,筆者買的機子共32600元,配置如下,所有東西都是全新的:
CPU:2*EPYC 7R32(96核192線程,滿載3.3 GHz)
主板:技嘉MZ72-HB0(支持1~3代EPYC,官方支持280W CPU)
顯卡:主板集顯
內存:16*32GB=512GB 鎂光DDR4-2666 ECC REG
硬盤:三星PM9A1 2TB
電源:海韻FOCUS GX1000
機箱:追風者614PC
散熱器:見后文
聲卡:無(主板也沒有集成,筆者也不需要)
關于技嘉MZ72-HB0主板的介紹,可以參看官網介紹https://www.gigabyte.com/us/Enterprise/Server-Motherboard/MZ72-HB0-rev-30-40和測評https://www.anandtech.com/show/16825/the-gigabyte-mz72hb0-motherboard-review-dual-socket-3rd-gen-epyc。
這個商家挺不錯,整個購買過程中和客服交流順利,各種問題都在15秒內回復,水平也比較專業,也沒有亂推薦、亂出主意。整套配置報價相當良心,淘寶上應該沒有明顯能做到價格更低的了。敲定配置和價格后,當即筆者就用支付寶付款。上述價格已經包含了北京地區送貨上門費用。然后過了兩天,機子就送到家了。
順帶一提,為了避免牽扯利益關系,讀者請勿向筆者詢問賣家信息,感興趣的讀者可以根據本文的配置自行在淘寶上搜合適的賣家。
3 機子照片
下圖是機子照片,風扇吹風方向如紅色箭頭所示。商家配了5個利民TL-C14X 14cm機箱風扇,單價120塊。商家配的CPU散熱器是貓頭鷹NH-U12S TR4-SP3(5熱管散熱器,原配1個貓頭鷹NF-F12 12cm風扇,又再加裝了一個NF-F12風扇),這樣一個散熱器淘寶上賣600多塊。商家在散熱上很重視而且挺舍得的,在散熱上的成本就差不多2000塊錢了。這家淘寶店值得好評,配件完全屬實,沒有任何貓膩,而且如下圖可見,機子裝得不錯,理線弄得都很好。
可見同一個散熱器的兩個風扇通過貓頭鷹的Y型線轉成一個4pin。此主板有兩個4pin CPU風扇口。
追風者614PC是個很好的機箱,設計很科學,上下前后都能裝機箱風扇,背部走線的地方還自帶了粘扣,給理線帶來了極大方便。
在機箱前后走線的窟窿的地方有橡膠片使線材固定,是個很好的設計
機箱前面沒啥特殊的,四個USB,一個耳機口一個Mic,一個硬啟按鈕。機箱上面是能發光的開機鍵,旁邊是個小的硬盤讀寫指示燈。下圖中機箱上的金屬logo和文字是商家自己粘的。
機箱前面板可以用力拽開
拽開前面板之后就可以把上面掀開
機箱下面前后有兩個濾網,可以方便地抽出來。如果在下面加裝風扇吸風,時間長了積了灰時就可以方便地抽出濾網清潔。
機箱背部,一個串口,兩個USB,兩個LAN口(技嘉MZ72-HB0提供的是倆萬兆網口,是個亮點),一個管理LAN口,一個VGA口,還有個帶LED的ID button。如果你不額外加裝GPU,顯示器又沒VGA口,記得買個轉換器。
PM9A1固態硬盤。此硬盤較早的批次(GXA7301Q固件)有掉速問題,被一些人所顧忌,而如今較新的,包括我這個GXB7601Q,都沒這個問題了。注意MZ72-HB0只有一個M.2口,要是有倆就更好了。
內存
這臺機子相當沉,是一般女生搬不動的程度,比我以前用先馬泰坦機箱的雙路2696v3機子至少多重1/3。主要應該是追風者614PC這機箱比先馬泰坦更沉的緣故,高度略微更高,長度也明顯長一截。
4 散熱、噪音、功耗
7R32作為大功率CPU,大家必然十分關心發熱以及機子噪音問題。在環境溫度約27度時,AIDA64壓力測試全核滿載15分鐘后,CPU溫度穩定在73度。溫度確實控制得很理想,但是噪音令我很不滿意。由于這機子我是放在距離自己一米遠的地方用,顯然聲音不能太大。買之前我特意問了商家,商家說這個機子噪音不大,但是插上電剛開機時感覺聲音相當大。進系統后風扇轉速自動降低了之后還行,但是用AIDA64的壓力測試功能全核滿載運行時,聲音又是相當的大,不是能長時間忍受的程度。為了盡可能降低噪音,同時又不顯著令散熱效果降低,我花了很大精力鼓搗。
首先考慮降低機箱風扇的噪音。原配的5個利民TL-C14X風扇高轉速時噪音頗大(標稱最高轉速為1800rpm,全核滿載期間會達到1650rpm),我發現其實用5個完全是多余的。如上一節所示的CPU風扇吹風方向可見,風是從下往上吹的,給機箱前面板加風扇沒必要(本身風還會被硬盤架子擋一部分)。而且機箱后側風扇也完全多余,滿載時吹出的風都是涼的。于是我就把前面板兩個風扇和后側一個風扇都摘了,果然滿載時溫度幾乎沒變,而噪音有明顯減小。我又發現當前用的海韻GX1000電源比較短,機箱下方有裝14cm風扇的空間,于是就把摘下來的一個風扇裝到了下面往上吹風,滿載溫度平均降低了1.5度(效果不明顯,可有可無)。此時的風向如下所示
我認為像這樣從下向上走風比起從前往后走風好得多,此時兩個CPU的溫度是基本一致的,不像從前往后走風會導致后面那個CPU溫度比前面的明顯更高。而且熱風從上面出,滿載運算時在冬天可以把手放在機箱上方暖手(親測有效)。不過機箱上面就不能放東西了。
如上處理后,滿載運行聲音依然不小,畢竟現在還有的4個貓頭鷹NF-F12風扇和3個利民TL-C14X風扇。我原本打算買到閑魚上入手貓頭鷹的減速線NA-RC7或調速器NA-FC1降低風扇轉速,后來發現在技嘉MZ72-HB0主板的通過網頁瀏覽器訪問的MegaRAC SP-X網絡管理界面里可以細膩地根據CPU溫度控制風扇轉速百分比,徹底解決了噪音大的問題。
具體來說,把網線插到服務器的管理LAN口上,進BIOS后,進入Server Mgmt - BMC network configuration,恰當設置IP地址,比如我設Static地址,并指定地址為192.168.5.100。之后保存BIOS設置并重啟。之后在同一網段的另外的機子的網頁瀏覽器里輸入192.168.5.100,就可以進入服務器的管理界面了。登錄的用戶名是admin,密碼在主板的貼紙上,如下所示,密碼是3/A/后面的字符串,即LH4PA800228。
登錄后在界面左側選Settings,再選Fan Profile,就可以添加風扇運轉策略,比如我增加了balance、silent、ultra_silent三種,當前啟用的是ultra_silent,如下所示
我是下圖這樣定義ultra_silent策略的,能令室溫下CPU滿載溫度維持在不太高的情況下用盡可能低的轉速,讀者可以效仿。如圖所示,傳感器數據定義為兩個CPU的溫度,對主板所有風扇口(兩個CPU風扇口和4個機箱風扇口)控制轉速。由下圖右上角的示意圖可見,溫度低于30度時風扇20%轉速,30~77度之間轉速從20%緩慢線性提升至40%。超過77度就算稍高了,因此在77~90度之間轉速從40%較快地變化到90%。超過95度就危險了,達到CPU可承受的上限,所以>=95度時就令風扇全力全開了。
值得一提的是技嘉MZ72-HB0的網絡管理界面做得相當不錯,功能和設置很多,所有傳感器的信息在Sensor頁面里都能一覽無余地看到,并且還提供隨時間變化的動態變化圖。例如從下圖可見CPU溫度、風扇轉速、電壓等的變化情況。
經過如上調教后,環境溫度為27度時,全核滿載溫度在78~80度波動,期間貓頭鷹風扇在750~900rpm范圍波動,機箱風扇轉速維持在1200rpm。此時的噪音很令我滿意了,放在距離我一米遠的地方運行不覺得吵,噪音甚至比我在http://bbs.keinsci.com/thread-6310-1-1.html里介紹的那臺雙路2696v3的機子還小一點點。7R32這機子剛拿來的狀態下距離一米處滿載34分貝,經過調教后只有20分貝出頭一丁點了(我手頭沒專門的噪音測試儀,只是用手機app測了一下,所以絕對值肯定不準,但相對值能說明問題)。另外,調教后這個機子在待機狀態下相當安靜,CPU溫度維持在30度出頭,貓頭鷹風扇轉速只有300rpm,機箱風扇450rpm。
如果滿載時還想更靜音甚至還有余地,即允許讓CPU滿載溫度更高(如達到85度)換來更低的風扇轉速。還可以在機箱蓋里面貼一層吸音棉(淘寶有賣。一些以靜音為賣點的機箱也是這樣做的)。PS:按上述處理后,敞著機箱蓋運行不會令溫度有絲毫降低。網上有人說在機箱蓋上貼吸音棉會影響散熱,起碼這對于當前機子不適用,因為此機子滿載時兩側的機箱蓋并無明顯溫熱感,對散熱無貢獻,只有機箱上頭的出風處的金屬網會被熱風吹得很熱。
之前有人在計算化學公社論壇里專門討論主板MOS管散熱問題,有的上水冷有的用小風扇吹,而當前這機子完全不需要顧慮這個,不需要任何額外的輔助散熱就能在室溫下長期穩定運行。
關于風扇再多說幾句。在機箱風扇方面,如前所述,這機子的14 cm機箱風扇有上面兩個、下面一個就夠,而且機箱風扇對于CPU溫度影響很有限,故機箱風扇沒必要用利民TL-C14X那么貴的,用諸如60塊錢的ARCTIC F14 PWM PST就行了,價格只有TL-C14X的一半。雖然ARCTIC F14 PWM PST的最大轉速和風量都更小,但即便如此也綽綽有余,都完全用不著滿速運行。在CPU風扇方面,根據網上的一些測試,對于滿載的CPU,NF-U12S用倆風扇比單風扇溫度也就低三度左右,因此如果你對噪音敏感的話,用原配的一個風扇足矣,而且還少花錢。順帶一提,NF-U12S原配的NF-F12在12 cm風扇范疇內已經幾乎是最靜音的了,沒有比之明顯更好的選擇。貓頭鷹的NF-U14S散熱器也有適合EPYC的版本NF-U14S TR4-SP3,搭配的是單個14 cm風扇NF-A15,在同樣散熱能力下轉速能比NF-F12更低因而更靜音,但以當前主板倆CPU的間距來說,裝倆NF-U14S是不可能的。
這雙路7R32和雙路2696v3目前我并排放置使用,之間相距只有兩厘米,如下所示。兩臺機子同時滿載時我都感覺噪音不大,所以噪音問題完全不必擔心。兩臺機子挨著放也完全沒有相互影響散熱。
輸入功耗方面,根據計量插座顯示,關機狀態13瓦,win 11、Rocky Linux 9.0下待機80~90瓦,AIDA64壓力測試(stress CPU/FPU/cache/system memory都選上)時是640W左右,如下所示。考慮到功率轉換效率,輸出功率此時也就不到580W,顯然電源用額定1000W的GX1000綽綽有余。用較好牌子的額定850W的電源也夠。這機子的功耗比起以前我帖子里說的雙路2696v3滿載時的輸入功率455W大了近200W。按照北京地區居民電價,滿載一天不到8塊錢。
5 軟件安裝和運行
我的研究做的計算都是在Linux下跑的,Linux系統肯定是我自己根據實際需要裝的,不打算讓商家裝,但畢竟商家測試機子也得有個系統。商家問我裝什么系統時,就姑且先讓裝了Win11,也便于我跑Cinebench R23、AIDA64、CrystalDiskMark等一些Windows下的測試程序。
CentOS是我以前一直推崇的操作系統,后來變成stream形式了,失去了原有的靈魂,后來我就轉向了以魯棒為重的CentOS正統的繼任者Rocky Linux,和CentOS的界面和體驗完全沒有區別。Rocky Linux我裝的是最新的9.0,去https://rockylinux.org下載DVD iso,然后用rufus制作安裝U盤(順帶一提,別用UltraISO制作,否則沒法順利安裝),插上服務器并啟動就可以照常順利安裝了。作為計算用服務器,建議選成Workstation,然后把GNOME Applications、Legacy UNIX Compatibility、Developement Tools、System Tools、Graphical Administration Tools都選上。前面說了,我給這機子添了個以前留下的500GB固態硬盤,Rocky Linux就裝在了這里。機子是我私用的,硬盤配置方面給必須設的UEFI分區設了200MB,其它空間就都掛載到了/,用ext4文件系統,由于內存已經很大了就沒設swap分區。
由于之前PM9A1 2TB上商家已經裝了Win11,所以Rocky Linux 9裝完后再重啟就可以看到啟動菜單,可以選進入哪個系統。由于Windows對我沒用,所以后來就把PM9A1這個硬盤格掉了,把Gaussian、PSI4等程序的臨時文件目錄都設在了這個硬盤上。
Rocky Linux 9.0和當前這機子完全兼容,安裝和使用過程完全沒有出現任何問題。Multiwfn 3.8(dev)、Gaussian 16、ORCA 5.0.3、CP2K 2022.1、PSI4 1.6.1、xtb 6.5.1,以及OpenMPI 4.1.1和FFTW 3.3.8在這個機子上安裝/編譯和使用都非常順利。需要注意的是系統沒有自動裝gfortran,編譯OpenMPI之前記得用yum裝上gfortran,否則之后ORCA沒法正常并行。原本要裝的是經典的GROMACS 2018.8,可能是由于Rocky Linux 9.0自帶的gcc 11.2.1與老版本GROMACS語法兼容性的緣故編譯失敗,因此就裝了目前最新的2022.3,順利安裝,而且也正確識別出了AVX2。
肯定有人顧慮用AMD CPU的兼容性問題,至少安裝和使用上述程序時我沒碰到任何兼容性問題。安裝過程嚴格按照這些文章所述進行:《Gaussian的安裝方法及運行時的相關問題》(http://www.shanxitv.org/439)、《量子化學程序ORCA的安裝方法》(http://www.shanxitv.org/451)、《CP2K第一性原理程序在CentOS中的簡易安裝方法》(http://www.shanxitv.org/586)、《GROMACS的安裝方法(含全程視頻演示)》(http://www.shanxitv.org/457)。
此機子運行十分穩定,已經用了十幾天,沒任何問題。最長連續計算是用CP2K滿載跑AIMD跑兩天,毫無問題。
6 性能測試
在Win11下用Cinebench R23測試,結果如下。在雙路2696v3上得分是多核23391,單核745,可見雙路7R32這機子理論性能約為其3.5倍。當然,受制于實際計算程序的并行效率等原因,在大多數量子化學、第一性原理程序上比2*2696v3的優勢不會顯著到這種程度。
我在網上看到的雙路8375C的R23多核得分是72071,可見2*7R32雖然目前比2*8375C明顯更便宜,全核性能卻還更好(7R32單核性能會吃虧一些,但畢竟96核對64核,優勢還是明顯的)。不過考慮到實際量子化學、第一性原理程序的常規任務的并行效率大多達不到R23的程度,實際計算中比2*8375C的優勢不會多明顯。
也測了一下PM9A1在這機子上的表現,如下所示,發揮出了應有的水準,讀寫速度十分理想
下面是一些量子化學和第一性原理程序的性能測試。我發現如果開著HT,滿載頻率是3.0 GHz左右,關了之后可穩定在3.3 GHz。在《正確認識超線程(HT)技術對計算化學運算的影響》(http://www.shanxitv.org/392)里我說過,計算用的核數不應超過物理核心數,因此HT是擺設。雖然一般沒必要刻意關,但對于7R32,不關的話滿載頻率會降低1/10而有損性能,所以下面的測試若未注明我都是關了HT測的,平時也都關了HT用。關HT的方法是:進入BIOS,選AMD CBS - CPU Common Options - Performance - CCD/Core/Thread Enablement,選Accept,把SMT Control設Disable。
下面是Gaussian 16 C.02 AVX2版測試。使用Gaussian自帶的test0397,是化學組成為H90C54N6O18共168原子的普通有機體系,關鍵詞設為b3lyp/def2svp force scf=novaracc g09default。在其他人的《g16在8375C和7T83的表現小測評》(http://bbs.keinsci.com/thread-28607-1-1.html)里使用的也是同樣的測試任務,大家可以對照性能。我的測試結果如下,測試時是用%nproc設的并行核數:
2*2696v3:8m4s(484s)
2*7R32用48核:3m40s(220s) 是2*2696v3的2.2x
2*7R32用64核:3m12s(192s)
2*7R32用96核:2m46s(166s) 是2*2696v3的2.9x
2*7R32用96核開HT:3m7s(187s)
把基組改為更大的def2-TZVP,結果為:
2*2696v3:78m25s(4705s)
2*7R32用48核:31m23s(1883s) 是2*2696v3的2.5x
2*7R32用64核:25m52s(1552s)
2*7R32用96核:22m30s(1350s) 是2*2696v3的3.5x
2*7R32用96核開HT:23m11s(1391s)
可見,在大基組時才能把7R32相對于2696v3的優勢展現得更充分。也可以明顯看出,96核只跑一個任務很虧,同時跑兩個劃算得多。也要注意提交方式的問題。比如對一個H22B18C4Co1共45個原子的團簇體系在B3LYP/def2-TZVP下算單點,幾種計算方式的耗時如下:
2*7R32同時跑兩個48核任務,靠%cpu=0-47和%cpu=48-95分別綁在兩個不同CPU上:442s
2*7R32同時跑兩個48核任務,用%nproc=48:484s
2*7R32跑一個48核任務,用%nproc=48:430s
可見2*7R32這機子同時跑倆48核任務時應當記得綁定避免性能損失,但即便如此也沒只跑一個48核任務快。原理見《NUMA策略對Gaussian運算速度影響的小研究》(http://bbs.keinsci.com/thread-19773-1-1.html)。
下面是ORCA 5.0.3的測試,計算的是《使用Molclus結合xtb做的動力學模擬對瑞德西韋(Remdesivir)做構象搜索》(http://bbs.keinsci.com/thread-16255-1-1.html)一文里研究的瑞德西韋,關鍵詞用比較貼地氣的wB97M-V/def2-TZVP RIJCOSX strongSCF。
2*2696v3:483s
2*7R32用48核:241s 是2*2696v3的2.0x
2*7R32用96核:174.6s 是2*2696v3的2.8x
ORCA的這種比較典型的任務表現的并行效率不及G16用大基組做DFT時。所以,2*7R32機子上也是同時跑兩個或多個任務更劃算,此時也要注意綁定的問題,做法見《通過設置CPU內核綁定降低ORCA同時做多任務的耗時》(http://www.shanxitv.org/553)。
下面是CP2K 2022.1的測試。算的是SiO2超胞,共576原子,使用常用的PBE結合較大的TZV2P-MOLOPT-GTH基組,開OT算單點。輸入文件見此:http://www.shanxitv.org/attach/653/SiO2.inp。
2*2696v3:平均SCF每輪14s,共493s
2*7R32只用48核:平均SCF每輪6.4s,共225s
2*7R32只用64核:平均SCF每輪5.1s,共180s
2*7R32只用81核:平均SCF每輪4.9s,共174s,是2*2696v3的2.8x
我用全部96核時,SCF每輪速度比用81核時沒可查覺的優勢,而且偶然性地個別SCF步的耗時會最多增加到14s,導致總耗時還更高,原因不明(也許是MPI的問題,也許是內存帶寬用滿的問題),因此跑單個任務的話用81核比較保險。考慮到超過48核后性能提升就很不顯著了,為了最有效利用2*7R32計算能力,我建議同時跑兩個48核CP2K任務為宜。記得一定要分別綁定在兩個CPU上跑。如果直接mpirun -np 48 cp2k.popt提交兩個任務,SCF每輪的速度很不穩定(暗示可能內存訪問方面打架),平均每輪9點幾秒,最終351秒跑完。如果提交兩個的時候分別綁定在兩個CPU上,每輪SCF穩定在大約8.1秒,最終288s跑完。綁定方法見前述的《通過設置CPU內核綁定降低ORCA同時做多任務的耗時》,也是mpirun結合-rf實現。
我還對比了CP2K用雜化泛函PBE0結合TZVP-GTH計算含64個水的水合電子體系單點的速度,2*7R32能達到2*2696v3的三點幾倍,比起純泛函計算時性能優勢明顯得多。
7 總結
本文介紹了筆者近期從淘寶上網購的性價比極高的適合計算化學的雙路EPYC 7R32服務器,對于量子化學和第一性原理計算都是十分適合的。對于內存需求量不很大的情況,16條16GB就夠,此時遠不到3萬就能買一臺96個物理核心而且主頻中等偏上的服務器,可謂超值!對于筆者撰文時的情況,雙路7R32是組建高性能CPU計算服務器的幾乎最理想選擇。但我估計7R32的貨源不多,可能本文發布之后不久就賣光了,或者漲價。這令我想起當年我的《淘寶店購買雙路2696v3服務器的過程、使用感受和雜談》一文發布后,有好一陣子2696v3還漲價了很多,沒準是那篇文章明顯促進了2696v3的銷量。本文的這些討論不限于7R32,對于讀者購買和使用其它計算服務器也是有參考價值的。在未來購買什么配置合適可以看隔一段時間就會更新一次的《計算化學購機配置推薦》(http://www.shanxitv.org/444)。
附:再次勸讀者盡量不要花冤枉錢買“大品牌”服務器
再次強調,如果能不買所謂的大品牌服務器(我就不點名了),就別買那些牌子!我在http://www.shanxitv.org/444里已經非常非常非常著重強調了這點了。跟我這3萬塊錢的2*7R32的機子性能相當的配置,那些“大品牌”賣到十幾萬都極其正常(例:http://bbs.keinsci.com/thread-32672-1-1.html),報價可謂離譜至極,而且這不是極少數情況而是極多數情況。3萬塊錢從“大品牌”那里買只能買個雞肋,也就是“垃圾佬”服務器的性能水平。還有人覺得買那些“大品牌”是為了售后完善,難道再好的售后值這機子N倍的價錢?前述我的2*2696v3的購機貼里就已經充分體現了在淘寶上靠譜的賣家那里買機子根本就沒什么風險,這次購機再次充分體現這一點。店家都把機子測試好了(靠譜的商家都會經過長時間拷機)、系統裝好了(要Linux也給裝),直接插了電源、鼠標鍵盤、顯示器、網線之后上來就能用,買方對軟硬件一竅不通也無妨(需要組建集群另談)。就算花N倍價錢買所謂大品牌的機子,我相信絕大多數售后也不會貼心服務到會給你編譯CP2K之類的。靠譜的淘寶服務器商家都有像樣的售后,和所謂大品牌沒多大差異,諸如我買的這家在我拍之前在阿里旺旺上我已經問清楚了保修條款(商家原話粘貼過來):
主板 內存 固態 電源 顯卡 希捷企業級硬盤 西數機械硬盤 保三年
希捷普通機械硬盤保兩年
CPU 散熱器 機箱 保一年
注:以上均為免費質保(非人為、無燒傷、無外傷、無進水等)
以上質保已經足夠充分了。等以后過了保,即便出了問題,肯花錢的話店家肯定也給你弄。把服務器用順豐直接寄回去,換個配件,處理完了再寄回來就完了,就算是異地的來回一般也就一個禮拜的事。
還總有“大品牌”服務器商家謊稱淘寶上組裝的服務器質量不好,這是利用買方對硬件知識的極度匱乏進行欺騙。諸如本文說的7R32機子,用的海韻是最好的電源品牌之一,用的技嘉是最好的主板品牌之一,用的貓頭鷹是最好的散熱器品牌之一,用的三星是最好的固態硬盤品牌,用的追風者614PC這機箱的設計也基本無可挑剔,根本沒有任何可被貶損的余地。完全不懂硬件的讀者切勿隨便聽信“大品牌”的客服/銷售說的話。
至于配件的兼容性,雖然“大品牌”的服務器肯定沒兼容性的問題,但這并不是優勢,因為靠譜的賣家賣的配置,尤其是那些銷量較大、用的人較多的配置,都不會有兼容性或不穩定的問題,要不然早就在測試中發現或者有其他客戶向他們反饋了。
肯定有人說,由于購買渠道的限制,只能花大價錢買價格離譜的“大品牌”機子。這只能自己想辦法解決,未必沒有變通的空間,應積極主動聯系賣家想辦法。