国产熟女一区二区三区四区,久久久久久久久国产精品无码色欲 ,亚洲人网站,精品自拍18,色偷偷男人天堂av

美光DDR5搭配第四代AMDEPYC處理器官方基準(zhǔn)測(cè)試:所有性能均提升兩

時(shí)間:2022-12-19 17:50:00 來(lái)源:IT之家 閱讀量:9474

根據(jù)美光的發(fā)布,美光和AMD在奧斯汀建立了聯(lián)合服務(wù)器實(shí)驗(yàn)室,以減少服務(wù)器內(nèi)存驗(yàn)證時(shí)間,并在產(chǎn)品驗(yàn)證和發(fā)布期間聯(lián)合進(jìn)行工作負(fù)載測(cè)試。

美光DDR5搭配第四代AMDEPYC處理器官方基準(zhǔn)測(cè)試:所有性能均提升兩

目前,美光面向數(shù)據(jù)中心的DDR5內(nèi)存和第四代AMD EPYCTM處理器已經(jīng)出貨,并進(jìn)行一些高性能計(jì)算工作負(fù)載的通用基準(zhǔn)測(cè)試。

長(zhǎng)期以來(lái),超級(jí)計(jì)算機(jī)承擔(dān)著高性能計(jì)算的工作量如此大規(guī)模的數(shù)據(jù)密集型工作負(fù)載,需要運(yùn)行百萬(wàn)級(jí)并行運(yùn)算的TB級(jí)數(shù)據(jù),才能解決人類世界的難題,比如天氣氣候預(yù)測(cè),地震建模,化學(xué),物理和生物分析等

伴隨著計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展,這樣的工作負(fù)載通常被托管在非常大的橫向擴(kuò)展高性能服務(wù)器集群中這些服務(wù)器集群需要最強(qiáng)大的計(jì)算能力,架構(gòu),內(nèi)存和存儲(chǔ)基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負(fù)載的可擴(kuò)展性,低延遲和高性能要求可是,伴隨著服務(wù)器CPU性能和吞吐量的不斷提高,DDR4無(wú)法提供足夠的內(nèi)存帶寬來(lái)滿足不斷增加的高性能內(nèi)核

為了緩解這一瓶頸,美光DDR5內(nèi)存與采用Zen 4服務(wù)器架構(gòu)的第四代AMD EPYC處理器相結(jié)合,使服務(wù)器CPU能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負(fù)載的性能和效率要求本站了解到,美光已經(jīng)進(jìn)行了業(yè)界最新的AMD Zen 4 96核CPU和美光DDR5的基準(zhǔn)測(cè)試,所有結(jié)果都顯示性能提升了2倍

STREAM1是一個(gè)常用的基準(zhǔn)測(cè)試工具,用于測(cè)量高性能計(jì)算機(jī)的內(nèi)存帶寬,捕捉高性能計(jì)算系統(tǒng)的內(nèi)存帶寬峰值。

此工作負(fù)載使用的軟件堆棧

Alma 9 Linux內(nèi)核5.14

STREAM.f,2021年11月29日發(fā)布

測(cè)試設(shè)置

采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內(nèi)存槽已滿,總計(jì)64GB。

DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內(nèi)存槽已滿,共64GB。

試驗(yàn)結(jié)果

DDR 5系統(tǒng)每槽內(nèi)存帶寬翻倍至378GB/s。

這個(gè)結(jié)果意味著客戶可以運(yùn)行更大規(guī)模的人工智能/機(jī)器學(xué)習(xí)項(xiàng)目,或者使用DDR5增加的內(nèi)存帶寬來(lái)做更多的高性能計(jì)算。

本測(cè)試中使用的高性能計(jì)算工作負(fù)載代碼針對(duì)天氣和氣候WRF模型在一些支持高性能浮點(diǎn)處理,高內(nèi)存帶寬,低延遲網(wǎng)絡(luò)等的傳統(tǒng)高性能計(jì)算架構(gòu)中表現(xiàn)良好測(cè)試對(duì)象是美國(guó)大陸,水平分辨率為2.5公里

此工作負(fù)載使用的軟件堆棧

Alma 9 Linux內(nèi)核5.14

WRF 2.3.5安培,4.3.3

打開(kāi)MPI 4 . 1 . 1版

測(cè)試設(shè)置

采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內(nèi)存槽已滿,總計(jì)64GB。

DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內(nèi)存槽已滿,共64GB。

試驗(yàn)結(jié)果

采用第四代AMD EPYC處理器的Micron DDR5可以實(shí)現(xiàn)1.3567時(shí)間步/秒vs DDR 4系統(tǒng)的2.8533時(shí)間步/秒。

更快的速度意味著你可以使用更大的數(shù)據(jù)庫(kù)或運(yùn)行更多的模型來(lái)預(yù)測(cè)天氣,從而提高預(yù)測(cè)的準(zhǔn)確性。

OpenFOAM是計(jì)算流體力學(xué)的開(kāi)源高性能計(jì)算工作負(fù)載,廣泛應(yīng)用于多個(gè)行業(yè),有助于縮短開(kāi)發(fā)時(shí)間,降低成本從消費(fèi)產(chǎn)品設(shè)計(jì)到航空航天設(shè)計(jì),OpenFOAM可以模擬不同應(yīng)用中的物理交互,包括摩托車擋風(fēng)玻璃湍流

在這個(gè)模擬中,OpenFOAM可以計(jì)算摩托車和騎手周圍的穩(wěn)定氣流OpenFOAM可以根據(jù)用戶指定的進(jìn)程數(shù)量計(jì)算負(fù)載平衡,從而將網(wǎng)格劃分為多個(gè)部分,分配給不同的進(jìn)程解決方案完成后,網(wǎng)格和解決方案被重新組裝到一個(gè)域中

此工作負(fù)載使用的軟件堆棧

OpenFOAM CFD軟件,其中摩托車網(wǎng)格尺寸為600 x 240 x 240。

Alma 9 Linux內(nèi)核5.14

打開(kāi)MPI 4 . 1 . 1版

測(cè)試設(shè)置

采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內(nèi)存槽已滿,總計(jì)64GB。

DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內(nèi)存槽已滿,共64GB。

試驗(yàn)結(jié)果

測(cè)試結(jié)果顯示,美光的DDR5產(chǎn)品組合將OpenFOAM的性能提高了2.4倍OpenFOAM是五大高性能計(jì)算軟件平臺(tái)之一,擁有龐大的開(kāi)源社區(qū)這個(gè)軟件在大學(xué)和R&D中心被廣泛使用可以使用高帶寬內(nèi)存和內(nèi)核密集的高性能CPU,實(shí)現(xiàn)高并行運(yùn)算

CP2K是一個(gè)開(kāi)源的量子化學(xué)工具,適用于很多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬CP2K可以為不同的建模方法提供一個(gè)通用的框架測(cè)試對(duì)象是水的密度泛函理論模擬箱包含6144個(gè)原子

此工作負(fù)載使用的軟件堆棧

H2O密度泛函理論。NREP4和H2O密度泛函理論

Alma 9 Linux內(nèi)核5.14

測(cè)試設(shè)置

采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內(nèi)存槽已滿,總計(jì)64GB。

DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內(nèi)存槽已滿,共64GB。

試驗(yàn)結(jié)果

結(jié)果表明,美光的DDR5產(chǎn)品組合將分子動(dòng)力學(xué)性能提高了2.1倍伴隨著內(nèi)核數(shù)量和內(nèi)存帶寬的增加,這類工作負(fù)載的性能也會(huì)顯著提高

摘要

目前只測(cè)試了少量的高性能計(jì)算工作負(fù)載,所以以上結(jié)果只是初步的將高性能和高帶寬內(nèi)存與最新的服務(wù)器處理器相結(jié)合,可以為高性能計(jì)算客戶創(chuàng)造新的可能性

在STREAM benchmark測(cè)試中配置了1個(gè)具有25億個(gè)向量的STREAM benchmark——它運(yùn)行在單個(gè)AMD CPU系統(tǒng)上。

2AMD DDR4系統(tǒng)是64核AMD EPYC 7763處理器,DDR4—3200 MHz的RDIMM內(nèi)存槽滿,總計(jì)64GB。

3AMD DDR5系統(tǒng)是96核AMD EPYC 9654處理器,DDR5—4800 MHz的RDIMM內(nèi)存槽滿,總計(jì)64GB。

4水平分辨率為12.5km CONUS的WRF在DDR4系統(tǒng)上運(yùn)行929秒,在DDR5系統(tǒng)上運(yùn)行287秒本次測(cè)試中,WRF配置為2.5km CONUS,測(cè)試結(jié)果為1.3567時(shí)間步/秒,而DDR4的運(yùn)行時(shí)間為2.8533時(shí)間步/秒

5對(duì)于OpenFOAM,運(yùn)行了三種變體:

5a:1004040運(yùn)行時(shí),DDR4系統(tǒng)運(yùn)行時(shí)間為1144秒,DDR5系統(tǒng)運(yùn)行時(shí)間為478秒。

5b:1084646運(yùn)行時(shí),DDR4系統(tǒng)運(yùn)行時(shí)間為1633秒,DDR5系統(tǒng)運(yùn)行時(shí)間為698秒。

5c:1305252運(yùn)行時(shí),DDR4系統(tǒng)運(yùn)行時(shí)間為2522秒,DDR5系統(tǒng)運(yùn)行時(shí)間為1091秒。

分子動(dòng)力學(xué)工作負(fù)載在DDR4系統(tǒng)上的運(yùn)行時(shí)間為2519秒,在DDR5系統(tǒng)上的運(yùn)行時(shí)間為1242秒。



聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問(wèn),請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
hhx6 精彩圖片